积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(7)Hadoop(7)

语言

全部中文(简体)(6)西班牙语(1)

格式

全部PDF文档 PDF(7)
 
本次搜索耗时 0.021 秒,为您找到相关结果约 7 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 西班牙语
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 尚硅谷大数据技术之Hadoop(生产调优手册)

    namenode.handler.count=20 × ??????????? ????,比如集群规模(DataNode 台 数)为 3 台时,此参数设置为 21。可通过简单的 python 代码计算该值,代码如下。 [atguigu@hadoop102 ~]$ sudo yum install -y python [atguigu@hadoop102 ~]$ python Python 2 bw=360MiB/s (378MB/s), 360MiB/s-360MiB/s (378MB/s-378MB/s), io=20.0GiB (21.5GB), run=56885-56885msec 结果显示,磁盘的总体顺序读速度为 360MiB/s。 (2)顺序写测试 [atguigu@hadoop102 ~]# sudo fio - filename=/home/atguigu/test.log bw=341MiB/s (357MB/s), 341MiB/s-341MiB/s (357MB/s- 357MB/s), io=19.0GiB (21.4GB), run=60001-60001msec 结果显示,磁盘的总体顺序写速度为 341MiB/s。 (3)随机写测试 [atguigu@hadoop102 ~]# sudo fio - filename=/home/atguigu/test.log
    0 码力 | 41 页 | 2.32 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(入门)

    合资组建。 (2)公司成立之初就吸纳了大约 25 名至 30 名专门研究 Hadoop 的雅虎工程师,上述 工程师均在 2005 年开始协助雅虎开发 Hadoop,贡献了 Hadoop80%的代码。 (3)Hortonworks 的主打产品是 Hortonworks Data Platform(HDP),也同样是 100%开 源的产品,HDP 除常见的项目外还包括了 Ambari,一款开源的安装和管理系统。 $user@$host:$pdir/$fname 命令 选项参数 要拷贝的文件路径/名称 目的地用户@主机:目的地路径/名称 选项参数说明 选项 功能 -a 归档拷贝 -v 显示复制过程 (2)案例实操 (a)删除 hadoop103 中/opt/module/hadoop-3.1.3/wcinput [atguigu@hadoop103 hadoop-3.1 [atguigu@hadoop102 ~]$ mkdir bin [atguigu@hadoop102 ~]$ cd bin [atguigu@hadoop102 bin]$ vim xsync 在该文件中编写如下代码 #!/bin/bash #1. 判断参数个数 if [ $# -lt 1 ] then echo Not Enough Arguement! exit; fi
    0 码力 | 35 页 | 1.70 MB | 1 年前
    3
  • pdf文档 大数据集成与Hadoop - IBM

    迁 移至各映射节点,以便执行某些验证和增强操作。因此,会将 整个引用文件迁移至各映射节点,这使其更适合较小的引用 数据结构。如果进行手动编码,必须考虑这些处理流,因此 最好采用一些工具来生成代码,从而将数据集成逻辑下推到 MapReduce(也称为ETL pushdown)。 8 大数据集成与 Hadoop 在Hadoop中使用ETL pushdown处理方法(无论采用哪 种工 比MapReduce高10到15倍。2 InfoSphere DataStage还对Hadoop环境进行了均衡 优化。均衡优化可生成Jaql代码,以便在MapReduce环 境中本机运行它。Jaql自带优化器,该优化器会分析所生成 的代码,并将其优化到map组件和reduce组件中。这样 可自动执行传统的复杂开发任务,并让开发人员不必再为 MapReduce架构而担忧。 InfoSphere 在企业间实施世界级数据治理 5. 在企业间实施强大的管理和操作控制 最佳实践1:避免出于任何目的在任何位置进行手动编码 在过去的二十年中,大型企业认识到使用商业数据集成工具 替换手动编码具有很多优势。手动代码与数据集成工具之争 早已平息,很多技术分析师纷纷总结采用世界级数据集成软 件将会实现的巨大ROI优势3。 “如有疑问,请尽可能使用更高级的工 具。” —“Large-Scale ETL With
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
  • pdf文档 通过Oracle 并行处理集成 Hadoop 数据

    Hadoop 中存储的数据的一个模板实现。显然可能存在其他的甚至可能更好的实现。 下图是图 2 中原始示意图在技术上更准确、更具体的展示,解释了我们要在何处、如何使用 后文给出的部分实际代码: 图 3. 启动 Mapper 作业并检索数据 第 1 步是确定由谁作为查询协调器。对此我们采用一种将具有相同键值的记录写入表的简单 机制。首个插入胜出,作为此进程的查询协调器 Oracle 白皮书 — 通过 Oracle 并行处理集成 Hadoop 数据 示例代码 图3 至 图 5 实现的解决方案使用以下代码。所有的代码均在 Oracle Database 11g 和 5 个节点 的 Hadoop 集群上进行过测试。与大多数白皮书一样,请将这些脚本复制到文本编辑器中并 确保格式正确。
    0 码力 | 21 页 | 1.03 MB | 1 年前
    3
  • pdf文档 Hadoop 概述

    本进程,例如对底层操作系统及其文件系统的抽象。Hadoop Common 还包含必要的 Java 归档(Java Archive,JAR)文件和用于启 动 Hadoop 的脚本。Hadoop Common 包甚至提供了源代码和文档, 以及贡献者的相关内容。如果没有 Hadoop Common,你无法运行 Hadoop。 与任何软件栈一样,Apache 对于配置 Hadoop Common 有一定 要求。大体了解 资源管理(YARN) 存储 结构化 集成 图 1-5 1.4.2 数据集成与 Hadoop 数据集成是 Hadoop 解决方案架构的关键步骤。许多供应商利 用开源的集成工具在无须编写代码的情况下即可轻松地将 Apache Hadoop 连接到数百种数据系统。如果你的职业不是程序员或开发人 员,那么这点对你来说无疑是使用 Hadoop 的加分项。大多数供应 商使用各种开放源码 的支持,在用户桌面对并行 R 代码使用 R 语言风格的调试功能(见 图 1-10)。此连接器允许分析师将来自多种环境(客户桌面、HDFS、 Hive、Oracle 数据库和内存中的 R 语言数据结构)的数据组合到单个 分析任务执行的上下文中,从而简化数据的组装和准备。Oracle R Connector for Hadoop 也提供了一个通用的计算框架,用于并行执行 R 代码。 如本章所述,如果
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
  • pdf文档 MATLAB与Spark/Hadoop相集成:实现大数据的处理和价值挖

    tall数组 ➢ 并行与分布式计算 ▪ MATLAB与Spark/Hadoop集成 ➢ MATLAB访问HDFS(Hadoop分布式文件系统) ➢ 在Spark/Hadoop集群上运行MATLAB代码 ▪ 应用演示 – 汽车传感器数据分析 3 大数据概述 大数据的”4V”特征: ▪ Volumes - 数据规模,数据规模巨大 互联网、社交网络的普及,全社会的数字化转型,数据规模向PB级发展
    0 码力 | 17 页 | 1.64 MB | 1 年前
    3
  • pdf文档 Hadoop 迁移到阿里云MaxCompute 技术方案

    强大。 * 完全自主开发的 compiler,语言功能开发更灵活,迭 代快,语法语义检查更加灵活高效 * 基于代价的优化器,更智能,更强大,更适合复杂的查 询 * 基于 LLVM 的代码生成,让执行过程更高效 * 支持复杂数据类型(array,map,struct) * 支持 Java、Python 语言的 UDF/UDAF/UDTF * 语法:Values、CTE、SEMIJOIN、FROM
    0 码力 | 59 页 | 4.33 MB | 1 年前
    3
共 7 条
  • 1
前往
页
相关搜索词
硅谷大数技术Hadoop生产调优手册入门集成IBM通过Oracle并行处理并行处理数据概述MATLABSpark实现价值迁移阿里MaxCompute方案
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩