积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(7)Hadoop(7)

语言

全部中文(简体)(7)

格式

全部PDF文档 PDF(7)
 
本次搜索耗时 0.014 秒,为您找到相关结果约 7 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 通过Oracle 并行处理集成 Hadoop 数据

    查询中访问这些数据的过程。 甲骨文(中国)软件系统有限公司 北京远洋光华中心办公室 地址:北京市朝阳区景华南街5号远洋光华中心C座21层 邮编:100020 电话:(86.10) 6535-6688 传真:(86.10) 6515-1015 北京上地6号办公室 地址:北京市海淀区上地信息产业基地,上地西路8号,上地六号大厦D座702室 邮编:100085 8513-2000 传真:(86.20) 8513-2380 成都分公司(川信大厦办公室) 地址:成都市人民南路二段18号四川川信大厦20层A&D座 邮编:610016 电话:(86.28) 8619-7200 传真:(86.28) 8619-9573 成都分公司(高新国际广场办公室) 地址:成都市高新区天韵路150号高新国际广场D座四楼18-19,22-25单元
    0 码力 | 21 页 | 1.03 MB | 1 年前
    3
  • pdf文档 Hadoop 3.0以及未来

    XOR编码: 1,0 需要额外的1位 HDFS纠错码(Erasure Coding) • Reed-Solomon (RS) 编码 数据可靠性和存储效率 • 数据可靠性:可以最多几个节点故障 • 存储效率:k/(k+m) 可靠性 存储效率 单副本 0 100% 3副本 2 33% XOR(6个数据单元) 1 86% RS(6,3) 3 67% RS(10,4) 4 71% 存储布局-连续和条状
    0 码力 | 33 页 | 841.56 KB | 1 年前
    3
  • pdf文档 Spark 简介以及与 Hadoop 的对比

    RDD 数据集的操作之后的结果,都可以存放到 内存中,下一个操作可以直接从内存中输入,省去了 MapReduce 大量的磁盘 IO 操作。这对 于迭代运算比较常见的机器学习算法, 交互式数据挖掘来说,效率提升比较大。 1.2.2 RDD 的转换与操作 对于 RDD 可以有两种计算方式:转换(返回值还是一个 RDD)与操作(返回值不是一个 RDD) 1. 转换(Transformations) 记录每 个 RDD 的 lineage(血统)来重新计算生成丢失的分区数据。 2 Spark 与 Hadoop 对比 2.1 快速 Spark 的中间数据放到内存中,对于迭代运算效率更高。Spark 更适合于迭代运算比较多 的 ML 和 DM 运算。因为在 Spark 里面,有 RDD 的抽象概念。 2.2 灵活 1. Spark 提供的数据集操作类型有很多种,不像
    0 码力 | 3 页 | 172.14 KB | 1 年前
    3
  • pdf文档 Hadoop 概述

    或者加载数据到文本文件或者基于文本文件的 Hive 表中。分区也可 以在从 Hive 分区表中查询或加载时被删减。 另一种 Oracle 解决方案 Oracle Loader for Hadoop 是一种高性能 且高效率的连接器,用于从 Hadoop 中加载数据到 Oracle 数据库。 当 Hadoop 发起数据传送时,Oracle Loader for Hadoop 将数据推送到 数据库中。如图 1-9 所示。Oracle 之相关的组件,均能得到直接收益。它推翻了以前认为只有依靠数 据挖掘工具才能实现的界限,使你能够以一种截然不同的方式来查 看数据。Hadoop 并不能替代组织查看数据的方式,却能显著提高其 查看数据的效率。Hadoop 排除了各种局限性,并且正在各个新领域 中继续发展。 理解 Hadoop 的存储系统将使你能够利用数据集成和业务分析 来汇总大型数据湖并分析各种数据类型,而且不依赖于它们的当前
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
  • pdf文档 大数据集成与Hadoop - IBM

    节点间,单个作业对所有 分区数据执行相同的应用 程序逻辑。 形成设计隔离的环境 设计一个数据处理作业, 并且无需重新设计和重新 调整作业,即可在任何硬 件配置中使用它。 使用它。这些功能对于通过提升效率来降低成本至关重要。没 有它们,该平台将无法处理大量的大数据。 InfoSphere Information Server数据集成产品组合 支持4大海量数据可扩展性架构特征。请在Forrester报 选择并行RDBMS、Hadoop和可扩展的ETL网格来运行大数据 集成工作负载。但无论选择哪种方法,信息基础架构都必须满足 一个常见的要求:全面支持大规模可扩展处理。 某些数据集成操作在RDBMS引擎内外的运行效率较高。同样, 并非所有数据集成操作均适用于Hadoop环境。设计精妙的架 构必须足够灵活,可以充分利用系统中每个环境的优势(参见 图3)。 在ETL网格中运行 在数据库中运行 在Hadoop中运行
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
  • pdf文档 大数据时代的Intel之Hadoop

    数据库虚拟大表功能,实现 HBase 数据库复制和备仹功能, 等等。 提供底层 Hadoop 性能优化算法和稳定性增强 •基亍 Hadoop 底层的大量优化算法,配合英特尔优化架构,使应用效率更高、计算存储分布更均衡,系统安装程序计算得出的优化参数配置,适合大多数 应用情冴,不硬件技术相结合,提高平台性能 提供企业必须的管理和监控功能 •提供独有的基亍浏览器的集群安装和管理界面,
    0 码力 | 36 页 | 2.50 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(生产调优手册)

    集群间数据拷贝 尚硅谷大数据技术 之集群迁移(Apache和CDH).doc 第 8 章 MapReduce 生产经验 8.1 MapReduce 跑的慢的原因 MapReduce 程序效率的瓶颈在于两点: 1)计算机性能 CPU、内存、磁盘、网络 2)I/O 操作优化 (1)数据倾斜 (2)Map 运行时间太长,导致 Reduce 等待过久 (3)小文件过多
    0 码力 | 41 页 | 2.32 MB | 1 年前
    3
共 7 条
  • 1
前往
页
相关搜索词
通过Oracle并行处理并行处理集成Hadoop数据3.0以及未来Spark简介对比概述大数IBM时代Intel硅谷技术生产调优手册
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩