积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(9)Hadoop(9)

语言

全部中文(简体)(8)西班牙语(1)

格式

全部PDF文档 PDF(9)
 
本次搜索耗时 0.017 秒,为您找到相关结果约 9 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 西班牙语
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 通过Oracle 并行处理集成 Hadoop 数据

    白皮书 — 通过 Oracle 并行处理集成 Hadoop 数据 引言 许多垂直行业都在关注文件系统中庞大的数据。这些数据中通常包含大量无关的 明细信息,以及部分可用于趋势分析或丰富其他数据的精华信息。尽管这些数据 存储在数据库之外,但一些客户仍然希望将其与数据库中的数据整合在一起以提 取对业务用户有价值的信息。 本文详细介绍了如何从 Oracle 实现本文所述的数据库内的 mapreduce。通常情况 下,Oracle Database 11g 中的并行执行框架足以满足针对外部表大多数的并行操作。 在有些情况下(例如,如果 FUSE 不可用),外部表方法可能不适用。Oracle 表函数提供了 从 Hadoop 中获取数据的替代方法。本文附带的示例展示了一种这样的方法。更深入地来 讲,我们用一个表函数来实现,这个表函数使用 DBMS_SCHEDULER 白皮书 — 通过 Oracle 并行处理集成 Hadoop 数据 mapper 进程处理数据,并在第 5 步写入一个队列。在本文的示例中,我们选择了一个在集群 范围内可用的队列。现在,我们只是单纯地将任何输出直接写入到队列里。您可以通过批量 处理输出并将其移入队列来提高性能。显然,您也可以选择管道和关系表等其他各种机制。 随后的第 6 步是出队过程,这是通
    0 码力 | 21 页 | 1.03 MB | 1 年前
    3
  • pdf文档 大数据集成与Hadoop - IBM

    工作 负载迁移到运行Hadoop的硬件环境,从而帮助将处理工 作移到数据存储位置,并充分利用Hadoop和ETL处理 硬件。 资源管理系统(如IBM Platform™ Symphony)还可用 于管理Hadoop环境内外的数据集成工作负载。 这意味着,虽然InfoSphere DataStage与数据可能不在 同一个节点上运行,但却在同一个高速背板上运行,因而无 需将数据移出Hadoop环境,也无需在速度较低的网络连 构建工作流,其中包括通过Oozie直接按作业序列定义 的基于Hadoop的活动,以及其他数据集成活动 大数据集成的行政管理必须包括: • 基于Web的集成式安装程序,用于执行所有功能 • 高可用性配置,用于满足全天候需求 • 灵活的部署选项,用于部署新实例或展开经过优化的专 家硬件系统上的现有实例 • 集中实现身份验证、授权和会话管理 • 审核安全相关事件的日志记录,推动满足《萨班斯奥克 Jeopardy Productions, Inc.。JEOPARDY!是 Jeopardy Productions, Inc. 的注册商标。保留所有权利。 本出版物中对IBM产品和服务的引用不代表它们可用于所有IBM运营的国家。客 户成功案例可从ibm.com/software/success/cssdb.nsf获得 本文中包含的信息仅供参考。虽然在检查本文信息时尽量保证其完整性和准确 性,但
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(生产调优手册)

    —————————— 更多 Java –大数据 –前端 –python 人工智能资料下载,可百度访问:尚硅谷官网 dfs.namenode.safemode.min.datanodes:最小可用 datanode 数量,默认 0 dfs.namenode.safemode.threshold-pct:副本数达到最小要求的 block 占系统总 block 数的 百分比,默认 0.999f。(只允许丢一个块) Buffer中的数据达到多少比例 开始写入磁盘,默认值0.66。可以提高到0.75 2)mapreduce.reduce.shuffle.input.buffer.percent Buffer大小占Reduce可用内存的比例,默认值0.7。可以提高到0.8 7)mapreduce.reduce.maxattempts每个Reduce Task最大重试次数, 一旦重试次数超过该值,则认为Map Task运行失败,默认值:4。 –大数据 –前端 –python 人工智能资料下载,可百度访问:尚硅谷官网 5 mapreduce.reduce.shuffle.input.buffer.percent 0
    0 码力 | 41 页 | 2.32 MB | 1 年前
    3
  • pdf文档 银河麒麟服务器操作系统V4 Hadoop 软件适配手册

    力系统等国家关键行业的服务器应用领域,突出高安全性、高可用性、高效数据 处理、虚拟化等关键技术优势,针对关键业务构建的丰富高效、安全可靠的功能 特性,兼容适配长城、联想、浪潮、华为、曙光等国内主流厂商的服务器整机产 品,以及达梦、金仓、神通等主要国产数据库和中创、金蝶、东方通等国产中间 件,满足虚拟化、云计算和大数据时代,服务器业务对操作系统在性能、安全性 及可扩展性等方面的需求,是一款具有高安全、高可用、高可靠、高性能的自主
    0 码力 | 8 页 | 313.35 KB | 1 年前
    3
  • pdf文档 Hadoop 3.0以及未来

    YARN的Web页面的增强 • MapReduce YARN Timeline Service v.2 • 扩展性 分布式读写 读写分离 HBase存储 YARN Timeline Service v.2 • 可用性 流(flow) 聚合(aggregation) YARN Federation • YARN-2915 允许YARN的集群扩展到一万个戒更多个节点 YARN的集群的集群对用户来说是一个整体的集群
    0 码力 | 33 页 | 841.56 KB | 1 年前
    3
  • pdf文档 大数据时代的Intel之Hadoop

    - 跨数据中心大表 虚拟大表 分中心 A 分中心 B 分中心 C 特点与优势 全局虚拟大表,访问方便 大表数据分区存放在物理分中心 接入仸何分中心可访问全局数据 高可用性 适合本地高速写入 分布式聚合计算,避免大数据传输 英特尔Hadoop发行版 – 主要特色 经实际验证的企业级 Hadoop 发行版 •全面测试的企业级发行版,保证长期稳定运行,集
    0 码力 | 36 页 | 2.50 MB | 1 年前
    3
  • pdf文档 Hadoop 概述

    也有类似 的属性。它是产品平台的结合,由平台拥有者所开发的核心组件所 定义,辅之以自动化(机器脱离人类自主运转)企业在其周边(围绕着 一个空间)所开发的应用程序。 以 Apache 的多种可用产品和大量供应商提供的将 Hadoop 与企 业工具相集成的解决方案为基础,Hadoop 的开放源码和企业生态系 统还在不断成长。HDFS是该生态系统的主要组成部分。由于Hadoop 有着低廉的商业成本,因此很容易去探索
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
  • pdf文档 Hadoop 迁移到阿里云MaxCompute 技术方案

    请确保您的 Hadoop 集群所在的 IDC 网络,与您选择的阿里云服务(MaxCompute、 Dataworks)所在的 Region 能够正常建立网络连接。如果无法访问,建议您预先拉专线, 保证网络可用。 Alibaba Cloud MaxCompute 解决方案 56 2、 您可以使用 MMA Agent 的 network-measurement-tool 工具检查您的 Hadoop
    0 码力 | 59 页 | 4.33 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(入门)

    间进行数据的传递,可以将一个关系型数据库(例如 :MySQL,Oracle 等)中的数据导进 到 Hadoop 的 HDFS 中,也可以将 HDFS 的数据导进到关系型数据库中。 2)Flume:Flume 是一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统, Flume 支持在日志系统中定制各类数据发送方,用于收集数据; 3)Kafka:Kafka 是一种高吞吐量的分布式发布订阅消息系统;
    0 码力 | 35 页 | 1.70 MB | 1 年前
    3
共 9 条
  • 1
前往
页
相关搜索词
通过Oracle并行处理并行处理集成Hadoop数据大数IBM硅谷技术生产调优手册银河麒麟服务务器服务器操作系统操作系统V4软件适配3.0以及未来时代Intel概述迁移阿里MaxCompute方案入门
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩