积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(8)Hadoop(8)

语言

全部中文(简体)(7)西班牙语(1)

格式

全部PDF文档 PDF(8)
 
本次搜索耗时 0.016 秒,为您找到相关结果约 8 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 西班牙语
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 大数据集成与Hadoop - IBM

    IBM软件 2014 年 9 月 大数据集成与 Hadoop 可最大限度降低Hadoop计划风险并提高ROI的最佳实践 2 大数据集成与 Hadoop 简介 Apache Hadoop技术通过支持新的流程和架构,不断改进 大数据措施的经济性和活力,这样不仅有助于削减成本、增加 收益,而且还能树立竞争优势。Hadoop是一个开源软件项目, 支持在多个商业服务器群集间分散处理和存储大型数据集, (请阅读此报告,其中对Hadoop为何并非数据集成平台进行了 讨论)。更加糟糕的是,一些Hadoop软件供应商利用炒作、神 话、误导或矛盾信息来渗透市场。 为彻底切断这种误导,并开发适合您的Hadoop大数据项目的 采用计划,必须遵循最佳实践方法,充分考虑各种新兴技术、可 扩展性需求以及当前的资源和技能水平。面临的挑战:创建最佳 的大数据集成方法和架构,同时避免各种实施缺陷。 海量数据可扩展性:总体要求 如果您 说明Hadoop卓尔不群的言论。充分使用Hadoop的神话 与现实之间存在巨大的反差,这在大数据集成方面表现尤为 突出。很多业界传言称,任何不可扩展的抽取、转换和加载 (ETL) 工具搭配Hadoop后都会得到高性能、高度可扩展 的数据集成平台。 事实上,MapReduce的设计宗旨并非是对海量数据进行 高性能处理,而是为了实现细粒度的容错。这种差异可能会 使整体性能和有效性降低一个数量级乃至更多。
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
  • pdf文档 Hadoop 迁移到阿里云MaxCompute 技术方案

    储,我们也常称之为数据湖。如 HDFS、对象存储服务等。  批处理:由于大数据场景必须处理大规模的数据集,批处理往往需要从数据存储中读取大量 数据进 行长 时间 处理 分析 ,并将 处理 后的 数据 写 入 新的 数据 对象 供后 续使 用。如 Hive、 MapReduce、Spark 等。 Alibaba Cloud MaxCompute 解决方案 8  实时消息采集:用于实时数 Streaming、Storm 等。  机器学习:满足机器学习工作负载的服务。如当前流行的 Spark MLib/ML、Tensorflow 等。  分析型数据存储:对数据进行处理加工后,面向应用场景,将数据以结构化的方式进行存储, 以便分析工具或分析应用能够获取数据。如利用 MPP 数据仓库、Spark SQL 等支持 BI 工具 访问,利用 Hbase 实现低延迟的在线服务等 项目支持企业从创业团队发展到独角兽的 数据规模需求; 数据分布式存储,多副本冗余,数据存储对外仅开放表的 操作接口,不提供文件系统访问接口 自研数据存储结构,表数据列式存储,默认高度压缩,后 D k n e P y l w s o u ) ( ( f I w s A n t S B M / ) g p L K n T i Q w s J C R a b b C v
    0 码力 | 59 页 | 4.33 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(生产调优手册)

    (2)分发配置并重启 Yarn 集群 3)测试结果分析 (1)由于副本 1 就在本地,所以该副本不参与测试 一共参与测试的文件:10 个文件 * 2 个副本 = 20 个 压测后的速度:1.61 实测速度:1.61M/s * 20 个文件 ≈ 32M/s 三台服务器的带宽:12.5 + 12.5 + 12.5 ≈ 30m/s 所有网络资源都已经用满。 如果实测 生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可 以执行磁盘数据均衡命令。(Hadoop3.x 新特性) (1)生成均衡计划(我们只有一块磁盘,不会生成计划) hdfs diskbalancer -plan hadoop103 (2)执行均衡计划 hdfs diskbalancer -execute hadoop103.plan.json (3)查看当前均衡任务的执行情况 5)等待退役节点状态为 decommissioned(所有块已经复制完成),停止该节点及节点资源 管理器。注意:如果副本数是 3,服役的节点小于等于 3,是不能退役成功的,需要修改 副本数后才能退役 [atguigu@hadoop105 hadoop-3.1.3]$ hdfs --daemon stop datanode stopping datanode [atguigu@hadoop105
    0 码力 | 41 页 | 2.32 MB | 1 年前
    3
  • pdf文档 Hadoop 概述

    Hadoop 并不是你能够应付的任务。建议在尝试安装 Hadoop 之前,你需要 先熟悉此类环境。 1.1.2 Hadoop 分布式文件系统(HDFS) 在 Hadoop Common 安装完成后,是时候该研究 Hadoop Stack 的其余组件了。HDFS(Hadoop Distributed File System)提供一个分布 式文件系统,设计目标是能够运行在基础硬件组件之上。大多数企 Hive Thrift 服务器 驱动程序 解析器 执行 Hive Web 接口 计划器 优化器 MS 客户端 元存储 图 1-3 1.4 与其他系统集成 如果在科技领域工作,你一定清楚地知道集成是任何成功实现 中必不可少的部分。一般来说,通过一些发现流程或计划会议,组 织可以更高效地确定管理大数据的需求。后续步骤包括做出关于如 何将 Hadoop 落实到现有环境的决定。 消息队列、电子邮件、 社交媒介 大型主机 实时 图 1-6 这并不意味着 Hadoop 或者其他数据平台的解决方案无法在非 Windows 环境下运行。你应该细心检查现有的或者计划使用的环境 以决定最优解决方案。数据平台或者数据管理平台正如其名。它是 一个集中式计算系统,用于收集、集成和管理大型结构化和非结构 化数据集。 从理论上讲,无论 HortonWorks,还是
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
  • pdf文档 大数据时代的Intel之Hadoop

    SATA硬盘, 千兆以太网 测试用例和性能  向HBase集群插入1KB大小的记录  每台服务器平均每秒插入1万条记录,峰值在2万条记录  每台服务器,从磁盘扫描数据,每秒完成400个扫描。 一次扫描从HBase表中获得单个用户一个月内的所有记录(平均100条) 0 0.2 0.4 0.6 0.8 1 ren 0 0 10000 20000 30000
    0 码力 | 36 页 | 2.50 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(入门)

    export PATH=$PATH:$HADOOP_HOME/bin export PATH=$PATH:$HADOOP_HOME/sbin ➢ 保存并退出: :wq (3)让修改后的文件生效 [atguigu@hadoop102 hadoop-3.1.3]$ source /etc/profile 6)测试是否安装成功 [atguigu@hadoop102 hadoop-3 公钥(A) 授权key Authorized_keys 2)拷贝 3)ssh 访问B(数 据用私钥A加密) A服务器 B服务器 4)接收到数据后,去授 权key中查找A的公钥, 并解密数据。 5)采用A公钥加 密的数据返回给A 6 接收到数 据后,用A的 私钥解密数 据 (2)生成公钥和私钥 [atguigu@hadoop102 .ssh]$ pwd /home/atguigu/ 上传大文件 [atguigu@hadoop102 ~]$ hadoop fs -put /opt/software/jdk-8u212- linux-x64.tar.gz / (2)上传文件后查看文件存放在什么位置 ➢ 查看 HDFS 文件存储路径 [atguigu@hadoop102 subdir0]$ pwd /opt/module/hadoop-3.1.3/data/df
    0 码力 | 35 页 | 1.70 MB | 1 年前
    3
  • pdf文档 Hadoop开发指南

    Hadoop开发指南 开发指南 注解:本例中所运⾏脚本需在CentOS操作系统上,其他操作系统请修改脚本后再尝试执⾏。 1. 在 在UHost上安装 上安装Hadoop客户端 客户端 出于安全性考虑,⼀般建议⽤⼾在⾮UHadoop集群机器上安装客⼾端进⾏任务提交与相关操作 1.1 控制台安装 控制台安装 可通过控制台⼀键安装,参考:客⼾端安装。 1.2 ⾃⾏安装 ⾃⾏安装 针对部分存 password port client_ip: 客⼾机IP client_user: 客⼾机上需要安装客⼾端的⽤⼾名 password: 客⼾机root密码 port:客⼾机ssh连接端⼝ 安装完成后,请重新登录客⼾机或执⾏source ~/.bashrc 1.2.2 ⾃⾏安装 ⾃⾏安装 安装jdk,从集群master1节点上拷⻉安装包到UHost: scp -r root@master_ip:/usr/java
    0 码力 | 12 页 | 135.94 KB | 1 年前
    3
  • pdf文档 银河麒麟服务器操作系统V4 Hadoop 软件适配手册

    为单位分 配资源。 Client 向 ResourceManager 提交的每一个应用程序都必须有一个 Application Master,它经过 ResourceManager 分配资源后,运行于某一个 Slave 节点的 Container 中,具体做事情的 Task,同样也运行与某一个 Slave 节点的 Container 中。RM, NM,AM 乃至普通的 Container
    0 码力 | 8 页 | 313.35 KB | 1 年前
    3
共 8 条
  • 1
前往
页
相关搜索词
大数集成HadoopIBM迁移阿里MaxCompute技术方案硅谷生产调优手册概述时代Intel入门开发指南银河麒麟服务务器服务器操作系统操作系统V4软件适配
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩