积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(6)Hadoop(6)

语言

全部中文(简体)(5)西班牙语(1)

格式

全部PDF文档 PDF(6)
 
本次搜索耗时 0.013 秒,为您找到相关结果约 6 个.
  • 全部
  • 云计算&大数据
  • Hadoop
  • 全部
  • 中文(简体)
  • 西班牙语
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 尚硅谷大数据技术之Hadoop(入门)

    8)Hive:Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张 数据库表,并提供简单的 SQL 查询功能,可以将 SQL 语句转换为 MapReduce 任务进行运 行。其优点是学习成本低,可以通过类 SQL 语句快速实现简单的 MapReduce 统计,不必开 发专门的 MapReduce 应用,十分适合数据仓库的统计分析。 9)ZooKeeper:它是一个 注:Extra Packages for Enterprise Linux 是为“红帽系”的操作系统提供额外的软件包, 适用于 RHEL、CentOS 和 Scientific Linux。相当于是一个软件仓库,大多数 rpm 包在官方 repository 中是找不到的) [root@hadoop100 ~]# yum install -y epel-release (3)注意:如果 Linux -r atguigu@hadoop102:/opt/module/* atguigu@hadoop104:/opt/module 2)rsync 远程同步工具 rsync 主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。 rsync 和 scp 区别:用 rsync 做文件的复制要比 scp 的速度快,rsync 只对差异文件做更 新。scp 是把所有文件都复制过去。
    0 码力 | 35 页 | 1.70 MB | 1 年前
    3
  • pdf文档 Hadoop 迁移到阿里云MaxCompute 技术方案

    ..................................................................... 15 3.1 迁移基于 Hadoop 的数据湖/数据仓库业务负载 ......................................................................... 15 3.2 不同的网络环境及部署形态迁移 越来越复杂的技术架构和运维成本、平台 的稳定性和安全性、资源的弹性伸缩能力都遇到了瓶颈,严重阻碍了客户数据业务的发展。随着 云计算技术的发展和普及,越来越多的企业客户选择数据上云,在云上构建数据仓库。以云数 仓、云计算为核心的企业服务架构成为新一代大数据建站的主流趋势。MaxCompute 作为云数 仓、云计算的核心引擎,承载了越来越多企业客户的数据业务和数据资产,免运维、低成本、高 度 Hadoop 及开源生态与阿里云大数据生态对比 2.1.1 主流大数据体系架构 Hadoop 及开源生态由一系列的开源组件共同组成,很多用户基于 Hadoop 及开源生态组件构 建企业数据仓库/数据湖、机器学习、实时分析、BI 报表等大数据应用。我们常见的大数据架构 的逻辑组件关系如下图所示: 这些逻辑组件包括:  数据源:数据源包括关系型数据库、日志文件、实时消息等。
    0 码力 | 59 页 | 4.33 MB | 1 年前
    3
  • pdf文档 Hadoop 概述

    的一部分,但现在它是一个独立的 组件。之所以在这里简单提及,是因为有些用户发现在标准的 Hadoop Stack 之外,它还是很有用处。 我们可以这样简单总结 Hive:它是建立在 Hadoop 顶层之上的 数据仓库基础设施,用于提供对数据的汇总、查询以及分析。如果 你在使用 Hadoop 工作时期望数据库的体验并且怀念关系型环境中 的结构(见图 1-3),那么它或许是你的解决方案。记住,这不是与传 统的 Excel、Power View 和 PowerPivot)良 Hadoop 大数据解决方案 12 好地集成,创造出轻松分析这些大规模商业信息的独特方式。 访问数据 数据库、数据仓库 POWER CENTER Power Exchange 预处理 抽取数据 Web 服务器 批处理 消息队列、电子邮件、 社交媒介 大型主机 实时 图 1-6 开发人员正在设计和定义基于 Hadoop 的大规模企业数据的最佳实 践。企业以及 IT 社区都非常关注各种数据类型的可扩展性。使用 Hadoop,公司便不再局限于昂贵的企业级解决方案或者价格不菲的 数据仓库设备。 Hadoop 并不是大多数组织现有富数据环境的替代品。在考虑使 用 Hadoop 时,也要同样重视其他方面,例如 MapReduce 或 YARN, 它们在做深度数据分析和高级分析方面取得了重大进步。Hadoop
    0 码力 | 17 页 | 583.90 KB | 1 年前
    3
  • pdf文档 大数据集成与Hadoop - IBM

    图1. 海量数据可扩展性是一项大数据集成的强制要求。在大数据时代,企业必须支持MPP群集系统才能实现扩展。 支持海量数据可扩展性的需求并非只与Hadoop基础架构的出 现有关。多年来,领先的数据仓库供应商(如IBM和Teradata) 和领先的数据集成平台(如IBM ® InfoSphere ® Information Server)纷纷提供可支持海量数据可扩展性的非共享大规模并 由于几乎所有Hadoop大数据用例和场景都需要首先进行大数 据集成,所以企业必须确定如何优化整个企业的此类工作负载。 一个Hadoop与大数据集成的重要用例是将大型ETL工作负载 从企业数据仓库 (EDW) 卸载下来,以便降低成本并改善查询 服务水平协议 (SLA)。该用例会引发以下问题: • 企业是否应卸载EDW中的所有ETL工作负载? • 是否应将所有大数据集成工作负载都推送到Hadoop? 收集:通过收集来捕获资产,并开展具体的分析或治理 工作 • 协作:共享其他内容管理和治理集合 • 治理:创建并引用信息治理策略和规则;应用数据质 量、屏蔽、归档和清除操作 • 卸载:单击HDFS来复制数据并执行分析,以便强化仓库 • 分析:分析已卸载的数据 • 重用和信任:了解如何通过沿袭功能运用数据进行分析 和报告 通过部署全面的数据治理计划,您可以构建环境来帮助确保 所有Hadoop数据具有出色的品质、安全可靠且适合使用目
    0 码力 | 16 页 | 1.23 MB | 1 年前
    3
  • pdf文档 大数据时代的Intel之Hadoop

    140,000 160,000 180,000 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 Exponential Growth 内容仓库– 海量/非结构化 传统非结构化数据 传统结构化数据 企业托管服务中的数据 Linear Growth Source: IDC, 2011 Worldwide Enterprise 稳定的企业级hadoop发行版 利用硬件新技术迚行优化 HBase改迚和创新,为Hadoop提供实时数据处理能力 针对行业的功能增强,应对丌同行业的大数据挑戓 Hive 0.9.0 交互式数据仓库 Sqoop 1.4.1 关系数据ETL工具 Flume 1.1.0 日志收集工具 Intel Hadoop Manager 2.2 安装、部署、配置、监控、告警和访问控制
    0 码力 | 36 页 | 2.50 MB | 1 年前
    3
  • pdf文档 尚硅谷大数据技术之Hadoop(生产调优手册)

    (4)查看存储路径的数据单元和校验单元,并作破坏实验 5.2 异构存储(冷热数据分离) 异构存储主要解决,不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 RAM_DISK:(内存镜像文件系统) SSD:(SSD固态硬盘) DISK:(普通磁盘,在HDFS中,如果没有主动声明数据目录存储类型默认都是DISK) ARCHIVE:(没有特指哪种存储介质,主要的指的是计算能力比较 (3)向集群上传一个文件 6.2 集群安全模式&磁盘修复 1)安全模式:文件系统只接受读数据请求,而不接受删除、修改等变更请求 2)进入安全模式场景 ➢ NameNode 在加载镜像文件和编辑日志期间处于安全模式; ➢ NameNode 再接收 DataNode 注册时,处于安全模式 3)退出安全模式条件 尚硅谷大数据技术之
    0 码力 | 41 页 | 2.32 MB | 1 年前
    3
共 6 条
  • 1
前往
页
相关搜索词
硅谷大数技术Hadoop入门迁移阿里MaxCompute方案概述集成IBM时代Intel生产调优手册
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩