HDFS - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

微服务架构实践-唯品会

��! ��! ��! ��! ��! JVM��! ��! ��! ��! ��! ��! ES�mysql,Cassandra,� �! Hbase! ES�H2! mysql,hdfs! 34 Pinpoint�� • Collector, ��agent�� Hbase� • Agent, �� JVM��Java�� Cache! …! ��! HttpThread ��! ��Call��! ��SQL��! ��Cache� �! …! ��! ThreadContext hdfs! mysql! �� Receiver! Receiver! Receiver! Queues Analyzer! Analyzer Analyzer � � �� • �� • ��hdfs��hdfs �� • �� • ��

0 码力 | 120 页 | 82.16 MB | 1 年前
3
高可用分布式流数据存储设计-李玥

如何实现？如何优化？ WHY 为什什么需要流数据存储？单体应⽤用烟筒式 SOA 微服务那些年年的服务 MySQL ES HDFS KV HBase Hive 这些年年的数据 Services Data MySQL ES HDFS KV HBase Hive 统⼀一的流数据存储平台我们的愿景 Services Streaming Storage Data

0 码力 | 36 页 | 6.02 MB | 1 年前
3
美团点评2018技术年货

件Mafka和开源消息中间件Kafka，以消息的形式上报上来，方便我们后续的处理，MQ的方式能够让系统更好的解耦，并且具备更高的吞吐量，还可以指定消费的起始时间点，做到消息的回溯。 2. 历史数据的来源主要是我们的Hive和HDFS，可以方便的做到大数据量的存储和并行计算。离线计算简介离线计算简介在离线处理这块，主要包含了MR模块和Spark模块，我们的一些ETL操作，就是基于MR模块的，一些用户行为数据的深度 fka2Hive任务成功完成数据传输后，由Camus负责在相应的HDFS 目录下记录该任务的启动时间。Checkdone会扫描前一天的所有时间戳，如果最大的时间戳已经超过了0 点，就说明前一天的Kafka2Hive任务都成功完成了，这样Checkdone就完成了检测。此外，由于Camus本身只是完成了读Kafka然后写HDFS文件的过程，还必须完成对Hive分区的加载才能使下游查询到。 binlog库下的一张表中，即前面图中的original_binlog.*db*，其中存储的是对应到一个MySQL DB的全部Binlog。上图说明了一个Kafka2Hive完成后，文件在HDFS上的目录结构。假如一个MySQL DB叫做user，对应的 Binlog存储在original_binlog.user表中。ready目录中，按天存储了当天所有成功执行的Kafka2Hive任务

0 码力 | 229 页 | 61.61 MB | 1 年前
3
钟阳红-Apache Ballista Introduction

DAG and fault tolerance • Support data exchange • Support different kinds of object stores, like HDFS, S3, Azure, etc • Support data cache and cache aware task scheduling Overview Cluster Setup The

0 码力 | 17 页 | 2.66 MB | 1 年前
3
2.5 Go在猎豹移动的应用

服务应该是无状态的；  api服务出现瓶颈的时候，直接scale out；  graceful restart依赖健康检测；  api质量监控，使用日志来追踪，通过本地日志+flume+hdfs+hive；  实时监控可以考虑flume sink到kafka，再依赖Spark计算； RPC  协议&远程调用的选型；  net/rpc，thrift，grpc等；

0 码力 | 24 页 | 4.26 MB | 1 年前
3
海尔实时计算平台技术选型与实践

Topology Monitor Server Message Notification 实时计算质量保证实时计算结果正确性如何验证？方案一：结果导向 Source Flume HDFS Kafka Storm Mr / Impala Result Result 备份比对方案二：经验值 w1 w2 current w1 w2 w3 … … w1 w2

0 码力 | 41 页 | 3.21 MB | 1 年前
3
从百度文件系统看大型分布式系统设计中的定式与创新

分布式存储系统设计的特殊性 • 最基础服务的提供者 - 不可能做成无状态的 • 最底层的仲裁者 - 不能依赖ZooKeeper等系统选主 - 分布式的双主问题只从存储系统解决这些设计给BFS带来哪些优势? HDFS BFS 名字节点扩展方式联邦式分裂的目录树分布式统一的目录树宕机恢复时间分钟级秒级外部依赖 ZooKeeper & QJM 无开发语言 Java C++

0 码力 | 24 页 | 937.45 KB | 1 年前
3
Spring Boot 3.2.3-SNAPSHOT Reference Documentation

pulsar-io-flume 3.1.2 org.apache.pulsar pulsar-io-hbase 3.1.2 org.apache.pulsar pulsar-io-hdfs2 3.1.2 org.apache.pulsar pulsar-io-hdfs3 3.1.2 org.apache.pulsar pulsar-io-http 3.1.2 org.apache.pulsar pulsar-io-influxdb

0 码力 | 975 页 | 17.43 MB | 1 年前
3
Spring Boot 3.2.9-snapshot Reference Documentation

pulsar-io-flume 3.1.3 org.apache.pulsar pulsar-io-hbase 3.1.3 org.apache.pulsar pulsar-io-hdfs2 3.1.3 org.apache.pulsar pulsar-io-hdfs3 3.1.3 org.apache.pulsar pulsar-io-http 3.1.3 org.apache.pulsar pulsar-io-influxdb

0 码力 | 976 页 | 17.49 MB | 1 年前
3
Spring Boot 3.2.7 Reference Documentation

pulsar-io-flume 3.1.3 org.apache.pulsar pulsar-io-hbase 3.1.3 org.apache.pulsar pulsar-io-hdfs2 3.1.3 org.apache.pulsar pulsar-io-hdfs3 3.1.3 org.apache.pulsar pulsar-io-http 3.1.3 org.apache.pulsar pulsar-io-influxdb

0 码力 | 974 页 | 17.47 MB | 1 年前
3

共 78 条前往

页

分类

语言

格式

微服务架构实践-唯品会

高可用分布式流数据存储设计-李玥

美团点评2018技术年货

钟阳红-Apache Ballista Introduction

2.5 Go在猎豹移动的应用

海尔实时计算平台技术选型与实践

从百度文件系统看大型分布式系统设计中的定式与创新

Spring Boot 3.2.3-SNAPSHOT Reference Documentation

Spring Boot 3.2.9-snapshot Reference Documentation

Spring Boot 3.2.7 Reference Documentation