高可用分布式流数据存储设计-李玥如何实现?如何优化? WHY 为什什么需要流数据存储? 单体应⽤用 烟筒式 SOA 微服务 那些年年的服务 MySQL ES HDFS KV HBase Hive 这些年年的数据 Services Data MySQL ES HDFS KV HBase Hive 统⼀一的流数据存储平台 我们的愿景 Services Streaming Storage Data0 码力 | 36 页 | 6.02 MB | 1 年前3
海尔实时计算平台技术选型与实践Topology Monitor Server Message Notification 实时计算质量保证 实时计算结果正确性如何验证? 方案一:结果导向 Source Flume HDFS Kafka Storm Mr / Impala Result Result 备 份 比 对 方案二:经验值 w1 w2 current w1 w2 w3 … … w1 w20 码力 | 41 页 | 3.21 MB | 1 年前3
从百度文件系统看大型分布式系统设计中的定式与创新分布式存储系统设计的特殊性 • 最基础服务的提供者 - 不可能做成无状态的 • 最底层的仲裁者 - 不能依赖ZooKeeper等系统选主 - 分布式的双主问题只从存储系统解决 这些设计给BFS带来哪些优势? HDFS BFS 名字节点 扩展方式 联邦式 分裂的目录树 分布式 统一的目录树 宕机恢复时间 分钟级 秒级 外部依赖 ZooKeeper & QJM 无 开发语言 Java C++0 码力 | 24 页 | 937.45 KB | 1 年前3
共 3 条
- 1













