大数据时代的Intel之Hadoop
大数据时代的Intel乊Hadoop 系统方案架构师:朱海峰 英特尔®中国于计算创新中心 2013.4 北京 法律声明 本文所提供乊信息均不英特尔® 产品相关。本文丌代表英特尔公司戒其它机构向仸何人明确戒隐含地授予仸何知识产权。除相关产品的英特尔销售条款不条件中列明乊担保条件以外,英特 尔公司丌对销售和/戒使用英特尔产品做出其它仸何明确戒隐含的担保,包括对适用亍特定用途、适销 些设备的质量、可靠性、功能戒兼容性丌提供仸何担保戒保证。本列表和/戒这些设备可随时更改,恕丌另行通知。 版权所有 © 2012 英特尔公司。所有权保留。 提纲 • 大数据时代的新挑戓 • 大数据时代的Intel • 关注产业应用,产研相亏促迚 从文明诞生到2003年,人类文明产生了 5EB的数据; 而今天,我们每两天产生5EB的数据。 Eric Schmidt PB)数据, 2015 年150亿部接入设备 大数据时代的数据 2011年每天处理的数据超 过: 24 PB 2011年6月乊前, Facebook平台每天分享资 料: 40亿 智慧城市数据 中国某一线城市: 200PB/季度 中国一线城市健康档案数 据: 5.5 million 传统的数据处理技术 大数据时代的数据 速度 数据量 多样化 传统数据0 码力 | 36 页 | 2.50 MB | 1 年前3Apache Pulsar,云原生时代的消息平台 - 翟佳
Apache Pulsar 云原⽣时代的消息平台 翟佳 streamnative.io ⾃我介绍 • 开源项⽬爱好者: • Apache Pulsar PMC成员 • Apache BookKeeper PMC成员 • EMC -> StreamNative • 华中科⼤ -> 中科院计算所 • Pulsar 的根本不同 • Apache Pulsar 简介 • Pulsar0 码力 | 39 页 | 12.71 MB | 5 月前0.03云时代下多数据计算引擎的设计与实现
All rights reserved. OpenPie Confidential @2024 OpenPie. All rights reserved. OpenPie Confidential 云时代下多数据计算引擎的设计与实现 郭罡 CTO 拓数派(OpenPie) @2024 OpenPie. All rights reserved. OpenPie Confidential 关 于 存储底座是各计算引擎的载体. • 已落地或者正在落地:IoT、金融、新能源、医疗等行业. @2024 OpenPie. All rights reserved. OpenPie Confidential 云时代 数据计算 多数据模态支持 广泛的生态支持 “一份数据,多引擎计算”的述求 让数据流动起来 @2024 OpenPie. All rights reserved. OpenPie Confidential0 码力 | 15 页 | 3.09 MB | 1 年前3云原生时代分布式链路追踪实践-曲赛
云原生时代分布式链路 追踪实践 2021-08 曲赛 (saiqu) 微服务架构的困境 故障定位难 极高的沟通和交接成本 错综难懂的模块依赖关系 链路梳理难 日志分散 定位过程“击鼓传花” 跨端性能瓶颈分析繁杂 性能分析难 缺乏对系统整体认知的把控 不合理的调用关系 不合理的直连存储 架构治理能力匮乏 云原生可观测性 3 4 Trace 标准规范 5 标准0 码力 | 17 页 | 2.47 MB | 1 年前3大模型时代下向量数据库的设计与应用
大模型时代下向量数据库的设计与应用 个人简介 目前在拓数派负责向量数据库PieCloudVector产品,聚焦于大模型 与大数据领域。拥有多年数据库内核研发和配套解决方案架构经验, 在加入拓数派前曾就职于开源大数据平台Greenplum团队,担任外部 数据源访问框架,对象存储访问扩展,ETL工具等产品模块的研发, 并曾参与PostgreSQL多个版本的代码贡献,拥有丰富的存储模块核心0 码力 | 28 页 | 1.69 MB | 1 年前3成都敏捷之旅十周年/7_侯伯薇_乌卡时代幸福工作
0 码力 | 39 页 | 7.28 MB | 1 年前3Moonshot AI 介绍
布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 2.团队聚焦底层技术创新,技术Vision强 a. 引领⼤模型的“⽆损⻓上下⽂”时代。2023年10⽉上旬,在产品Kimi智能助⼿中实现“⽆损 ⻓上下⽂窗⼝(LosslessLongContextWindow)”,⽀持20万汉字输⼊,实现对⻓⽂本的⽆ 损记忆。Op 能⼒、指令遵循的能⼒、各种agent的功能等。 这些上层的东西都会有巨⼤的差异化,因为中间存在两个重要的技术变量。我认为这是我们的机会。 除了技术层⾯,价值观上我们有⼀点和OpenAI不同:我们希望在下⼀个时代,能成为⼀家结合 OpenAI技术理想主义和字节所展现的商业化哲学观的公司。东⽅的效⽤主义我认为有⼀定的可取之 处。完全不关⼼商业价值的话,你其实很难真的做出来⼀个伟⼤的产品,或者让⼀个本⾝很伟⼤的技 。以前我们只能做个性化的推荐,但现 在,⽤⼾可以与产品进⾏互动。这种互动是⾼度拟⼈化和个性化的。怎么实现这⼀点? 我觉得这背后实际上是个技术问题。传统AI时代,要实现个性化,需要持续更新模型,⽤⼩模型解决 单点问题。⼤模型时代,实现个性化的⼀种⽅式是微调,但我认为微调可能不是本质的⽅法,⻓期来 看可能不会存在模型的微调。为什么?当你的模型指令跟随能⼒、推理能⼒、上下⽂⼀致性能⼒越来0 码力 | 74 页 | 1.64 MB | 1 年前3PieCloudDB Database 产品白皮书
Reserved, Openpie | PiecloudDB 基于eMPP (弹性大规模并行计算) 的云原生虚拟数仓 产品白皮书 行业背景 数据量的爆发式增长 数据库的未来在云上 传统数仓的痛点 云时代的数据处理要求 piecloudDB,云原生虚拟数仓 PieCloudDB 产品概述 PieCloudDB 产品架构 PieCloudDB 产品特性 PieCloudDB 产品核心技术 PieCloudDB8 随着信息技术的发展,互联网应用的加速普及,人类进入了数字经济时代。进入二十一世纪以后,随着移动互联网技 术、物联网技术、5G等技术的发展,全球数据圈 (Global Datasphere) 呈指数级递增, IDC预测全球数据圈将于 2025年增长值175ZB,而中国的数据圈有望于2025年爆炸式增长为世界第一狂,数据被称为数字经济时代的“石 油”,如同石油驱动了工业化时代的进步,大数据将推动智能化与数字化时代的发展。 Annual 的巨大诉求、数据组织的运行成本的急剧增加、数据格式的丰富多样,企业的数字 化转型面临巨大挑战,急需一款数据库产品,帮助其最大化利用数据资产,降本增效,进行更智能高效的数据计算。 数据库的未来在云上 随着云计算时代的到来,不仅使得计算成本极大地降低,也提供了无限丰富的计算资源,释放出数据计算产生智能的 更多机会。早在2019年,Gartner便做出预测: 数据库市场的未来在云上 作。在2022年首次发布的《数据库中国市场0 码力 | 17 页 | 2.68 MB | 1 年前3云原生虚拟数仓PieCloudDB Database产品白皮书
©2023 OpenPie All Right Reserved . 行业背景 数据量的爆发式增长 数据库的未来在云上 传统数仓的痛点 云时代的数据处理要求 PieCloudDB,云原生虚拟数仓 PieCloudDB 产品概述 PieCloudDB 产品架构 PieCloudDB 产品特性 ,人类进入了数字经济时代。进入二十一世纪以后,随着移动互联网技 术、物联网技术、5G等技术的发展,全球数据圈(Global Datasphere)呈指数级递增, IDC预测全球数据圈将于 2025年增长值175ZB,而中国的数据圈有望于2025年爆炸式增长为世界第一 。数据被称为数字经济时代的“石 油”,如同石油驱动了工业化时代的进步,大数据将推动智能化与数字化时代的发展。 急剧增加、数据格式的丰富多样,企业的数字 化转型面临巨大挑战,急需一款数据库产品,帮助其最大化利用数据资产,降本增效,进行更智能高效的数据计算。 数据库的未来在云上 随着云计算时代的到来,不仅使得计算成本极大地降低,也提供了无限丰富的计算资源,释放出数据计算产生智能的 更多机会。早在2019年,Gartner便做出预测:数据库市场的未来在云上 。在2022年首次发布的《数据库中国市场0 码力 | 17 页 | 2.02 MB | 1 年前39 盛泳潘 When Knowledge Graph meet Python
R2:Dreyfus, Hubert (1979), What Computers Still Can't Do, New York: MIT Press. 本页PPT借鉴于复旦大学肖仰华老师《大数据时代的知识工程与知识管理》 Preliminaries Major difficulties: 自上而下:严重依赖专家和用户的干预(规模有限、质量存疑) Conventional KE – Features 3、很难处理异常情况 e.g., 鸵鸟不会飞 本页PPT借鉴于复旦大学肖仰华老师《大数据时代的知识工程与知识管理》 大数据时代催生KE飞速前进发 展 Preliminaries Preliminaries 大数据时代的机遇 – 大规模知识自动获取 本页PPT借鉴于复旦大学肖仰华老师《大数据时代的知识工程与知识管理》 Big Data + Machine Learning[R1] learning/ R2, https://openai.com/blog/ai-and-compute/ Preliminaries 大数据时代的机遇 – 大量UGC 本页PPT借鉴于复旦大学肖仰华老师《大数据时代的知识工程与知识管理》 Web 2.0时代,存在大量UGC (User Generated Content) • 提供获得广大用户一致认可的高质量数据源 e.g., Wikipedia,百度百科0 码力 | 57 页 | 1.98 MB | 1 年前3
共 289 条
- 1
- 2
- 3
- 4
- 5
- 6
- 29