Apache Pulsar,云原生时代的消息平台 - 翟佳Apache Pulsar 云原⽣时代的消息平台 翟佳 streamnative.io ⾃我介绍 • 开源项⽬爱好者: • Apache Pulsar PMC成员 • Apache BookKeeper PMC成员 • EMC -> StreamNative • 华中科⼤ -> 中科院计算所 • Pulsar 的根本不同 • Apache Pulsar 简介 • Pulsar0 码力 | 39 页 | 12.71 MB | 6 月前0.03
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502电气革命 信息革命 以大模型为代表的 人工智能革命 人工智能是新质生产力的关键支撑技术,人工智能+百业千行将带动新一轮工业革命,为高质量发展注入强大动能 大模型的进一步突破将引领人类社会进入智能化时代,对我们的生活方式、生产方式带来巨大变革 重塑经济图景 解决复杂问题 7政企、创业者必读 8 AI不仅是技术革新,更是思维方式和社会结构的变革 国家 产业 个人 企业政企、创业者必读 当年IBM做出超级电脑,并没有带来工业 革命,因为只有少数人用 • IBM甚至声称,全世界只用5台电脑就够了 • 真正带来信息革命的是个人电脑走入千家 万户、百行千业 当年的电脑 当今的大模型 • 如果需要十万或百万张卡起玩,就无法 产生工业革命 • 只有把大模型拉下神坛,让大模型走进 千家万户、百行千业,才能掀起新一轮 工业革命 12政企、创业者必读 DeepSeek出现之前 我们对大模型发展趋势的十大预判 MoE架构盛行,本质是多个专家模型组成一个大模型 Deepmind的Alpha系列产品是这一趋势的最佳诠释 16政企、创业者必读 DeepSeek出现之前的十大预判 之四 模型越做越小 17 大模型进入「轻量化」时代,上车上终端,蒸馏小模型 先做得更大,然后探索能做多小政企、创业者必读 DeepSeek出现之前的十大预判 之五 知识的质量和密度决定大模型能力 高质量数据、合成数据使模型知识密度的快速增长0 码力 | 76 页 | 5.02 MB | 5 月前3
蚂蚁金服网络代理演进之路01 2010 开始网络代理白盒 化,定制业务逻辑,软 硬件一体解决方案 自研 02 2015 年无线通道协议,安 全升级, 连接收编 All in 无线 03 PC时代 移动时代 万物互联云原生时代 2018 年协议,安全持续升 级(QUIC,MQTT,国密), 云原生 再启程 03前世 F5 BigIP Netscaler自研四层网络代理 2011 2014 2018 百万级每秒推送Spanner 2010 • 自研,网络设备白盒化 • 全面实践全网https 2012 • 首次全流量支撑双十一大促 2013 • 支持蚂蚁LDC架构,三地五中心容灾架构 • 全面上线SSL加速卡,提供软硬件一体加速方案 2015 • All in 无线,通信通道全面升级(MMTP,MTLS协议) 2016 • 安全防护能力提升,WAF,流量镜像 2018至 今 • 通信协议,架 Intel QAT Cavium Nitrox软硬件一体解决方案 SSL握手性能 提升3倍 • 对Spanner实现了异步化改造 • 对openssl进行了异步化引擎改造 • 实现多芯片卡的负载均衡协议实现的改造-MTLS MTLS:1) 轻量级TLS库,小于50k;2) 优化的TLS协议 0-RTT • 减少握手延迟 • 代价:握手前发送的数据不能 保证防重放攻击,因此要求应0 码力 | 46 页 | 19.93 MB | 6 月前3
新一代云原生分布式存储分布式存储的要素 02 03 04 Ceph 架构简介 | 场景介绍 | 使用中的问题 Curve 架构简介 | 数据对比 | 应用情况 FAQ 答疑存储的发展 互联网时代,数据大爆炸 大型主机 成本高 单点问题 扩容困难 各存储设备通过网络互联 大规模 弹性扩容 底层构建在分布式存储之上 云的概念 成本:共用基础设施 弹性:随意扩缩容 速度:更快的构建发布业务 自定义)功能。块存储场景 为物理机提供块设备 Linux IO栈 应用程序 -> 文件系统 -> 块设备层 -> 不同协议/驱动使用中的问题 • io抖动(一致性协议): 异常场景(比如阵列卡一致性巡检,坏盘,慢盘,网络异常),服务升级 • 性能差(一致性协议):在通用硬件下,无法支撑数据库、kafka等中间件对存储性能和稳定性要求 • 容量不均衡(数据放置):集群各节点容量不均衡需要人为干预0 码力 | 29 页 | 2.46 MB | 6 月前3
Python 标准库参考指南 3.13 UTC 时差返回为一个timedelta 对象,如果本地时区在 UTC 以东则为正值。如果本 地时区在 UTC 以西则为负值。 这表示与 UTC 的 总计时差;举例来说,如果一个tzinfo 对象同时代表时区和 DST 调整, 则utcoffset() 应当返回两者的和。如果 UTC 时差不确定则返回 None。在其他情况下返回值必 须为一个timedelta 对象,其取值严格限制于 -timedelta(hours=24) in a[lo : ip]) 为真值而对于右侧切片 all(elem > x for elem in a[ip : hi]) 为真值。 在 3.10 版本发生变更: 增加了 key 形参。 1 当前时代的磁盘平衡算法与其说是巧妙,不如说是麻烦,这是由磁盘的寻址能力导致的结果。在无法寻址的设备例如大型磁 带机上,情况则相当不同,开发者必须非常聪明地(极为提前地)确保每次磁带转动都尽可能地高效(就是说能够最好地加入到合 [810, 896, 958, 1011, 1060, 1109, 1162, 1224, 1310] 蒙特卡罗模拟输入 为了估算一个不易获得解析解的模型分布,NormalDist 可以生成用于 蒙特卡洛模拟 的输入样本: >>> def model(x, y, z): ... return (3*x + 7*x*y - 5*y) / (11 * z) ... >>> n = 100_000 >>>0 码力 | 2246 页 | 11.74 MB | 9 月前3
Python 标准库参考指南 3.13 UTC 时差返回为一个timedelta 对象,如果本地时区在 UTC 以东则为正值。如果本 地时区在 UTC 以西则为负值。 这表示与 UTC 的 总计时差;举例来说,如果一个tzinfo 对象同时代表时区和 DST 调整, 则utcoffset() 应当返回两者的和。如果 UTC 时差不确定则返回 None。在其他情况下返回值必 须为一个timedelta 对象,其取值严格限制于 -timedelta(hours=24) in a[lo : ip]) 为真值而对于右侧切片 all(elem > x for elem in a[ip : hi]) 为真值。 在 3.10 版本发生变更: 增加了 key 形参。 1 当前时代的磁盘平衡算法与其说是巧妙,不如说是麻烦,这是由磁盘的寻址能力导致的结果。在无法寻址的设备例如大型磁 带机上,情况则相当不同,开发者必须非常聪明地(极为提前地)确保每次磁带转动都尽可能地高效(就是说能够最好地加入到合 [810, 896, 958, 1011, 1060, 1109, 1162, 1224, 1310] 蒙特卡罗模拟输入 为了估算一个不易获得解析解的模型分布,NormalDist 可以生成用于 蒙特卡洛模拟 的输入样本: >>> def model(x, y, z): ... return (3*x + 7*x*y - 5*y) / (11 * z) ... >>> n = 100_000 >>>0 码力 | 2242 页 | 11.73 MB | 9 月前3
2024 中国开源开发者报告容,大量的用户访问这些内容;另一种模式是用户的问题有很高比例是重复的,例如拍照搜题、 生成调研报告等。 总体来说,目前 AI 应用尚处于“iPhone 1”时代,模型能力、应用生态、用户习惯都在快 速进化中。所谓“AI 一天,人间一年”,即使是 AI 专家,也很难跟上所有最新的科研进展。大 模型的时代才刚刚开始,预测未来的最好方式就是持续学习、探索、利用 AI 能力,创造未来。 李博杰 李博杰是 AI 创业者,研究方向为高性能数据中心系统。曾任华为计算 60%。仅仅在编程这一项工作(虽然只占开发人员 20-30% 的工作量)上,研发效率能提升 20-30%。 当然,我们不能局限于这一个 编程环境,最好要从需求开始就 应用大模型。ATDD(验收测试驱 动开发)是大模型时代软件研发 的正确打开方式,让大模型帮我 们生成需求及其验收标准,业务 约束更明确了,上下文更清楚了, 在此基础上分别由不同的模型生 成产品代码和测试代码,再让它 们之间相互验证和博弈(如图 本译作。曾任思科(中 国)软件有限公司 QA 高级总监、IEEE ICST 2019 工业论坛主席、 IEEE ICST、QRS 等程序委员、《软件学报》和《计算机学报》审 稿人等。 图 4 大模型时代的软件研发正确方式 44 / 111 RAG 市场的 2024:随需而变,从狂热到理性 文/卢向东 转眼到了 2024 年尾,和小伙伴一起创立 TorchV 也接近一年。虽然这一年做了很多事情,0 码力 | 111 页 | 11.44 MB | 8 月前3
Python 标准库参考指南 3.12 UTC 时差返回为一个timedelta 对象,如果本地时区在 UTC 以东则为正值。如果本 地时区在 UTC 以西则为负值。 这表示与 UTC 的 总计时差;举例来说,如果一个tzinfo 对象同时代表时区和 DST 调整, 则utcoffset() 应当返回两者的和。如果 UTC 时差不确定则返回 None。在其他情况下返回值必 须为一个timedelta 对象,其取值严格限制于 -timedelta(hours=24) in a[lo : ip]) 为真值而对于右侧切片 all(elem > x for elem in a[ip : hi]) 为真值。 在 3.10 版本发生变更: 增加了 key 形参。 1 当前时代的磁盘平衡算法与其说是巧妙,不如说是麻烦,这是由磁盘的寻址能力导致的结果。在无法寻址的设备例如大型磁 带机上,情况则相当不同,开发者必须非常聪明地(极为提前地)确保每次磁带转动都尽可能地高效(就是说能够最好地加入到合 数字统计函数 361 The Python Library Reference, 发行版本 3.12.7 蒙特卡罗模拟输入 为了估算一个不易获得解析解的模型分布,NormalDist 可以生成用于 蒙特卡洛模拟 的输入样本: >>> def model(x, y, z): ... return (3*x + 7*x*y - 5*y) / (11 * z) ... >>> n = 100_000 >>>0 码力 | 2253 页 | 11.81 MB | 9 月前3
Python 标准库参考指南 3.12 UTC 时差返回为一个timedelta 对象,如果本地时区在 UTC 以东则为正值。如果本 地时区在 UTC 以西则为负值。 这表示与 UTC 的 总计时差;举例来说,如果一个tzinfo 对象同时代表时区和 DST 调整, 则utcoffset() 应当返回两者的和。如果 UTC 时差不确定则返回 None。在其他情况下返回值必 须为一个timedelta 对象,其取值严格限制于 -timedelta(hours=24) in a[lo : ip]) 为真值而对于右侧切片 all(elem > x for elem in a[ip : hi]) 为真值。 在 3.10 版本发生变更: 增加了 key 形参。 1 当前时代的磁盘平衡算法与其说是巧妙,不如说是麻烦,这是由磁盘的寻址能力导致的结果。在无法寻址的设备例如大型磁 带机上,情况则相当不同,开发者必须非常聪明地(极为提前地)确保每次磁带转动都尽可能地高效(就是说能够最好地加入到合 数字统计函数 361 The Python Library Reference, 发行版本 3.12.7 蒙特卡罗模拟输入 为了估算一个不易获得解析解的模型分布,NormalDist 可以生成用于 蒙特卡洛模拟 的输入样本: >>> def model(x, y, z): ... return (3*x + 7*x*y - 5*y) / (11 * z) ... >>> n = 100_000 >>>0 码力 | 2253 页 | 11.81 MB | 9 月前3
24-云原生中间件之道-高磊技术在构筑数字大楼的同时,不仅带来了全新的安全场景,也成为网络安全攻防 当中的利器;2020年井喷的远程办公,拷问传统安全边界防线,让“零信任”这一有着十年历史的理念再次受到关注,成为企业构建后疫情时代安全体系 的基石;云上原生的安全能力让成本、效率、安全可以兼得,上云正在成为企业解决数字化转型后顾之忧的最优解…… 安全是为了预防资产损失,所以当安全投入 的成本大于能够避免的资产损失价值时,变 (Serverless化) 在过去,每家公司自建消息中间件集群,或是自研的、或是开源的,需要投入巨大的研发、运维成本。云原生时代的消息服务借助Serverless等弹 性技术,无需预先Book服务器资源,无需容量规划,采取按量付费这种更经济的模式将大幅度降低成本。 易用性 (Mesh化) 在云原生时代,消息服务第一步将进化成为一种所见即所得、开箱即用的服务,易用性极大的提高。接下来,消息服务将以网格的形式触达更复 高级能力-云原生大数据|AI-业务赋能的基石-1 大数据发展了近30年,甚至比云计算的历史还要 早,它带有那个时代的架构思路,体系庞大而且 复杂,因为业务上极其重要的地位,发出现先发 的优势,但是带来了后发的劣势: • 大数据平台为业务的营销、决策等活动进行 数字化支撑,这是新时代数字化的核心平台, 唯有数据才是企业的资产。 • 大数据平台大体分成两层:数据应用和数据 工程化引擎 • 在云原生场景下,希望应用能够适应敏态化0 码力 | 22 页 | 4.39 MB | 6 月前3
共 68 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7













