Greenplum 6新特性:
在线扩容工具GPexpand剖析Pivotal ## Greenplum 6新特性: 在线扩容工具GPexpand剖析 杜佳伦 (jdu@pivotal.io) ## 大纲 • Greenplum 集群部署 • GPExpand简介与具体用法 • Greenplum 6中GPExpand的改进与实现 ## Greenplum 集群部署  ## 推荐篇 推荐场景、在线机器学习和深度学习 集 • 模型: $ H_{targets} = f(V_{context}, V_{user}, V_{objects}) $ ## 趋势 • 实时化:在线机器学习 • 深度化:深度学习 • 平台化:机器学习平台 ## 3 在线机器学习 ## · 实时化 • 特征实时化:更及时反馈用户行为,更细粒度刻画用户 - 模型实时化:根据线上样本实时训练模型,及时地反映对象的线上变化 !0 码力 | 36 页 | 16.69 MB | 2 年前3
One year of Meeting C++ online0 码力 | 11 页 | 924.04 KB | 1 年前3
TiDB 原理与实战0 码力 | 23 页 | 496.41 KB | 1 年前3
2020美团技术年货 算法篇本文将与大家探讨美团搜索与 NLP 部使用的统一在线预估框架 Augur 的设计思路、效果、优势与不足,希望对大家有所帮助或者启发。 搜索优化问题,是个典型的 AI 应用问题,而 AI 应用问题首先是个系统问题。经历近 10 年的技术积累和沉淀,美团搜索系统架构从传统检索引擎升级转变为 AI 搜索引擎。当前,美团搜索整体架构主要由搜索数据平台、在线检索框架及云搜平台、在线 AI 服务及实验平台三大体系构成。在 服务及实验平台三大体系构成。在 AI 服务及实验平台中,模型训练平台 Poker 和在线预估框架 Augur 是搜索 AI 化的核心组件,解决了模型从离线训练到在线服务的一系列系统问题,极大地提升了整个搜索策略迭代效率、在线模型预估的性能以及排序稳定性,并助力商户、外卖、内容等核心搜索场景业务指标的飞速提升。 低成本,快速构筑在线企业数据仓库。 • 行存储及多种索引(Btree,Bitmap 等),点查询毫秒级返回•0 码力 | 22 页 | 2.98 MB | 2 年前3
The Vitess 12.0 Documentation0 码力 | 534 页 | 3.32 MB | 2 年前3
Facebook messenger架构介绍-覃超 facebook[Image](/uploads/documents/a/6/a/b/a6aba639dca31ca6d249138ad2d797c5/p27_2.jpg) ## 系统难点 1. 信息传输的时效性 2. '在线状态' 跟踪 3. Queue(消息队列)+ 送达机制 4. 多并发连接 5. 消息的历史记录 ### 1. 0 Architecture ## System overview browsers0 码力 | 51 页 | 4.39 MB | 2 年前3
2020 中国开源年度报告
现状,从而为开源的后来人提供权威的参考。 - 调查对象:覆盖开发者、社区成员、贡献者、学生、政府企业管理人员 - 调查内容:主要涵盖个人信息、工作状况、开源社区以及开发者技术 - 调查方法:以在线问卷方式搜集样本和数据,交叉对比法分析数据 推广方法:线上社交媒体、博客、开源社、开源中国网站 • 问题数量:59 - 问题类型:单选、多选、开放性 • 样本量:236 ## 2、 重要发现 者投入到了文档撰写中; - 开源活动的参与频率相较往年有所上升,这与国内愈发繁荣的开源氛围和逐渐丰富的开源活动也有关系。81% 的开发者认为开源活动对促进和推动开源社区至关重要。而对于更倾向于线上还是线下的会议,结果竟惊人地持平; 在 2020 年 COVID-19 这个大背景下,各行各业都不可避免受到了冲击和影响;82% 的人认为疫情对于参加开源社区的活动产生了影响,但也具有推动作用,11% 的人认为毫无影响,7% 的人认为疫情的负面影响大于正面影响; - 在在线文档协作工具的使用上,石墨文档以黑马的形式由第三名一跃成为第一名,压倒了wiki和Google Doc,国内正在涌现出一批优秀的协作工具,并越来越为大家认可; - 2020 年 9 月 9 日,中国首个开源软件基金会「开放原子开源基金会(OpenAtom Foundation)」官方正式对外发声,大家对此抱有多重期望:推0 码力 | 46 页 | 4.09 MB | 2 年前3
2022年美团技术年货 合辑基于交叉验证降噪的极值点优化模型融合方案: (1)基于交叉验证的降噪,由于在线仅能进行一天一次的提交,并且最终的评测会由A榜测试集切到B榜测试集,并且由于A榜数据集小在线评测指标存在不稳定性,故而离线迭代验证的方式就显得尤为重要。为了能使离线迭代置信,我们采用两种验证方式进行辅助,第一种是下一天同时间段验证,我们在训练集最后M天上对每一天都取在线同一时间段的数据集,得到M个验证集。第二种是N-fold天级采样 制的图神经网络(GNN: Graph Neural Network)模型的基本范式。 近年来,图神经网络逐渐成为学术界的研究热点之一 $ ^{[5]} $ 。在工业界,图神经网络在电商搜索、推荐、在线广告、金融风控、交通预估等领域也有诸多的落地应用,并带来了显著收益。 由于图数据特有的稀疏性(图的所有节点对之间只有少量边相连),直接使用通用的深度学习框架(例如 TensorFlow 和 PyT 点击率(Click Through Rate, CTR)/转化率(Conversion Rate, CVR)预估技术得到了长足的发展,深度学习技术已经成为业界的主流方法。美团外卖也通过应用深度模型,在线上取得了显著的收益。预估模型所做的事情,是建模蕴藏在数据中、在特定场景下用户和商品之间的关联性(即“人-货-场”)。以点击率预估为例,可以对画像特征、上下文特征、行为特征等进行建模,模型能够感知在该场景下用户和商品之间的关联。0 码力 | 1356 页 | 45.90 MB | 2 年前3
共 893 条
- 1
- 2
- 3
- 4
- 5
- 6
- 90
相关搜索词













