5. ClickHouse at Ximalaya for Shanghai Meetup 2019 PDF1.jpg) Magic Mirror ## Funnel Analysis by "Magic Mirror" (魔镜) 魔镜 概览 漏斗分析 路径分析 留存分析 数据分析 可视化埋点 漏斗分析 漏斗步骤 浏览 新首页 2 浏览 我听 + 添加  魔镜 APP √ 主APP √ ◁ ② 联系客服 概览 留存分析 / 留存概览 Retention overview 渠道对比 次日留存 Retention rate trend of users from different app markets0 码力 | 28 页 | 6.87 MB | 2 年前3
ClickHouse在B站海量数据场景的落地实践[Image](/uploads/documents/9/0/4/5/90450d8d637a7624f7a2038fdd8a63b7/p1_1.jpg) ## 目录 ClickHouse在B站 内核 日志 用户行为数据分析 Future Work Q&A : ➢ 日志&Trace分析 ➢ 用户行为分析(包括事件分析,漏斗分析,路径分析等) ➢ 圈人定投 ➢ 广告DMP(包括统计分析,人群预估) 电商交易分析 ➢ OGV内容分析 ➢ APM (Application Performance Management)  ## 基于ClickHouse的交互式OLAP技术架构 Applications 日志&Trace 平台 报表平台 标签圈人 埋点分析 广告DMP 内容定投 APM 内容分析 HDFS/Hive 离线接入 (Rider/Spark/WaterDrop) Yuuni 定制开发的ClickHouse-JDBC 与ClickHouse兼容的HTTP接口0 码力 | 26 页 | 2.15 MB | 2 年前3
The Tale of Smokey and the Crypto Bandits0 码力 | 14 页 | 926.57 KB | 1 年前3
Rust API可靠性分析与验证API可靠性分析与验证 姜剑峰 ## 主题内容 • Rust第三方库API可靠性现状 • 现用方法的局限性 - 基于程序合成+模糊测试的可靠性分析方法 ## 自我简介 • 本(2019)硕(2022)毕业于复旦大学 - 目前在蚂蚁集团安全计算部门开发应用于机密计算的Rust系统软件 - 研究生期间主要从事Rust测试与验证工具的研究,本人所在的是国内最早开展Rust程序分析相关研究的实 所有动态检查都不应该被违背(可以被安全的移除),除非panic是一种允许的行为 ## 现有的可靠性分析方法及其局限性 模糊测试(afl.rs, libfuzzer): 分支覆盖率;用例程序的构造 符号执行(klee, angr):路径爆炸;求解困难 静态分析(MirChecker, Rudra, SafeDrop):分析特定问题;假阳性 形式化验证(RustBelt):无法方便的验证第三方库 结论以及未来的发展 1. Rust优秀的语言设计避免了大量可能发生的潜在错误 2. 目前Rust程序合成的难点在于unsafe代码,泛型与trait,宏等 3. 保障Rust程序的可靠性仍然需要各种程序分析以及软件测试的手段 ## Thanks ## Rust China Conf 2021-2022 – Online, China0 码力 | 13 页 | 1.68 MB | 2 年前3
DataEase 嵌入式分析 2024年3月## DataEase 嵌入式分析 2024年3月 ## 人人可用的 开源数据可视化分析工具 DataEase 可以帮助用户快速分析业务数据并洞察其趋势,从而实现业务的改进与优化。DataEase 支持丰富的数据源连接,能够通过拖拉拽的方式快速制作图表,并且可以方便地与他人进行分享。 ## FIT2CLOUD 飞致云 ## DataEase v2 的不同版本对比 |版本类型|社区版|嵌入式版|企业版| |目标群体|任何用户|ISV / 系统集成商|最终客户| |产品功能|社区版功能|社区版功能 + X-Pack 部分功能(含嵌入式分析能力)注:单数据集限制 10 万行数据。|社区版功能 + X-Pack 所有功能(含嵌入式分析能力)注:数据集无行数限制。| |销售方式|社区分发免费使用|线上销售 / 线下推广标准化合同模板|线下推广线下商务流程| |授权方式|免费永久使用|按套永久授权不限用户规模|按套订阅或者永久授权按用户规模定档定价| 订阅或者永久授权按用户规模定档定价| |服务方式|社区支持|原厂企业级技术支持服务(基础级,5×8)|原厂企业级技术支持服务(基础级,5×8;增强级,7×24)| 嵌入式分析可以给 ISV 带来哪些价值? DataEase 嵌入式分析的方案 DataEase 嵌入式分析的优势 在线体验 & 嵌入流程介绍 ## 什么是嵌入式分析? 嵌入式分析是可以嵌入在商业应用程序中,为应用软件提供或者增强分析功能的专业0 码力 | 29 页 | 7.29 MB | 1 年前3
基于静态分析的Rust内存安全缺陷检测研究## 基于静态分析的Rust内存安全缺陷检测研究 报告人:徐辉 复旦大学 报告日期:2022.11.25 ## 大纲 一、问题背景 二、Rust指针缺陷检测方法 三、实验结论 四、论文发表心得 ## 大纲 一、问题背景 二、Rust指针缺陷检测方法 三、实验结论 四、论文发表心得 ## Rust语言 ## 系统级安全编程语言 手动释放内存或调用析构函数 函数返回时发生的自动析构或内存释放 ☐ Rust设计的目标之一是编译时检查指针别名(共享可变引用) 但一般意义上的指针分析是NP-hard问题 智能指针可行,但作为运行时方案,效率低 ■ Rust在语法设计中引入所有权机制,简化指针分析问题 ## Rust所有权模型 => XOR Mutability ☐ 一个对象有且只有一个所有者 ☐ 所有权可以转移给其它变量 0x012345usize; let r = address as *const i32; } unsafe { risky(); } ## Rust的安全哲学 ☐ Safe API无论如何被使用都不应带来未定义行为 ☐ 程序员应避免直接使用unsafe code ☐ Interior unsafe:将unsafe code封装为safe API  全业务场景 用户行为管理 数据驾驶舱 ## 数据可视化对不同人员的价值 ## FIT2CLOUD FIT2CLOUD 飞致云 ## 前端业务人员 能够快速、高效地提供体验良好的数据展现手段,通过分析数据资产的质量,助力企业做出更加准确的业务策略。 ## 数据管理人员 提供多种数据使用模式,提供更为丰富、安全的数据管理手段,有助于企业内部进行更为广泛的数据整合与分析,并由此创造数据价值。 ## 企业管理者 能够合理评估、规范和洞察企业信息,洞悉企业发展趋势,在有效管理 IT 投资和降本增效的同时,挖掘0 码力 | 27 页 | 3.61 MB | 2 年前3
Chatbots 中对话式交互系统的分析与应用咨询热线:010-64738142 ## 吴金龙 • 2005~2010:北大数学院 • 推荐系统 • 2010~2011:阿里云 • PC/手机输入法 • 2011~2017:世纪佳缘 • 用户推荐、网警等数据系统 • 技术部负责人 • 一个AI负责人 • 2017~现在:爱因互动 • 技术合伙人、算法负责人 • ChatbotsChina发起人 • 微博:@breezedeus R-Bot:检索问答系统 KB/KG 问题 问题分析 检索 排序 词/同义词  答案[列表] 实体识别 问题分类 同类词 TF-IDF LtR 指代消解 词向量 CNN/RNN 关系抽取 情感分析 ## I R-Bot:深度学习 be27fc1/p14_2.jpg) ## 状态追踪 Dialogue State Tracking (DST) • 对话状态应该包含持续对话所需要的各种信息 - DST问题:依据最新的系统和用户动作,更新对话状态  ## Q: 如何表示对话状态0 码力 | 39 页 | 2.24 MB | 2 年前3
Flink如何实时分析Iceberg数据湖的CDC数据Flink如何实时分析Iceberg数据湖的CDC数据 阿里巴巴 李劲松/胡争 FLINK FORWARD #ASIA 2020 #1 #2 #3 #4 常见的CDC 为何选择 Flink 如何实时写 未来规划 分析方案 + Iceberg 入读取 FLINK FORWARD #ASIA 2020 ## #1 常见的CDC分析方案 ## 离线 HBase 集群分析 CDC 数据 MySQL $ ^{®} $ → HBASE ## 方案评估 优点 1、CDC记录实时写入HBase。高吞吐+低延迟。 2、小范围查询延迟低。 3、集群可拓展 缺点 1、行存索引不适合分析任务。 2、HBase集群维护成本较高。 3、通过RegionServer定位HFile,Server的优化和缓存完全用不上。 4、数据格式绑定HFile,不方便拓展到Parquet、Avro、Orc等。 FORWARD #ASIA 2020 ## Apache Kudu 维护 CDC 数据集 ## MySQL ## 方案评估 优点 1、支持实时更新数据,时效性佳。 2、列存加速,适合OLAP分析。 ## 缺点 1、独立的Kudu集群,比较小众。维护成本高。 2、和 HDFS / S3 / OSS 等割裂。数据独立,且存储成本不如 S3 / OSS。 3、Kudu的批量扫描不如parquet。0 码力 | 36 页 | 781.69 KB | 2 年前3
使用 TiDB 进行实时数据分析-马晓宇## 使用 TiDB 进行实时数据分析 ## 马晓宇@PingCAP ## 极客邦科技 会议推荐2019  ## QCon ## 全球软件开发大会 大会:5月6–8日 培训:5月9–10日 ## QCon 北京 广州 ## 大会:11月21–22日 培训:11月23–24日 ## About Me • 分析产品负责人@PingCAP 曾就职于网易杭研,担任 BigData Infra Team Lead - 主要关注大数据,分布式数据库,SQL on Hadoop 等领域 ## 实时场景技术选型 ## 案例分析 我希望做一个实时分析系统,提供运营人员实时查询当前经营数据 - 我需要一个存储系统当做 Data Sink RDBMS 或者 NoSQL ☐ 需要 Update?手动维护变更数据 使用传统关系型数据库 ☐ 承载大量数据力有未逮 ☐ 算力扩展堪忧 ## 现实的困境 • 单一系统也许无法完成任务 • 为了用户能打一个响指就完成愿望 你需要集齐多个系统 0 码力 | 36 页 | 9.32 MB | 2 年前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100













