Cardinality and frequency estimation - CS 591 K1: Data Stream Processing and Analytics Spring 20200 码力 | 69 页 | 630.01 KB | 2 年前3
4. ClickHouse在苏宁用户画像场景的实践苏宁如何使用ClickHouse ClickHouse集成Bitmap 用户画像场景实践 ## 3 ## 选择ClickHouse的原因 1. 速度快 2. 特性发布快 3. 软件质量高 4. 物化视图 5. 高基数查询 6. 精确去重计数(count distinct) ## 精确去重计数性能测试 4亿多的数据集上,去重计算出6千万整形数值, 非精确去重函数:unique、uniqueHLL12、uniqueCombined GB (59.09 million rows/s., 472.72 MB/s.) ## ClickHouse在苏宁使用场景 ## OLAP平台存储引擎 -- 存储时序数据、cube加速数据,应用于高基数查询、精确去重场景。 ## 运维监控 -- 实时聚合分析监控数据,主要使用物化视图技术。 ## ➢ 用户画像场景 -- 标签数据的存储、用户画像查询引擎。 苏宁如何使用ClickHouse0 码力 | 32 页 | 1.47 MB | 2 年前3
Lecture 3: Logistic Regression0 码力 | 29 页 | 660.51 KB | 2 年前3
Lecture 2: Linear Regression0 码力 | 31 页 | 608.38 KB | 2 年前3
Blender v4.1 参考手册 5f13e971251e/484dd1cd.png) ## 运行的任务 显示当前运行的任务(比如"渲染"或"烘焙")的进度。将鼠标指针悬停在进度条上会显示一个时间估计。任务可以通过点击取消按钮(x图标)中止。 报告信息 信息性消息或警告,例如在保存文件之后。它们会在短时间内消失。点击它们可以在信息编辑器中显示完整的信息。 ## 资源信息 状态栏的右侧显示有 活动物体显示当前所选活动物体的名称。 几何数据 根据模式和物体类型显示有关当前场景的信息。可以是顶点、面、三角形、或骨骼的数量。 物体所选物体的数量和总数。 系统内存 Blender内存消耗估计值。在单实例单机器的情况下,这个估计值提供了一个针对机器硬件限制的测量。 Blender 版本 当前运行的Blender版本。 - View Source - View Translation - 报告本页面的问题 that's closest to the viewport's viewing direction (when not hovering over a surface). 基础(基数) 原点 如何定义基底。 边: The base is defined from one corner to the opposing corner. 中心: The base is defined0 码力 | 6411 页 | 312.46 MB | 1 年前3
Blender v4.0 参考手册(简体中文版)e264b63e04340553/82366e44.png) ## 运行的任务 显示当前运行的任务(比如"渲染”或"烘焙")的进度。将鼠标指针悬停在进度条上会显示一个时间估计。任务可以通过点击取消按钮(x图标)中止。报告信息 信息性消息或警告,例如在保存文件之后。它们会在短时间内消失。点击它们可以在信息编辑器中显示完整的信息。 ## 资源信息 状态栏的右侧显示有关 ## 几何数据 根据模式和物体类型显示有关当前场景的信息。可以是顶点、面、三角形、或骨骼的数量。 ## 物体 所选物体的数量和总数。 ## 系统内存 Blender内存消耗估计值。在单实例单机器的情况下,这个估计值提供了一个针对机器硬件限制的测量。 ## Blender 版本 当前运行的Blender版本。 ## 区域 . 基础(基数) 原点 How the base is defined. 边: The base is defined from one corner to the opposing corner. 中心:0 码力 | 5352 页 | 306.21 MB | 2 年前3
Python 标准库参考指南 3.11.10 f'{255:X}' ('0xff', 'ff', 'FF') ``` 另见format()获取更多信息。 另请参阅 int() 将十六进制字符串转换为以16为基数的整数。 备注:如果要获取浮点数的十六进制字符串形式,请使用float.hex()方法。 ## id (object) 返回对象的“标识值”。该值是一个整数,在此对象的生命周期中保证是唯一且恒 x必须是一个表示以base为基数的整数的字符串、 bytes或bytearray实例。字符串前面还能加上可选的+或-(中间没有空格),带有前导的零,带有两侧的空格,并可带有数位之间的单个下划线。 一个以 n为基数的整数字符串包含多个数位,每个数位代表从0到n-1范围内的值。0--9的值可以用任何Unicode十进制数码来表示。10--35的值可以用a到z(或A到Z)来表示。默认的base为10。允许的基数为0和2--36。对于基数2 -36。对于基数2,-8和-16来说字符串前面还能加上可选的0b/0B,0o/00或0x/0X前缀,就像代码中的整数字面值那样。对于基数0来说,字符串会以与代码中的整数字面值类似的方式来解读,即实际的基数将由前缀确定为2,8,10或16。基数为0还会禁用前导的零: int('010',0)将是无效的,而int('010')和int('010',8)则是有效的。0 码力 | 2248 页 | 11.10 MB | 1 年前3
Blender v3.5 参考手册(简体中文版)状态栏的中间显示有关正在进行的操作的信息。 Sequence Render 94% ## 运行的任务 显示当前运行的任务(比如"渲染"或"烘焙")的进度。将鼠标指针悬停在进度条上会显示一个时间估计。任务可以通过点击取消按钮(x图标)中止。 ## 报告信息 信息性消息或警告,例如在保存文件之后。它们会在短时间内消失。点击它们可以在信息编辑器中显示完整的信息。 ## 资源信息 状态栏的右侧 几何数据(Geometry) 根据模式和物体类型显示有关当前场景的信息。可以是顶点、面、三角形、或骨骼的数量。 物体所选物体的数量和总数。 ## 系统内存 Blender内存消耗估计值。在单实例单机器的情况下,这个估计值提供了一个针对机器硬件限制的测量。 ## Blender 版本 当前运行的Blender版本。 ## 区域 Blender窗口被划分为若干矩形,称为区域。区域为编辑器保留屏 that's closest to the viewport's viewing direction (when not hovering over a surface). ## 基础(基数) ## 原点 How the base is defined. 边: The base is defined from one corner to the opposing corner. 中心:0 码力 | 4816 页 | 302.58 MB | 2 年前3
Hello 算法 1.2.0 简体中文 Java 版11.2 选择排序 11.3 冒泡排序 11.4 插入排序 11.5 快速排序 11.6 归并排序 11.7 堆排序 11.8 桶排序 11.9 计数排序 11.10 基数排序 11.11 小结 第12章 分治 12.1 分治算法 12.2 分治搜索策略 12.3 构建二叉树问题 12.4 汉诺塔问题 12.5 小结 第13章 不错,看上去并没有什么问题。 但如果学过算法,我们就会知道内置排序函数的时间复杂度是 $ O(n \log n) $ ;而如果给定的数据是固定位数的整数(例如学号),那么我们就可以用效率更高的“基数排序”来做,将时间复杂度降为 $ O(nk) $ ,其中 k 为位数。当数据体量很大时,节省出来的运行时间就能创造较大价值(成本降低、体验变好等)。 在工程领域中,大量问题是难以达到最优解的,许 于不同场景。 在做算法题时,我们会倾向于选择基于数组实现的栈,因为它提供了更高的操作效率和随机访问的能力,代价仅是需要预先为数组分配一定的内存空间。 如果数据量非常大、动态性很高、栈的预期大小难以估计,那么基于链表实现的栈更加合适。链表能够将大量数据分散存储于内存的不同部分,并且避免了数组扩容产生的额外开销。 ### 4.5 小结 ### 1. 重点回顾 - 数组和链表是两种基本的数据结构0 码力 | 379 页 | 18.48 MB | 1 年前3
Hello 算法 1.2.0 简体中文 JavaScript 版11.2 选择排序 11.3 冒泡排序 11.4 插入排序 11.5 快速排序 11.6 归并排序 11.7 堆排序 11.8 桶排序 11.9 计数排序 11.10 基数排序 11.11 小结 第12章 分治 12.1 分治算法 12.2 分治搜索策略 12.3 构建二叉树问题 12.4 汉诺塔问题 12.5 小结 第13章 不错,看上去并没有什么问题。 但如果学过算法,我们就会知道内置排序函数的时间复杂度是 $ O(n \log n) $ ;而如果给定的数据是固定位数的整数(例如学号),那么我们就可以用效率更高的“基数排序”来做,将时间复杂度降为 $ O(nk) $ ,其中 k 为位数。当数据体量很大时,节省出来的运行时间就能创造较大价值(成本降低、体验变好等)。 在工程领域中,大量问题是难以达到最优解的,许 不同场景。 在做算法题时,我们会倾向于选择基于数组实现的栈,因为它提供了更高的操作效率和随机访问的能力,代价仅是需要预先为数组分配一定的内存空间。 如果数据量非常大、动态性很高、栈的预期大小难以估计,那么基于链表实现的栈更加合适。链表能够将大量数据分散存储于内存的不同部分,并且避免了数组扩容产生的额外开销。 ### 4.5 小结 ### 1. 重点回顾 - 数组和链表是两种基本的数据结构0 码力 | 379 页 | 18.47 MB | 1 年前3
共 370 条
- 1
- 2
- 3
- 4
- 5
- 6
- 37













