SelectDB案例 从 ClickHouse 到 Apache Doris导致指标和标签缺乏统一管理, 4 这使得数据管理和使用的难度都变高。 Dataset 与物理位置绑定,应用层无法进行透明优化,如果 Doris 引擎出现负载较 高的情况,无法通过降低用户查询避免集群负载过高报错的问题。 数据架构 3.0 针对指标和标签定义口径不统一,数据使用和管理难度较高的问题,我们继续对架构进行升 级。数据架构 3.0 主要的变化是引入了专门的语义层,语义层的主要作用是将技术语言转 节点,细化负载均 衡粒度。 优化背景:在写入时发现某一个 BE 负载会远远高于其他的 BE,甚至出现 OOM。结合源 码发现:作业启动后会获取一次 BE 地址列表,从中随机选出一个 BE 作为 Coordinator 协 调者,该节点主要负责接收数据、并分发到其他的 BE 节点,除非作业异常报错,否则该节 点不会发生切换。 对于少量 Flink 作业大数据场景会导致选中的 BE 节点负载较高,因此我们尝试对 节点负载较高,因此我们尝试对 BE 提 交逻辑进行优化,设置每 1 小时缓存一次 BE 列表,每写入一个批次都随机从 BE 缓存列 表中获取一个进行提交,这样负载均衡的粒度就从 job 级别细化到每次提交的批次,使得 BE 间负载更加的均衡,这部分实现我们已经贡献到社区,欢迎大家一起使用并反馈。 https://github.com/apache/doris-spark-connector/pull/590 码力 | 12 页 | 1.55 MB | 1 年前3
百度智能云 Apache Doris 文档期望的并发度。一个例行导入作业会被分成多个子任务执行。这个参数指定一个作业最多有多少任务可以同时执行。 必须大于0。默认为3。 这个并发度并不是实际的并发度,实际的并发度,会通过集群的节点数、负载情况,以及数据源的情况综合考虑。 2. 这三个参数分别表示: 1. 每个子任务最大执行时间,单位是秒。范围为 5 到 60。默认为10。 2. 每个子任务最多读取的行数。必须大于等于200000。默认是200000。 ,则一切正常,可以进行之后的其他操作。 如果返回结果出现大量的 ,则可能说明目前集群某些资源(如IO)紧张导致导入的数据无法最终生 效。 状态的导入任务已经成功,无需重试,但此时建议减缓或停止新导入任务的提交,并观察集群负载情 况。 如果返回结果为 ,则说明导入失败,需根据具体原因查看问题。解决后,可以使用相同的 Label 重试。 在某些情况下,用户的 HTTP 连接可能会异常断开导致无法获取最终的返回结果。此时可以使用相同的0 码力 | 203 页 | 1.75 MB | 1 年前3
共 2 条
- 1













