Alluxio 助力 Kubernetes, 加速云端深度学习
Kubernetes, 加速云端深度学习 范斌 Alluxio 创始成员 车漾 阿里云高级技术专家 目录 • 我们是谁 • 问题背景 • Alluxio 助力云原生 AI 模型训练 • 相关资料 • Alluxio 是谁 • Allluxio 与 Kubernetes 结合 • Alluxio 优化实践 我们是谁? 车漾 阿里云高级技术专家 范斌 Alluxio 创始成员 背景0 码力 | 22 页 | 11.79 MB | 1 年前3从十到千,响应团队规模的敏捷与DevOps实践-冯斌
从十到千,响应团队规模的敏捷与DevOps实践-冯斌0 码力 | 27 页 | 8.15 MB | 1 年前3腾讯云 Kubernetes 高性能网络技术揭秘——使用 eBPF 增强 IPVS 优化 K8s 网络性能-范建明
0 码力 | 27 页 | 1.19 MB | 9 月前3成都敏捷之旅十周年/4_廖靖斌如何使用影响地图发掘有价值的需求2018
0 码力 | 29 页 | 1.81 MB | 1 年前3C++高性能并行编程与优化 - 课件 - 09 CUDA C++ 流体仿真实战
CUDA C++ 流体仿真实 战 by 彭于斌( @archibate ) 往期录播: https://www.bilibili.com/video/BV16b4y1E74f 课程 PPT 和代码: https://github.com/parallel101/course CUDA 纹理对象 https://docs.nvidia.com/cuda/cuda-c-programming-guide/index 当然如果是三维数组,那就是三维纹理对象,访问时是 提供三线性插值( trilerp )的。 CUDA 纹理对象:封装 • 其中 cudaTextureAddressMode 表示采样的坐标超出范 围时采取的措施,有以下几种选择: • cudaAddressModeClamp :超出范围就用边界值代替 • 示意: AA | ABCDE | EE • cudaAddressModeBorder0 码力 | 58 页 | 14.90 MB | 1 年前32022年美团技术年货 合辑
链接预测及图分类在内的多种图相关的任务。 图 3 GraphSage 模型的采样及聚合过程 算法 < 105 GraphSAGE 等基于消息传递范式的图神经网络方法,其中心节点能聚合到的特征范 围取决于其采样的邻居阶数。在使用这类图神经网络训练时,除了使用节点的固有特 征作为模型输入外,我们还可以给每个节点加入独立可训练的向量参数,从而更好的 学习到高阶邻居的相关性。 除了上述提到 历发送至:tech@meituan.com(邮件主题:美团平台 / 搜索推荐算法部)。 算法 < 129 美团外卖推荐情境化智能流量分发的实践与探索 作者:瑞东 俊洁 乐然 覃禹 秀峰 王超 张鹏 尹斌 北海 1. 引言 美团外卖推荐服务了数亿用户,通过持续优化用户体验和流量分发精准性,为用户提 供品质生活,“帮大家吃得更好,生活更好”。对于“用户”,大家可能会有不同的理 解,通常的理解是用 是不可取的,在未来将考虑 结合 AutoML、交叉网络等手段提高参数利用效率,寻求在推荐场景落地稀疏专家网 络的工业级解决方案。 5. 本文作者 瑞东、俊洁、乐然、覃禹、秀峰、王超、张鹏、尹斌、北海等,均来自到家事业群 / 到家研发平 台 / 搜索推荐技术部。 6. 参考文献 [1] Zhou G, Zhu X, Song C, et al. Deep interest network0 码力 | 1356 页 | 45.90 MB | 1 年前3Nacos架构&原理
320 结语 326 结语 326 作者 < 6 作者 李艳林(彦林) 李晓双 孙立(涌月) 柳遵飞(翼严) 廖春涛(春少) 杨翊(席翁) 程露 钱陈(潕量) 张龙 范扬(扬少) 张斌斌 李志鹏(怀成) 黄文清 吴援飘(草谷) 吴毅挺 任浩军 张波 王建伟(正己) 卿亮 许进 7 > 推荐序 推荐序 阿里巴巴合伙人 - 蒋江伟(小邪) 随着企业加速0 码力 | 326 页 | 12.83 MB | 9 月前3C++高性能并行编程与优化 - 课件 - 01 学 C++ 从 CMake 学起
学 C++ 从 CMake 学起 by 彭于斌( @archibate ) 高性能并行编程与优化 - 课程大纲 • 分为前半段和后半段,前半段主要介绍现代 C++ ,后半段主要介绍并行编程与优化。 1.课程安排与开发环境搭建: cmake 与 git 入门 2.现代 C++ 入门:常用 STL 容器, RAII 内存管理 3.现代 C++ 进阶:模板元编程与函数式编程 4.编译器如何自动优化:从汇编角度看 -B build -DCMAKE_TOOLCHAIN_FILE="%CD%/vcpkg/scripts/buildsystems/vcpkg.cmake" 感谢观看! presents by 彭于斌 个人 GitHub : https://github.com/archibate Bilibili 主页: https://space.bilibili.com/263032155 PPT 和代码:0 码力 | 32 页 | 11.40 MB | 1 年前3C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型
从稀疏数据结构到量化数据类型 by 彭于斌( @archibate ) 往期录播: https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码: https://github.com/parallel101/course 本课涵盖:稀疏矩阵、 unordered_map 、空间稀 疏网格、位运算、浮点的二进制格式、内存带宽优 化 面向人群:图形学、 及时释放全零的块,用量化的 bit 压缩空 间,使用 omp 或 tbb 并行,用 accessor 缓存坐标以减轻锁的压力。 • 评分规则:加速了多少倍就是多少分。 感谢观看! by 彭于斌( github@archibate ) 录播: https://space.bilibili.com/ 263032155 课件: https://github.com/parallel101/ course0 码力 | 102 页 | 9.50 MB | 1 年前3C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化
从汇编角度看编译器优化 by 彭于斌( @archibate ) 往期录播: https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码: https://github.com/parallel101/course 高性能并行编程与优化 - 课程大纲 • 分为前半段和后半段,前半段主要介绍现代 C++ ,后半段主要介绍并行编程与优化。 1 -march=native CMake 中开启 -O3 CMake 中开启 -fopenmp CMake 中开启 -ffast-math 和 -march=native 感谢观看! by 彭于斌( github@archibate ) 录播: https://space.bilibili.com/ 263032155 课件: https://github.com/parallel101/ course0 码力 | 108 页 | 9.47 MB | 1 年前3
共 379 条
- 1
- 2
- 3
- 4
- 5
- 6
- 38