FFmpeg在Intel GPU上的硬件加速与优化## FFmpeg在Intel GPU上的硬件加速与优化 赵军 DCG/NPG @ Intel ## 介绍FFmpeg VAAPI • Media pipeline review • 何谓FFmpeg VAAPI • 为什么我们需要FFmpeg VAAPI • 当前状态 • 更进一步的计划 · 附录 ## 典型的 media pipeline SOURCE libavformat acceleration) MPEG-2, MPEG-4 on VIA Unichrome ## • Xv/XvMC 的限制 - 不支持解码所有阶段的硬件加速 - 依赖于X-protocol协议(转码时候,你需要Xwindow吗?) - 不支持硬件编码加速 ## Linux Video API 续 一 ## • 何谓VA-API(Video Acceleration API ) • An API license • It opens and registers a backend https://github.com/01org/libva ## • 依赖于后端驱动,可以提供Video硬件加速 • 解码 • 编码 • 图像后处理 ## 可用的后端驱动 • Intel VA(i965) driver for Intel chip-sets • Intel hybrid driver0 码力 | 26 页 | 964.83 KB | 2 年前3
激活函数与GPU加速## PyTorch ## 激活函数与GPU加速 主讲人:龙良曲    ## GPU accelerated ## ☐ ☐ ☐ device = torch.device('cuda:0') net = MLP().to(device) optimizer =0 码力 | 11 页 | 452.22 KB | 2 年前3
Go on GPU## Go on GPU ## Changkun Ou changkun.de/s/gogpu GopherChina 2023 Session “Foundational Toolchains” 2023 June 10 ## Agenda - Basic knowledge for interacting with GPUs • Accelerate Go programs using • Conclusion and outlooks ## Agenda - Basic knowledge for interacting with GPUs o Motivation o GPU Driver and Standards Render and compute pipeline o Vulkan/Metal/DX12/OpenGL ☐ Accelerate Go programs programs using GPUs ☐ Challenges in Go when using GPUs ☐ Conclusion and outlooks ## Motivation of GPU Acceleration Improve system computation performance Increase amount of concurrency Processing large0 码力 | 57 页 | 4.62 MB | 2 年前3
1.2.4 Go on GPUGo on GPU 欧长坤 changkun.de/s/gogpu GopherChina 2023 Session “Foundational Toolchains” 2023 June 10 关于我 慕尼黑大学博士 (@mimuc/staff) 研究方向人在环路优化 (human-in-the-loop optimization) Sixt高级工程师 (@sixt/pricing-yield) …) 大纲 与GPU进行交互的基本知识 在Go程序中支持GPU加速 使用 Go 进行 GPU 计算的挑战 总结 大纲 与 GPU 进行交互的基本知识 使用 GPU 的动机 GPU 驱动和标准 渲染管线和计算管线 Vulkan/Metal/DX12/OpenGL 在 Go 程序中支持 GPU 加速 使用 Go 进行 GPU 计算的挑战 总结 总结 使用GPU加速计算的动机 提高系统计算性能 更大的并发量 大规模数据处理 机器学习、深度学习、图形学渲染等等 ’ alt=‘OCR图片’/> CPU的架构 ’ alt=‘OCR图片’/> GPU的架构 SIMD Exec Unit Cache SIMD Exec Unit Cache SIMD Exec Unit Cache SIMD Exec Unit Cache SIMD Exec0 码力 | 55 页 | 4.79 MB | 1 月前3
GPU Resource Management On JDOS## GPU Resource Management On JDOS 梁永清 liangyongqing1@jd.com ## 提供的服务 ## Experiment ## Training 1. 用于实验的 GPU 容器 2. 基于 Kubeflow 的机器学习训练服务 3. 模型管理和模型 Serving 服务 ## Serving 均基于容器,不对业务方直接提供 GPU 物理机 物理机 ## GPU 实验 JDOS 常规的容器服务, 使用 gpu 的 zone,自行设定相应的镜像即可, 有完善的周边服务 我的系统  三一键编译  public/tensor/now.1.4.1-ueve-gpu-vi  public/tensorflow:1.7.0-devel-gpu-py3-v1  ## 加速同节点pod间通信 cilium 使用 eBPF 程序,借助 bpf_redirect() 或 bpf_redirect_peer() 等 helper 函数,快速帮助同宿主机间的流量转发,节省了大量的内核协议栈处理流程0 码力 | 14 页 | 11.97 MB | 1 年前3
Bridging the Gap: Writing Portable Programs for CPU and GPUCPU and GPU ## THOMAS MEJSTRIK ## DIMETOR  FWF ## Bridging the Gap: Writing Portable Programs for CPU and GPU using CUDA ROCm, Vulkan, ... ☐ You can tell me about afterwards ## Why write programs for CPU and GPU ## ☐ Difference CPU/GPU Algorithms are designed differently ☐ Latency/Throughput ☐ Memory bandwidth ☐ Number Problem ☐ Why it makes sense? ☐ Scope of the talk ## Why write programs for CPU and GPU ## ☐ Difference CPU/GPU ☐ Why it makes sense? Library/Framework developers ☐ Embarrassingly parallel algorithms0 码力 | 124 页 | 4.10 MB | 1 年前3
使用硬件加速Tokio - 戴翔## RUST CHINA CONF 2023 第三届中国 Rust 开发者大会 6.17-6.18 @Shanghai ## 使用硬件加速 Tokio 演讲人:Loong.Dai, Cathy.Lu ## 😍 ## 自我介绍 0 码力 | 17 页 | 1.66 MB | 2 年前3
Alluxio 助力 Kubernetes, 加速云端深度学习## Alluxio 助力 Kubernetes, 加速云端深度学习 范斌 Alluxio 创始成员 车漾 阿里云高级技术专家 ## 目录 - 我们是谁 - 问题背景 - Alluxio 助力云原生 AI 模型训练 - Alluxio 是谁 - Alluxio 与 Kubernetes 结合 - Alluxio 优化实践 - 相关资料 ## 我们是谁? 模拟数据训练速度  分布式训练/GPU硬件升级加速明显 ## 模拟数据训练时间  1卡:12.78 元/小时 x108 = 1380.24 元 ## 数据访问的新挑战 1. 强大的算力需要匹配的I/O吞吐 2. 计算存储分离导致 I/O 延迟 3. 单机缓存无法满足海量数据加速   












