Go on GPUChangkun Ou. 2023. Go on GPU. GopherChina 2023. Session "Foundational Toolchains" Go on GPU Changkun Ou changkun.de/s/gogpu GopherChina 2023 Session “Foundational Toolchains” 2023 June 10 1 Changkun Ou. 2023. Go on GPU. GopherChina 2023. Session "Foundational Toolchains" Agenda ● Basic knowledge for interacting with GPUs ● Accelerate Go programs using GPUs ● Challenges in Go when using outlooks 2 Changkun Ou. 2023. Go on GPU. GopherChina 2023. Session "Foundational Toolchains" Agenda ● Basic knowledge for interacting with GPUs ○ Motivation ○ GPU Driver and Standards ○ Render and0 码力 | 57 页 | 4.62 MB | 1 年前3
Bridging the Gap: Writing Portable Programs for CPU and GPU1/66Bridging the Gap: Writing Portable Programs for CPU and GPU using CUDA Thomas Mejstrik Sebastian Woblistin 2/66Content 1 Motivation Audience etc.. Cuda crash course Quiz time 2 Patterns Oldschool Motivation Patterns The dark path Cuda proposal Thank you Why write programs for CPU and GPU Difference CPU/GPU Algorithms are designed differently Latency/Throughput Memory bandwidth Number of cores Motivation Patterns The dark path Cuda proposal Thank you Why write programs for CPU and GPU Difference CPU/GPU Why it makes sense? Library/Framework developers Embarrassingly parallel algorithms User0 码力 | 124 页 | 4.10 MB | 6 月前3
FFmpeg在Intel GPU上的硬件加速与优化FFmpeg在Intel GPU上的 硬件加速与优化 赵军 DCG/NPG @ Intel 介绍FFmpeg VAAPI • Media pipeline review • 何谓FFmpeg VAAPI • 为什么我们需要FFmpeg VAAPI • 当前状态 • 更进一步的计划 • 附录 典型的 media pipeline File Device Network Stream radeon, nouveau (?), freedreno, … • 废弃的 API bridges • vdpau—va bridge • powervr—va bridge • … Intel GPU简介 • Gfx Label • Gen3: Pinetrail (Pineview) • Gen4: G965 • Gen5: G4X, Ironlake (Piketon, Calpella) Kabylake • … • Intel® Processor Graphics • 3D 渲染(OpenGL & Vulkan) • Media • 显示与计算(CUDA & OpenCL) Intel GPU media 硬件编程模型 slice Ring buffer FFmpeg MSDK i965/iHD OS scheduler com1 KMD com2 com3 Batch0 码力 | 26 页 | 964.83 KB | 1 年前3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程CUDA 开启的 GPU 编程 by 彭于斌( @archibate ) 往期录播: https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码: https://github.com/parallel101/course 前置条件 • 学过 C/C++ 语言编程。 • 理解 malloc/free 之类的概念。 • 熟悉 STL 中的容器、函数模板等。 做不到的。 编写一段在 GPU 上运行的代码 • 定义函数 kernel ,前面加上 __global__ 修 饰符,即可让他在 GPU 上执行。 • 不过调用 kernel 时,不能直接 kernel() ,而 是要用 kernel<<<1, 1>>>() 这样的三重尖括 号语法。为什么?这里面的两个 1 有什么用 ?稍后会说明。 • 运行以后,就会在 GPU 上执行 printf 了。 kernel 函数在 GPU 上执行,称为核 函数,用 __global__ 修饰的就是核函数。 没有反应?同步一下! • 然而如果直接编译运行刚刚那段代码,是不会打印出 Hello, world! 的。 • 这是因为 GPU 和 CPU 之间的通信,为了高效,是异 步的。也就是 CPU 调用 kernel<<<1, 1>>>() 后,并不 会立即在 GPU 上执行完毕,再返回。实际上只是把0 码力 | 142 页 | 13.52 MB | 1 年前3
2022年美团技术年货 合辑目录 < v Replication(上):常见复制模型 & 分布式系统挑战 792 Replication(下):事务,一致性与共识 818 TensorFlow 在美团外卖推荐场景的 GPU 训练优化实践 855 CompletableFuture 原理与实践 - 外卖商家端 API 的异步化 879 工程效能 CI/CD 之流水线引擎的建设实践 912 美团外卖搜索基于 Elasticsearch SQL 分析与审计系统性能优化之旅 1048 数据库异常智能分析与诊断 1059 美团外卖广告智能算力的探索与实践(二) 1079 Linux 下跨语言调用 C++ 实践 1101 GPU 在外卖场景精排模型预估中的应用实践 1130 美团集群调度系统的云原生实践 1149 广告平台化的探索与实践 | 美团外卖广告工程实践专题连载 1161 数据 1193 Kafka AP,在 T4 上推理速度可达 1242 FPS;YOLOv6-s 在 COCO 上精度可达 43.1% AP,在 T4 上推理速度可达 520 FPS。在部署方面, YOLOv6 支 持 GPU(TensorRT)、CPU(OPENVINO)、ARM(MNN、TNN、 NCNN)等不同平台的部署,极大地简化工程部署时的适配工作。 目前,项目已开源至 Github,传送门:YOLOv6。欢迎有需要的小伙伴们0 码力 | 1356 页 | 45.90 MB | 1 年前3
CmlPHP v2.x 开发手册
1.6.26 7. 部署 1.7 1. 伪静态配置 1.7.1 1. Apache 1.7.1.1 2. Nginx 1.7.1.2 2. 静态资源管理 1.7.2 8. 安全 1.8 1. 防注入 1.8.1 2. 用户数据输入 1.8.2 3. csrf 1.8.3 4. 加密解密 1.8 在服务器配置方便修改的情况下入口文件也在这个目录 下,在框架推荐的分应用模式下,上线后通过系统命令会将 projxxx 下的所有应用 下 Resource目录 映射到 public 下。详情查看 静态资源管理 开发指引 本章节主要从开发的各个模块讲解 CmlPHP 的使用。帮忙开发人员快速、高效的使 用 CmlPHP 开发项目。 配置 在项目目录说明 下的 Config章节说过,在 cli 、 http://mysite/public/web/js/1.js 。此时 public 目录 中并没有这个静态文件,静态文件是存在于应用目录下的 Resource 中,此时我们 要使用静态资源管理工具去管理静态资源目录,点击查看静态资源管理。 模板中判断有无某个模块的权限 使用模板标签 {{acl xxx}} {{acl user/add}} 我有添加用户的权限 {{/acl}} 或 {{acl0 码力 | 251 页 | 973.37 KB | 1 年前3
CmlPHP v2.x 开发手册
1.8.1 1.8.2 1.8.3 1.8.4 1.9 1.9.1 1.10 1.11 验证码 文件上传 数据库迁移 部署 伪静态配置 Apache Nginx 静态资源管理 安全 防注入 用户数据输入 csrf 加密解密 常见问题 模板中不同的url_model模式下传参给后端 ? &符混乱 服务高可用 升级日志 CmlPHP v2.x开发手册 在服务器配置方便修改的情况下入口文件 也在这个目录下,在框架推荐的分应用模式下,上线后通过系统命 令会将 projxxx 下的所有应用下 Resource目录 映射到 public 下。详情查看 静态资源管理 开发指引 本章节主要从开发的各个模块讲解 CmlPHP 的使用。帮忙开发人员快 速、高效的使用 CmlPHP 开发项目。 配置 在项目目录说明 下的 Config章节说过, 在 http://mysite/public/web/js/1.js 。此时 public 目录 中并没有这个静态文件,静态文件是存在于应用目录下的 Resource 中,此时我们要使用静态资源管理工具去管理静态资 源目录,点击查看静态资源管理。 模板中判断有无某个模块的权限 使用模板标签 {{acl xxx}} {{acl user/add}} 我有添加用户的权限 {{/acl}} 或 {{acl0 码力 | 245 页 | 720.67 KB | 1 年前3
CmlPHP v2.x 开发手册
2 1.8.3 1.8.4 1.9 1.9.1 1.10 1.11 权限管理 数据验证 验证码 文件上传 数据库迁移 部署 伪静态配置 Apache Nginx 静态资源管理 安全 防注入 用户数据输入 csrf 加密解密 常见问题 模板中不同的url_model模式下传参给后端 ? &符混乱 服务高可用 升级日志 3 CmlPHP v2.x开发手册 在服务器配置方便修改的情况下入口文件也在这个目录下,在框架推荐的 分应用模式下,上线后通过系统命令会将 projxxx 下的所有应用下 Resource目录 映射到 public 下。详情查看 静态资源管理 15 开发指引 本章节主要从开发的各个模块讲解 CmlPHP 的使用。帮忙开发人员快速、高效的使用 CmlPHP 开发项 目。 16 配置 在项目目录说明 下的 Config章节说过,在 http://mysite/public/web/js/1.js 。此 时 public 目录中并没有这个静态文件,静态文件是存在于应用目录下的 Resource 中, 此时我们要使用静态资源管理工具去管理静态资源目录,点击查看静态资源管理。 模板中判断有无某个模块的权限 使用模板标签 {{acl xxx}} {{acl user/add}} 我有添加用户的权限 {{/acl}} 或 {{acl0 码力 | 143 页 | 1.54 MB | 1 年前3
1.2 基于 Golang 构建高可扩展的云原生 PaaS 平台业务 数据 业务系统 C 业务 数据 业务系统 A 业务 数据 业务系统 B 资源管理在统⼀平台 应⽤运⾏在统⼀平台 构建标准的交付环境 交付产物标准化 - 业务配置 - 资源配置 - 依赖配置 - 流⽔线配置 配置即代码 : 实现⼤规模交付的部署过程可被验证 PaaS 平台:资源管理,容器编排,基础监控和告警 APM 监控:应⽤诊断,链路追踪,⽇志分析 微服务治理组件 Operator 注册中⼼ 配置中⼼ API ⽹关 微服务拓扑 全链路追踪 错误分析 ⽇志分析 主动监控 浏览器监控 APP 监控 慢SQL JVM 诊断 ⾃定义告警 APM 微服务管理 资源管理 标签管理 系统监控 集群管理 服务⽬录 埋点 数据库 ⽇志 画像 标签 报表 推荐 … 代码管理 持续集成 编排部署 应⽤运维 测试管理 协同管理 数据源管理 数据集成0 码力 | 40 页 | 8.60 MB | 1 年前3
尝试用RUST写教学操作系统当锁离开作用域时自动释放, 防 止造成死锁 • Rust 提供了unsafe 这种块能够做不安全但必须的事 情如指针算术. 但不安全的代码越少越好 14 RUST的运行时约束: 所有权机制和资源管理 • RefCell– borrow() – borrow_mut() • Mutex – lock() • Dirty – borrow() – borrow_mut() 0 码力 | 23 页 | 1.53 MB | 1 年前3
共 301 条
- 1
- 2
- 3
- 4
- 5
- 6
- 31













