使用硬件加速Tokio - 戴翔
第三届中国 Rust 开发者大会 使用硬件加速 Tokio 演讲人: Loong.Dai, Cathy.Lu Loong Dai • Intel 云原生工程师 • 微软 MVP • Dapr 、 Thanos 、 Golangci-lint 的 Maintainer • 现在主要专注于服务网格领域,探索云原生软硬件结 合新范式 • Github ID: daixiang0 自我介绍 自我介绍 Cathy Lu • Intel 软件工程师 • 专注于 NFV, 电信网络云化等方案 Rust currently provides only the bare essentials for writing async code. Rust has very strict backward compatibility requirements, , and they haven't0 码力 | 17 页 | 1.66 MB | 1 年前3FPGA助力Python加速计算 陈志勇
Python 加速计算 陈志勇 高级技术市场经理 安富利电子科技 2019年10月19日,北京 2 ➢ Python 语言:易学易读易用、可扩展性、可移植性等。 ➢ Python 开发工具:库丰富、效率高、调试方便 ➢ Python 的应用: 人工智能、数据分析等 ➢ Python 的生态环境:软件平台、硬件平台、方案合作伙伴等 ➢ 用 Python 如何开发嵌入式产品?如何实现 算法硬件加速? ➢ ➢ 之前基于python开发的工程师很少接触嵌入式环境, 接触硬件 ➢ 本次题目的主要内容 ➢ Python <- tools -> FPGA ➢ 算法硬件加速:用FPGA的逻辑硬件实现算法加速 ➢ 算法如何在FPGA 中实现?如何用”与或非”门电路去写 算法? ➢ 目前哪些 Xilinx FPGA的开发工具支持python 语言? ➢ 目前Xilinx 工具支持python 的主要应用领域 件设备、 嵌入 式操作系统以及用户的应用程序等四个部分组成。 ➢ 嵌入式系统促使计算机的形态和性能更加小型化,多功能,低功耗. ➢ 加速计算: ➢ 如何提高计算效率,提高计算性能 ➢ 加速计算框架的考虑 ➢ 加速计算平台的考虑 ➢ FPGA 是如何作为加速平台的?在边缘和云端 Python 与嵌入式计算 4 ➢ FPGA(Field Programmable Gate Array)是在0 码力 | 34 页 | 4.19 MB | 1 年前307 FPGA 助力Python加速计算 陈志勇
FPGA 助力 Python 加速计算 陈志勇 高级技术市场经理 安富利电子科技 2019年10月20日,深圳 2 Ø Python 语言:易学易读易用、可扩展性、可移植性等。 Ø Python 开发工具:库丰富、效率高、调试方便 Ø Python 的应用: 人工智能、数据分析等 Ø Python 的生态环境:软件平台、硬件平台、方案合作伙伴 等 Ø 用 Python 如何开发嵌入式产品?如何实现 如何开发嵌入式产品?如何实现 算法硬件加速? Ø 之前基于python开发的工程师很少接触嵌入式环境, 接触硬件 Ø 本次题目的主要内容 Ø Python <- tools -> FPGA Ø 算法硬件加速:用FPGA的逻辑硬件实现算法加速 Ø 算法如何在FPGA 中实现?如何用”与或非”门电路去 写算法? Ø 目前哪些 Xilinx FPGA的开发工具支持python 语言? Ø 目前Xilinx 工具支持python 件设备、 嵌入 式操作系统以及用户的应用程序等四个部分组成。 Ø 嵌入式系统促使计算机的形态和性能更加小型化,多功能,低功耗. Ø 加速计算: Ø 如何提高计算效率,提高计算性能 Ø 加速计算框架的考虑 Ø 加速计算平台的考虑 Ø FPGA 是如何作为加速平台的?在边缘和云端 Python 与嵌入式计算 4 Ø FPGA(Field Programmable Gate Array)是在0 码力 | 34 页 | 6.89 MB | 1 年前32_FPGA助力Python加速计算_陈志勇
Python 加速计算 陈志勇 高级技术市场经理 安富利电子科技 2019年9月21日, 上海 2 Ø Python 语言:易学易读易用、可扩展性、可移植性等。 Ø Python 开发工具:库丰富、效率高、调试方便 Ø Python 的应用: 人工智能、数据分析等 Ø Python 的生态环境:软件平台、硬件平台、方案合作伙伴等 Ø 用 Python 如何开发嵌入式产品?如何实现 算法硬件加速? Ø Ø 之前基于python开发的工程师很少接触嵌入式环境, 接触硬件 Ø 本次题目的主要内容 Ø Python <- tools -> FPGA Ø 算法硬件加速:用FPGA的逻辑硬件实现算法加速 Ø 算法如何在FPGA 中实现?如何用”与或非”门电路去写 算法? Ø 目前哪些 Xilinx FPGA的开发工具支持python 语言? Ø 目前Xilinx 工具支持python 的主要应用领域 件设备、 嵌入 式操作系统以及用户的应用程序等四个部分组成。 Ø 嵌入式系统促使计算机的形态和性能更加小型化,多功能,低功耗. Ø 加速计算: Ø 如何提高计算效率,提高计算性能 Ø 加速计算框架的考虑 Ø 加速计算平台的考虑 Ø FPGA 是如何作为加速平台的?在边缘和云端 Python 与嵌入式计算 4 Ø FPGA(Field Programmable Gate Array)是在0 码力 | 33 页 | 8.99 MB | 1 年前3FFmpeg在Intel GPU上的硬件加速与优化
FFmpeg在Intel GPU上的 硬件加速与优化 赵军 DCG/NPG @ Intel 介绍FFmpeg VAAPI • Media pipeline review • 何谓FFmpeg VAAPI • 为什么我们需要FFmpeg VAAPI • 当前状态 • 更进一步的计划 • 附录 典型的 media pipeline File Device Network Stream acceleration) • MPEG-2, MPEG-4 on VIA Unichrome • Xv/XvMC 的限制 • 不支持解码所有阶段的硬件加速 • 依赖于X-protocol协议(转码时候,你需要Xwindow吗?) • 不支持硬件编码加速 • … Linux Video API 续 一 • 何谓VA-API(Video Acceleration API ) • An API specification MIT license • It opens and registers a backend • https://github.com/01org/libva • 依赖于后端驱动,可以提供Video硬件加速 • 解码 • 编码 • 图像后处理 可用的后端驱动 • Intel VA(i965) driver for Intel chip-sets • Intel hybrid driver • Intel0 码力 | 26 页 | 964.83 KB | 1 年前33 使用Python加速文件传输和文件复制 Giampaolo Rodola
● Linux + NFS ● server-side copy ● https://bugs.python.org/issue37159 Speedup shutil.copytree() 加速 shutil.copytree() >>> import shutil >>> shutil.copytree('somedir', 'somedir-2') Copy directory tree0 码力 | 78 页 | 654.51 KB | 1 年前32.2.6 字节跳动在 Go 网络库上的实践
字节跳动在 Go 网络库上的实践 何晨 字节跳动 基础架构 – 研发 应用层 Netpoll – 面向 RPC 场景的网络库 Go net Netpoll 网络层 RPC 框架 HTTP 框架 KiteX Hertz Netpoll – 性能表现 Environment CPU: 4 cores Memory: 8GB Go: 1.15.4 Netpoll0 码力 | 42 页 | 3.19 MB | 1 年前3PyConChina2022-上海-Python启动加速探索及实践-严懿宸
Python 启动加速 探索及实践 主讲人: 严懿宸 – 阿里云 严懿宸 曾于 Oracle Labs 参与 GraalVM 开发 毕业后加入阿里云 – 编译器 目前负责 Python / Node.js 的 Runtime 优化 Content • Python 启动速度简析 • PyCDS 设计与实现 • 更多讨论 Python startup time Python startup0 码力 | 21 页 | 3.18 MB | 1 年前3MoonBit月兔编程语言 现代编程思想 第十三课 案例:神经网络
0 码力 | 17 页 | 521.66 KB | 1 年前32020美团技术年货 算法篇
1. 背景 在过去十年,机器学习在学术界取得了众多的突破,在工业界也有很多应用落地。美 团很早就开始探索不同的机器学习模型在搜索场景下的应用,从最开始的线性模型、 树模型,再到近两年的深度神经网络、BERT、DQN 等,并在实践中也取得了良好 的效果与产出。 本文将与大家探讨美团搜索与 NLP 部使用的统一在线预估框架 Augur 的设计思路、 效果、优势与不足,希望对大家有所帮助或者启发。 f,获得最终的结果)。 4 > 美团 2020 技术年货 模型预估很简单,从业务工程的视角来看,无论多复杂,它只是一个计算分数的过 程。对于整个运算的优化,无论是矩阵运算,还是底层的 GPU 卡的加速,业界和美 团内部都有比较好的实践。美团也提供了高性能的 TF-Serving 服务(参见《基于 TensorFlow Serving 的深度学习在线预估》一文)以及自研的 MLX 模型打分服务, 然后将投影后的矩阵输入到 Multi-Head Attention。计算公式如下: Point-wise Feed-Forward Networks 该模块是为了提高模型的非线性能力提出来的,它就是全连接神经网络结构,计算公 式如下: 26 > 美团 2020 技术年货 Transformer Layer 就是通过这种自注意力机制层和普通非线性层来实现对输入信号 的编码,得到信号的表示。 美团搜索排序0 码力 | 317 页 | 16.57 MB | 1 年前3
共 348 条
- 1
- 2
- 3
- 4
- 5
- 6
- 35