THE FIRST EXPLORATION OF PROJECT SPARROW
html I. Background . Source: https://os.inf.tu-dresden.de/Studium/MkK//SS2021/01_intro.pdf Architecture & Design 1.2 L4 Overview I. Background https://en.wikipedia.org/wiki/L4_microkernel_family Source: https://sel4.systems/About/seL4-whitepaper.pdf I. Background Source: https://sel4.systems/About/seL4-whitepaper.pdf 1.2.1.2 Virtualization I. Background seL4 https://sel4.systems/About/seL4-whitepaper.pdf I. Background seL4 virtualization support with usermode VMMs Source: https://sel4.systems/About/seL4-whitepaper.pdf 1.2.1.3 Provable Security I. Background0 码力 | 68 页 | 13.14 MB | 1 年前3C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型
com/zenustech/zeno Taichi 也支持稀疏数据结构 • https://yuanming.taichi.graphics/publication/2019-taichi/taichi-lang-slides.pdf 第 4 章:并行与随机访问 回到指针的数组 试图并行地访问:出错了 为什么?因为多个核心同时访问了 m_block ,造成数据竞争。所 以有的指针被重复分配了两遍,写入了那个地址却没有实际被存到 taichi.graphics/publication/2021-quantaichi/quantaichi.pdf 小彭老师第一时间赶到现场锐评 • https://yuanming.taichi.graphics/publication/2021-quantaichi/quantaichi.pdf ← ??? 第 7 章: SPGrid 操作系统管理内存的最小单位:页( 4KB ) • 当调用 SPGrid ,不过 GPU 的 页大小是 2MB ,王鑫磊最近研究过这个,因为太繁 琐而放弃了。 http://pages.cs.wisc.edu/~sifakis/papers/SPGrid.pdf 今天的回家作业 • 用稀疏数据结构改良康威生命游戏 (conway’s game of life) 的代码。 • 要求:自动扩展边界,按需分配内存,垃圾回收及时释放全零的块,用量化的 bit0 码力 | 102 页 | 9.50 MB | 1 年前3C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程
里直接加你 的 .cu 文件,和 .cpp 一样。 https://www.nvidia.cn/docs/IO/51635/NVIDIA_CUDA_Programming_Guide_1.1_chs.pdf CUDA 编译器兼容 C++17 • CUDA 的语法,基本完全兼容 C++ 。包括 C+ +17 新特性,都可以用。甚至可以把任何一个 C++ 项目的文件后缀名全部改成 .cu ,都能编 同样是缩并到一定小的程度开始就切断 (cutoff) ,开始用 CPU 串行求和。 https://developer.download.nvidia.cn/assets/cuda/files/reduction.pdf 编译器真智能! • 刚刚说到虽然用了 atomicAdd 按理说是非常低 效的,然而却没有低效,这是因为编译器自动优 化成刚刚用 BLS 的数组求和了!可以看到他优 化后的效率和我们的 BLS 架构来说,每个线程最多可以有 63 个寄存器(每个有 4 字节)。 https://developer.download.nvidia.cn/CUDA/training/register_spilling.pdf 板块中的线程数量过少:延迟隐藏( latency hiding )失效 • 我们说过,每个 SM 一次只能执行板块中的一个线程组( warp ),也就是 32 个线程。 • 而当线程组陷入内0 码力 | 142 页 | 13.52 MB | 1 年前3NativeScript 101
dynatrace.com/rs/compuware/images/ Mobile_App_Survey_Report.pdf https://info.dynatrace.com/rs/compuware/images/ Mobile_App_Survey_Report.pdf Nativ e Hybri d ? Fast to market ? Best experience Binary0 码力 | 90 页 | 40.11 MB | 1 年前3C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门:RAII 内存管理
n_Action/README.md) - [ 因特尔 TBB 编程指南 ](https://www.inf.ed.ac.uk/teaching/courses/ppls/TBBtutorial.pdf) - [ 并行体系结构与编程 (CMU 15-418)](https://www.bilibili.com/video/av48153629/) - [ 深入理解计算机原理 (CSAPP)](http://csapp0 码力 | 96 页 | 16.28 MB | 1 年前3
共 5 条
- 1