未授权访问漏洞 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

新一代分布式高性能图数据库的构建 - 沈游人

据的表示学习模型、语义推荐和风险管理关键技术，构建了完整的兼具理论指导与应用检验的大规模图数据智能分析系统与平台，满足了大数据时代从复杂异质图数据中进行知识发现的重要需求。最终获得国内外授权发明专利 43 项， CCF -A 类论文 51 篇，获得 2 次国际竞赛冠军，参与了 2 项图计算相关标准制定。 AtlasGraph 架构及实现图技术简介 Takeway “ 世界是复杂关系的总和”—— 内存缓存结构：加速图数据查询 • 由于图数据的查询通常是 IO 密集型，且访问的数据随机又分散，拥有内存缓存能起到很好的加速效果 • 要想让内存缓存发挥最大的作用，就要能在有限的内存中存下尽量多的图数据 • 例如，对于属性的存储，可以通过自行序列化 / 反序列化大幅节省内存 • 而自定义存储格式往往需要内存的精细操作，由于 Rust 允许在 unsafe 下访问裸指针，可以实现零开销读取 • 将 Unsafe 查询分析、服务状态监控、用户管理能力免代码，可视化定义实体、边，设计图模型。【亮点】 • 支持模型导入导出 • 拖拽式关系构建 • 丰富的样式配置 • 实时图结构预览 • 用户授权管理 • 中文及显示别名支持图模型设计 WebUI—— 可视化图探索分析【亮点】 • K 步邻居查询、属性过滤 • 最短路径、全路径分析 • 按实体、边类型匹配查询 • 子图识别、环路识别等在

0 码力 | 38 页 | 24.68 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

m) • 由于刚刚说了， map 真正的“元素类型”是 K-V 对，所以这里的 auto 如果不省略应该是： • for (pair tmp: m) • 如果要单独访问 K 或者 V 怎么办？我们看一下 pair 的定义，里面只有两个成员： • struct pair { • T1 first; T2 second; • }; }; map 的遍历：用 C++17 range-based loop • 所以 for (auto tmp: m) 这里 tmp 的类型是 pair 。 • 如果要单独访问 K 或者 V 怎么办？我们看一下 pair 的定义，里面只有两个成员： • struct pair { • T1 first; • T2 second; } map 的遍历：用 C++17 range-based loop • 所以 for (auto tmp: m) 这里 tmp 的类型是 pair 。 • 如果要单独访问 K 或者 V 怎么办？我们看一下 pair 的定义，里面只有两个成员： • struct pair { • T1 first; • T2 second;

0 码力 | 90 页 | 8.76 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

如下载一个文件，同时还要和用户交互。 • 这在 GUI 应用程序中很常见，比如浏览器在后台下载文件的同时，用户仍然可以用鼠标操作其 UI 界面。没有多线程：程序未响应 • 没有多线程的话，就必须等文件下载完了才能继续和用户交互。 • 下载完成前，整个界面都会处于“未响应”状态，用户想做别的事情就做不了。现代 C++ 中的多线程： std::thread • C++11 开始，为多线程提供了语言级别的值函数，但是提供了移动构造 / 赋值函数。 • 因此，当 t1 所在的函数退出时，就会调用 std::thread 的解构函数，这会销毁 t1 线程。 • 所以， download 函数才会出师未捷身先死 ——还没开始执行他的线程就被销毁了。解构函数不再销毁线程： t1.detach() • 解决方案：调用成员函数 detach() 分离该线程——意味着线程的生命周期不再由当前不传递任何实际的值。第 3 章：互斥量多线程打架案例 • 两个线程试图往同一个数组里推数据。 • 奔溃了！为什么？ • vector 不是多线程安全（ MT-safe ）的容器。 • 多个线程同时访问同一个 vector 会出现数据竞争（ data-race ）现象。 std::mutex ：上锁，防止多个线程同时进入某一代码段 • 调用 std::mutex 的 lock() 时，会检测

0 码力 | 79 页 | 14.11 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 13 C++ STL 容器全解之 vector

4 。 • size_t size() const noexcept; vector 容器： operator[] • 要访问 vector 里的元素，只需用 [] 运算符： • 例如 a[0] 访问第 0 个元素（人类的第一个） • 例如 a[1] 访问第 1 个元素（人类的第二个） • int &operator[](size_t i) noexcept; • int const vector 容器： operator[] • 值得注意的是， [] 运算符在索引超出数组大小时并不会直接报错，这是为了性能的考虑。 • 如果你不小心用 [] 访问了越界的索引，可能会覆盖掉别的变量导致程序行为异常，或是访问到操作系统未映射的区域导致奔溃。 • int &operator[](size_t i) noexcept; • int const &operator[](size_t 存储的数组，因此只要得到了首地址，下一个元素的地址只需指针 +1 即可。 • 因为指针的 p[i] 相当于 *(p + i) ，因此可以把 data() 返回的首地址指针当一个数组来访问。 • int *data() noexcept; • int const *data() const noexcept; vector 容器： data() 获取首地址指针 • data()

0 码力 | 90 页 | 4.93 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

写时， sv1 和 sv2 看到的字符串也改写了。强弱引用の安全守则 • 强引用和弱引用都可以用来访问对象。 • 每个存活的对象，强引用有且只有一个。 • 但弱引用可以同时存在多个，也可以没有。 • 强引用销毁时，所有弱引用都会失效。如果强引用销毁以后，仍存在其他指向该对象的弱引用，访问他会导致程序奔溃（野指针）。来点小彭老师地狱比喻？ • 强引用就像星巴克老板，弱引用就像来上厕所的张心欣（小彭老师的老板）。那么继续往下看， basic_string 里定义了一个 _Alloc_hider 类型的变量 _M_dataplus ，刚刚说了他里面实际派用场的是 _M_p ，所以下面的 _M_data() 函数直接访问 _M_dataplus._M_p 了。 string 的空基类优化 • 为了弥补这个缺点， C++ 标准委员会提出了空基类优化： • 如果一个类（ _Alloc_hider ）的基类是空类（ Shift-JIS 编码格式表示日语的字符…… 再后来，为了促进两岸统一，中国又有了包含同时简体和繁体的 GB18030 编码，包含了 27484 个汉字。 • 但是随着富连网的普及，很多网站都会跨国访问，如果你的电脑配置为 GBK ，那么看到其他编码格式的网站就会出现乱码。如何统一世界上这么多文字的编码？所以出现了俗称“万国码”的 Unicode 。他给世界上所有的字符编码，从英文字母到中

0 码力 | 162 页 | 40.20 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 09 CUDA C++ 流体仿真实战

的三维数组之间拷贝数据。 CUDA 表面对象：封装 • 要访问一个多维数组，必须先创建一个表面对象（ cudaSurfaceObject_t ）。 • 考虑到多维数组始终是需要通过表面对象来访问的，这里我们让表面对象继承自多维数组。 • 在核函数中可以用 surf3Dread 和 surf3Dwrite 来读写表面对象中的元素， x,y,z 参数指定要访问元素的坐标，要注意 x 必须乘以 sizeof( sizeof( 元素类型 ) ，否则出错。 • 这里用了访问者模式（ Accessor ， GPU 编程常用）。原来的 CudaSurface 管理资源，禁止拷贝。然后单独弄一个访问者类 CudaSurfaceAccessor ，不管理资源，仅仅是指向资源的一个弱引用，可以随意拷贝。并把读写访问的方法（ surf3Dread ）定义在访问者类。 CUDA 表面对象：封装 • 此外，表面对象还支持自动判断；对于写来说越界会放弃写入，不修改数组中的任何值。 • 表面对象保障了高效的访存，并且自动判断越界，体现了 GPU 作为图形学专业硬件的能力。 CUDA 纹理对象：封装 • 表面对象访问数组是可读可写的。纹理对象也可以访问数组，不过是只读的。好处是他可以通过浮点坐标来访问，且提供了线性滤波的能力。 • 在核函数中可以通过 tex3D 来读取纹理中的值。 • 之所以纹理是因为 GPU 一开始是渲染图形的专用硬件

0 码力 | 58 页 | 14.90 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

内部引入了一片极小的存储器——虽然小，但是读写速度却特别快。这片小而快的存储器称为缓存（ cache ）。 • 当 CPU 访问某个地址时，会先查找缓存中是否有对应的数据。如果没有，则从内存中读取，并存储到缓存中；如果有，则直接使用缓存中的数据。 • 这样一来，访问的数据量比较小时，就可以自动预先加载到这个更高效的缓存里，然后再开始做运算，从而避免从外部内存读写的超高延迟。缓存的分级结构回缓存中的数据。如果找不到，则向主内存发送请求，等读取到该地址的数据，就创建一个新条目。 • 在 x86 架构中每个条目的存储 64 字节的数据，这个条目又称之为缓存行（ cacheline ）。 • 当访问 0x0048~0x0050 这 4 个字节时，实际会导致 0x0040~0x0080 的 64 字节数据整个被读取到缓存中。 • 这就是为什么我们喜欢把数据结构的起始地址和大小对齐到 64 如有多级缓存，则一级缓存失效后会丢给二级缓存。连续访问与跨步访问 • 如果访问数组时，按一定的间距跨步访问，则效率如何？ • 从 1 到 16 都是一样快的， 32 开始才按 2 的倍率变慢，为什么？ • 因为 CPU 和内存之间隔着缓存，而缓存和内存之间传输数据的最小单位是缓存行（ 64 字节）。 16 个 float 是 64 字节，所以小于 64 字节的跨步访问，都会导致数据全部被读取出来。而超过

0 码力 | 147 页 | 18.88 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

区分两种拷贝可以提高性能。 • int x = 1; // 拷贝构造函数 • x = 2; // 拷贝赋值函数 • 拷贝赋值函数≈解构函数 + 拷贝构造函数 • 拷贝构造：直接未初始化的内存上构造 2 • 拷贝赋值：先销毁现有的 1 ，再重新构造 2 • 因此若对提高性能不感兴趣，可以这样写：拷贝赋值函数：提高性能 • 区分两种拷贝可以提高性能。 • 内存的销毁重新分配可以通过 objlist 一样长。因此需要接过掌管对象生命周期的大权。 • 请根据你的具体情况，决定要选用哪一种解决方案。移交控制权后仍希望访问到 p 指向的对象 • 解决方案 2 中，有时候我们会遇到移交控制权后，仍希望访问到对象的需求。 • 如果还是用 p 去访问的话，因为被移动构造函数转移了， p 已经变成空指针，从而出错。解决方案：提前获取原始指针 • 最简单的办法是，在移交控制权给和 Python 等 GC 语言的引用计数机制很像。但从长远来看是不行的，因为： 1. shared_ptr 需要维护一个 atomic 的引用计数器，效率低，需要额外的一块管理内存，访问实际对象需要二级指针，而且 deleter 使用了类型擦除技术。 2. 全部用 shared_ptr ，可能出现循环引用之类的问题，导致内存泄露，依然需要使用不影响计数的原始指针或者

0 码力 | 96 页 | 16.28 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - Zeno 中的现代 C++ 最佳实践

我们可以定义一个全局的函数表（右图中的 functab ），然后利用小彭老师的静态初始化大法，把这些函数在 main 之前就插入到全局的函数表。 • 这样 main 里面就可以仅通过函数名从 functab 访问到他们，从而 catFunc 和 dogFunc 甚至不需要在头文件里声明（只需要他们的函数签名一样即可放入 function 容器）。静态初始化的顺序是符号定义的顺序决定的，若在不同文件则顺序可能打乱和 dog.o 后面的话，那么 cat.o 和 dog.o 的静态初始化就会先被调用，这时候 functab 的 map 还没有初始化（ map 的构造函数也是静态初始化！）从而会调用未初始化的 map 对象导致奔溃。函数体内的静态初始化 • 为了寻找思路，我们把眼光挪开全局的 static 变量，来看看函数的 static 变量吧！ • 众所周知，函数体内声明为

0 码力 | 54 页 | 3.94 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

线程，用于处理大吞吐量的数据。获取线程编号 • 可以通过 threadIdx.x 获取当前线程的编号，我们打印一下试试看。 • 这是 CUDA 中的特殊变量之一，只有在核函数里才可以访问。 • 可以看到线程编号从 0 开始计数，打印出了 0 ， 1 ， 2 。这也是我们指定了线程数量为 3 的缘故。 • 等等，为什么后面有个 .x ？稍后再说明。获取线程数量 • 还可以用 int 。 • 可以通过 cudaGetErrorName 获取该 enum 的具体名字。这里显示错误号为 77 ，具体名字是 cudaErrorIllegalAddress 。意思是我们访问了非法的地址，和 CPU 上的 Segmentation Fault 差不多。封装好了： helper_cuda.h • 其实 CUDA toolkit 安装时，会默认附带一系列案例代码，报告出错所在的行号，函数名等，很方便。堆上分配试试？ • 那你可能会想，难道是因为我的 ret 创建在栈上，所以 GPU 不能访问，才出错的？ • 于是你试图用 malloc 在堆上分配一个 int 来给 GPU 访问，结果还是失败了。原因： GPU 使用独立的显存，不能访问 CPU 内存 • 原来， GPU 和 CPU 各自使用着独立的内存。 CPU 的内存称为主机内存 (host)

0 码力 | 142 页 | 13.52 MB | 1 年前
3

共 19 条前往

页

游人 RustCC AtlasGraph C++高性性能高性能并行编程优化课件 17 05 13 15 09 07 02 08

分类

语言

格式