2 使用Python训练和部署低精度模型 张校捷3bbe1f6675c3cec959e1f224b976c60/p1_2.jpg) PYTHON 30th ## 使用Python训练和部署低精度模型 (TensorFlow版) 张校捷 2019/9/21 ## 目录 >> 低精度的概念和意义 TensorFlow的FP16模型 >> TensorRT的FP16/Int8模型 总结  FP16: E8M7 (TPU, tf.bfloat16) FP16: E5M10 (GPU, tf.float16) Int8 ## 低精度浮点数的优点 ### 1. 节约 节约内存/显存的使用(FP16为原来的1/2,int8为原来的1/4) 2. 特殊的硬件专门用于低精度浮点数的计算加速(TensorCore) FP16 storage/input Full precision product Sum with FP32 accumulator Convert to FP32 result  let foo: unknown; // never类型(Bottom Type) let bar: never; ## TypeScript 结构类型系统 #include#include using namespace std; struct Person1 { string name; of local variable 'p1' to 'Person2' ↔ More actions... Person2 p2 = p1; } ## 标明类型系统 即使两个类的结构完全一致,也不能互相赋值 interface Person1 { name: string; age: number; } interface Person2 { 0 码力 | 25 页 | 1.27 MB | 2 年前3
PostgresChina 2018 张启程 为什么我们抛弃MongoDB和MySQL,选择PgSQL确,在此抛砖引玉,只是结合我们团队业务场景来分享下我们选择数据库的过程。 - 不是数据库不好用, • 而是我们不会用, • 是我们用的姿势不对! 主要业务场景 • IM工具+SCRM系统(高并发、低延迟、稳定) • 大量客户需要私有化云服务器部署(云更新) • 需求变更频繁,不适合关系型数据库 ## 目前服务器架构  缓存服务器 Redis ## MySQL应用史 • 最开始做的站群系统WEB端使用MySQL: - copy简单快速,批量复制,替换修改简单; - 每个网站一个库,单体数据量小,数据类型固定; • 后来做SCRM系统,也首选MySQL: - 需求经常改动,每次改需求先改数据库; • 数据量越来越大,越来越不了解这只海豚; ## MySQL+MongoDB0 码力 | 9 页 | 563.82 KB | 2 年前3
When Nanoseconds Matter: Ultrafast Trading Systems in C++0 码力 | 123 页 | 5.89 MB | 1 年前3
2-6-Golang 在 Baidu-FrontEnd 的应用-陶春华-数据的封装和互斥访问; - 并行运算逻辑的同步 ## C vs Python (1) • 性能: - 相差10倍以上 – Python: 解释执行,动态类型 · 并发性能 -C: 直接用系统的机制 – Python: 自己实现的thread, 只能使用一个CPU • 开发效率 - 相差5-10倍 - 内存的处理是一个难点 – dict/map, list ## C vs Python • 性能 - 和 C 接近 • 并发性 –Go routine: 屏蔽底层的机制,充分利用cpu资源 –多线程模型:容易思考 · 开发效率 - 描述能力和python接近 -较丰富的库(系统库,第三方库) ## Golang (2) - 大型程序的组织 - Package - 数据访问的限制(首字母大小写的区别) - 可测试能力 - 内置的单测和覆盖检查工具,易于做TDD ## GC带来的问题 -GC是个好东西,但也有问题 -难以避免的延迟(几十到几百ms) ·经验公式:10万对象1ms扫描时间 -1个tcp连接,约10个对象=>1万连接,1ms gc延迟 • GO-BFE的实时需求 - 请求的处理延迟 平均1ms以内,最大10ms · 实测 -100万连接,400ms gc延迟 ## GC优化思路 • Go的gc算法(go1.3) –Mark0 码力 | 35 页 | 730.17 KB | 2 年前3
基于Go的大数据平台-党合萱日志检索服务 对象存储服务 Report Studio XSpark ## 简单·可信赖 ## 内容提要 - 系统设计分析与架构 - 多种上下游适配 - 高吞吐/低延迟问题探究 - 高可用与水平扩展 - 自动化运维 - Go的应用 ## 系统设计分析与架构 ## 构建系统的挑战 每天数千亿数据点 任务切分粒度 每天百TB数据量 1 高吞吐量 4 水平扩展 机器扩容 高峰期每分钟近200GB数据量 高峰期每分钟近200GB数据量 master节点failover 5 高可用 分钟级数据延迟 ② 低延迟 server节点无状态 挑战 七牛云存储 自动调度/负载均衡 时序数据库 大任务隔离 3 适配多种下游 6 自动化运维 日志检索 快速扩容/缩容 远端HTTP服务 监控 ## export service系统全貌  Sinker 云存储导出模型 ## 高吞吐/低延迟问题探究 ## 简单·可信赖 ## 困难 高吞吐 1、资源利用率低 2、上下游吞吐能力不匹配  ## 一、 Curvefs测试 • 1. 启动curvefs • 问题1:root用户无法访问挂载目录 • 测试 allow root - 测试allow_other • 参考文献 - 问题2:本地文件系统挂载默认是共享的? - 问题3:文件系统访问控制是在哪一层实现的? ## 二、 文件系统权限管理 • 文件类型 • 文件权限 文件权限 • 特殊权限 (SUID, SGID, STICKY) - 文件默认权限mask - 用户&用户组 - 文件系统用户权限管理 - 对mode的管理 - 对ACL(Access Control Lists)的管理 - ACL Access Entry保存在哪? • ACL的表示 • 内存中的ACL 是如何与具体的 Inode 相关联 • • 如何存储和获取ACL信息 • Inode权限校验 • chmod、chown、setfacl、getfacl接口文件系统自己如何实现 • 结论: • 参考文献: ## 一、 Curvefs测试 代码:https://github.com/cw123/curve/tree/fs_s3_joint_debugging 环境:test2 ### 1. 启动curvefs0 码力 | 33 页 | 732.13 KB | 1 年前3
华为云 KubeCon China KubeEdge Demo Session0 码力 | 10 页 | 836.76 KB | 1 年前3
分布式任务系统cronsun## 分布式任务系统 cronsun 苏创绩 ## 目录 01 任务系统 02 分布式任务系统 03 cron sun 04 心得体会   ## 01 Part One 任务系统 ## 任务 1. 什么时间 2. 什么地点 3. 做什么事 ## 一 个简单的任务  星期数,范围:0-7(0和7都是星期天) e42541490db6c0e/p6_1.jpg) crontab cmd1 cmd2 cmd3 ## 早期的 cron V7, 1979 1. 在Version 7 Unix里是一个系统服务 2. 只用 root 运行任务 3. 算法简单直接 ## 早期的 cron 运行逻辑 1. 读 /usr/lib/crontab 文件 2. 如果有命令要在当前时间执行,就用 root0 码力 | 48 页 | 1.52 MB | 2 年前3
声明式自愈系统——高可用分布式系统的设计之道-王昕## 声明式自愈系统——高可用分布式系统的设计之道 王昕 高级技术专家 全球技术领导力峰会 # 500+高端科技领导者与你一起探讨 技术、管理与商业那些事儿 2019年6月14–15日 上海圣诺亚皇冠假日酒店  












