低延时 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

2 使用Python训练和部署低精度模型张校捷

3bbe1f6675c3cec959e1f224b976c60/p1_2.jpg) PYTHON 30th ## 使用Python训练和部署低精度模型 (TensorFlow版) 张校捷 2019/9/21 ## 目录 >> 低精度的概念和意义 TensorFlow的FP16模型 >> TensorRT的FP16/Int8模型总结 ![Image]( PYTHON 30th ## 1 低精度的概念和意义实数的16-bit半精度浮点数和8-bit定点数表示使用低精度的意义 ## 深度学习模型中实数的表示 FP32: E8M23 (tf.float32) FP16: E8M7 (TPU, tf.bfloat16) FP16: E5M10 (GPU, tf.float16) Int8 ## 低精度浮点数的优点 ### 1. 节约节约内存/显存的使用（FP16为原来的1/2，int8为原来的1/4） 2. 特殊的硬件专门用于低精度浮点数的计算加速（TensorCore） FP16 storage/input Full precision product Sum with FP32 accumulator Convert to FP32 result ![Image](/uploads/documents/a/3/

0 码力 | 24 页 | 981.45 KB | 2 年前
3
Apache Pulsar，云原生时代的消息平台 - 翟佳

9b240963783e387a4f2d57e585/p5_2.jpg) ## Apache Pulsar 要解决的问题 ## • 企业需求和数据规模 • 多租户 - 百万Topics - 低延时 - 持久化 - 跨地域复制 • 解除存储计算耦合 • 运维痛点：替换机器、服务扩容、数据 rebalance ## · 减少文件系统依赖 • 性能难保障：持久化（fsync）、一致性（ack: ![Image](/uploads/documents/7/d/a/4/7da43c9b240963783e387a4f2d57e585/p16_2.jpg) ## 分布式日志/流存储 - 低延时、高吞吐、持久化 • 强一致 (repeatable read consistency) · 高可用 • 单节点可以存储很多日志 • I/O隔离 ![Image](/uploads/doc

0 码力 | 39 页 | 12.71 MB | 1 年前
3
PostgresChina 2018 张启程为什么我们抛弃MongoDB和MySQL，选择PgSQL

此抛砖引玉，只是结合我们团队业务场景来分享下我们选择数据库的过程。 - 不是数据库不好用， • 而是我们不会用， • 是我们用的姿势不对! 主要业务场景 • IM工具+SCRM系统（高并发、低延迟、稳定） • 大量客户需要私有化云服务器部署（云更新） • 需求变更频繁，不适合关系型数据库 ## 目前服务器架构 ![Image](/uploads/documents/a/7/3/6/a

0 码力 | 9 页 | 563.82 KB | 2 年前
3
2-6-Golang 在 Baidu-FrontEnd 的应用-陶春华

[Image](/uploads/documents/b/6/7/f/b67feeef329677168cf0f86a902dbe8e/p33_1.jpg) ## 总结 • Go可以用于高并发、低延迟的程序开发 • Go极大的提升了开发效率 THANKS Bai百度

0 码力 | 35 页 | 730.17 KB | 2 年前
3
基于Go的大数据平台-党合萱

多种上下游适配 - 高吞吐/低延迟问题探究 - 高可用与水平扩展 - 自动化运维 - Go的应用 ## 系统设计分析与架构 ## 构建系统的挑战每天数千亿数据点任务切分粒度每天百TB数据量 1 高吞吐量 4 水平扩展机器扩容高峰期每分钟近200GB数据量 master节点failover 5 高可用分钟级数据延迟 ② 低延迟 server节点无状态 ts/7/1/6/b/716b45ba07ae342152eb1f7952269e99/p10_3.jpg) Sinker 云存储导出模型 ## 高吞吐/低延迟问题探究 ## 简单·可信赖 ## 困难高吞吐 1、资源利用率低 2、上下游吞吐能力不匹配 ![Image](/uploads/documents/7/1/6/b/716b45ba07ae342152eb1f7952269e99/p12_2

0 码力 | 34 页 | 1.26 MB | 2 年前
3
华为云 KubeCon China KubeEdge Demo Session

0 码力 | 10 页 | 836.76 KB | 2 年前
3
领域驱动设计&中台/DDD的为与不为

套路化之后的有条理的多关于软件结构的新思维方式分离技术复杂度和业务复杂度 ## DDD为何？ KIS S 高内聚分层抽象 DRY 纯函数 YAGNI 模块化低耦合依赖倒置迪米特里氏替换关注点分离单一职责面向接口不变性开闭原则 ## DDD为何？ 01010101010010111010101011 ## DDD为何？ !

0 码力 | 25 页 | 931.68 KB | 2 年前
3
Apache RocketMQ 介绍

来源网站：链滴许可协议：署名-相同方式共享4.0国际(CC BY-SA 4.0) # Apache RocketMQ 介绍 ## 概要 Apache RocketMQ是一个分布式消息传递和流媒体平台，具有低延迟，高性能和可靠性，万亿级容和灵活的可伸缩性。它的一个重要特性是支持非日志类型的可靠消息传送，非常适合运用在金融和电商务领域。目前他是Apache社区的顶级项目，在全球有超过100家公司在其业务中使用RocketMQ开源版本。 IO模块遇到了瓶颈，几经努力但改善成果不。这时正值Kafka流行，于是引起了阿里巴巴开发团队的注意，对kafka的无限消息堆积，高效持久化度等特性非常赞赏。但不幸的是，Kafka不能满足他们的要求，特别是在低延迟和高可靠性方面。在种情况下，阿里巴巴决定发明一个新的消息传递引擎来处理更广泛的用例集，从传统的发布/订阅方到大批量实时零损失容忍交易系统。 ## 里程碑 2012年，阿里巴巴开始开发Rocke RocketMQ在社区各方面的努力下，茁壮发展，很多功能都得到了加强。 ## RocketMQ的技术概览在我们看来，它最大的创新点在于能够通过精巧的横向、纵向扩展，不断满足与日俱增的海量消息在吞吐、高可靠、低延迟方面的要求。目前RocketMQ主要由NameServer、Broker、Producer以及Consumer四部分构成，如下图所示。 ![Image](/uploads/documents/

0 码力 | 5 页 | 375.48 KB | 2 年前
3
When Nanoseconds Matter: Ultrafast Trading Systems in C++

0 码力 | 123 页 | 5.89 MB | 1 年前
3
2022年美团技术年货合辑

EfficientRep Backbone 和 Rep-PAN Neck。 - 优化设计了更简洁有效的 Efficient Decoupled Head，在维持精度的同时，进一步降低了一般解耦头带来的额外延时开销。 - 在训练策略上，我们采用 Anchor-free 无锚范式，同时辅以 SimOTA $ ^{[2]} $ 标签分配策略以及 SIoU $ ^{[9]} $ 边界框回归损失来进一步提高检测精度。 YOLOv5/YOLOX 使用的 Backbone 和 Neck 都基于 CSPNet $ ^{[5]} $ 搭建，采用了多分支的方式和残差结构。对于 GPU 等硬件来说，这种结构会一定程度上增加延时，同时减小内存带宽利用率。下图 2 为计算机体系结构领域中的 Roofline Model $ ^{[8]} $ 介绍图，显示了硬件中计算能力和内存带宽之间的关联关系。 ![Image](/upl 卷积结构，可以有效利用计算密集型硬件计算能力（比如 GPU），同时也可获得 GPU/CPU 上已经高度优化的 NVIDIA cuDNN 和 Intel MKL 编译框架的帮助。实验表明，通过上述策略，YOLOv6 减少了在硬件上的延时，并显著提升了算法的精度，让检测网络更快更强。以 nano 尺寸模型为例，对比 YOLOv5-nano 采用的网络结构，本方法在速度上提升了 21%，同时精度提升 3.6% AP。 ![Image

0 码力 | 1356 页 | 45.90 MB | 2 年前
3

共 721 条前往

页

分类

语言

格式

2 使用Python训练和部署低精度模型张校捷

Apache Pulsar，云原生时代的消息平台 - 翟佳

PostgresChina 2018 张启程为什么我们抛弃MongoDB和MySQL，选择PgSQL

2-6-Golang 在 Baidu-FrontEnd 的应用-陶春华

基于Go的大数据平台-党合萱

华为云 KubeCon China KubeEdge Demo Session

领域驱动设计&中台/DDD的为与不为

Apache RocketMQ 介绍

When Nanoseconds Matter: Ultrafast Trading Systems in C++

2022年美团技术年货合辑

搜索

分类

语言

格式