星际争霸与人工智能0 码力 | 24 页 | 2.54 MB | 2 年前3
DeepSeek从入门到精通(20250204)DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。  AI + 国产 + 免费 + 开源 + 强大 ## Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景,支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。  ## 知识推理 知识推理 逻辑问题解答(数学、常识推理) 因果分析(事件关联性) ## 编程与代码相关  ## ☐ 袁镱 博士,专家工程师 ☐ 研究方向:机器学习系统,云计算,大数据系统 ☐ 负责腾讯平台与内容事业群(PCG)技术中台核心引擎:无量系统。支持大规模稀疏模型训练,上线与推理 ## ☐ 无量系统 ☐ 项目于17年启动,先后经过了6个主要版本的迭代 ☐ 覆盖腾讯PCG全部业务的推荐场景,支持腾讯IEG,CSIG,QQ音乐,阅文等业务的部分推荐场景 ## 提纲 ☐ 推荐场景深度学习系统的基本问题与特点 ,QQ看点,浏览器,微视,QQ小世界等) ☐ 腾讯系内容推荐:阅文集团,QQ音乐 ☐ Facebook推荐场景推理成本占AI推理成本的>72% [ISCA2020 RecNMP] ## ☐ 千亿级推荐模型应用 01. 千亿级特征(TB级)的模型的在线/离线训练,在线推理服务和持续上线 O2. 针对推荐特点的深度优化,达到业界先进水平 短期命中的高频key随时间缓慢变化 ## 推荐系统的核心特点  ## ☐ Feature 2(数据的时空特点) 2.1 短时间内只有部分item和user被命中,只有部分参数被用到 ☐ Feature 1(基本特点) 1.1 User与推荐系统交互,7*24小时流式学习 1.2 Item和Us0 码力 | 22 页 | 6.76 MB | 2 年前3
2022年美团技术年货 合辑YOLOv6 是美团视觉智能部研发的一款目标检测框架,致力于工业应用。本框架同时专注于检测的精度和推理效率,在工业界常用的尺寸模型中:YOLOv6-nano 在 COCO 上精度可达 35.0% AP,在 T4 上推理速度可达 1242 FPS;YOLOv6-s 在 COCO 上精度可达 43.1% AP,在 T4 上推理速度可达 520 FPS。在部署方面,YOLOv6 支持 GPU(TensorRT)、C $ 最具代表性,但在实际使用中,我们发现上述框架在速度和精度方面仍有很大的提升的空间。基于此,我们通过研究并借鉴了业界已有的先进技术,开发了一套新的目标检测框架——YOLOv6。该框架支持模型训练、推理及多平台部署等全链条的工业应用需求,并在网络结构、训练策略等算法层面进行了多项改进和优化,在 COCO 数据集上,YOLOv6 在精度和速度方面均超越其他同体量算法,相关结果如下图 1 所示:  AI + 国产 + 免费 + 开源 + 强大 ## Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景,支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。  ## 知识推理 知识推理 逻辑问题解答(数学、常识推理) 因果分析(事件关联性) ## 编程与代码相关 时,建议条件允许的情况下选择一个尽可能大的 batch,(因为较大的 batch 通常评估/预测的速度会更快)。 • Epoch: 轮次,通常被定义为「在整个数据集上的一轮迭代」,用 } = [\text{a}, \text{b}], \text{output} = \text{c}) $ 添加的 Keras 属性是:- keras_shape: 通过 Keras 端的尺寸推理进行传播的整数尺寸元组。- keras_history: 应用于张量的最后一层。整个网络层计算图可以递归地从该层中检索。 ## 参数 - shape: 一个尺寸元组(整数),不包含批量大小。A shape 任意。当使用此层作为模型中的第一层时,使用参数 input_shape(整数元组,不包括样本数的轴)。 ## 输出尺寸 由 output_shape 参数指定 (或者在使用 TensorFlow 时,自动推理得到)。 #### 5.2.10 ActivityRegularization [source] keras.layers.ActivityRegularization(l1=0.0, l2=00 码力 | 257 页 | 1.19 MB | 2 年前3
vLLM v0.5.0 Documentation0 码力 | 132 页 | 1.05 MB | 3 月前3
共 213 条
- 1
- 2
- 3
- 4
- 5
- 6
- 22













