JVM 内存模型## JVM 内存模型 0 码力 | 1 页 | 48.42 KB | 2 年前3
QCon北京2018-《深度学习在微博信息流排序的应用》-刘博微博Feed流排序场景介绍  常规CTR方法排序 深度学习应用与实践 ## 微博Feed流产品介绍—排序场景  ## 目录 ![Image] 85a6156/p6_2.jpg) 常规CTR方法排序  深度学习应用与实践 ## CTR概要介绍 ## CTR任务特点 - 大量离散特征、高维稀疏 - 特征关联性挖掘 ## CTR预估常用算法 • LR • GBDT •0 码力 | 21 页 | 2.14 MB | 2 年前3
开源中国 2023 大模型(LLM)技术报告李泽辰,Gitee 主编 李涛,APUS董事长兼CEO 2023年12月发布 设计:张琪 ## LLM 技术报告 大语言模型(LLM)技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统,专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法,从而能够执行各种语言相关任务。以 GPT 系列为代表,LLM 以其在自 以其在自然语言处理领域的卓越表现,成为推动语言理解、生成和应用的引擎。 LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域,GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面,LLM 技术也发挥了关键作用。此外,它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。 本报告从技术人视角出发,将深入探讨 LLM 技术的背景、基础设施、应用现状,以及相关的工具和平台。 ## LLM Tech Map ## 大模型 ➢ 备案上线的中国大模型 知名大模型 知名大模型应用 LLMOps 大模型聚合平台 ## 工具和平台 ➢ 开发工具 插件、IDE、终端代码生成工具 ## AI 编程 ## 算力 ## 基础设施 向量数据库 数据库向量支持 ➢ 大模型框架、微调 (Fine Tuning) ➢ 大模型训练平台与工具 ## LLM Agent0 码力 | 32 页 | 13.09 MB | 2 年前3
RustBelt - Rust 的形式化语义模型RUST CHINA CONF 2023 第三届中国 Rust 开发者大会 王俊吉 6.17-6.18 @Shanghai ## Outline ## RustBelt - Rust 的形式化语义模型 Background Rust Semantics • RustBelt Project • Type System • Rust Types Overview • The own Predict0 码力 | 21 页 | 2.63 MB | 2 年前3
领域驱动设计&中台/架构分层模型适配## 架构分层模型适配 有效防止架构腐化实践 吴雪峰@201811 DDCHINA ## CONTENTS 01 DDD分层参考架构 02 严纪律 防腐化 — 分层模型适配 03 分层模型适配实例 ## DDD分层参考架构 ## DDD分层参考架构 前端应用  给用户提供界面,关注用户交互和体验 为前端应用提供API服务,关注事务和分布式等技术性问题 领域模型和领域逻辑,关注业务概念。 访问外界系统(调用外界系统)的技术相关实现。 分层依据: 干系人和技术点 ## DDD分层参考架构 - 前端应用 前端应用 UX关注的层  ## 腐化案例: 亏空 大量技术术语业务人员完全看不懂领域模型和领域逻辑,关注业务概念。0 码力 | 39 页 | 2.54 MB | 2 年前3
AI大模型千问 qwen 中文文档AI agent, etc. 最新版本 Qwen1.5 有以下特点: • 6 种模型规模,包括 0.5B、1.8B、4B、7B、14B 和 72B; - 针对每种尺寸提供基础模型和 Chat 模型,并确保聊天模型按照人类偏好进行校准; • 对基础模型和 Chat 模型的多语言支持 - 基础模型和聊天模型都支持多种语言; - 支持工具调用、RAG(检索增强文本生成)、角色扮演、AI Agent 微信群。很期待见到你们! ## 文档 ### 1.1 安装 要快速上手 Qwen1.5,您可以从 Hugging Face 安装 transformers 库,并使用 Qwen1.5 Collection 中的模型。我们建议您安装最新版本的 transformers 库,或者至少安装 4.37.0 版本。 #### 1.1.1 Pip 安装 pip install transformers -U #### 我们建议您首先尝试使用 transformers 进行推理。请确保已安装了 transformers>=4.37.0 版本。以下是一个非常简单的代码片段示例,展示如何运行 Qwen1.5-Chat 模型,其中包含 Qwen1.5-7B-Chat 的实例: from transformers import AutoModelForCausalLM, AutoTokenizer device = "cuda"0 码力 | 56 页 | 835.78 KB | 2 年前3
机器学习课程-温州大学-11深度学习-序列模型## 深度学习-序列模型 黄海广 副教授 2023年05月 ## 本章目录 01 序列模型概述 02 循环神经网络(RNN) 03 长短期记忆(LSTM) 04 双向循环神经网络 05 深层循环神经网络 ### 1. 序列模型概述 ## 01 序列模型概述 02 循环神经网络(RNN) 03 长短期记忆(LSTM) 04 双向循环神经网络 05 深层循环神经网络 ### ### 1. 序列模型概述 循环神经网络(RNN)之类的模型在语音识别、自然语言处理和其他领域中引起变革。  ## 数学符号 在这里 $ x^{<1>} $ 表示Harry这个单词,它就是一个第4075行是1,其余值都是0的向 卷积神经网络或全连接网络的局限性 · 同一层节点之间无关联,从而导致获取时序规则方面功能不足 ## • 循环神经网络可以解决时序问题 · 基于语言模型(LM),故可以捕捉时序规则信息 它是如何实现的? ### 2. 循环神经网络(RNN) 01 序列模型概述 02 循环神经网络(RNN) 03 长短期记忆(LSTM) 04 双向循环神经网络 05 深层循环神经网络 ### 2. 循环神经网络(RNN)0 码力 | 29 页 | 1.68 MB | 2 年前3
Java 应用与开发 - Java 内存模型与分配机制Java 内存模型与分配机制 王晓东 wangxiaodongQouc.edu.cn 中国海洋大学 September 30, 2018 Java 内 学习目标 1. 理解 JVM 内存模型,掌握 JVM 内存构成 2. 理解 Java 程序的运行过程,学会通过调 HH 变化 3. 了解 Java 内存管理,认识垃圾回收 4. 建立编程时高效利用内存、避免内存溢上 D 的理 试模式观察内存的 大网 Java 内存模型 Java 程序内存运行分析 Java 内存管理建议 大纲 Java 内存模型 Java 程序内存运行分析 Java 内存管理建议 大网 Java 内存模型 Java 程序内存运行分析 Java 内存管理建议 接下来… Java 内存模型 大网 Java 内存模型 Java 内存管理建议 Java 虚拟机 (Java Virtual Machine, JVM ) *0 码力 | 44 页 | 818.30 KB | 2 年前3
搜狗深度学习技术在广告推荐领域的应用2017年10月19–21日 咨询热线:010-64738142 ## 目录 CONTENTS 01 搜索广告背景知识 02 深度学习在搜狗搜索广告的一些应用 03 基于多模型融合的CTR预估 04 若干思考 ## 搜索广告背景知识  送给老公的生日蛋糕 ## 03 ## 基于多模型融合的CTR预估 ## CTR预估流程 Data Feature Model Online 原始数据 领域特征 模型训练 线上Server 查询特征 查询日志 线性模型 特征抽取 广告特征 CTR预估 点击日志 非线性模型 匹配特征 Rank ## CTR预估涉及技术  ## 中国最大的互联网安全公司 360电脑安全产品 月活跃数达到4.42亿 360导航 日均独立访问用户为8900万人 [Image](/uploads/documents/e/0/0/e/e00eb30f0dd66a8704ffc9e91bb99d35/p6_1.jpg) i i i i 语义理解 大数据分析 人工智能 ## 视觉感知模型 环境  物 业务 核心 云端 [Image](/uploads/documents/e/0/0/e/e00eb30f0dd66a8704ffc9e91bb99d35/p8_4.jpg) ## 图像技术的三个核心难点>>小、快、准 ## 小模型 ## 线上速度快 Frequent remote upgrade 












