数据库模型 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

AI大模型千问 qwen 中文文档

AI agent, etc. 最新版本 Qwen1.5 有以下特点： • 6 种模型规模，包括 0.5B、1.8B、4B、7B、14B 和 72B； • 针对每种尺寸提供基础模型和 Chat 模型，并确保聊天模型按照人类偏好进行校准； • 对基础模型和 Chat 模型的多语言支持 • 基础模型和聊天模型都支持多种语言； • 支持工具调用、RAG（检索增强文本生成）、角色扮演、AI Agent 快速开始 CHAPTER1 文档 1.1 安装要快速上手 Qwen1.5，您可以从 Hugging Face 安装 transformers 库，并使用 Qwen1.5 Collection 中的模型。我们建议您安装最新版本的 transformers 库，或者至少安装 4.37.0 版本。 1.1.1 Pip 安装 pip install transformers -U 1.1.2 Conda 5，我们建议您首先尝试使用 transformers 进行推理。请确保已安装了 transformers>=4. 37.0 版本。以下是一个非常简单的代码片段示例，展示如何运行 Qwen1.5-Chat 模型，其中包含 Qwen1. 5-7B-Chat 的实例： from transformers import AutoModelForCausalLM, AutoTokenizer device = "cuda"

0 码力 | 56 页 | 835.78 KB | 1 年前
3
机器学习课程-温州大学-11深度学习-序列模型

2023年05月深度学习-序列模型黄海广副教授 2 03 长短期记忆(LSTM) 04 双向循环神经网络本章目录 01 序列模型概述 02 循环神经网络(RNN) 05 深层循环神经网络 3 03 长短期记忆(LSTM) 04 双向循环神经网络 1.序列模型概述 01 序列模型概述 02 循环神经网络(RNN) 循环神经网络(RNN) 05 深层循环神经网络 4 1.序列模型概述循环神经网络（RNN）之类的模型在语音识别、自然语言处理和其他领域中引起变革。 5 数学符号在这里?<1>表示Harry这个单词，它就是一个第 4075行是1，其余值都是0的向量（上图编号1所示），因为那是Harry在这个词典里的位置。 ?<2>是第6830行是1，其余位置都是0的向量（上图编号2所示）。同一层节点之间无关联，从而导致获取时序规则方面功能不足  循环神经网络可以解决时序问题  基于语言模型（LM），故可以捕捉时序规则信息  它是如何实现的？ 7 03 长短期记忆(LSTM) 04 双向循环神经网络 2.循环神经网络(RNN) 01 序列模型概述 02 循环神经网络(RNN) 05 深层循环神经网络 8 2.循环神经网络(RNN)

0 码力 | 29 页 | 1.68 MB | 1 年前
3
李东亮：云端图像技术的深度学习模型与应用

云端图像技术的深度学习模型与应用李东亮 360 人工智能研究院 lidongliang@360.cn 2017.10.20 SACC2017 360电脑安全产品月活跃数达到4.42亿 360手机安全产品移动端用户总数已达约1.49亿 360浏览器月活跃用户数量为3.03亿 360导航日均独立访问用户为8900万人日均点击量约为4.51亿次 360搜索稳定拥有35%以上的市场份额移动端业务视觉感知模型 SACC2017 视觉感知核心问题 Object Segmentation Object Classification Person, Horse, Barrier, Table, etc Object Detection 检测识别分割跟踪核心 SACC2017 图像技术的三个核心难点>>小、快、准小模型线上速度快预测准 Frequent remote upgrade CPU-constrained, real-time Cloud processing SACC2017 视觉感知模型分割 Forward Block Forward Block deconvolution deconvolution convolution convolution 检测 Forward Block Forward

0 码力 | 26 页 | 3.69 MB | 1 年前
3
《TensorFlow 2项目进阶实战》2-快速上手篇：动⼿训练模型和部署服务

扫码试看/订阅《TensorFlow 2 项目进阶实战》视频课程快速上手篇：动⼿训练模型和部署服务 • TensorFlow 2 开发环境搭建 • 使用 tf.keras.datasets 加载数据 • 使用 tf.data.Dataset 加载数据 • 使用 tf.keras.Model 管理模型 • Fashion MNIST 数据集介绍 • 使用 TensorFlow 2 训练分类网络 from_generator 加载 Generator 使用 tf.data.TextLineDataset 加载文本 “Hello TensorFlow” Try it！使用 tf.keras.Model 管理模型历史上的 tf.keras.Model • Class tf.compat.v1.keras.Model • Class tf.compat.v1.keras.models.Model • Model • Class tf.keras.models.Model 使用 tf.keras.Model 构建模型使用 tf.keras.Model 构建模型使用 tf.keras.Model 训练模型保存和加载 h5 模型保存和加载 SavedModel 模型 Fashion MNIST 数据集介绍 Original MNIST dataset The MNIST database

0 码力 | 52 页 | 7.99 MB | 1 年前
3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计袁镱

从推荐模型的基础特点看  袁镱腾讯个⼈简介 � ⽆量系统 � 项⽬于17年启动，先后经过了6个主要版本的迭代 � 覆盖腾讯PCG全部业务的推荐场景，⽀持腾讯 IEG，CSIG，QQ⾳乐，阅⽂等业务的部分推荐场景 � 袁镱博⼠，专家⼯程师 � 研究⽅向：机器学习系统，云计算，⼤数据系统 � 负责腾讯平台与内容事业群（PCG）技术中台核⼼引擎：⽆量系统。⽀持⼤规模稀疏模型训练， �推荐场景深度学习系统的基本问题与特点 �推荐类模型的深度学习系统设计 � 系统维度 � 算法维度 �总结基于深度学习模型的推荐流程，场景与⽬标 Serving系统 HDFS 数据通道训练系统召回业务服务排序混排模型管理上线管理⽆量 RGW/Cos/ kafka 样本存储实时样本⽣成服务离线样本⽣成任务数据通道特征处理模型登记模型上线预测 QQ⼩世界等） � 腾讯系内容推荐：阅⽂集团，QQ⾳乐 � Facebook推荐场景推理成本占AI推理成本的 >72% [ISCA2020 RecNMP] � 千亿级推荐模型应⽤ O1. 千亿级特征（TB级）的模型的在线/离线训练，在线推理服务和持续上线 O2. 针对推荐特点的深度优化，达到业界先进⽔平推荐系统的核⼼特点 � Feature 1（基本特点） 1.1 User与推荐系统交互，7*24⼩时

0 码力 | 22 页 | 6.76 MB | 1 年前
3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入

第一步，先从大量的文本集中学习词嵌入。第二步，你可以用这些词嵌入模型把它迁移到你的新的只有少量标注训练集的任务中，比如说用这个300维的词嵌入来表示你的单词。这样做的一个好处就是你可以用更低维度的特征向量代替原来的10000维的one-hot向量，现在你可以用一个300维更加紧凑的向量。第三步，当你在你新的任务上训练模型时，在你的命名实体识别任务上，只有少量的标记数据集上，你可以词汇表征和文本数据处理 15 3.Word2Vec 语言模型的训练机制就是这样 1.我们获得了大量文本数据（例如，所有维基百科文章）。然后 2.我们有一个窗口（比如说三个单词），我们会对所有文本进行滑动。 3.滑动窗口为我们的模型生成训练样本 16 3.Word2Vec （下图左边为CBOW，右边为Skip-Gram） CBOW对小型数据库比较合适，而Skip-Gram在大型语料中表现更好。更好。 17 3.Word2Vec 我们实际构建和训练模型的数据集将如下所示：这被称为连续词袋结构，并在word2vec论文 one of the word2vec papers 中进行过描述。 18 3.Word2Vec 负采样计算的角度来看，SkipGram非常消耗资源：尤其是我们将在数据集中为每个训练样本做一次（很可能数千万次）。我们需要做一些事情来提高效率。

0 码力 | 44 页 | 2.36 MB | 1 年前
3
机器学习课程-温州大学-01机器学习-引言

03 机器学习的背景知识 04 机器学习的开发流程 4 机器学习与人工智能、深度学习的关系人工智能：机器展现的人类智能机器学习：计算机利用已有的数据(经验)，得出了某种模型，并利用此模型预测未来的一种方法。深度学习：实现机器学习的一种技术人工智能机器学习深度学习 5 杨立昆（Yann LeCun）杰弗里·欣顿（Geoffrey Hinton）本吉奥（ Preferred Networks 深度学习、机器学习技术物联网日本 2016年 C轮融资估值20亿美元 9 机器学习的范围 10 • 给定数据的预测问题 ✓ 数据清洗/特征选择 ✓ 确定算法模型/参数优化 ✓ 结果预测 • 不能解决什么 ✓ 大数据存储/并行计算 ✓ 做一个机器人机器学习可以解决什么问题 11 机器学习发展史总的来说，人工智能经历了逻辑推理、知识工程、机器 ✓ 机器学习方法 ✓ 模型 ✓ 损失函数 ✓ 优化算法 ✓ 模型评估指标机器学习的概念 20 机器学习的概念-模型机器学习首先要考虑使用什么样的模型。模型的类别，大致有两种：一是概率模型(Probabilistic Model)和非概率模型 (Non-Probabilistic Model)。在监督学习中，概率模型可被表示为?(?|?)，非概率模型则为? = ?(?)。

0 码力 | 78 页 | 3.69 MB | 1 年前
3
机器学习课程-温州大学-01深度学习-引言

03 深度学习的背景知识 04 深度学习的开发流程 4 深度学习与机器学习、人工智能的关系人工智能：机器展现的人类智能机器学习：计算机利用已有的数据(经验)，得出了某种模型，并利用此模型预测未来的一种方法。深度学习：实现机器学习的一种技术 5 杨立昆（Yann LeCun）杰弗里·欣顿（Geoffrey Hinton）本吉奥（ Bengio ）共同获得了2018年计算机科学的最高奖项深度学习入门-目标检测 16 深度学习入门-图像分割 17 深度学习入门-图像分割 18 自然语言处理（Natural Language Processing）是一门通过建立形式化的计算模型来分析、理解和处理自然语言的学科，也是一门横跨语言学、计算机科学、数学等领域的交叉学科。自然语言处理，是指用计算机对自然语言的形、音、义等信息进行处理，即对字、词、句、篇章的输入、输出、识别、 TFLOPS Single: 14 TFLOPS DL: 112 TFLOPS 180 TFLOPS 420 TFLOPS 深度学习的硬件 27 • 提问：训练一个模型需要多大开销？ • 以训练 BERT-large 模型为例, 16 Cloud TPUs = 16 * 4.5 = 72 USD / hour One-day cost = 72 * 24 = 1,728 USD Four-day

0 码力 | 80 页 | 5.38 MB | 1 年前
3
《TensorFlow 快速入门与实战》4-实战TensorFlow房价预测

快速入门与实战》视频课程 • 房价预测模型介绍 • 使用 TensorFlow 实现房价预测模型 • 使用 TensorBoard 可视化模型数据流图 • 实战 TensorFlow 房价预测第四部分目录房价预测模型介绍前置知识：监督学习（Supervised Learning）监督学习是机器学习的一种方法，指从训练数据（输入和预期输出）中学到一个模型（函数），并根据模型可以推断新实例的方法。并根据模型可以推断新实例的方法。函数的输出通常为一个连续值（回归分析）或类别标签（分类）。训练数据学习算法模型新数据推断结果前置知识：监督学习典型算法 • 线性回归（Linear Regression） • 逻辑回归（Logistic Regression） • 决策树（Decision Tree） • 随机森林（Random Forest） • 最近邻算法（k-NN） • 朴素贝叶斯（Naive 深度神经网络（DNN）前置知识：线性回归在统计学中，线性回归是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。前置知识：单变量线性回归理想函数假设函数损失值（误差）前置知识：单变量线性回归前置知识：梯度下降前置知识：多变量线性回归假设函数

0 码力 | 46 页 | 5.71 MB | 1 年前
3
机器学习课程-温州大学-机器学习项目流程

数据搜集数据清洗特征工程数据建模 • 基于性能指标比较几种机器学习模型 • 对最佳模型执行超参数调整 • 在测试集上评估最佳模型 • 解释模型结果 • 得出结论 • 数据清理和格式化 • 探索性数据分析(EDA) • 特征工程 • 特征选择 • 网络下载 • 网络爬虫 • 数据库读取 • 开放数据 • …… 7 2.数据清洗 01 机器学习项目流程概述需要对变量进行变换，例如自然对数和平方根，或者对分类变量进行one-hot编码，以便它们可以在模型中使用。一般来说，我认为特征工程是从原始数据创建附加特征。 •特征选择: 选择数据中最相关的特征的过程。在特征选择中，我们删除特征以帮助模型更好地总结新数据并创建更具可解释性的模型。一般来说，特征选择是减去特征，所以我们只留下那些最重要的特征。 20 特征工程主要方法数据和特征决定了机器学习的上限，而模型和算法只能逼近这个上限而已。特征工程重要性：特征越好，灵活性越强；特征越好，模型越简单；特征越好，性能越出色；好特征即使使用一般的模型，也能得到很好的效果！ 3.特征工程 21 特征选择主要方法去除变化小的特征去除共线特征去除重复特征主成分分析（PCA） …… 特征选择主要有两个功能： 1.减少特征数量、降维，使模型泛化能力更

0 码力 | 26 页 | 1.53 MB | 1 年前
3

共 65 条前往

页

分类

语言

格式