开源中国 2023 大模型(LLM)技术报告LLM 技术报告 大语言模型(LLM) 技术作为人工智能领域的一项重要创 新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统,专门 设计来理解、生成和回应自然语言。这些模型通过分析大量 的文本数据来学习语言的结构和用法,从而能够执行各种语 言相关任务。以 GPT 系列为代表,LLM 以其在自然语言 处理领域的卓越表现,成为推动语言理解、生成和应用的引 擎。 LLM 基础设施、应用现状,以及相关的工具和平台。 2 / 32 LLM Tech Map 向量数据库 数据库向量支持 大模型框架、微调 (Fine Tuning) 大模型训练平台与工具 基础设施 LLM Agent 备案上线的中国大模型 知名大模型 知名大模型应用 大模型 算力 工具和平台 LLMOps 大模型聚合平台 开发工具 AI 编程 插件、IDE、终端 代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展,其预训练和微调的 方法为语言任0 码力 | 32 页 | 13.09 MB | 1 年前3
202306 ⼈⼈可⽤的开源数据可视化分析⼯具2023 年 6 ⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 能够快速、⾼效地 提供体验良好的数 据展现⼿段,通过 分析数据资产的质 量,助⼒企业做出 更加准确的业务策 略。 前端业务⼈员 数据管理⼈员 企业管理者 IT 建设⼈员 提供多种数据使⽤ 模式,提供更为丰 富、安全的数据管 理⼿段,有助于企 业内部进⾏更为⼴ 泛的数据整合与分 析,并由此创造数 据价值。 能够合理评估、规 范 和 洞 察 企 业 信 息,洞悉企业发展 趋 势 , 在 有 效 管 理 IT 投资和降本 投资和降本 增效的同时,挖掘 和发挥数据资产的 价值,辅助企业制 定发展决策。 能够规范数据处理 的过程、保证数据 质量、提升 IT 系 统建设效率、快速 ⽀撑业务部⻔的运 营发展需要,有效 激发 IT 建设的创 新、体现 IT 信息 的价值。 数据可视化对不同⼈员的价值 数据可视化⼯具更加强调⼈性化,功能趋于“傻⽠”式,强调易⽤、稳定、开放,协作和⾃助,关注信息数 据的整合与展示,能够通过⾃0 码力 | 27 页 | 3.61 MB | 1 年前3
DataEase 人人可⽤的开源数据可视化分析⼯具 2022 年 12 ⽉2022 年 12 ⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 能够快速、⾼效地 提供体验良好的数 据展现⼿段,通过 分析数据资产的质 量,助⼒企业做出 更加准确的业务策 略。 前端业务⼈员 数据管理⼈员 企业管理者 IT 建设⼈员 提供多种数据使⽤ 模式,提供更为丰 富、安全的数据管 理⼿段,有助于企 业内部进⾏更为⼴ 泛的数据整合与分 析,并由此创造数 据价值。 能够合理评估、规 范 和 洞 察 企 业 信 息,洞悉企业发展 趋 势 , 在 有 效 管 理 IT 投资和降本 投资和降本 增效的同时,挖掘 和发挥数据资产的 价值,辅助企业制 定发展决策。 能够规范数据处理 的过程、保证数据 质量、提升 IT 系 统建设效率、快速 ⽀撑业务部⻔的运 营发展需要,有效 激发 IT 建设的创 新、体现 IT 信息 的价值。 数据可视化对不同⼈员的价值 数据可视化⼯具更加强调⼈性化,功能趋于“傻⽠”式,强调易⽤、稳定、开放,协作和⾃助,关注信息数 据的整合与展示,能够通过⾃0 码力 | 27 页 | 3.58 MB | 1 年前3
DataEase 人人可⽤的开源数据可视化分析⼯具 2022 年 06 ⽉2022 年 6 ⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 能够快速、⾼效地 提供体验良好的数 据展现⼿段,通过 分析数据资产的质 量,助⼒企业做出 更加准确的业务策 略。 前端业务⼈员 数据管理⼈员 企业管理者 IT 建设⼈员 提供多种数据使⽤ 模式,提供更为丰 富、安全的数据管 理⼿段,有助于企 业内部进⾏更为⼴ 泛的数据整合与分 析,并由此创造数 据价值。 能够合理评估、规 范 和 洞 察 企 业 信 息,洞悉企业发展 趋 势 , 在 有 效 管 理 IT 投资和降本 投资和降本 增效的同时,挖掘 和发挥数据资产的 价值,辅助企业制 定发展决策。 能够规范数据处理 的过程、保证数据 质量、提升 IT 系 统建设效率、快速 ⽀撑业务部⻔的运 营发展需要,有效 激发 IT 建设的创 新、体现 IT 信息 的价值。 数据可视化对不同⼈员的价值 数据可视化⼯具更加强调⼈性化,功能趋于“傻⽠”式,强调易⽤、稳定、开放,协作和⾃助,关注信息数 据的整合与展示,能够通过⾃0 码力 | 27 页 | 10.32 MB | 1 年前3
DataEase 人人可⽤的开源数据可视化分析⼯具 2023 年 04 ⽉2023 年 04 ⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 能够快速、⾼效地 提供体验良好的数 据展现⼿段,通过 分析数据资产的质 量,助⼒企业做出 更加准确的业务策 略。 前端业务⼈员 数据管理⼈员 企业管理者 IT 建设⼈员 提供多种数据使⽤ 模式,提供更为丰 富、安全的数据管 理⼿段,有助于企 业内部进⾏更为⼴ 泛的数据整合与分 析,并由此创造数 据价值。 能够合理评估、规 范 和 洞 察 企 业 信 息,洞悉企业发展 趋 势 , 在 有 效 管 理 IT 投资和降本 投资和降本 增效的同时,挖掘 和发挥数据资产的 价值,辅助企业制 定发展决策。 能够规范数据处理 的过程、保证数据 质量、提升 IT 系 统建设效率、快速 ⽀撑业务部⻔的运 营发展需要,有效 激发 IT 建设的创 新、体现 IT 信息 的价值。 数据可视化对不同⼈员的价值 数据可视化⼯具更加强调⼈性化,功能趋于“傻⽠”式,强调易⽤、稳定、开放,协作和⾃助,关注信息数 据的整合与展示,能够通过⾃0 码力 | 27 页 | 3.60 MB | 1 年前3
DataEase 人人可⽤的开源数据可视化分析⼯具 2023 年 12 ⽉可以帮助用户快速分析业务数据并洞察其趋势,为企业的业 务改进与优化提供支持。 人 人 可 用 的 开源数据可视化分析工具 DataEase 的使命 他们都在用 DataEase 累计安装下载约 10 万次,50+ 技术支持群,广受各行各业用户的喜爱 DataEase 功能架构 数据源 DataEase 支持近 20 种常见的数据源,更多数据源支持持续增加中… 核心概念 数据集 通过 通过对表的数据进行关联与处理,用户可自由组合形成自有数据集合,供后续进行业务分析与图表制作使用 核心概念 数据大屏 支持图层管理与大屏尺寸设置 灵活在大型显示器上实时展示各种数据指标和信息,以帮助用户监测业务状况、分析趋势和做出实时决策 大屏制作 大屏展示 核心概念 仪表板 支持元素自动挤压占位,方便用户快速编辑,同时支持设置移动端布局 通常偏向于静态或定期更新,适用于日常分析与制作各项业务数据报告等 各项业务数据报告等 PC 端 移动端 核心概念 连接数据 数据准备 可视化分析 数据源 1 数据源 2 数据源 3 数据源 4 组合及处理数据 数据集 1 数据集 2 数据集 3 数据集 4 仪表板创建与管理 数据大屏创建与管理 数据图表制作 数据实时分析 数据大屏展示 收藏导出分享 DataEase 工作流程 DataEase 支持丰富的数据源连接,能够有0 码力 | 36 页 | 7.05 MB | 1 年前3
DataEase 人人可用的开源数据可视化分析工具 2024 年 03 月可以帮助用户快速分析业务数据并洞察其趋势,为企业的业 务改进与优化提供支持。 人 人 可 用 的 开源数据可视化分析工具 DataEase 的使命 他们都在用 DataEase 累计安装下载约 10 万次,50+ 技术支持群,广受各行各业用户的喜爱 DataEase 功能架构 数据源 DataEase 支持近 20 种常见的数据源,更多数据源支持持续增加中… 核心概念 数据集 通过 通过对表的数据进行关联与处理,用户可自由组合形成自有数据集合,供后续进行业务分析与图表制作使用 核心概念 数据大屏 支持图层管理与大屏尺寸设置 灵活在大型显示器上实时展示各种数据指标和信息,以帮助用户监测业务状况、分析趋势和做出实时决策 大屏制作 大屏展示 核心概念 仪表板 支持元素自动挤压占位,方便用户快速编辑,同时支持设置移动端布局 通常偏向于静态或定期更新,适用于日常分析与制作各项业务数据报告等 各项业务数据报告等 PC 端 移动端 核心概念 连接数据 数据准备 可视化分析 数据源 1 数据源 2 数据源 3 数据源 4 组合及处理数据 数据集 1 数据集 2 数据集 3 数据集 4 仪表板创建与管理 数据大屏创建与管理 数据图表制作 数据实时分析 数据大屏展示 收藏导出分享 DataEase 工作流程 DataEase 支持丰富的数据源连接,能够有0 码力 | 39 页 | 6.95 MB | 1 年前3
2023 中国开源开发者报告1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 LLM 狂 潮卷到天际。 四、 Stable Diffusion 和 Midjourney 这两大图像生成系统 的出现,极大地拓展和加速了 LLM 在计算机视觉领域的应 用,它们突破了传统图像生成方式的局限,仅需要用户提供 文字描述,就可以生成高质量的数字艺术作品。它们的图像 生成质量、样 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解 和生成效果。这开启了 LLM 集成应用的新方向,并诞生了 一个新的细分领域“LLMOps”。 七、 “提示词工程”,这是 LLM 直接催生出来的新“学科”, 它的核心在于研究人类如何与 LLM0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告TOP101-2024 大 模 型 观 点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要 反映中国开源开发者使用开源大模型概况、开源项目/组织健康 度,以及中国开源社区的生态评估等情况。 Gitee 数据篇 本报告数据来源:2024年1月至2024年12月 Gitee及Gitee AI平台相关公开数据 4 / 111 开发者是社区的力量源泉 2000 码力 | 111 页 | 11.44 MB | 8 月前3
网易数帆 领先的数字化转型技术与服务提供商 2021网易数帆是网易集团旗下 TO B 企业服务品牌,定位于领先的数字化转型 技术与服务提供商,为客户提供创新、可靠的国产软件基础平台产品及相 应技术服务,业务覆盖云原生基础软件、数据智能全链路产品、人工智能 算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 等诸多大中型客户。 以“开放、开源、跨云”为技术理念,网易数帆大力推动技术研究,先后取 得“工信部云计算服务能力标准首批试点单位”、“国家企业技术中心”、“信 通院云计算标准和开源推进委员会成员”、“信通院大数据技术标准推进委 员会成员”、“信创工委会成员”等机构资质。同时,网易数帆积极推动跨厂 商的数字化技术融合发展,与AWS、阿里云、百度云、华为鲲鹏云计算、 浪潮、新华三等多家企业完成技术兼容性认证。 数帆历程 关于数帆 数帆实力 荣誉资质 客户名录 客户口碑 业务全景 产品篇 网易有数 网易轻舟 网易易智 客户案例篇 解决方案篇 数据中台解决方案 业务中台解决方案 金融分布式解决方案 金融大数据解决方案 零售大数据解决方案 零售行业 金融行业 制造行业 综合行业 02 03 04 02 01 04 05 06 08 09 10 120 码力 | 43 页 | 884.64 KB | 1 年前3
共 198 条
- 1
- 2
- 3
- 4
- 5
- 6
- 20













