2024 中国开源开发者报告开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 为了更全面客观地展示中国大模型 LLM 开发技术栈的开源 社区生态,我们使用了 对开源社区的生态评 估体系,希望通过这些数据洞察中国开源开发者在 AI 技术 领域的活跃度、生产力和创新能力。 组织给予减轻或免承担法律责任;《生成式人工智能服务管理暂行办法》 则明确了人工智能技 术的使用和合规要求,促进了开源模型在合规框架下良性发展。 变革 端上模型的兴起与隐私保护 随着小型模型的性能逐步增强,更多高级 AI 正转向在个人设备上运行。这一趋势不仅显著 降低了云端推理成本,还提升了用户隐私控制。 中国 AI 社区在这一领域也做了重要贡献,推出了如 Qwen2-1.5B、MiniCPM 系列和 典型案例,强化了推理能力的同时,也大大缓解了幻觉问题。 2. 大模型做不到的,“现存工具”强势补位。 无法持续更新的知识库,可以通过 RAG(Retrieval Augmented Generation,检索增强 生成)来解决。 RAG 的出现,让各界越来越深刻地认识到,大模型没必要存储那么多知识,只需要如何使 用搜索引擎这个外部工具即可。大模型可以在搜索结果上做进一步的信息筛选和优化,而搜索引 擎弥补了大模型的知识缺陷,实现了0 码力 | 111 页 | 11.44 MB | 8 月前3
人工智能安全治理框架 1.0隐患。 2.2 技术应对措施方面。针对模型算法、训练数据、算力设施、产品服务、 应用场景,提出通过安全软件开发、数据质量提升、安全建设运维、测评监测 加固等技术手段提升人工智能产品及应用的安全性、公平性、可靠性、鲁棒性- 3 - 人工智能安全治理框架 的措施。 2.3 综合治理措施方面。明确技术研发机构、服务提供者、用户、政府 部门、行业协会、社会组织等各方发现、防范、应对人工智能安全风险的措施 力, 确保基础设施和服务运行不中断。 (d)对于人工智能系统采用的芯片、软件、工具、算力和数据资源,应 高度关注供应链安全。跟踪软硬件产品的漏洞、缺陷信息并及时采取修补加固 措施,保证系统安全性。 4.2 针对人工智能应用安全风险 4.2.1 网络域风险应对 (a)建立安全防护机制,防止模型运行过程中被干扰、篡改而输出不可 信结果。 (b)应建立数据护栏,确保人工智能系统输出敏感个人信息和重要数据 南,完善伦理 审查制度。 5.5 强化人工智能供应链安全保障。推动共享人工智能知识成果,开 源人工智能技术,共同研发人工智能芯片、框架、软件,引导产业界建立开放 生态,增强供应链来源多样性,保障人工智能供应链安全性稳定性。 5.6 推进人工智能可解释性研究。从机器学习理论、训练方法、人机 交互等方面组织研究人工智能决策透明度、可信度、纠错机制等问题,不断提 高人工智能可解释性和可预测0 码力 | 20 页 | 3.79 MB | 1 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单• 情感分析与数据解读:利用o3mini结合 情感分析,对数据进行深入解读,帮助市场调 研等领域理解消费者情感,优化产品和策略。 • 故事化数据呈现:借助o3mini将数据以 故事的形式呈现,增强数据的可读性和吸引力, 帮助公众理解复杂的科学和技术知识。 • 复杂数据模式识别:借助o3mini高效分 析复杂数据,帮助科学研究和工程领域发现 模式和规律,如天文学中的星系演化或地质 学中的地震数据分析。 多版本与模块化支持:目前提供三个版本(基础版、增 强版、专业版),能够灵活应对不同用户的综述需求。 工具内包括文献观点梳理、问题提出等功能模块,确保 用户在不同科研需求下得到充分支持。 增强版绘图功能:增强版具备绘图功能,可通过可视化 图示(如文献关键词共现图)直观展示综述内容,帮助 用户更好理解和呈现研究成果。 无数据检索:以现有真实数据库作为支撑,通过关键词 检索,自动搜集相关文献并生成综述报告,目前只支持 综述生成:点击生成综述,等待2-3分钟即可下载综述报告。 元知AI综述工具官网:https://yuanzhi.zeelin.cn/#/ 选择版本:根据需求选择工具的四个版本,包括基础版、增强版、专业版(单图)、专业版(双图)。 文献导入:用户可从现有文献数据库中下载中英文数据后导入平台,或直接通过实时联网访问免费数据库 进行在线分析,操作简单便捷。 信息提取与分析:平台自动0 码力 | 85 页 | 8.31 MB | 8 月前3
2023 中国开源开发者报告 许多 AI 采用者仍处于早期阶段:26% 的人使用 AI 不到一年,而 18% 的人已经在生产中进行了应用。 16% 从事 AI 工作的受访者表示正在使用开源模型。 意外结果、安全性、公平性、偏见和隐私是采用者测试 的最大风险。 工业和信息化部赛迪研究院数据显示,目前,我国已有超 过 19 个大语言模型研发厂商。其中,15 家厂商的模型 产品已经通过备案,预计今年我国大语言模型市场规模将 OpenAI 正式发布GPT-4 AIGC 回顾 2023 大语言模型 LLM 元年的重磅事件。 开源开发者事件回顾 Anthropic 推出Claude 2023 年 3 月,百度全新一代知识增强大语言模型、文心大模型家族的新成 员——文心一言 (ERNIE Bot) 正式发布。 百度文心一言正式亮相 2023 年 7 月,Meta 和 微软深度合作,正式推 出下一代开源大语言 模型 Llama “大圣净化”、“一指禅” 和 “叮小跳”。 自动跳过开屏广告应用「李跳跳」无限期停更 微软于 2023 年 8 月发布了 Visual Studio for Mac 的退役公告。未来, 开发团队将专注于增强 Visual Studio 和 VS Code,优化它们以进行跨平 台开发。 Visual Studio for Mac 退役后,微软方面仍会为 Mac 开发者提供替代方 案,例如 C# Dev0 码力 | 87 页 | 31.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021华为鲲鹏计算兼容性测试认证 大数据技术机构资质 信通院大数据技术标准推进委员会成员 大数据系统软件浙江省工程实验室 浙江省网易大数据重点企业研究院 浙江省云计算和大数据省级企业研究院 人工智能技术机构资质 浙江省增强现实与智能交互工程技术研究中心 省级组织资质 浙江省重点企业研究院 浙江省企业技术中心 云计算技术机构资质 工信部云计算服务能力标准首批试点单位 信通院云计算标准和开源推进委员会成员 信通院首批开源供应商 支持节点、可用区级故障,灵活调度策 略,有效保障数据安全性与可用性。 故障恢复 支持 Node 级和实例级故障自动恢复, 无需人工值守。 异构网络访问 支 持 异 构 协 议 转 换 为 HTTP 协 议 RESTFUL 接口,具备请求转换能力,有 效集成企业存量应用。 基于开源自主可控 基于社区开源版本,进行源码级内核优 化,性能增强,自主可控。 完备的监控 丰富的企业经验积累,支持完备的监控 画像分析 群组管理 API管理 支持数据产品研发 无代码平台,与 BI 、数据填报、复杂报 表、智能决策深度融合。 开放与集成能力 以标准类接口开放所有资源,支持集 成,兼容性强。 内置增强分析 内置高级分析模型,如预测、聚类,离 散;支持智能问答、智能分析等多种分 析场景。 产品特色 产品能力 业务流程覆盖数据收集、加工、分析、应用等全链路环节,内置可视化报告、自助式 ETL0 码力 | 43 页 | 884.64 KB | 1 年前3
2021 中国开源年度报告…………………………………………………………………………………………… 116 一、各国开源政策将对开源世界的未来产生重大影响 ………………………………………………… 116 二、开源法务合规趋势 :意识增强,道阻且长 ………………………………………………………… 116 三、开源治理成为显学 …………………………………………………………………………………… 116 四、国际基金会的左右博弈 :RMS …………………………………………………………………………………………… 118 一、各国开源政策将对开源世界的未来产生重大影响 ………………………………………………… 118 二、开源法务合规趋势 :意识增强,道阻且长 ………………………………………………………… 119 三、开源治理成为显学 …………………………………………………………………………………… 120 四、 国际基金会的左右博弈 :RMS 如果可以跨越这一阶段,会迎来快速增长时期。 图表 16 :开源社区成熟度曲线 资料来源:PingCAP,中国信通院 3.2.3 加速扩张阶段:加速软件采用及付费转换—销售管理 加速扩张阶段的主要任务是增强开发者和用户对软件的喜爱、采用和价值,发掘潜在客户并将免费用户 向付费用户转换。定位潜在用户应该优先考虑针对特定细分市场的活动,基于产品使用信息进行用户分析, 了解哪些角色和部门正在使用该产品以0 码力 | 132 页 | 14.24 MB | 1 年前3
DeepSeek图解10页PDFTransformer 结构的优势 1. 高效的并行计算:摒弃循环结构,使计算速度大幅提升。 2. 更好的上下文理解:注意力机制可捕捉长文本中的远程依赖关系。 3. 良好的可扩展性:可适配更大规模模型训练,增强 AI 泛化能力。 教程作者:郭震,工作 8 年目前美国 AI 博士在读,公众号:郭震 AI,欢迎关注获取更多原创教程。资 料用心打磨且开源,是为了帮助更多人了解获取 AI 知识,严禁拿此资料引流、出书、等形式的商业活动 Tuning),如下图11所示。通用强化学习训练过 程后,使得 R1 不仅在推理任务中表现卓越,同时在非推理任务中也表现出 色。但由于其能力拓展至非推理类应用,因此在这些应用中引入了帮助性 (helpfulness)和安全性(safety)奖励模型(类似于 Llama 模型),以优化 与这些应用相关的提示处理能力。 DeepSeek-R1 是训练流程的终点,结合了 R1-Zero 的推理能力和通用强化 学习的任务 DeepSeek-R1 中间推理模型生成:通过推理导向的强化学习(Reasoning-Oriented RL), 直接生成高质量的推理数据(CoT 示例),减少人工标注依赖。通用强化学 习优化:基于帮助性和安全性奖励模型,优化推理与非推理任务表现,构建 通用性强的模型。最终,DeepSeek-R1 将 R1-Zero 的推理能力与通用强化 学习的适应能力相结合,成为一个兼具强推理能力和任务广泛适应性的高0 码力 | 11 页 | 2.64 MB | 8 月前3
2021 中国开源年度报告expansion stage: accelerating software adoption and paid conversion - sales management 加速扩张阶段的主要任务是增强开发者和用户对软件的喜爱、采用和价值,发掘潜在客户并将 免费用户向付费用户转换。定位潜在用户应该优先考虑针对特定细分市场的活动,基于产品使 用信息进行用户分析,了解哪些角色和部门正在使用该产品以及他们的兴趣所在,同时预测免 Source: Synopsys, Cloud Qi Capital 全球知名开源日志组件 Apache Log4j 于 2021 年 12 月被曝存在严重高危险级别远程代 码执行漏洞,引发人们对开源安全性问题的探讨。12 月 9 日,Apache Log4j2 被曝出第一个 高危漏洞 Log4Shell,并在此之后持续爆雷,至 12 月 22 日已经发现了第三个高危漏洞 CVE- 2021-45105。而由于 市 场契合度引入了用户,价值市场契合度就是找到客户关心并愿意支付的费用,进而使企业可以 自然延伸来推动收入。开源软件公司已经找到了一些围绕功能的价值市场契合,包括 RAS(可 靠性、可用性、安全性)、工具附加组件、性能、审计、服务等。 Secondly, open source projects should have a value-market fit. Value-market fit0 码力 | 199 页 | 9.63 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书向上对接高校及研究机构, 加紧基础技术共建;向下对 应发行版ISV厂商,将软件向 更多行业及场景渗透 规划开源软件迭代方向,包 括但不限于软件特性增加、 现有功能增强、Bug修补, 并提出相应的合格指标 一方面积极对社区开发者的回 复给予反馈,另一方面发掘优 秀的灵感,增强创新能力 对开发者提交的代码进行评 审,确保代码的可读性和可 维护性,及时做出缺陷反馈 提出企业开源项目,确定是 否开源、开源时间、企业内 是否具有开源应用场景以及 OpenHarmony社区是技术发展逐步演变的典范。自开源以来, OpenHarmony操作系统逐渐由仅支持小型带屏设备逐步演进为可 支持复杂标准带屏设备。这意味着开源促进了OpenHarmony操作系统的技术升级,增强了对复杂、多样场景的支持。 OpenHarmony的演变成果得益于其良好的技术架构,良好的系统原生特性加之后期持续的社区运营努力,便有了今天的成果。从 码云数据、社区活跃度、生态等指标来看, Ope 同一数据库 可以轻松扩 展至其他互 联网平台 架构复杂: 多为单体应 用,架构上 耦合度较 高,代码难 度高 架构轻:前 端展示、中 层业务处理 逻辑、后端 数据库 “求稳定”:更注重 系统对业务的安全性 和稳定性的支持,因 而采用自建服务器或 私有云的运营方式 “求灵活”:更注重 系统对业务快速扩张 和灵活变动的支持, 因而更多采取订阅云 服务的轻资产模式 开源<闭源:更复 杂、更封闭、更求稳0 码力 | 43 页 | 4.69 MB | 1 年前3
清华大学 普通人如何抓住DeepSeek红利探讨大语言模型(LLMs)在模拟人类意见动态和社 会现象(如极化和错误信息传播)中的表现,特别 是引入偏误信息后的意见动态变化。使用大模型模 拟多个虚拟代理,讨论“气候变暖”、“转基因食 品的安全性”和“疫苗的有效性和安全性”三个具 有科学共识的话题。 实验一在无偏误信息条件下,代理通过社交网络进 行每日对话,记录最终信念状态和信息传播路径。 实验二改变初始信念分布,探讨初始条件对结果的 影响。 影精品。从精心构思到精湛制作,每 一环节均体现出国产电影追求卓越的 精神。市场反应热烈,观众好评不断, 充分反映出国人对优秀影视作品的殷 切期待。此次票房突破不仅是经济效 益的体现,更标志着我国文化软实力 不断增强。近年来,国家大力支持文 化产业发展,推动创意与技术深度融 合,激励更多优秀作品涌现,培育文 化自信。展望未来,中国电影必将在 创新驱动下,以多元风貌走向世界, 为构建社会主义文化强国贡献更大力 量。国产电影正昂首阔步迈向辉煌未0 码力 | 65 页 | 4.47 MB | 8 月前3
共 146 条
- 1
- 2
- 3
- 4
- 5
- 6
- 15













