2024 中国开源开发者报告一次性解决这些问题。 人类语言就是一种高度抽象、跨模态、表达力充分的符号系统,同时它作为知识的载体,自 然地存在大量数据可用于训练,还蕴含了人类的思维模式。 在此基础上训练得到的 LLM,自然具备被诱导出类人思考的潜力。在 COT(思维链)【4】、 TOT(思维树)【5】等技术的加持下,大模型正在学习拆解自己的“思维”,OpenAI 的 o1 就是 典型案例,强化了推理能力的同时,也大大缓解了幻觉问题。 无商业限制的基座的可能性也很高。小应 用开发商很可能很容易获得一个低成本 serving 的“量化小基座”。 “7B”是一个 magic number!无论是 RAG 里的向量表征模型,还是文生图、文本识别 (OCR)、语音合成(TTS)、人脸识别等等垂直领域,一个 1B~7B 的小模型已经可以满足很 多生产、应用需要,并且效果也在逐步推高【8,9,10】。这些模型,作为智能体的“三头六臂”, 架构呈现了 O(n²)的理论计算复杂度,这里的 n 指的是大模型输入 序列的 token 数量,但其前任语言模型担当 RNN 只有 O(n)的理论计算复杂度。 最近,以 Mamba、RWKV 为代表的类 RNN 结构死灰复燃,公开挑战 transformer 地位。 更有最新研究【13】从理论上表明,RNN 对比 Transformer 的表达力,只差一个 in-context-retrieval。0 码力 | 111 页 | 11.44 MB | 8 月前3
Moonshot AI 介绍专业解读⽂件:⽆论是⾦融分析、法律咨询还是市场调研,Kimi都能以专业⽔准提供⽀持。超⻓⽂ 档、多个⽂件,都可以快速摘要、翻译、答疑,⽀持上传PDF、Word、Excel、PPT、TXT⽂件和 图⽚。 • 整理资料:⽆论是堆积如⼭的发票,还是复杂冗⻓的会议记录,Kimi都能智能识别整理,⾃动提取 关键点,让资料整理不再繁琐,信息⼀⽬了然。 • 辅助创作:根据你提供的⽹⻚链接、⽂件、指令 和⽂本,basemodel的scaling效果仍然远远超过⽤⼾的,但我认为最终会转移到⽤⼾的scaling law,只是个时间问题。 现在⾯对数据瓶颈,这⼀点尤为重要。特别是⼈类偏好数据,它⾮常有限,但没有它⼜不⾏。我觉得 这也是每⼀个AI-Native产品现在最值得思考的问题之⼀。所以,⼀个不⾜够关⼼⽤⼾的公司最终可能 也没法实现AGI。 海外独⻆兽:怎么看 定效果会⽐⼀个只有千亿参数的模型要 好。 海外独⻆兽:Anthropic⼀直在提模型的可解释性,这⼀点其实有蛮多争论。你是如何思考可解释性 的?因为刚刚你也提到了模型是⼀个⿊盒,并且其实⼈类到现在还没有弄清楚⾃⼰的⼤脑是怎么⼯作 的。 杨植麟:可解释性核⼼是个信任的问题。建⽴⼀个信任的⼼智是很重要的,对应的应⽤场景甚⾄可能 和ChatGPT的也会不同,⽐如long-context和搜索的结合。0 码力 | 74 页 | 1.64 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 常见许可证: • MIT • Apache2.0 • BDS2.0-clause • 木兰宽松许可证 类别二 一定条件下允许二 次闭源发行 常见许可证: • LGLP2.1,商业 软件通过代码类 库引用(软件代 码与引用的源代 码 呈 “ 松 耦 合 性” )的方式 下可以闭源发行 类别三 不允许二次闭源发 行 常见许可证: • GPL ( 其 2.0 版 本不允许闭源发 行,3.0版本在 建议。 企业开发者旨在实现商业收益,选取优秀开源代码,并根据自身的行业Knowhow,在其上二次开发产出定制化的行业发行版本。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 两类开源开发者行为差异 参与开源目的 代码贡献特征 付费意愿 平台权益 个人开发者 企业开发者 出于兴趣或求知欲进入 开源社区,希望学习社 区内优秀代码,并与 “大神”交流 以商业视角出发,希望0 码力 | 43 页 | 4.69 MB | 1 年前3
2023 中国开源开发者报告累,没法速成。” 长度是 Llama 1 的 2 倍,并采用了分组查询注意力机制。具体来说,Llama 2 预训练模型是在 2 万亿的 token 上训练的,微调 Chat 模型是在 100 万人类标 记数据上训练的。 7 / 87 1 1 开源开发者事件回顾 Auto-GPT 横空出世,席卷 AI 圈 “零一万物”发布 Yi 系列开源大模型 Vercel 发布"v0":根据文本生成 网站,提供了许多高质量的电影、电视 剧、音乐、游戏和软件等种子资源。它成立于 2008 年,总部位于保加利 亚,已经成为了 BitTorrent 社区中备受喜爱的网站之一。 libjpeg-turbo 是一个 JPEG 图 像编解码器。 它 使 用 SIMD 指 令 ( MMX 、 SSE2、AVX2、Neon、AltiVec) 来加速 x86、x86-64、Arm 和 PowerPC 系统上的基线 JPEG 压缩和解压缩,以及 流等更新的方法脱颖而出,允许 以高性能向用户交付复杂的 Web 应用程序。 Dart 3 正式发布,100% 健全的空安全 Dart 3 包含了三个主要改进:完成了 100% 健全的空安全;添加了记录、 模式和类修饰符的新语言特性;以及对未来进行了预览,即,通过 Wasm 编 译扩大了对网络原生代码的平台支持。 Cython 3.0 正式发布 经过近五年的漫长岁月,Cython 3.0 于 2023 年 70 码力 | 87 页 | 31.99 MB | 1 年前3
2020 中国开源年度报告
化”,也就是在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 随着越来越多中国开源项⽬的影响⼒不断增加、⽊兰协议的推出、开放原⼦基⾦会的成⽴, Gitee 但是,接下来应该怎么发展呢?为了抗击疫情⽽凝聚起来的⼈,创造的项⽬,积累的经验,总 结的教训,应该如何“整理、封装、模块化”,并为了今后的各种意外,做好准备呢?这些都是 值得⻓期思考并改进的领域。 作为⼀份⼒图完整、客观、全⾯、丰富的报告,值得探讨的问题当然不⽌上述这些,也欢迎朋 友们阅读下⾯的报告,并随时与我们交流。 庄表伟,开源社理事⻓ 2021 年 1 ⽉ 16 ⽇ 特邀点评专家: 吴晟,Apache 品牌和整个社区免于受到伤害。 3.3 数据分析 我们计算了所有源⾃中国的共计 21 个 ASF 项⽬仓库的活动情况,数据如下。 我们统计了所有源⾃中国的 ASF 项⽬仓库的⼯作时间情况,并为每个仓库绘制了⼯作时间分 布图。在此,我们选择三个⼯作时间分布有明显特征的项⽬进⾏简单分析。 apache/carbondata,Apache CarbonData 是⼀种新的融合存储解决⽅案,利⽤先进 的列式存储、索引、0 码力 | 46 页 | 4.09 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021新与业务需求脱节的窘境。 高效 通过自动化与生产协作方式 的优化,多环节提升软件生产 的效率。 开放 基于开放的技术体系,打造开 放的软件架构。 轻舟云原生软件生产力平台 2.0 能力全景图 轻舟优势 搭建云原生技术底座,助力企业与时俱进实现云上软件创新,支撑业务高速发展。 12 PRODUCT 首批通过信通院认定项目:首批可信云·微服务先进级评估;首批可信云·服务网格先进级评估 任务运维 文件管理 任务开发 租户管理 自助分析 权限管理 可视化调度 数据开发及管理平台 标签画像 消费者运营平台 机器学习平台 BI 有数优势 有数全链路数据生产力平台2.0能力全景图 易用 覆盖企业数据全链路的大数 据产品,全面降低数据使用门 槛。 开放 专注大数据技术领域,核心 技术自主可控,支持多云和跨 云部署。 高效 联动数据链路多环节,从系统 层面加快业务高效运营和有 分析 特征治理 模型管理 交互式建模 可视化建模 在线推理 图分析 标签管理 画像分析 群组管理 API管理 支持数据产品研发 无代码平台,与 BI 、数据填报、复杂报 表、智能决策深度融合。 开放与集成能力 以标准类接口开放所有资源,支持集 成,兼容性强。 内置增强分析 内置高级分析模型,如预测、聚类,离 散;支持智能问答、智能分析等多种分 析场景。 产品特色 产品能力0 码力 | 43 页 | 884.64 KB | 1 年前3
2021 中国开源年度报告到 59,7,1% 40 到 49,34,6% 30 到 39,120,22% 参与者年龄分布 参与者性别分布 男 女 男,441,82% 女 ,96,18% 14 注:问卷篇中饼图的数据标签,例如“硕士 ,107,20%”,其中硕士表 示选项,107 是选择该选项的人数,20% 是选择该选项人数所占的比例。 专家点评 堵俊平:整体而言,在开源领域,男性在参与人数上仍然占据绝对优势,这一点和 32429 6518 GitHub 数据 2021 中国开源年度报告 49 VSCode 工作时间分布打孔图 不管是从活跃度及具体数据,还是直观的打孔图来看,VSCode 都是当之无愧的国际开源项目,参与人 数多,涉及地区广。 NixOS/nixpkgs 工作时间分布打孔图 每一位开发者在使用 Linux 的过程中想必都遭受过软件包版本冲突的痛苦折磨。NixOS 系统以非常出色 的 dcloudio/uni-app 596 50 3 40 52 PaddlePaddle/Paddle 工作时间分布打孔图分析 ant-design/ant-design 工作时间分布打孔图分析 pingcap/tidb 工作时间分布打孔图分析 pingcap/tidb 工作时间分布打孔图分析 2021 中国开源年度报告 53 专家点评 王蓉:期待后续榜单能以项目为单位聚合同一个大项目的 repository,这样我们0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告注:问卷篇中饼图的数据标签,例如“硕士,107,20%”,其中硕士表示选项,107 是选择该选项 的人数,20%是选择该选项人数所占的比例。 Note: The data labels of the pie chart 932022448100 15618 80426 5336 9 dotnet/runtime 13663.644119775200 7816 82210 7011 VSCode 工作时间分布打孔图 VSCode Punch Chart for Work Time Distribution VSCode is a deserved international open source project whether from the activity and specific data or the visual punch chart. NixOS/nixpkgs 工作时间分布打孔图 NixOS/nixpkgs Punch Chart for Work Time Distribution 每一位开发者在使用 Linux 的过程中想必都遭受过软件包版本冲突的痛苦折磨。NixOS0 码力 | 199 页 | 9.63 MB | 1 年前3
中国开源软件产业研究报告中国的开源软件法制建设:国内涉及开源的法律诉讼主要包含两种,其一是软件侵权案被告 方以原告所诉软件为开源软件为由进行抗辩,其二是开源软件作者起诉被告企业未遵守开源 协议。国内开源司法实践以保护软件研发的创造性劳动为核心,对上述两类案件通常支持原 告方立场。涉及开源的法律法规建设正在进一步完善,有望为我国的开源软件产业创设更有 序的发展环境。 SMS 中国的开源软件产业发展:得益于政策支持、软件产业高速发展、软件行业人才不断累计, 开源是软件市场“后进者”扩大市场影响力的重要手段 从市场竞争战略的视角上看,软件开源通常是软件市场的“后进者”扩大市场影响力、追赶头部企业的重要手段。观察PC 操作系统、移动操作系统、DBMS(核心数据库)三大类典型基础软件产品的开源/闭源情况,整体来看后出现的软件产品 更有可能是开源的,这一情况在DBMS情况尤为显著。通过开源,新的产品能够能更快地打入市场,开放的源代码也更容 易获得顾客的信任和了解;在市场 9%,其次为大数据以及网络服务器类型。 Linux基金会已经向累计多于750个开源项目及社区提供服务,2021年Linux基金会中云计算、容器和虚拟化开源项目的占 比最大,达到22.7%。整体来看,全球开源项目类型集中在开发框架、文档类开源项目、云计算等相关领域。此外,开源 项目的类型往往能反映当前市场关注的热点,如容器与云原生应用技术、人工智能开发框架等技术的流行。 来源:Apache软件基金会,艾瑞咨询研究院根据公开资料研究及绘制。0 码力 | 68 页 | 3.63 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)CON将举办全球最大规模AI黑客大赛 微软将用近一年时间完成对0-day Secure Boot漏洞的修复工作 06 06 04 开源热点 芬兰南萨沃计划建立开源能力中心 Decidim参与式民主的开源平台正在被日本广泛使用 图林根继续支持开源替代方案 07 07 08 09 10 11 16 06 开源创业企业 PingCAP平凯星辰 07 开源报告 开源软件国家情报报告-捷克 05 开源法律速览 案例分享:全国首例GPL抗辩获得支持案 提案等流程参与政府政策法规的制定过程来实现数 字民主。 全球开源态势洞察|第十期 08 图林根继续支持开源替代方案 德国图林根自由州与OpenTalk团队的合作成果在Chemnitzer Linux-Tage大会上宣布并展示。 在该会议中,Peer Heinlein(OpenTalk首席执行官)与Christian Stötzer(图林根自由州财政 部负责人)就“图林根自由州的IT战略:开源与数字主权”进行联合演讲。Peer 德国图林根自由州已经表明了其对开源项目的支持。其一,在2019年设立开源奖(图林根开源 奖由图林根经济、科学和数字社会部发起,旨在提高开源解决方案的认知度),其获奖者包括 edu sharing、in.RET、IG Papiergraben。其二,在2019年该州议会通过了一项关于公共采购 的规定,明确将开源定义为“源代码公开可访问且许可证不限制其使用、分发和修改的软件解决 方案”。图林根州公共采购法(Thüringer Ve0 码力 | 22 页 | 1.99 MB | 1 年前3
共 11 条
- 1
- 2













