2023 中国开源开发者报告索如何以 LLM 可以解析的方式来表达需要它完成的任务, 寻找 LLM 的“最佳输入形式”。通过注入提示词,提示词 工程建立了一套“人机交互语法”,来更精准地向 LLM 传 达想要它生成何种输出的指令。这为人们与 LLM 之间建立 高效、准确的“沟通桥梁”提供了可能性。什么“链式思考 1 1 (CoT)”、“自动推理并使用工具(ART)”、“思维 树(ToT)”……甚至运用心理学对 LLM 暂停项目维护。 主要原因在于作者暂无精力维护 wangEditor ,且 “最近行业形势也不太 好,先努力搞钱吧”。 他也欢迎有人接手 wangEditor 的维护,不过需要通过初步考核:在 issues 列表中,回答 10 个 issue。 微软官宣:Visual Studio for Mac 退役 libjpeg-turbo 的首席开发人员 DRC 在完成该项目的 3.0.0 版本发布后 表示,由 月,由于双方规则冲突,curl 作者 Daniel Stenberg 宣布,将 不再向各 Linux 发行版的邮件列表发送有关 curl 安全漏洞的提前预告。 curl 新的政策导致,在通知各发行版的时候,这些安全问题已经在公共的 git 存储库中提交了修复程序,而按照发行版邮件列表的政策规定,公开 的安全问题则属于” 禁运 “的话题。 curl 作者宣布不再向各发行版发送安全漏洞预警 在经0 码力 | 87 页 | 31.99 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)本。 全球开源态势洞察|第十期 18 政策和法律框架 政策和法律框架 • 2022年8月,捷克颁布《关于开放数据和公共部门信息再利用的2019年第1024号欧洲指令(“OD 指令”)》14的实施方案。该指令的功能之一是支持信息和数据的提供,以便这些信息和数据被重 复获取,特别是通过开放数据获取。为了支持这项法规,捷克相关部门已对现有法规进行了多样化 的修正。15 • 2022年2 l的开源解决方案。此 外,他们还在为斯洛伐克地方政府开发该平台。 本节将总结过去十年间与开源软件相关的主要政策和法律法规,包括该领域已知的重要里程碑。列表 将从最新的里程碑开始,按照时间顺序呈现。 本节介绍了捷克主要的开源软件相关倡议。该列表按时间顺序排列,从最新的倡议开始。 14 https://eur-lex.europa.eu/eli/dir/2019/1024/oj 15 https://data0 码力 | 22 页 | 1.99 MB | 1 年前3
2021 中国开源年度报告在社区的交流方式中,Github Issue、微信和邮件列表目前最为普遍。 Among the community communication tools, Github Issues, WeChat and mailing lists are currently the most common. 【专家点评】/ [Expert Comment] 堵俊平:在欧美,邮件列表和 Issue 是开源开发者交流的主要方式,这样既可以公开、 较短周 期的速度进行付费转化,并使其成为长期用户。另一方面,企业可以通过观察用户对免费版 软件的使用行为,进行有针对性的转换跟进和追加销售,例如,向销售团队提供超出其使用 限制并准备付款的客户列表。除了传统的销售转化,还可以通过自助购买路径进行转化(Self- service selling),这种转换路径很大程度上降低了销售成本。 Secondly, open source software 电路图、 材料清单和开发板布局数据。并且硬件设计的源代码的特定的格式可以为其他人获得,以方便 对其进行修改。以 CPU 处理器为例,开源芯片的开源通常包括三个层次,首先是指令集(ISA) 开源,例如 RISC-V 指令集规范是开源的;其次是微架构的设计开源;第三层是开源 RTL 源 码乃至 GDSII,例如 Berkeley 的 Rocket Chip、剑桥大学的 lowRISC、芯来蜂鸟0 码力 | 199 页 | 9.63 MB | 1 年前3
2021 中国开源年度报告业手段,这距离开源生态的真正繁荣还有差距。 2021 中国开源年度报告 33 4.6 开源社区的交流方式 在社区的交流方式中,Github Issue、微信和邮件列表目前最为普遍。 专家点评 堵俊平:在欧美,邮件列表和 Issue 是开源开发者交流的主要方式,这样既可以公开、透明,又可以把讨论的 过程沉淀下来,降低后加入者的学习成本。国内开发者当前习惯在微信群中讨论问题,但受限于微信群的规模 以以较短周期的速度进行付费转化, 并使其成为长期用户。另一方面,企业可以通过观察用户对免费版软件的使用行为,进行有针对性的转 换跟进和追加销售,例如,向销售团队提供超出其使用限制并准备付款的客户列表。除了传统的销售转化, 还可以通过自助购买路径进行转化(Self-service selling),这种转换路径很大程度上降低了销售成本。 最后在留存阶段,开源软件可以使用户规避供应商锁定风险,使其愿意进行长期使用。基于同一个开源 Hardware,是可以通过公开渠道获得的硬件设计,如电路图、材料清单 和开发板布局数据。并且硬件设计的源代码的特定的格式可以为其他人获得,以方便对其进行修改。以 CPU 处理器为例,开源芯片的开源通常包括三个层次,首先是指令集(ISA)开源,例如 RISC-V 指 令集规范是开源的 ;其次是微架构的设计开源 ;第三层是开源 RTL 源码乃至 GDSII,例如 Berkeley 的 Rocket Chip、剑桥大学的0 码力 | 132 页 | 14.24 MB | 1 年前3
2024 中国开源开发者报告开源的大模型也是在不断提升智能化能力,例如 2024 年 9 月阿里发布的 Qwen 2.5 72B 模型 成为全球最强开源大模型。此外,Qwen 2.5 的整体性能相比前一代提升了超过 18%,并且在 多模态能力、长文本处理和指令遵循等方面也有所增强。 大模型应用从 Chatbot 到 RAG、Copilot 和 Agent 的发展历程充满了挑战与机遇。随着技 术的不断进步和创新,我们有理由相信,大模型应用将在未来展现出更加广阔的应用前景和巨大 (NPU)则直接运行深度学习相关程序。 处理器芯片设计是一项很复杂的任务,整个过程犹如一座冰山。冰山水面上是用户或者大 众看到的处理器芯片架构,呈现为一组微架构核心参数,比如 8 核、8 发射乱序执行、32KB 指令 Cache、2MB L2 Cache 等等。 但为何是选择这样的配置,不同配置对处理器的 PPA(性能、功耗、面积)有什么影响? 要搞清楚这些联系,则需要一整套处理器架构设计基础设施的支撑(即冰山水面下部分)—— Unit)为例,这是现代高性能处理器的一个 重要组成部分,负责根据分支指令执行历史预测分支的走向,从而提前执行对应方向上的指 令。BPU 的预测准确率直接影响着处理器整体的性能和功耗,当 BPU 预测准确率高,则处 理器流水线的空泡(Stall)就比较少,甚至完全消除。但当 BPU 出现预测错误,不仅已执行 的错误路径上的指令都被浪费,而且还需要冲刷流水线等来保证后续执行的正确性,这降低了 处理器性能,也带来额外的功耗。0 码力 | 111 页 | 11.44 MB | 8 月前3
Moonshot AI 介绍图⽚。 • 整理资料:⽆论是堆积如⼭的发票,还是复杂冗⻓的会议记录,Kimi都能智能识别整理,⾃动提取 关键点,让资料整理不再繁琐,信息⼀⽬了然。 • 辅助创作:根据你提供的⽹⻚链接、⽂件、指令,Kimi可以帮助你梳理⼤纲、续写⽂章、创作⽂ 案、写作周报、撰写⽅案,成为你的内容创作⼿脚架,提供⽆限灵感。 • 编程助⼿:Kimi可以帮你快速阅读API⽂档,定位所需信息,还可以根据你的需求⽣成代码、快 代AI需要拔掉数据线,做到只要源源不断地输⼊电 ⼒,就能源源不断地输出智能。 这两个核⼼问题导致在第三层有巨⼤的空间,包括long-context、不同模态的⽣成、模型多步规划的 能⼒、指令遵循的能⼒、各种agent的功能等。 这些上层的东西都会有巨⼤的差异化,因为中间存在两个重要的技术变量。我认为这是我们的机会。 除了技术层⾯,价值观上我们有⼀点和OpenAI不同:我们希望在下⼀个时代,能成为⼀家结合 我觉得这背后实际上是个技术问题。传统AI时代,要实现个性化,需要持续更新模型,⽤⼩模型解决 单点问题。⼤模型时代,实现个性化的⼀种⽅式是微调,但我认为微调可能不是本质的⽅法,⻓期来 看可能不会存在模型的微调。为什么?当你的模型指令跟随能⼒、推理能⼒、上下⽂⼀致性能⼒越来 越强时,所有东西只需要放在内存⾥就可以。⽐如你的⼤模型内存有⼀堆prefix这样的东西⽤来 follow,成本可以降到⾮常低。最终,你对模型个性化0 码力 | 74 页 | 1.64 MB | 1 年前3
2020 中国开源年度报告
3 开源活动 绝⼤多数参与者每年只会参加⼏次线上/线下的开源活动,每个⽉参加⼀到两次线上/线下开源 活动的参与者占⽐约两成。线下的开源活动⼤多以沙⻰、讲座等为主,线上的开源活动以在线 会议、邮件列表讨论、PR 活动等为主。 81% 的参与者认为开源活动对促进和推动开源社区⾄关重要。 【专家点评】 ⾼阳:我们⿎励开发者积极参与到开源活动中来,尤其⿎励⼤家积极参与线下活动。线下的⻅ ⾯、沟 开源产品的前景展望中,互联⽹产品以 34% 的⽐例成为参与者最看好的开源产品发展⽅向。 ⼈⼯智能和开发⼯具异军突起,成为现在开源产品中的⻛⼝和热点。 5.5 开源社区的交流⽅式 在社区的交流⽅式中,微信和邮件列表⽬前最为普遍,QQ 也是国内重要的即时交流⼯具。新 锐的交流⼯具⽐例上升:Slack 和 Zoom 也是值得关注的现象。 【专家点评】 吴晟:微信、QQ 群的⾼强度使⽤,仍然显示出开源圈⼦缺少国际化社交和协作能⼒的⼀贯性 合⼊增加的代码⾏数 pull_deletions 项⽬通过 PR 合⼊删除的代码⾏数 2.2 中国开源 Top 50 项⽬ Top50 列表中,从项⽬活跃度来看,第 1 名与第 50 名的项⽬活跃度相差超过 10 倍,说明 中国开源项⽬之间的差距较⼤。 从这个列表中,我们发现,阿⾥在开源领域中的成绩显著。Top10 项⽬中上榜的项⽬有 4 个,除了蚂蚁⾦服采⽤ React 封装的⼀套组件库0 码力 | 46 页 | 4.09 MB | 1 年前3
Gitea,新一代的代码托管平台Maven、Go、RPM、NPM、PyPI 等;支持源代码和二进制文件的版本发布 Gitea 延伸能力:依赖项扫描 自动扫描代码仓的依赖库,发现有漏洞的版本,并给出升级或替换建议,及时发现和解决安全隐患 扫描结果列表 扫描结果详情 支持扫描的语言 包括但不限于 Go、NodeJS、C#、Rust、Java、PHP、Python、Ruby 等 Tea 命令行工具 迁移数据到 Gitea 开放的 第三方集成市场0 码力 | 30 页 | 14.34 MB | 1 年前3
中国开源软件产业研究报告已经实现并维护了核心基础结构计划(CII)的“最佳实践徽章” ⚫ 完成独立的第三方安全审核,并按照要求发布审核结果 ⚫ 采用CNCF行为准则 ⚫ 明确定义项目治理和提交者所要遵循的流程 ⚫ 至少在主要仓库提供项目采用者的公开列表 沙箱阶段 Sandbox Stage ⚫ 至少有三个独立的用户在生产中成功使用了项目,经TOC的判断具备有 足够的质量和范围 ⚫ 拥有足够数量的提交者(项目贡献者) ⚫ 拥有大量的、持续的提交和合并的贡献0 码力 | 68 页 | 3.63 MB | 1 年前3
共 9 条
- 1













