2020 中国开源年度报告
年中国开源世界的地图。 这份问卷是每年中国开源年报的重要⼀环,不基于调研的分析报告不过是纸上谈兵。在往年的 基础上,我们参考了其他现存的主流开发者问卷内容,并加⼊了⼀些新的视⻆。基于 2020年 COVID-19 这个不容忽视的⼤背景,这份调查问卷进⼀步将视⻆发散到开源世界的线上协 作,以及开源能够为世界带来什么等主题。 通过近 60 项左右问题的统计调查与分析,我们希望能够还原出当前中国开源社区的真实现 万开发者⽤户。我们对托管在 Gitee 的开源项⽬进⾏了统计分析,梳理和解读编程语⾔、功能分布的变化趋势,分析开发者 在 Gitee 参与开源的情况,以期为观察国内开源的演进提供⼀个 “本⼟平台” 视⻆。 2. 主要内容与发现 2.1 总体趋势 2020 年总体项⽬趋势包括: 2020 年 Gitee 上托管的代码仓库超过了 1500 万。 Gitee 上的开源项⽬数量相⽐ 20190 码力 | 46 页 | 4.09 MB | 1 年前32021 中国开源年度报告
万开发者用户。我们对托管在 Gitee 的开源 项目进行了统计分析,梳理和解读编程语言、功能分布的变化趋势,分析开发者在 Gitee 参与开源的情况, 以期为观察国内开源的演进提供一个 “本土平台” 视⻆。 2 主要内容与发现 2.1 总体趋势 2021 年 Gitee 上托管的代码仓库超过了 2000 万。 2021 年 Gitee ⽤户总量超过 800 万。 2.2 总体语言趋势 排名 Zilliz 的核心项目向量相似度搜索引擎 Milvus 是全球首款 GPU 加速海量特征向量匹配和检索引擎。 Milvus 依托 GPU 加速,提供极速特征向量匹配以及多维度数据联合查询(特征、标签、图片、视 频、文本和语音等联合查询)功能,并且支持自动分库分表和多副本,能对接 TensorFlow、PyTorch 和 MxNet 等 AI 模型,可实现百亿特征向量的秒级查询。Milvus 于 2019 2016/6/3 2017/4/19 Apache Kylin Apache 软件基金会 eBay 2014/11/25 2015/11/18 Apache SeaTunnel Apache 软件基金会 乐视 2021/12/9 Apache Linkis Apache 软件基金会 微众银行 2021/8/2 Apache Kyuubi Apache 软件基金会 网易 2021/6/21 Apache0 码力 | 132 页 | 14.24 MB | 1 年前3Moonshot AI 介绍
没有特别精准的定义。以前我们开发产品,⼀般是有 明确的⽬标下,产品经理、前端、后端彼此配合,按照周期去迭代交付,观察⽤⼾数据进⾏A/B Test,找到最好的路径。 但今天站在AGI的视⻆,做superapp的开发,开发范式到底应该是怎么样的?还会是原来的开发形 态吗? 杨植麟:产品开发⽅式会随着底层技术的变化⽽变化。 移动互联⽹时代的开发,是有了明确的需求,对应确定的操作和完全确定性的事件。背后对应的是旧 是⾮常关键的 问题。 预测下⼀个token是唯⼀问题 36氪:AI领域有⼏⼤⽅向:图像识别(CV)、⾃然语⾔处理(NLP)、机器学习(ML)。前⼏年CV更 热闹,上⼀波AI四⼩⻰(商汤、旷视、云从、依图)都是这个⽅向。你⼀直在做NLP,为什么? 杨植麟:抛开偶然因素,还是有⼀些必然的原因。我觉得,Vision(视觉)⽅向其实更早地看到⼀些产 业成果,但NLP可以去解决更多认知类的问题,让AI真正实现价值。 据我们所知,这是⽬前全球市场上能够产品化使⽤的⼤模型服务中所能⽀持的最⻓上下⽂输⼊⻓度, 标志着MoonshotAI在“⻓⽂本”这⼀重要技术上取得了世界领先⽔平。 为什么说⼤模型的“⻓⽂本”能⼒很重要? 因为从技术视⻆看,参数量决定了⼤模型⽀持多复杂的“计算”,⽽能够接收多少⽂本输⼊(即⻓⽂ 本技术)则决定了⼤模型有多⼤的“内存”,两者共同决定模型的应⽤效果。⽀持更⻓的上下⽂意味 着⼤模型拥有更⼤的“内存”,0 码力 | 74 页 | 1.64 MB | 1 年前32023 中国开源开发者报告
站时,手机和电 脑端都无法访问视频详情页,且手机端无法查看收藏夹与历史记录。还 有网友表示,首页能够正常加载,但全部是繁体字。 8 月 4 日晚间,距离上次事故 5 个月后,又有许多网友反馈 B 站图片(视 频封面)无法加载、视频无法打开、视频一直在缓冲。 2023 年 6 月 8 日下午,中国电信的网 络和通信服务出现无信号等失灵现 象,绝大部分反馈的用户都在广东区 域,疑似广东省内故障。 该问题在广大社交平台上引起热议, 9527:不懂就问,TCP 慢启动算法这个靠前端能解决? houj2:一切都是基于它“小”, 它不能修改 HTTP 协议和相关算法,但它 “秘诀在于遵守 TCP 慢启动算法中的 14kb 规则:当包含渲染初始视口的 所有内容和样式的 HTML 内容低于 14kb 时,页面加载速度会显着加快” bisu3306:我选择 jQuery,只要能达到效果。屎一样的代码继续支行。 -SORA-:我选择 vanilla,连0 码力 | 87 页 | 31.99 MB | 1 年前32021 中国开源年度报告
万开发者用户。我们对托管在 Gitee 的开源项目进行了统计分析,梳理和解读编程语言、功能分布的变化趋势,分析开发者 在 Gitee 参与开源的情况,以期为观察国内开源的演进提供一个 “本土平台” 视⻆。 Gitee is the code hosting platform of Open Source China which has over 8 million users. We have Apache Kylin Apache 软 件基金会 eBay 2014/11/25 2015/11/18 Apache SeaTunnel Apache 软 件基金会 乐视 2021/12/9 Apache Linkis Apache 软 件基金会 微众银行 2021/8/2 Apache Kyuubi Apache 软 网易 2021/6/210 码力 | 199 页 | 9.63 MB | 1 年前32024 中国开源开发者报告
随着大模型训练范式从预训练(Pre-training)阶段向后训练(Post-Training)阶段的迁移, 人们的关注焦点也逐渐从语言模型的生成能力越来越多转向推理能力。这一转变的本质是更加重 视模型理解和处理复杂问题的能力。 以此为驱动,垂直领域私域知识库的应用也会更关注解决复杂问题的能力,如指标解读、研 报生成、诊疗决策、表格计算、事实问答等,这些都是传统 RAG 向量计算模型难以解决的。0 码力 | 111 页 | 11.44 MB | 8 月前3
共 6 条
- 1