开源中国 2023 大模型(LLM)技术报告用于优化计算密集型任务,而 Java 在企业环境中处理模型部署和系 统集成方面常见。JavaScript 适用于 Web 环境的 LLM 应用。 13 / 32 LLM 基础设施:编程语言 2023 年是大语言模型 (LLM) 之年,Python 作为人工智能领域使用度最高的编程语言,在 2023 年到底有多火? 从各种开发者报告、编程语言榜单来看。只要出现有关编程语言流行度的排名, ,而 Java、C/C++ AI 编程 生成式 AI 正经历前所未有的快速普及, 而开发者们正积极将 AI 作为自己的生 产力工具,随着众多 AI 编程工具的普 及,开发者们使用 AI 辅助工作已经逐 渐司空见惯。 分析公司 O’Reilly 日前发布一份 《2023 Generative AI in the Enterprise》报告, 报告中指出, 。 图源:https://www.oreilly.com/rada0 码力 | 32 页 | 13.09 MB | 1 年前3
TVM: Where Are We GoingSubclassesUnified Runtime Benefit mod.export_library("mylib.so") Unified library packaging Free API (Py/Java/Go) lib = tvm.module.load("mylib.so") func = lib["npufunction0"] func(a, b) Automatic RPC Support decl_buffer(shape=[%n], src=%a) %B = decl_buffer(shape=[%n], src=%b) for %i = 0 to 10 [data_par] { %B[%i] = %A[%i] + 1.0 } }First-class Python Support @tvm.hybrid def te_add_one(a, = bind_buffer(shape=[n], a) B = bind_buffer(shape=[n], b) for i in iter_range(n, iter_type=”data_par”): A[i] = B[i] + 1 mod = tvm.IRModule([te_add_one]) print(mod[”te_add_one”].args)0 码力 | 31 页 | 22.64 MB | 6 月前3
DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language Modelamong open-source models. The model checkpoints are available at h t t p s : / / g i t h u b . c o m / d e e p s e e k - a i / D e e p S e e k - V 2 . 0 20 40 60 80 100 Activated Parameters (Billions) 55 2; ...; k?,?ℎ] = k?, (5) [v?,1;v?,2; ...; v?,?ℎ] = v?, (6) o?,? = ?∑︁ ?=1 Softmax?( q? ?,?k?,? √ ?ℎ )v?,?, (7) u? = ??[o?,1; o?,2; ...; o?,?ℎ], (8) where q?,?, k?,?, v?,? ∈ R?ℎ denote the query, key [q? ?,?; q? ?,?], (16) k?,? = [k? ?,?; k? ? ], (17) o?,? = ?∑︁ ?=1 Softmax?( q? ?,?k?,? √︃ ?ℎ + ?? ℎ )v? ?,?, (18) u? = ??[o?,1; o?,2; ...; o?,?ℎ], (19) where ??? ∈ R?? ℎ ?ℎ×?′ ? and ? ?? ∈ R??0 码力 | 52 页 | 1.23 MB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单(如医疗、法律)进行优化, 提供高精度结果。 长文本处理:擅长处理长文本 和复杂文档,适合专业场景。 定制化能力:支持用户自定义 训练和微调,适应特定需求。 Open AI o3 mini 小型化设计:轻量级模型, 适合资源有限的环境。 快速响应:优化推理速度, 适合实时交互场景。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 年春运(2025年1月14日到2月8日) 相关数据(如日期、全社会跨区域人员流动量、铁路客运 量、公路人员流动量、水路客运量、民航客运量等)”完 成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 响应速度快,能够高效提 取所有需求链接,输出完 整可运行python脚本,代 码运行后生成文件,但数 据采集结果为空。 DeepSeek R1 能够提取所有网址并进行 筛选、去重,所撰写代码 目前DeepSeek R1、Open AI o3mini、Kimi k1.5支持联网查询网址,Claude 3.5 sonnet暂不支持; 四个模型均能根据上传的网页代码,对多个网址链接进行筛选、去重,完全提取出符合指令要求的所有网址链接并形成列表; 在复杂爬虫任务上,DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务,o3响应速度更快,R1数据采集结果更加完0 码力 | 85 页 | 8.31 MB | 8 月前3
Trends Artificial Intelligence
Cloud GPUs Computing Cycles Over Time – 1960s-2020s, per Morgan Stanley Note: Axis is logarithmic; i.e., there are expected to be tens of thousands more AI Era devices than Mainframe devices 1960 Department of Homeland Security unveils its AI Roadmap Strategy 5/24: OpenAI releases GPT-4o, which has full multimodality across audio, visual, & text inputs 7/24: Apple releases Apple 12/24: OpenAI announces o3, its highest-ever performing model 1/25: Alibaba unveils Qwen2.5-Max, which surpasses the performance of other leading models (GPT- 4o, Claude 3.5) on some0 码力 | 340 页 | 12.14 MB | 5 月前3
Manus AI:Agent元年开启/012334%&'(56789:;<=>?@A BC%&'() • DEFGHI)*DEFGJKHI567LMN0OITPQRSTUVW5VWXYZ=>O[ \]^_`) • abcde&fghi=>.gjklmno5pqLr?E=PstOuv5w%xyabz {|L}=>~}m•O2€.jk• • ‚ƒc„…†Agent…‡ˆAGIO‰Š‹Œ•1 Manus AI!"#$%&'Agent3 Manus AI%&'() "GAIçèûÞ&> • AI*+uv5´µ#$GManusuv,!"#$%AI*+,)`%&R<º»JK> • ÑÒÓ*5'de() • ManusêëF-*Bz'()+,-,Manus./I6¦Gdeáâ(),012÷345de> !"#$%Bloomberg*&'()7 Manus AI%6789: • 67,89:;<щ=>?Š@&ACEO,BC‡DF<Ñg[> • 2016 ƒ5†D‡[ˆ%GD‡5†IJÞ--‰Š!ƒD‡5†[ˆGfigma> • 2022Eb,÷‹MonicauŒ>Monica!"#¶‰$•)€GAIŸ ,$ŒÜÝÞLMŽ•áâS),•ÌQŸ%ãR²cA+C•‘W O>Monica !"#. ChatGPT API áâ()G Chrome ßà,’L!"#$%Bloomberg*&'()2 Agent()9 Agent%;<=4 0 码力 | 23 页 | 4.87 MB | 6 月前3
清华大学 普通人如何抓住DeepSeek红利! 学习太难?DeepSeek带你“开挂”逆袭! 生活太累?DeepSeek帮你“减负”到家! 社交障碍?DeepSeek教你“高情商”破局! ZXDWsPoPvNtNtNnQnPpMsP8O8QaQpNpPsQqNeRqQnPkPnMpM9PoOwOxNpNsPuOqQpN p 提示词驱动的新生产力 在AI时代,知识的获取成本趋近于零,拥有知识不再是核心竞争力。利用提示词创造知识,引领创新、明确 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正 式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大 提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAl-o1正式版。 (Pass@1) S v L C q Y 4 Y V 1 T 8 0 u m B k k m O x d k C i y K r j i 6 n p Y d O w t v B 4 G 0 G p y 8 U I q e T 9 M 6 Deepseek的能力图谱 直接面向用户或者支持开发者,提供智能对话、0 码力 | 65 页 | 4.47 MB | 8 月前3
OpenAI 《A practical guide to building agents》piece of info is missing. 11 A practical guide to building agents You can use advanced models, like o1 or o3-mini, to automatically generate instructions from existing documents. Here’s a sample prompt illustrating initiate_ refund function ‘is_safe’ True Reply to user User input User AgentSDK gpt-4o-mini Hallucination/ relevence gpt-4o-mini (FT) safe/unsafe LLM Moderation API Rules-based protections input character ( ) except GuardrailTripwireTriggered: ( ) try: await print print "I think I might cancel my subscription") "Guardrail didn't trip - this is unexpected" "Churn detection guardrail0 码力 | 34 页 | 7.00 MB | 6 月前3
DeepSeek从入门到精通(20250204)如何使用DeepSeek? https://chat.deepseek.com 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 Refinement, Synthesis)。这个 模型概括了提示语链设计的四个关键环节: R e f i n e m e n t ( 优 化 ) C o n t e x t ( 上 下 文 ) 对初步输出进行修改和完善 Synthesis(综合) 整合所有输出,形成最终成果 I n s t r u c t i o n ( 指 令 ) 给出具体的指示 提供背景信息和任务概述 任务分解的提示语链设计步骤0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通网页端:https://chat.deepseek.com APP:DeepSeek 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 Refinement, Synthesis)。这个 模型概括了提示语链设计的四个关键环节: R e f i n e m e n t ( 优 化 ) C o n t e x t ( 上 下 文 ) 对初步输出进行修改和完善 Synthesis(综合) 整合所有输出,形成最终成果 I n s t r u c t i o n ( 指 令 ) 给出具体的指示 提供背景信息和任务概述 任务分解的提示语链设计步骤0 码力 | 103 页 | 5.40 MB | 8 月前3
共 27 条
- 1
- 2
- 3













