2024 中国开源开发者报告等多家知名企业工作。 曾联合发起全球首个开源向量数据库项目 Milvus,并帮助 Milvus 社区 在两年间迅速拓展到两千家企业用户。 29 / 111 大模型撞上“算力墙”,超级应用的探寻之路 文/傅聪 近日,大模型教父 Sam Altman 在 Reddit 上的评论透露出 GPT-5 难产的隐忧,直言有限 的算力约束让 OpenAI 面临迭代优先级的艰难抉择,在通往 AGI 的道路上一路高歌猛进的领头 Generated Data’ 【15】The Platonic Representation Hypothesis 傅聪 浙江大学计算机博士,美国南加州大学访问学者,《业务驱动的推荐系 统:方法与实践》作者。高性能检索算法 NSG、SSG 的发明者,知乎 科技博主“傅聪 Cong”。 前阿里巴巴算法专家,目前就职于 Shopee(新加坡)任资深算法专家。 在顶会和期刊 TPAMI、K 码往往会 继承这些问题,导致质量较差。例如,模型可能生成带有潜在安全漏洞的代码(如未验证用户输 入的 SQL 查询),或使用已经被淘汰的技术框架和方法(如不安全的加密算法)。此外,训练 数据中若缺少高质量的代码示例,生成结果可能在可维护性、性能和测试性方面表现不佳。 上下文理解的局限性。大模型的代码生成通常基于短期上下文(如用户输入的一段描述或代 码片段),缺乏对整体系统架构和长期上下文0 码力 | 111 页 | 11.44 MB | 8 月前3
Hello 算法 1.2.0 简体中文 C# 版notation),表示函数 ?(?) 的 渐近上界(asymptotic upper bound)。 时间复杂度分析本质上是计算“操作数量 ?(?)”的渐近上界,它具有明确的数学定义。 函数渐近上界 若存在正实数 ? 和实数 ?0 ,使得对于所有的 ? > ?0 ,均有 ?(?) ≤ ? ⋅ ?(?) ,则可认为 ?(?) 给 出了 ?(?) 的一个渐近上界,记为 ?(?) = ?(?(?)) 。 在这种情况下,我们通常使用最差时间复杂度作为算法效率的评判标准。 为什么很少看到 Θ 符号? 可能由于 ? 符号过于朗朗上口,因此我们常常使用它来表示平均时间复杂度。但从严格意义上讲,这 种做法并不规范。在本书和其他资料中,若遇到类似“平均时间复杂度 ?(?)”的表述,请将其直接 理解为 Θ(?) 。 2.4 空间复杂度 空间复杂度(space complexity)用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间 算法”中的所有字符都 编码为 2 字节长度。这样系统就可以每隔 2 字节解析一个字符,恢复这个短语的内容了。 图 3‑7 Unicode 编码示例 然而 ASCII 码已经向我们证明,编码英文只需 1 字节。若采用上述方案,英文文本占用空间的大小将会是 ASCII 编码下的两倍,非常浪费内存空间。因此,我们需要一种更加高效的 Unicode 编码方法。 3.4.4 UTF‑8 编码 目前,UTF‑8 已成为国际上使用最广泛的0 码力 | 379 页 | 18.48 MB | 10 月前3
Hello 算法 1.2.0 简体中文 Ruby 版notation),表示函数 ?(?) 的 渐近上界(asymptotic upper bound)。 时间复杂度分析本质上是计算“操作数量 ?(?)”的渐近上界,它具有明确的数学定义。 函数渐近上界 若存在正实数 ? 和实数 ?0 ,使得对于所有的 ? > ?0 ,均有 ?(?) ≤ ? ⋅ ?(?) ,则可认为 ?(?) 给 出了 ?(?) 的一个渐近上界,记为 ?(?) = ?(?(?)) 。 在这种情况下,我们通常使用最差时间复杂度作为算法效率的评判标准。 为什么很少看到 Θ 符号? 可能由于 ? 符号过于朗朗上口,因此我们常常使用它来表示平均时间复杂度。但从严格意义上讲,这 种做法并不规范。在本书和其他资料中,若遇到类似“平均时间复杂度 ?(?)”的表述,请将其直接 理解为 Θ(?) 。 2.4 空间复杂度 空间复杂度(space complexity)用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间 算法”中的所有字符都 编码为 2 字节长度。这样系统就可以每隔 2 字节解析一个字符,恢复这个短语的内容了。 图 3‑7 Unicode 编码示例 然而 ASCII 码已经向我们证明,编码英文只需 1 字节。若采用上述方案,英文文本占用空间的大小将会是 ASCII 编码下的两倍,非常浪费内存空间。因此,我们需要一种更加高效的 Unicode 编码方法。 3.4.4 UTF‑8 编码 目前,UTF‑8 已成为国际上使用最广泛的0 码力 | 372 页 | 18.44 MB | 10 月前3
Hello 算法 1.2.0 简体中文 Dart 版notation),表示函数 ?(?) 的 渐近上界(asymptotic upper bound)。 时间复杂度分析本质上是计算“操作数量 ?(?)”的渐近上界,它具有明确的数学定义。 函数渐近上界 若存在正实数 ? 和实数 ?0 ,使得对于所有的 ? > ?0 ,均有 ?(?) ≤ ? ⋅ ?(?) ,则可认为 ?(?) 给 出了 ?(?) 的一个渐近上界,记为 ?(?) = ?(?(?)) 。 在这种情况下,我们通常使用最差时间复杂度作为算法效率的评判标准。 为什么很少看到 Θ 符号? 可能由于 ? 符号过于朗朗上口,因此我们常常使用它来表示平均时间复杂度。但从严格意义上讲,这 种做法并不规范。在本书和其他资料中,若遇到类似“平均时间复杂度 ?(?)”的表述,请将其直接 理解为 Θ(?) 。 2.4 空间复杂度 空间复杂度(space complexity)用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间 算法”中的所有字符都 编码为 2 字节长度。这样系统就可以每隔 2 字节解析一个字符,恢复这个短语的内容了。 图 3‑7 Unicode 编码示例 然而 ASCII 码已经向我们证明,编码英文只需 1 字节。若采用上述方案,英文文本占用空间的大小将会是 ASCII 编码下的两倍,非常浪费内存空间。因此,我们需要一种更加高效的 Unicode 编码方法。 3.4.4 UTF‑8 编码 目前,UTF‑8 已成为国际上使用最广泛的0 码力 | 378 页 | 18.46 MB | 10 月前3
Hello 算法 1.2.0 简体中文 Kotlin 版notation),表示函数 ?(?) 的 渐近上界(asymptotic upper bound)。 时间复杂度分析本质上是计算“操作数量 ?(?)”的渐近上界,它具有明确的数学定义。 函数渐近上界 若存在正实数 ? 和实数 ?0 ,使得对于所有的 ? > ?0 ,均有 ?(?) ≤ ? ⋅ ?(?) ,则可认为 ?(?) 给 出了 ?(?) 的一个渐近上界,记为 ?(?) = ?(?(?)) 。 在这种情况下,我们通常使用最差时间复杂度作为算法效率的评判标准。 为什么很少看到 Θ 符号? 可能由于 ? 符号过于朗朗上口,因此我们常常使用它来表示平均时间复杂度。但从严格意义上讲,这 种做法并不规范。在本书和其他资料中,若遇到类似“平均时间复杂度 ?(?)”的表述,请将其直接 理解为 Θ(?) 。 2.4 空间复杂度 空间复杂度(space complexity)用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间 算法”中的所有字符都 编码为 2 字节长度。这样系统就可以每隔 2 字节解析一个字符,恢复这个短语的内容了。 图 3‑7 Unicode 编码示例 然而 ASCII 码已经向我们证明,编码英文只需 1 字节。若采用上述方案,英文文本占用空间的大小将会是 ASCII 编码下的两倍,非常浪费内存空间。因此,我们需要一种更加高效的 Unicode 编码方法。 3.4.4 UTF‑8 编码 目前,UTF‑8 已成为国际上使用最广泛的0 码力 | 382 页 | 18.48 MB | 10 月前3
Hello 算法 1.2.0 简体中文 JavaScript 版notation),表示函数 ?(?) 的 渐近上界(asymptotic upper bound)。 时间复杂度分析本质上是计算“操作数量 ?(?)”的渐近上界,它具有明确的数学定义。 函数渐近上界 若存在正实数 ? 和实数 ?0 ,使得对于所有的 ? > ?0 ,均有 ?(?) ≤ ? ⋅ ?(?) ,则可认为 ?(?) 给 出了 ?(?) 的一个渐近上界,记为 ?(?) = ?(?(?)) 。 在这种情况下,我们通常使用最差时间复杂度作为算法效率的评判标准。 为什么很少看到 Θ 符号? 可能由于 ? 符号过于朗朗上口,因此我们常常使用它来表示平均时间复杂度。但从严格意义上讲,这 种做法并不规范。在本书和其他资料中,若遇到类似“平均时间复杂度 ?(?)”的表述,请将其直接 理解为 Θ(?) 。 2.4 空间复杂度 空间复杂度(space complexity)用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间 算法”中的所有字符都 编码为 2 字节长度。这样系统就可以每隔 2 字节解析一个字符,恢复这个短语的内容了。 图 3‑7 Unicode 编码示例 然而 ASCII 码已经向我们证明,编码英文只需 1 字节。若采用上述方案,英文文本占用空间的大小将会是 ASCII 编码下的两倍,非常浪费内存空间。因此,我们需要一种更加高效的 Unicode 编码方法。 3.4.4 UTF‑8 编码 目前,UTF‑8 已成为国际上使用最广泛的0 码力 | 379 页 | 18.47 MB | 10 月前3
Hello 算法 1.2.0 简体中文 Swift 版notation),表示函数 ?(?) 的 渐近上界(asymptotic upper bound)。 时间复杂度分析本质上是计算“操作数量 ?(?)”的渐近上界,它具有明确的数学定义。 函数渐近上界 若存在正实数 ? 和实数 ?0 ,使得对于所有的 ? > ?0 ,均有 ?(?) ≤ ? ⋅ ?(?) ,则可认为 ?(?) 给 出了 ?(?) 的一个渐近上界,记为 ?(?) = ?(?(?)) 。 在这种情况下,我们通常使用最差时间复杂度作为算法效率的评判标准。 为什么很少看到 Θ 符号? 可能由于 ? 符号过于朗朗上口,因此我们常常使用它来表示平均时间复杂度。但从严格意义上讲,这 种做法并不规范。在本书和其他资料中,若遇到类似“平均时间复杂度 ?(?)”的表述,请将其直接 理解为 Θ(?) 。 2.4 空间复杂度 空间复杂度(space complexity)用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间 算法”中的所有字符都 编码为 2 字节长度。这样系统就可以每隔 2 字节解析一个字符,恢复这个短语的内容了。 图 3‑7 Unicode 编码示例 然而 ASCII 码已经向我们证明,编码英文只需 1 字节。若采用上述方案,英文文本占用空间的大小将会是 ASCII 编码下的两倍,非常浪费内存空间。因此,我们需要一种更加高效的 Unicode 编码方法。 3.4.4 UTF‑8 编码 目前,UTF‑8 已成为国际上使用最广泛的0 码力 | 379 页 | 18.48 MB | 10 月前3
Hello 算法 1.2.0 简体中文 Rust 版notation),表示函数 ?(?) 的 渐近上界(asymptotic upper bound)。 时间复杂度分析本质上是计算“操作数量 ?(?)”的渐近上界,它具有明确的数学定义。 函数渐近上界 若存在正实数 ? 和实数 ?0 ,使得对于所有的 ? > ?0 ,均有 ?(?) ≤ ? ⋅ ?(?) ,则可认为 ?(?) 给 出了 ?(?) 的一个渐近上界,记为 ?(?) = ?(?(?)) 。 在这种情况下,我们通常使用最差时间复杂度作为算法效率的评判标准。 为什么很少看到 Θ 符号? 可能由于 ? 符号过于朗朗上口,因此我们常常使用它来表示平均时间复杂度。但从严格意义上讲,这 种做法并不规范。在本书和其他资料中,若遇到类似“平均时间复杂度 ?(?)”的表述,请将其直接 理解为 Θ(?) 。 2.4 空间复杂度 空间复杂度(space complexity)用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间 算法”中的所有字符都 编码为 2 字节长度。这样系统就可以每隔 2 字节解析一个字符,恢复这个短语的内容了。 图 3‑7 Unicode 编码示例 然而 ASCII 码已经向我们证明,编码英文只需 1 字节。若采用上述方案,英文文本占用空间的大小将会是 ASCII 编码下的两倍,非常浪费内存空间。因此,我们需要一种更加高效的 Unicode 编码方法。 3.4.4 UTF‑8 编码 目前,UTF‑8 已成为国际上使用最广泛的0 码力 | 387 页 | 18.51 MB | 10 月前3
Hello 算法 1.2.0 简体中文 TypeScript 版notation),表示函数 ?(?) 的 渐近上界(asymptotic upper bound)。 时间复杂度分析本质上是计算“操作数量 ?(?)”的渐近上界,它具有明确的数学定义。 函数渐近上界 若存在正实数 ? 和实数 ?0 ,使得对于所有的 ? > ?0 ,均有 ?(?) ≤ ? ⋅ ?(?) ,则可认为 ?(?) 给 出了 ?(?) 的一个渐近上界,记为 ?(?) = ?(?(?)) 。 在这种情况下,我们通常使用最差时间复杂度作为算法效率的评判标准。 为什么很少看到 Θ 符号? 可能由于 ? 符号过于朗朗上口,因此我们常常使用它来表示平均时间复杂度。但从严格意义上讲,这 种做法并不规范。在本书和其他资料中,若遇到类似“平均时间复杂度 ?(?)”的表述,请将其直接 理解为 Θ(?) 。 2.4 空间复杂度 空间复杂度(space complexity)用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间 算法”中的所有字符都 编码为 2 字节长度。这样系统就可以每隔 2 字节解析一个字符,恢复这个短语的内容了。 图 3‑7 Unicode 编码示例 然而 ASCII 码已经向我们证明,编码英文只需 1 字节。若采用上述方案,英文文本占用空间的大小将会是 ASCII 编码下的两倍,非常浪费内存空间。因此,我们需要一种更加高效的 Unicode 编码方法。 3.4.4 UTF‑8 编码 目前,UTF‑8 已成为国际上使用最广泛的0 码力 | 383 页 | 18.49 MB | 10 月前3
Hello 算法 1.2.0 简体中文 Python 版notation),表示函数 ?(?) 的 渐近上界(asymptotic upper bound)。 时间复杂度分析本质上是计算“操作数量 ?(?)”的渐近上界,它具有明确的数学定义。 函数渐近上界 若存在正实数 ? 和实数 ?0 ,使得对于所有的 ? > ?0 ,均有 ?(?) ≤ ? ⋅ ?(?) ,则可认为 ?(?) 给 出了 ?(?) 的一个渐近上界,记为 ?(?) = ?(?(?)) 。 在这种情况下,我们通常使用最差时间复杂度作为算法效率的评判标准。 为什么很少看到 Θ 符号? 可能由于 ? 符号过于朗朗上口,因此我们常常使用它来表示平均时间复杂度。但从严格意义上讲,这 种做法并不规范。在本书和其他资料中,若遇到类似“平均时间复杂度 ?(?)”的表述,请将其直接 理解为 Θ(?) 。 2.4 空间复杂度 空间复杂度(space complexity)用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间 算法”中的所有字符都 编码为 2 字节长度。这样系统就可以每隔 2 字节解析一个字符,恢复这个短语的内容了。 图 3‑7 Unicode 编码示例 然而 ASCII 码已经向我们证明,编码英文只需 1 字节。若采用上述方案,英文文本占用空间的大小将会是 ASCII 编码下的两倍,非常浪费内存空间。因此,我们需要一种更加高效的 Unicode 编码方法。 3.4.4 UTF‑8 编码 目前,UTF‑8 已成为国际上使用最广泛的0 码力 | 364 页 | 18.43 MB | 10 月前3
共 64 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7













