查看: 348|回复: 2

苦涩的启示：对AI系统构建方式的反思 [复制链接]

see122

军衔等级：

少校

注册：2007-10-29 点赞数

11

发表于 2025-4-18 15:58:31 |显示全部楼层

神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，重点先容国外的新技术、新观点、新风向。

编者按：理查德·萨顿提出的“苦涩的教训”揭示AI发展本质：算力驱动系统终将超越人工设计。本文通过客服案例和强化学习革命阐明，企业应聚焦算力基建与扩展架构，工程师需转型为算力赛道的搭建者，而非规则制定者。文章来自编译。

AI进步之争

2019年，Richard Sutton发表了开创性文章《苦涩的启示》。简言之，其核心结论是：随着算力提升而进化的系统，终将战胜那些无法如此的系统。在AI领域，原始算力始终碾压人类设计的复杂方案。我曾以为精巧编排与复杂规则是构建更好AI系统的关键——这是典型的App开发者思维：搭建系统、寻找边缘案例并搞定即可大功告成。我可真是大错特错。

自然界的启示

近日我在打理小花园时，顿悟出这个原理的完美类比：植物生长不需要详细指令。只要提供基础条件（水、阳光、养分），它们自会探索生长之道。这正是高效AI系统的工作方式。

当大家的AI解决方案被过度设计时，就像对植物的生长进行微观管理，规定每片叶子的发育路径。这不仅低效，还会制造出无法适应新环境的脆弱系统。

三种方案的启示

当前，客户服务是AI智能体最常见的企业应用场景之一。容我分享构建客服自动化系统时的一个真实案例：

基于规则的方法：初期，人们设计了包含数百条规则的决策树来处理客户咨询。虽能应对常规案例，但稍遇变化即崩溃，维护成本更是噩梦。

有限算力智能体：随着ChatGPT问世，算力有限的AI客服出现。根据历史数据或标准流程编写提示词，虽能处理简单问题，但面对复杂咨询仍需人工干预。

这便是多数AI智能体的现状。路径之一是进一步限制其边界，引入各种框架和护栏确保智能体忠于目标，但却在无意间固化了算力上限。或者尝试：

扩展方案：大家尝试突破性思路——加大算力投放。不仅升级GPU，更重构了AI使用范式：让智能体并行生成多个回应，同步运行多条推理路径并择优输出。每次与客户交互可能触发数十次AI调用以探索不同方案。系统生成多种潜在回应、评估效果，甚至模拟对话走向。尽管算力消耗巨大，效果却令人惊叹。它开始处理大家未曾设想的边缘案例，更重要的是，通过自由探索发现了自然涌现的交互模式。

强化学习革命

2025年，这一模式在强化学习（RL）智能体上体现得愈发显著。当众多企业忙于为通用模型套壳（约束模型遵循特定工作流）时，真正的突破来自对后训练RL算力的投入。这些RL增强模型不仅遵循预设模式，更能发现全新解决方案。以OpenAI的深度研究或Claude的计算机使用能力为例，它们证明了：在后训练阶段投入海量算力，效果远胜复杂编排层。套壳没有错，但那属于固守单一解题路径。而拥有探索自由与庞大算力的RL智能体，找到了人类未曾设想的更优方案。

RL智能体的精妙在于其自然学习机制。就像教人骑自行车——你不会扔给对方50页的物理原理手册，而是让人通过尝试、摔倒、调整最终掌握。RL智能体也是一样的原理，但规模要大得多：尝试数千种解题路径，接收效果反馈，成功强化特定神经通路，每次失败都有助于避免走进死胡同。

比方说在客服场景里，RL智能体可能发现：即使问题看似明确，在对话早期提出澄清性质疑，能显著提升解决率。这种模式通常不会被编码进套壳里面，而是由智能体通过海量试错发现的。关键在于拥有足够算力去跑这些实验，并从中学习。

这种方法的强大之处在于，它突破了人类的认知局限。套壳方案本质上是对现有最佳实践的固化，而RL智能体却能发现全新范式。它们可能会发现：看似无关的方法组合，效果却优于人类设计的逻辑分步方案。这正是“苦涩的启示”的实践——在充足算力下，探索式学习终将战胜人工规则。

Claude代码与Cursor的竞争即将印证这点。当前用户反馈Cursor与Claude Sonnet 3.7兼容性欠佳，但与3.5版的配合却很完美。而使用Sonnet 3.7的Claude代码虽消耗大量token，效果却十分惊人。据悉Cursor将推出基于用量的定价方案，以更好利用3.7版的智能体行为。这种模式将在更多领域显现，特别是在非代码领域——当人类固守单一流程时，智能体已在探索多条路径。

对AI工程师的启示

这个洞见彻底改变了AI系统的设计范式：

<ol>

简单起步，扩展做大：从能捕捉问题本质的最简学习架构出发，通过增加算力而非复杂度来扩展系统。

为扩展而设计：构建能有效利用额外算力的系统，包括：可并行化架构，随数据/算力增长而扩展的灵活学习框架，支撑分布式处理的基础设施

避免过早优化：在算力潜力未充分挖掘前，不要耗费数周时间去优化算法。精巧工程带来的回报，通常远逊于单纯增加计算资源。
</ol>
深刻启示

这对工程师意味着深刻而略感不适的启示：

投资战略：企业应更多投资于计算基础设施，而非复杂算法开发。
竞争优势：AI领域的赢家不会是算法最精妙者，而是能高效驾驭最大算力者。
职业关注：AI工程师的价值不在于雕琢完美算法，而在于构建能有效利用海量计算资源的系统。这是App开发思维模式的根本转变。

未来展望

这个启示看似削弱了AI工程师的作用，其实不然，AI工程师的作用反而提升了。大家的工作变成了：

设计能有效利用不断增加的算力的系统
构建可扩展的健壮的学习环境
创建无需重构即可扩展的架构

未来属于那些通过算力构建学习适应系统的实践者，而非试图将人类常识编码为刚性规则的工程师。

切记：在精巧工程与原始算力的竞赛中，算力终将笑到最后。大家的角色是建造赛道，而非设计跑者的每个动作。

译者：boxi。

来源：36kr

举报本楼

本帖有 2 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图

GMT+8, 2025-4-22 13:05 , Processed in 0.134475 second(s), 16 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册