在生成式 AI 革命的第二个年头,人工智能领域正迎来一个新的时代 —— 自主推理时代。
随着基础模型层的稳定,由微软 / OpenAI、AWS/Anthropic、Meta 和 Google/DeepMind 等巨头主导,市场结构趋于平衡,预测下一个词的成本不断降低。
然而,真正的创新正在于推理层的发展,重点是 “系统 2” 思维,即模型在推断时进行有意识的推理和问题解决,超越了简单的模式匹配。
OpenAI 在 2024 年推出的 o1 模型(代号 Strawberry)成为这一转变的标志性成果。
作为首个通过推断时计算实现通用推理能力的模型,o1 能够在回答前 “停下来思考”,需要更多的推断时计算资源。
这种方法使其在逻辑、编码、数学等领域表现出色,但在开放性更强的任务上仍有提升空间。
这种创新灵感源自 2016 年 AlphaGo 战胜李世石的策略。AlphaGo 不仅依赖预训练的数据,还在推断时进行搜索和模拟,评估潜在的结果并选择最佳行动。
类似地,o1 模型通过增加推断时的计算,实现了更深层次的推理能力。
这引出了一个新的扩展定律:给予模型更多的推断时计算资源,模型的推理能力会显著提高。 这开启了从大规模预训练集群转向 “推断云” 的新竞赛。
然而,尽管基础模型变得更加强大,现实世界的复杂性使得定制化的认知架构在应用层仍有巨大的发展空间。
AI 公司通过模拟人类在特定任务中的思维流程,打造了更有效的系统。例如,Factory 的 “droid” 产品为每个任务设计了专属的认知架构,提升了工作效率。这体现了认知架构在应用层的关键作用,即系统如何处理用户输入、执行操作并生成响应。
这一趋势推动了从 “软件即服务”(SaaS)向 “服务即软件” 的转变。AI 公司不再按用户数量收费,而是按完成的工作量收费,直接瞄准了价值数万亿美元的服务市场。
Sierra 作为 AI 客户支持代理,按每次成功解决客户问题收费,而非传统的按席位收费模式,正是这一新商业模式的典型代表。
新一代的基于代理的 AI 应用正在各个领域崛起,包括 AI 律师 Harvey、AI 工作助手 Glean、AI 软件工程师 Factory、AI 医疗记录员 Abridge、AI 渗透测试工具 XBOW 等。
他们通过降低服务的边际成本,开拓并扩大了新的市场。这预示着 AI 可能不仅会提供新的服务模式,还可能取代传统的软件,引发 SaaS 行业的深刻变革。AI 原生公司在产品开发和业务模式上对现有的 SaaS 公司构成了挑战。
未来,推理和推断时计算将继续成为 AI 发展的核心主题。随着认知架构和用户界面的创新,基于代理的 AI 应用将变得更加复杂和可靠,能够更好地解决现实世界中的多样化问题。
人们期待着 AI 领域出现类似 AlphaGo “第 37 手” 那样的突破性时刻,即 AI 展示出超越人类、具有独立思考能力的表现。这将标志着 AI 进入新的发展阶段,带来更广泛的应用和影响。