加入我们的每日和每周新闻通讯,获取最新的行业领先 AI 覆盖内容。了解更多。
Noam Brown,OpenAI 的一位杰出研究科学家,在周二的 TED AI 会议上在旧金山的舞台上发表了一篇关于人工智能未来的重要演讲,特别关注 OpenAI 的新 o1 模型及其通过战略推理、高级编程和科学研究等手段对行业进行变革的潜力。 Brown,之前在推动 AI 系统如 Libratus(扑克 AI)和 CICERO(外交棋盘游戏)方面取得了突破,现在他设想了一个未来,AI 不仅是一个工具,而且是跨行业创新和决策的核心引擎。
“过去五年来人工智能的进步可以用一个词来概括:规模”,布朗开始说,他面对着一群充满热情的开发者、投资者和行业领导者,他们全神贯注地听他讲话。是的,确实有上行技术的进步,但今天前沿模型的基础架构仍然是 2017 年引入的 Transformer 架构。主要的区别在于数据量和计算量的规模。”
Brown,OpenAI 研究领域的关键人物,迅速强调了虽然模型规模的扩展是人工智能进步的关键因素,但需要进行范式的转变。他指出,AI 应该超越单纯的数据处理,转向他所称的“系统二思考”——一种更慢、更审慎的推理方式,这种推理方式与人类解决复杂问题的方式相类似。
人工智能下一重大飞跃的心理学基础:理解系统二思维
为了强调这一点,布朗分享了他在博士期间的一个故事,当时他正在研究 Libratus,这个著名的扑克 AI 在 2017 年击败了顶尖人类玩家。
“结果表明,仅仅在扑克牌手牌中让机器人思考 20 秒,就能达到与将模型扩展 100,000 倍并训练 100,000 倍之久相同的效果。”布朗说。“当我得到这个结果时,我简直以为这是个 bug。在我读博士的前三年,我成功地将这些模型扩大了 100 倍。我为此感到自豪。” 我写过多篇关于如何进行这种扩展的文章,但我知道很快就会发现,所有这些都会被这个扩展系统所超越。”
布朗的演讲介绍了系统二思考作为传统扩展的解决方案。这种思考方式由心理学家丹尼尔·卡内曼在《思考,快与慢》一书中广为流行,指的是人类用于解决复杂问题的较慢、更审慎的思考模式。布朗认为,将这种思维方式融入到 AI 模型中,可以实现显著的性能提升,而无需付出成倍的数据或计算资源。
他回忆说,让 Libratus 在做出决策前思考 20 秒,对结果产生了深远的影响,相当于将模型放大 100,000 倍。布朗说:“结果让我大吃一惊。”他指出,通过专注于系统二思考,企业可以以较少的资源实现更好的结果。
Inside OpenAI 的 o1:一个革命性的模型,需要时间来思考
Brown 的演讲紧随 OpenAI 的 o1 系列模型发布之后,这些模型引入了系统二思考,将这种思维方式带入了 AI。这些模型于 2024 年 9 月推出,设计用于比其前身更仔细地处理信息,使其在科学研究、编程和战略决策等领域特别适合复杂任务。
“我们不再局限于仅仅扩大系统的一个训练。现在我们也可以同时扩大系统两个思考层面,这在扩大方向上是相当未被开发的,”布朗解释道。“这并不是 10 年或 2 年后的革命,而是在现在发生的革命。”
o1 模型已经在各种基准测试中展示了强大的性能。例如,在国际数学奥林匹克竞赛的资格考试中,o1 模型的准确率达到了 83%,这比 OpenAI 的 GPT-4o 的 13% 高出了一个数量级。布朗指出,能够通过复杂的数学公式和科学数据进行推理,使 o1 模型在依赖数据驱动决策的行业特别有价值。
企业解决方案中慢 AI 的商业案例:耐心在企业解决方案中会带来回报
对于企业而言,OpenAI 的 o1 模型在学术表现之外还提供了诸多好处。布朗强调,扩大系统二思考的规模可以改善医疗、能源和金融等行业中的决策过程。他举了癌症治疗的例子,问道:“如果你们愿意为一种新的癌症治疗支付超过 1 美元,你们会愿意支付多少……1000 美元?1000000 美元呢?”
布朗建议,o1 模型可以帮助研究人员加快数据收集和分析,使他们能够专注于解读结果和生成新的假设。在能源领域,他指出,该模型可以加速更高效太阳能电池板的开发,可能带来可再生能源领域的突破。
他承认了关于慢 AI 模型的质疑。当我说到这一点时,我经常收到的回应是,人们可能不愿意等待几分钟来得到回复,或者支付几美元来得到问题的答案,他说。但对于最重要的问题,他认为这种成本是值得的。
硅谷的新 AI 赛道:处理能力不是一切
OpenAI 的转向系统二思考可能会重塑 AI 的竞争格局,特别是在企业应用领域。虽然当前大多数模型都是为速度优化的,但 o1 的有意识的推理过程可能为企业提供更准确的见解,特别是在金融和医疗等行业的应用中。
在科技行业,像 Google 和 Meta 这样的公司正在大力投资 AI,而 OpenAI 的深度推理研究使其脱颖而出。例如,Google 的 Gemini AI 专注于多模态任务,但要确定它在问题解决能力方面的表现如何,还有待观察。
不过,实施 o1 的成本可能会限制其广泛采用。该模型运行速度较慢,成本更高。据报道,o1-preview 模型每 1000 万输入令牌的成本为 15 美元,每 1000 万输出令牌的成本为 60 美元,远高于 GPT-4o。然而,对于需要高精度输出的企业而言,这种投资可能值得。
当布朗结束他的演讲时,他强调了人工智能发展正处于关键转折点:“我们现在有了一个新的参数,可以扩展系统二的思考——我们刚刚开始在这个方向上扩展。”