机器之心报道
编辑:Panda
昨天,我们报道了一个行业猜想,说是 OpenAI 和 Anthropic 等前沿大模型公司可能已经训练出了下一代大模型,但由于它们的使用成本过高,所以短时间内根本不会被放出来。但是,为了响应用户期待,OpenAI 和 Anthropic 等公司会不断放出一些基于下一代大模型蒸馏得到的较小模型。
有意思的是,就在这篇文章发布后不久,OpenAI CEO 山姆・奥特曼就在 X 上宣布将在「几周内」发布 o3-mini,并且这一次会同时发布 API 与网页端。从名字也能看出来,o3-mini 应该就是某个大模型的蒸馏版,这似乎也映证了上面的猜想。
另据 OpenAI 研究科学家 Hongyu Ren 透露,他们会同时发布 o3-mini 的 high、medium、low 三个版本。
当然,严格来说,这并不算是一个新闻。早在上个月 21 日,OpenAI 十二天连发的最后一天,奥特曼就提到过计划在一月底左右推出 o3-mini,并在不久后推出完整的 o3 模型。
这条推文之后,奥特曼又积极地回答了许多网友的提问,为我们揭示了更多细节。
首先,奥特曼证实 o3-mini 的性能表现会逊于 o1-pro,但速度会更快。
这一点着实让不少网友失望,因为从这个描述看,o3-mini 可能也就比 o1-mini 强一点。
但其实,OpenAI 此前就已经公布过相关基准数据了,所以这一点倒并不让人惊讶。比如在 Codeforces 编程基准上,o3-mini (low) 性能不及 o1,high 版本会好一些,但整体都更具成本效益,这使其非常适合用来编程。
OpenAI 的 Dylan Hunn 也强调了 o3-mini 在编程速度上的优势。
或许是为了安抚大家的情绪,奥特曼又抬出了 o3,表示这个版本会比 o1-pro 聪明得多,更别提 o3-pro 了。同时,他也表示 o3-pro 的定价不会是一个月 2000 美元起,200 美元的 Pro 订阅者应该就能获得一定的使用额度。
至于 o3-mini 的使用额度,奥特曼只是说「真的高」,从上下文看应该会比 o1 系列的高一些。
奥特曼也表示 o3-mini 会向 ChatGPT Plus 订阅者提供,并不限于 200 美元月供的 Pro 用户。
另外,奥特曼也谈到了 GPT 系列与 o 系列模型品牌融合的问题。看起来,这个融合行动就将在今年发生!
AGI 需要 872 兆瓦的计算功率
除了与 o3-mini 相关的问题,奥特曼也解答了一个与 AGI 相关的提问。当然,他的答复已经不是第一次出现了:AGI 可以实现,并且需要 872 兆瓦的计算功率。作为参考,美国目前最大的核电站 Alvin W. Vogtle 发电站的装机容量为 4536 兆瓦,理想情况下也顶多仅能供养 5 个这样的 AGI。不过话也说回来,872 兆瓦这个数据着实精确得让人惊讶。
那我们目前实际上已经到哪一步了呢?根据 situational-awareness.ai 的估算,目前 AI 的功率应该差不多就在这个水平。
看起来,OpenAI 确实很有可能已经开发出了下一代模型,甚至有可能达到了 AGI 等级 —— 当然,这得取决于 OpenAI 对 AGI 的具体定义。事实上,已经有人根据所谓的内部消息在暗示这一点了。
对此,你有什么看法呢?
参考链接
https://x.com/sama/with_replies
https://en.wikipedia.org/wiki/List_of_largest_power_stations_in_the_United_States
https://situational-awareness.ai/racing-to-the-trillion-dollar-cluster/
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin.com
原标题:《确认了!o3-mini几周内发布,奥特曼表示AGI只需872兆瓦计算功率》
还没有评论,来说两句吧...