商报讯(记者 吕文鹃)北京时间2月18日,xAI创始人埃隆·马斯克在X平台开启视频直播,发布旗下人工智能模型Grok的第三代版本Grok 3。此前,马斯克称这款Grok 3为“地球上最聪明的AI”。当天中午的发布会正式开始前,xAI直播间的观看人数已经超过100万人,新版本模型的热度可见一斑。
在发布会上,马斯克表示,“Grok 3具有极强推理能力,在我们迄今为止所做的测试中,其表现优于我们所知的任何已发布产品。”马斯克还表示:我们有信心Grok 3会比其他任何AI都强,将成为AI领域真正的颠覆者。
据悉,作为Grok 2的升级版,Grok 3最大的亮点在于其引入了“思维链”(Chain Of Thought)推理机制。这一机制允许Grok 3像人类一样分步骤解决复杂问题,显著提高了模型处理复杂查询和提供更连贯、更有逻辑响应的能力。马斯克还表示,这种推理机制使得Grok 3在逻辑推理测试中的表现远超ChatGPT-5和谷歌的Gemini Ultra,能够构思出新颖的想法和解决方案。
在直播中,马斯克和他的同事现场给Grok 3发布指令,让Grok 3解决一道物理题,并创作一款融合《宝石迷阵》和《俄罗斯方块》的游戏,Grok 3在数分钟的思考后给出来看起来不错的答案。
xAI公司表示,Grok 3 的推理模型处于测试版,仍在训练中。据介绍,Grok 3 还引入了 DeepSearch,xAI 将其描述为一种新型搜索引擎,也是类似智能体能力的早期版本。不过马斯克表示,语音模式仍有点不稳定,大概一周后可能推出。此外,马斯克称将在xAI推出一个人工智能游戏工作室。
马斯克及其团队表示,Grok 3也将具有类似DeepSeek R1和OpenAI o3 Mini的推理能力。虽然Grok起步较晚,但在MMLU得分上以超快的速度追上了ChatGPT。X平台Premium+会员将率先体验Grok 3。
除了Grok 3这一边的动态,昨日,OpenAI首席执行官兼联合创始人奥特曼突然表示,“对于高要求的测试者来说,试用GPT-4.5带来的感受AGI的体验,远比我预期的要深刻得多!”此番言论立刻引起关注,有人猜测,GPT-4.5的正式发布可能也不远了,而选在Grok 3发布日发表此言论则被视为是在公开对标Grok 3。