一文带你快速了解马斯克的Grok 3
2025年2月18日,埃隆·马斯克的xAI公司正式发布了其最新的人工智能旗舰模型——Grok 3。 马斯克在发布会上表示,Grok 3的能力比其前身Grok 2强大了一个数量级,展现出“非常聪明”的特性。
Grok 3是什么
“我们非常高兴地推出Grok 3,我们认为它的能力比Grok 2强大了一个数量级,”马斯克在发布更新中表示。Grok 3是xAI正在开发的最新版本的AI大语言模型(LLM),据报道,其计算能力比Grok 2提高了10倍。该AI在“科洛苏斯超级集群孟菲斯数据中心”中依靠超过20万个GPU进行了反复训练,这是一个显著的成就。
虽然Grok 3主要作为聊天机器人使用,能够理解和与用户进行自然语言互动,但其背后的团队对宇宙及其所包含的一切有着更深刻的理解。Grok 3包括多个模型,其中Grok 3 mini运行更快,但不充分利用其思维能力。高级模型具备“推理”能力,能够逻辑性地测试其响应并进行事实核查,类似于其他先进的AI模型。尽管xAI的Grok 3已经开始推出,但并未向所有用户全面开放所有功能。
谁可以使用Grok 3
与之前版本的Grok 3模型一样,该AI目前仅对X Premium Plus订阅用户开放。未来可能会向其他用户推出访问权限,但目前要访问其高级功能并了解其在AI竞争中的表现,您需要订阅。此外,还有一个SuperGrok计划,需要订阅才能访问更多推理能力和无限图像生成。
该AI预计将在未来几周内推出语音模式,Grok 3模型也将通过xAI的企业API提供访问。一旦Grok 3完全稳定并全面推出,Grok 2将成为开源,以便那些希望深入研究其结构和能力的人进行探索。
(Grok 3 在直播中展示的基准测试性能)
Grok 3有多强大
根据xAI Grok 3的直播更新,该团队开发的LLM在许多竞争对手中表现出色。Grok 3在一般数学推理、科学常识以及编码方面的基准测试显示,Grok 3和Grok 3 mini均优于其他一些知名AI模型。Grok 3的早期版本在聊天机器人竞技场中也表现不俗,用户可以盲目反应不同AI的响应,以选择他们偏好的回答。
Grok 3的基准测试显示,未来几周还有进一步扩展模型的空间。在展示中,马斯克解释说,该模型“每天都在改进”,团队似乎正在积极工作以进一步完善和测试该模型。
Grok 3的特点
Grok 3与其他聊天机器人一样,能够回复用户查询,但自推出以来,该工具以其独特的风格而闻名。该AI不会像其他模型那样自我审查,马斯克为确保AI的幽默感而感到自豪。更严肃地说,xAI的Grok 3具备先进的“思考”和“推理”能力,使AI能够推理自己的响应并提供更全面的答案。部分思考过程被模糊化,以防止被其他竞争对手复制。Grok足够聪明,能够编写游戏或结合现有游戏,以展示其推理能力的进步。
这些思考和推理能力并非AI所独有,其他先进的AI模型也已经展示了这样的能力,但xAI在如此短的时间内将Grok 3提升到这一水平仍然令人印象深刻。
DeepSearch:下一代搜索引擎
除了Grok 3,xAI还推出了 DeepSearch,这是一种被称为“下一代搜索引擎”的新工具。DeepSearch被描述为Grok 3代理的第一代,允许用户提问并获得答案。与传统的搜索引擎不同,DeepSearch展示了Grok 3的思考过程,从问题思考到研究,再到最终答案的生成。
在演示中,DeepSearch花费了大约一分钟的时间,引用了15条X帖子和32个网页作为参考。例如,在询问有关“疯狂三月”的问题时,Grok 3提到需要查看球队排名、常规赛表现、伤病情况以及历史表现数据。这种推理能力与中国DeepSeek的做法相似,后者在其平台中也展示了回答查询时的推理过程。
DeepSearch的另一个功能是查看Grok 3的推理过程。用户可以清晰地看到AI是如何得出结论的,这为搜索体验增加了透明度和深度。这种创新不仅提升了用户体验,也为AI搜索工具的发展树立了新的标杆。
Grok 3的发布标志着xAI在人工智能领域的进一步发展,展现了其在技术创新和市场竞争中的潜力。随着Grok 3的逐步推出,用户对其能力的期待也在不断增加。未来,Grok 3将如何在激烈的市场竞争中立足,值得我们持续关注。