山西证券：未来Grok 3有望在复杂推理场景深度应用-财中社

山西证券：未来Grok 3有望在复杂推理场景深度应用

<{$news["createtime"]|date_format:"%Y-%m-%d %H:%M"}> 财中社邓芷晴 2.5w阅读 2025-02-21 09:27:32

2月21日，事件描述：...

2月21日，事件描述：

2月18日，Grok3（Beta版）正式发布，并面向X的PremiumPlus订阅用户率先开放，同时推出了每月30美元或每年300美元的SuperGrok单独订阅服务，订阅用户可解锁深度搜索等先进功能，而语音交互功能将在约一周后上线。

山西证券发表研究报告称：

Grok3和Grok3mini在多方面性能上均超过或媲美Gemini、DeepSeek和ChatGPT等对手。根据官方公布的测试数据，Grok3和Grok3mini在数学推理（AIME）、科学逻辑推理（GPQA）和代码写作（LCB）的基准测试上性能表现优于DeepSeekV3、GPT-4o、Gemini2Pro及Claude3.5Sonnet，其中，Grok3性能较DeepSeekV3提升了27%-43%。而在推理能力测试中，Grok3和Grok3mini推理模型的性能再次刷新了sota，其中，相较于DeepSeekR1，Grok3的性能表现提升了16%-22%。

得益于思维链推理能力的引入，Grok3在解决复杂任务方面的表现较为突出。Grok3在发布会的演示上完成了多个复杂任务，包括正确编码并实现飞船从地球发射、登陆火星、到在下一个发射窗口返回地球的3D动画，其中Grok3经过114秒的思考成功求解了开普勒定律，以及Grok3融合俄罗斯方块和宝石迷阵的规则成功创作出新游戏。可以预计，未来Grok3有望在医疗诊断、法律分析等复杂推理场景中得到深度应用。

Grok3总训练成本预计高达DeepSeekV3模型的数倍乃至数百倍。xAI公司为Grok3配备了拥有20万个上半年00GPU的Colossus超级计算机进行训练，Grok3累计训练时长达2亿GPU小时，根据vastai最新数据，上半年00租赁价格大约在1-3美元每GPU小时，因此估算Grok3的训练成本预计可达数亿美元，而DeepSeekV3论文中披露的模型正式训练阶段的成本仅557.6万美元。虽然Grok3的发布预示着预训练阶段的ScalingLaw仍在推动大模型的持续进步，但相较于DeepSeek，可以明显看出大模型在算法层面具备更大的进步空间。

重要提示：本文著作权归财中社所有。未经允许，任何单位或个人不得在任何公开传播平台上使用本文内容；经允许进行转载或引用时，请注明来源。联系请发邮件至editor@caizhongshe.cn。

历史搜索

热门搜索

山西证券：未来Grok 3有望在复杂推理场景深度应用

相关推荐

最新文章推荐