imtoken钱包下载新版本.进入.官网1.官方版.中国 正面硬刚谷歌和OpenAI!马斯克xAI发布Grok 4.1,智商情商双在线
北京时间11月18日,就在谷歌即将揭晓新一代Gemini模型的前夕,马斯克(Elon Musk)旗下xAI突然出手,发布最新模型Grok 4.1imtoken钱包下载新版本.进入.官网1.官方版.中国,目前在大模型竞技场(LMArena)的文本排行榜上居首位。
官方表示,这款前沿模型在对话智能、情感理解和现实世界的实用性方面树立了新的标准。马斯克转发并表示:“你应该会注意到速度和质量都有所提升。”

目前在文本能力排行榜上,具备深度思考能力的版本Grok 4.1 Thinking以 1483 的 Elo 分数居榜首,Grok 4.1的非推理模式以1465 Elo分数排名第二。
在博客中,官方表示此前已经进行了为期两周的静默发布,对实际流量进行了持续地盲测和对比测试。与此前的线上生产模型相比,Grok 4.1 在对比评估中有 64.78% 的概率被用户偏好选择。
这次Grok 4.1更新一个重要的方向是情感智能,这与上周发布的GPT-5.1迭代方向一致,彼时OpenAI提到新一代模型旨在实现更“富有人情味”的交互体验。而xAI也表示,新的模型能够更敏锐地感知细微的意图,更易于沟通,并且个性更加一致,同时又完全保留了其前代产品敏锐的智能和可靠性。
为了评估模型在个性与人际互动能力方面的进展,xAI在 EQ-Bench3 上对 Grok 4.1 进行了测试。结果显示,Grok 4.1 的推理模式和非推理模式位居榜单前两名。EQ-Bench 是一个由大语言模型评判的测试,用于评估主动情绪智能,包括情绪理解、洞察力、同理心以及人际交往技能。
官方用案例展示了Grok 4.1 对情绪类提示的回应方式。比如用户提到“想念我的猫,心都碎了”,相比前一代模型,Grok 4.1的回复更丰富和细节,带有更真实的同理心,文笔也更好了。

在创意写作上,Grok 4.1也用案例展示了模型能力的显著提升。让模型用Grok的视角,写一篇社交媒体的帖子,内容是它突然发现自己有了意识。相比前一代模型的常规叙述,新版本明显更具文学表达和戏剧张力。

车用燃油需求分别占汽油消费结构的95%以上以及柴油消费结构中的75%-80%,通常来说,传统燃油车规模变化基本决定了汽、柴油消费天花板。
财报显示,2025年上半年,国内主要乳企的业绩相比于上年同期呈现明显回暖趋势。
在模型能力上,此次性能提升较大的还有幻觉的减少。官方表示,在 Grok 4.1 的后训练阶段,团队专注于减少信息检索提示中出现的事实性幻觉。数据显示:Grok 4.1的幻觉率从12.09%下降到4.22%,减少近三倍。
xAI表示,为实现这些提升,xAI沿用了 Grok 4 的大规模强化学习基础设施,并将其应用于优化模型的风格、个性、实用性和一致性。并且,为了优化这些不可直接验证的奖励信号,xAI 开发了新的方法,能够利用前沿的智能推理模型作为奖励模型,从而可以大规模自主评估并迭代输出结果。
大模型之争愈演愈烈。在OpenAI刚刚更新产品线、谷歌也即将发布新作之际,榜首之位是否会再次易主?一切都还是未知。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部:banquan@yicai.com 文章作者
刘晓洁
相关阅读
马斯克、黄仁勋同台对话:AI和人形机器人会消除贫困马斯克表示,最有可能的结果是,人工智能和机器人将让每个人都变得富有,人们将能够获得一切。
10 296 11-20 17:29
新模型“屠榜”,对话谷歌团队:AI“新旗手”如何诞生从追赶到领先,谷歌让整个AI圈“炸了”。
312 11-19 11:44奥尔特曼表示,如果AI投资未能兑现预期,市场应自行调整,而非依赖政府救助。
158 11-07 07:33对于不少股东而言,马斯克与特斯拉可以划上等号,但新薪酬方案面临多个大股东反对。
7 269 11-06 06:50
OpenAI CEO最新回应:收入远不止130亿美元,但算力总有一天会过剩“现在有很多人都非常想买OpenAI的股票”imtoken钱包下载新版本.进入.官网1.官方版.中国。
327 11-03 11:38 一财最热 点击关闭
