2026-03-22
加拉塔萨雷在近10次欧战主场对阵英格兰球队时表现出色,仅输1场,取得6胜4平1负的佳绩,展现强大战斗力。 ... [详细]
|
距离2026年美加墨世界杯开幕仅剩数小时(北京时间6月12日凌晨),全球球迷的狂欢即将拉开帷幕。而在赛场之外,一场由AI(人工智能)主导的赛事研判与实力比拼早已悄然展开,各大国产大模型纷纷入局,试图在这场体育盛宴中展现自己的技术实力。 6月8日,国产大模型Kimi宣布将利用Agent(智能体)集群技术,同时调度300个子Agent,对104场世界杯赛事进行公开预测,并大胆提出德国队或成黑马夺冠。为了吸引用户参与,Kimi还上线了一场“押注”活动:设立1万亿Token(词元)奖池,用户选择支持的球队,若球队获胜即可瓜分Token,将体育赛事与AI用户运营紧密结合。 据徽声在线记者了解,千问也紧随其后推出了类似活动。通过实测发现,豆包、元宝、DeepSeek、文心一言等国产大模型在回答“2026年世界杯谁会夺冠”时,多数给出了“西班牙队”的预测,且判断逻辑高度相似。 然而,热闹背后,Kelly Bench的最新数据却显示,包括GPT等在内的顶级模型在足球赌盘上的表现并不尽如人意,甚至可以用惨淡来形容。 既然AI在足球预测上并不占优势,Kimi、千问等AI大模型为何还要纷纷押注世界杯?这背后,实际上反映了AI大模型行业的集体焦虑:当写诗、做题、对话等“内卷”行为走到尽头,各家厂商急于证明自己能够理解复杂、动态、充满不确定性的现实世界。
面对世界杯的巨大流量,各大品牌早已摩拳擦掌,除了传统赞助商外,手握万亿Token的AI大模型也加入了这场“流量争夺战”。 6月8日,Kimi发文详细介绍了其预测策略:通过Agent集群同时调度300个子Agent,对104场世界杯赛事进行赛前预测和赛后复盘。 Kimi的预测策略并未完全随波逐流。虽然它承认西班牙队和法国队是夺冠热门,但也提出了一个被市场忽视的观点:德国队的夺冠概率可能被低估。
面对网友对“AI预测究竟准不准”“AI懂不懂球”的质疑,Kimi在文章开头就坦诚表示:“我们的预测很可能是错的”,并希望通过这次尝试,将分析过程、预测结果和赛后复盘放在同一个透明框架中,供用户参考。 此外,Kimi还拿出了1万亿Token奖池作为激励,用户预测冠军队、挑选的球队每次获胜即可参与瓜分Token。截至6月11日18时,Kimi App显示,实时排行的队伍支持率TOP5分别为阿根廷、法国、西班牙、巴西、葡萄牙,其中阿根廷以43.33%的支持率领先。
那么,Kimi押注世界杯并豪掷万亿Token,究竟是能力展示还是品牌营销? 长期关注世界杯等知名赛事的体育咨询专家、关键之道创始人张庆在接受徽声在线记者采访时表示,Kimi此次活动类似于春晚抢红包、集福瓜分奖金等互联网平台常用打法,更像是一种营销活动。 “每一届世界杯都是巨大的流量池,各个企业都希望有机会参与,获得更多曝光和引流机会。而大模型天然适合做这类数据分析和预测。”张庆指出,当下大模型竞争激烈,尤其是用户注意力和使用频次的竞争,通过世界杯可以加持品牌声量,同时也有利于提升大模型的数据用户积累和活跃度。 深耕人工智能产业多年的技术专家王岩(化名)在接受徽声在线记者采访时坦言,大模型预测世界杯冠军是体育热点、Token补贴和Agent展示叠加形成的传播事件。 王岩认为,热点借势只是入口,真正竞争点在于谁能把抽象模型能力转化为用户可感知的结果。这意味着,AI大模型企业在品牌传播上不再只发布参数、榜单和技术报告,而是转为借高关注赛事制造用户体验入口;在商业竞争上,各家模型争夺的则是用户心智、使用频次、社交传播和开发者注意力。 截至目前,多少用户参与了Kimi“押注”世界杯的活动?通过用Agent集群预测世界杯冠军,Kimi又将获得哪些方面的能力提升?Kimi(月之暗面)方面向徽声在线记者表示:“暂无回应”。 多款国产大模型预测西班牙队,是精准共识还是算法趋同? 不只Kimi,其他AI大模型玩家也试图“分一杯世界杯的羹”。例如,千问也推出了“决战美加墨,与千问一起预测,赢万元现金”的活动,加入这场AI“秀肌肉”争夺战。
“我前两天也用DeepSeek、豆包预测了2026年世界杯冠军,想对比它们谁分析得更有道理,但我看到它们给出的预测和相关理由都有明显局限性。”张庆向徽声在线记者分享道。 在国产大模型眼中,谁是“2026年世界杯冠军队伍”?徽声在线记者实测DeepSeek、Kimi、豆包、元宝、千问、文心一言、智谱清言发现:DeepSeek押宝法国队,Kimi看好阿根廷队,而千问、豆包、元宝、文心一言、智谱清言5款国产大模型则均预测支持西班牙队。 每款AI大模型给出的“夺冠队伍”理由分析略有不同。值得注意的是,投票西班牙队的AI大模型们,其判断逻辑高度趋同,核心理由之一均为“权威数据模型、机构高度一致看好”。 大模型的预测到底准不准?能否获得球迷的青睐? 上海财经大学特聘教授胡延平向徽声在线记者表示,AI大模型已经初步展露出基于全局动态信息和深度复杂推理的特定预测能力,使得各家大模型有基础、有信心来进行预测,但足球是圆的,预测的成功率、精准度方面还有待观察。 “世界杯预测无疑是展示模型与智能体水准的一个上佳机会窗口,不过预测的效果也是一把双刃剑。个人预期这届世界杯,水准最高的预测模型,成功率能达到60%~80%左右。”胡延平坦言。 不过,Kelly Bench在2023—2024赛季英格兰超级联赛的模拟中显示,其评估的每个前沿模型在整个赛季都亏损了,并且许多都经历了破产。其中,Claude Opus 4.7目前以-3.7%的平均投资回报率领先;有4个模型避免了所有的破产。
“AI更多是一个辅助工具,基于战队历史战绩、世界杯排名、赔率、国际足联等大量数据的多维度预测,AI大模型呈现了客观数据统计,所以作为参考工具还是有意义的,但不会完全依赖它的结果。”一位长期关注世界杯的资深球迷告诉徽声在线记者。 在上述球迷看来,相比大模型的预测,每个球迷都更青睐自己喜欢的球队,喜好也会占一大部分判断,而且越到决赛越是球员临场发挥和心理上的博弈,不确定性太多了。
当Kimi拿出万亿Token、调动300个子Agent对世界杯赛事进行并行预测,当千问、豆包、元宝争先恐后地给出各自的夺冠热门队伍时,这场看似娱乐化的“AI押注战”背后,AI大模型厂商究竟想“秀”什么?又在集体“卷”什么? “本轮大模型预测世界杯冠军,是生成式AI从问答工具走向公共事件运营的典型样本。”王岩向徽声在线记者指出,公众看到的是冠军预测,企业展示的则是Agent协同、长上下文处理、实时检索、概率解释和高并发服务能力,商业上争夺的则是用户时长、付费转化和资本叙事。
当下,AI大模型的竞争早已不局限于单纯的参数榜单,而是从“会聊天”转向“能办事”,从“比模型”转向“比场景”。然而,《Build for the Future 2025》全球研究显示,在调研全球1250多家企业后,仅5%的公司实现了AI价值的规模化应用。Gartner数据也显示,截至2025年底,嵌入真正AI Agent的企业应用占比不足5%。 胡延平观察到,大模型和智能体正从对话走向任务,从预训练走向持续学习,从数据语料走向持续多维的现实感知。“预测世界杯这类探索项目会加速这个进化过程。未来行动智能体所需要的能力体系,也是在走向‘感知-交互-决策-协同’这个方向。” 不过,王岩坦言,世界杯预测可以成为Agent能力的公开压力测试,但不能自动证明Agent能力提升,大模型在这场押注中训练和检验的是长任务组织、概率校准和用户交互能力。 “Kimi的300个Agent代表分析覆盖面增加,不直接代表预测准确率提升。相关Agent任务Token消耗研究显示,同一任务的Token消耗可相差几十倍,更多Token并不必然带来更高准确率。同样,相关Prediction Arena研究也显示,多个前沿模型在Kalshi真实预测市场57天交易测试中最终收益为-16.0%至-30.8%,研究量与结果没有相关性。”王岩向徽声在线记者进一步分析道。 正如王岩所言:“当前Agent的最大缺口,正在从‘能否给出合理计划’转向‘能否稳定完成长周期真实任务’。”这意味着,谁能率先落地“实战能力”,谁就将有机会在愈发激烈的争夺赛中脱颖而出。 |
理想汽车首发高德汽车出行AI Agent,引领智能出行新潮流
蔚来李斌:市场剧变下新车持续热销成挑战 技术迭代加速供需平衡难度升级 2026-03-22
加拉塔萨雷在近10次欧战主场对阵英格兰球队时表现出色,仅输1场,取得6胜4平1负的佳绩,展现强大战斗力。 ... [详细]
2026-03-25
巴塞罗那正考虑引进阿根廷新晋国脚中锋帕尼切利,作为莱万多夫斯基的理想接班人。帕尼切利技术全面,战术适应能力强,有望为巴萨带来新的进攻活力。 ... [详细]
2026-05-01
中足联体育发展(北京)有限责任公司发布会员平台建设前期调研服务采购公告,采用竞争性谈判方式遴选服务商,详见中国招标投标公共服务平台。 ... [详细]
2026-05-28
海明威在《太阳照常升起》里写过一段对话。迈克说,他破产的过程分两步:“先是渐渐垮掉,然后突然完了。”回头看这赛季英超,这句话出奇地贴切。你有没有注意到,英超已经变了?过去几 ... [详细]
2026-05-28
由于与莱切存在积分差距,在最后两轮比赛中,克雷莫纳必须争取尽可能多的积分以实现保级目标。这并非易事,因为这支灰红军团将面对乌迪内斯和科莫这样的两支强队。从理论上讲,克雷 ... [详细]
啥病人看了这个都得好啊! 副标题 这胸是真的! 副标题 你赢了! 副标题 我是关心这是在哪里
乞丐装的最新境界! 副标题 买家你确定你不是阿宝?? 副标题 这裤子不敢坐下啊! 副标题 颜值
这鼠标垫你看到了什么?邪恶了吧! 副标题 毫无违和感! 副标题 小卖部的这女孩真会选呀! 副
女人真的不容易,怀孕后,内脏被挤压的严重,挺着大肚子干啥都不方便!近日,刘嘉姵和闺蜜集体拍
锤哥的替身也是辣么的帅气! 副标题 锤哥的替身好多啊! 副标题 你杀了你的替身,你可就没替
黄河是我们的母亲河,它孕育了中国几千年的文明,而在古代黄河上有个著名的渡口叫做蒲津渡
我们的生活之中。无论是面对面还是线上交流,我们不仅会使用文字语言,还会配比适当的肢体
圣托里尼一个存在于旅行社还有各大旅游婚纱摄影店的招牌爱情圣地,海报做的真的很美,浅蓝