“我以为AI怎么也能猜对七成。”6月16日,在北京后厂村联想咖啡车活动现场,一位程序员在得知AI实际预测成绩后这样感慨。而他的想法,代表了现场绝大多数人的心声。
6月12日至16日,联想、咪咕、查股网在北京西二旗、郎园Station和联想集团全球总部三地开展“联想咖啡车城市巡游”活动。核心玩法是“世界杯预测人机大战”——12个国内主流大模型同台竞猜世界杯赛果,过往行人可随时参与“人机对战”,每轮比赛结束后准确率即时刷新。16场小组赛战罢,一份出人意料的成绩单出炉了。
AI排行榜:百度文心领跑,DeepSeek跌出前五
截至6月16日,12个AI模型的预测成绩单如下:
百度文心以15场命中7场的成绩暂列第一,成为唯一突破四成准确率的模型。联想天禧、中移九天、腾讯混元、MiniMax紧随其后,均命中6场。而备受关注的DeepSeek仅命中5场,排名第六。
码农集体“看走眼”:猜谁都行,就是没猜中它
现场随机采访暴露出一个有趣的现象:绝大多数受访者未能猜中当前排名第一的模型。
当被问及“截止到目前准确率最高的是哪个AI”时,受访者的猜测集中在DeepSeek、Kimi、千问等几个名字上。百度文心目前领先的战绩,让多数受访者感到惊讶。
准确率预期方面,偏差更为显著。 多数受访者估计AI整体预测准确率在60%至80%之间,部分人甚至给出90%的判断。工作人员告知目前实际准确率约为35%后,多位受访者明确表示——该数值低于自身预期。
人vs机器:老球迷的“经验”赢了算法
关于“人准还是AI准”的讨论,受访者观点不一。
有人认为:“老球迷的经验AI学不来。”
也有人表示:“AI能综合历史数据和球员状态。”
16场比赛结束,数据给出了答案:参与预测的人类整体准确率超过45%,略高于AI平均水平。
在足球这个充满爆冷、黑马和意外剧本的舞台上,普通人的直觉暂时跑赢了算法的精密计算。
最尴尬一幕:12个AI集体翻车
6月16日伊朗对阵新西兰的比赛,成为整场活动的“名场面”——12个AI模型均预测伊朗取胜,实际结果为2:2平局,12个AI无一命中。
全员一致的预测方向,与完全错误的结果形成讽刺性对比。这也暴露出AI在应对冷门赛果时的集体盲区:当训练数据来源和算法逻辑高度同质化,一个模型“想错”,其他模型也跟着“跑偏”。
截至发稿,该排行榜仍在随比赛进程持续更新。这场发生在“中国硅谷”后厂村的街头实验,用实打实的数据揭开了公众对人工智能的“滤镜”——技术当然在进步,但对AI的过度神化,或许才是当下更该警惕的“bug”。
下一轮,AI能翻盘吗?还是继续被人类“碾压”?答案就藏在绿茵场上。
查股声明:查股网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。