看了幾場世界杯淘汰賽，我對大模型競爭的認識加深了

互聯(lián)網(wǎng)怪盜團丶 2026-07-02 16:56:28

今天凌晨1點多，當英格蘭隊到了下半場60多分鐘還落后于剛果（金）時，我們世界杯看球群的朋友已經(jīng)開始嚴肅討論“圖赫爾是否該下課”，以及“英國足球流氓會怎么鬧事”的問題了。然后，凱恩天神下凡，攻入一球。我們又開始討論“能不能90分鐘結束戰(zhàn)斗，別打加時賽了”。懂球的朋友表示，可能性不大，剛果（金）的防線扎得很牢固、防守意志堅決，看樣子還是得120分鐘決勝負。

然后，凱恩又天神下凡了，英格蘭涉險過關。巧在兩次都是剛換上場的戈登助攻。圖赫爾一下子從下課邊緣到了封神邊緣，相當于從跌停板被驟然拉到漲停板。不過，公允的說，決定比賽的因素很簡單：巨星的個人能力。

前天姆巴佩的雙響，以及哈蘭德的進球，道理是一樣的。嚴格地說，巴西VS日本那場比賽，維尼修斯起到了類似作用：雖然他沒有進球，但每次沖進日本隊防守三區(qū)都會引發(fā)一陣混亂，充分顯示了個人能力的碾壓。日本沒有巨星，第一檔次的球星都很少，哪怕守進了加時賽，勝率也是渺茫的——這一點應承認。

這是世界杯淘汰賽，一場定勝負，90-120分鐘結束之后，一個繼續(xù)前進、一個打道回府。這種場合只有團隊精神是不夠的，必須有超級巨星的靈光一閃。我想起了《點球成金》(Moneyball)，男主角依靠數(shù)據(jù)分析在常規(guī)賽高歌猛進，到了季后賽卻始終拿不下最終的錦標，電影本身給出了解答：

最優(yōu)秀的球員都有溢價，依靠數(shù)據(jù)分析去淘性價比高的球員，意味著你的每個位置都不是最頂尖的。優(yōu)秀與頂尖之間，是一道鴻溝。
在淘汰賽中，你必須有能力戰(zhàn)勝任何對手，關鍵時刻一定需要球星“硬解”。這種“硬解”能力很昂貴，沒有任何高性價比的替代品。

我很喜歡《最后之舞》(The Last Dance)這部紀錄片，其中整整一集都用來描述1998年NBA總決賽的第六場——喬丹封神之戰(zhàn)。皮蓬一開場就受傷了，主場作戰(zhàn)的爵士士氣高昂，喬丹下半場體力不支，好幾個投射都投短了，只能依靠突破和罰球得分。最后時刻，喬丹在自己投丟過好幾次的區(qū)域拔地而起，最后一投，拿下了第六個總冠軍。

爵士輸了。講道理嗎？不講。所以喬丹值3000萬美元年薪，所有人得圍繞他建隊。其實馬龍和斯托克頓是很偉大的球員，可惜凡人和籃球之神之間確實是有差距的，不講道理的硬解能力就是最大的差距。

說了這么多競技體育，跟大模型有什么關系？關系可大了。最近幾天，我在朋友圈看到了好幾篇討伐Anthropic的文章，甚至直斥其為“邪惡勢力”。天下苦Anthropic久矣：定價太高，客服很差，對某些國家的用戶很不友好，新出的模型還不讓人用，等等。你用Claude的頻率越高，就越是容易對它的開發(fā)商一肚子火，十分期待有人能取而代之。

DeepSeek V4, Kimi K2.5, GLM 5.2...誕生之時均被AI開發(fā)者社區(qū)追捧為“Claude殺手”。這除了說明它們有一定實力，還說明Anthropic何等不得人心。哪怕是提價之后的DeepSeek，API價格也只有Claude的一個零頭。至于我，一個普通的Claude Pro用戶，最痛苦的就是模型額度用的太快，哪怕你不編程、只做文本分析，也跟沙漠里的降雨一樣，稍微看到個影子就沒了。

要不是Claude實在太強大，我懷疑世界上不會有任何人用它。這是句真話，也是句廢話，我們還可以這樣改寫：

要不是凱恩太強大，不會有人花1億歐元在他29歲時買他；
要不是姆巴佩太強大，不會到哪個球隊都混成“總監(jiān)”，主宰更衣室運作；
要不是梅西太強大，2022年哪里輪得到阿根廷奪冠？
要不是哈蘭德太強大，挪威在世界杯淘汰賽贏球恐怕是癡人說夢。

我是GPT的重度用戶，有27個月不間斷的付費歷史；就連我也從2個月前開始叛逃到Claude（盡管還保留了GPT Plus）。因為有些任務就是只有Claude能完成，準確的說，只有Claude Opus 4.7/4.8（再加上剛剛恢復使用的Fable 5）能完成。GPT就是差那么一點點意思，至于其他模型，我不想說。

除了大家公認的編程和Agent能力之外，對于復雜的長文本，例如小說、劇本、哲學著作、非虛構作品的語義分析，Claude給我的答案也是最好的。從前有一陣子，GPT是最好的（尤其是GPT 4o時代），但是最近半年越來越不好，不是說它退步了，而是它趕不上Claude的進步速度。有一些言外之意只有Claude Opus看得出來。我還想指出一點：Opus對于“互文”，即文本之間的互相引用、化用、戲仿，看得非常準，已經(jīng)接近相關文科專業(yè)博士生的水平，而且它看到這些事情只需要幾秒鐘而非幾天。

更便宜的模型能用嗎？能。

更便宜的模型有用嗎？有。

更便宜的模型方便嗎？方便，至少不會像Anthropic這個神經(jīng)病舉著大棒看誰都不順眼。

更便宜的模型能完成任務嗎？嗯，這個問題就復雜了，得看是什么任務……

萊萬走后，舒波莫廷一度在拜仁大殺四方，為什么拜仁還要買凱恩？是舒波莫廷沒有用嗎？還是舒波莫廷不夠便宜、性價比不夠？

阿森納花1億英鎊買了賴斯，是這個世界上沒有高性價比的后腰了嗎？這個夏天，好像所有英超豪門都在以1億英鎊爭奪安德森，是腦子都進水了嗎？價值3000-5000萬英鎊的后腰不好用嗎？

還有在拜仁剛打了兩個賽季好球的奧利塞，怎么皇馬突然就2億歐元求購了？如果拜仁愿意賣，相信愿意以類似價格買入的絕不止皇馬。

答案從來不在數(shù)據(jù)分析表上，而在球場上。今天凌晨凱恩的兩個進球，昨天奧利塞的兩次助攻，還有賴斯和安德森能上能下、跑滿整個球場的表現(xiàn)，證明他們就是關鍵時刻具備硬解能力的球星。別忘了本屆歐冠，賴斯對陣皇馬竟然單場攻入兩粒任意球，這種不講道理的硬解能力值不值1億英鎊？

所以Anthropic就算再邪惡、再傲嬌，大家捏著鼻子也得受著。今天早上Claude Fable 5剛恢復使用，我馬上就狠狠消耗了一波模型額度。除非GPT-5.6全面發(fā)布并且水平大幅提升，否則我覺得今年之內(nèi)，我最重要的生產(chǎn)力+生活輔助雙料工具仍然是Claude. 因為我不養(yǎng)龍蝦、沒有多少日常Agentic Worflow任務，所以更便宜的大模型API對我用處不大，還是得忍痛給Anthropic送錢。

附帶說一句，在對Gemini失去信任一個多月后，我再次成為了Google AI的付費用戶，唯一原因是Nano Banana Pro的生圖能力。我對比了GPT Image-2和Nano Banana Pro，認為前者在很多方面都很強大，但比后者還是差一點點。我希望生成國風或日漫二次元風格的人設和場景圖片，不知道為什么，GPT在這方面比較拙劣。幾乎所有專業(yè)AI漫劇公司的主力生圖模型都是Nano Banana Pro，不是因為其他模型沒有用，而是因為都不能穩(wěn)定的達到最高要求。

現(xiàn)在最尷尬的反而是OpenAI. 據(jù)說Sam Altman決定推遲IPO的原因，是難以保證獲得1萬億美元以上的估值。那么問題來了，Anthropic上一輪融資的估值已經(jīng)是9620億美元，離1萬億只有一步之遙；為何早在今年年初就達到8600億美元估值的OpenAI，不能更進一步呢？

因為GPT不再是“最優(yōu)秀的模型”，只是“優(yōu)秀的模型之一”。在文本任務和Coding方面比Claude略遜一籌，在多模態(tài)方面顯然打不過Gemini（以及Seedance）。這就好比一個球員的定位不是“超級巨星”，不具備無條件硬解能力，只是“合格的一流球員”——實際能力可能只有5-10%的差距，但這就是天與地的區(qū)別。

因為最強的模型具備定價權，整個市場的大部分利潤將注定被它吃掉。競爭對手可以走性價比路線，但是嚴格地說，這種路線不會對“最強的模型”形成競爭，就像球隊里的輪換球員不會對超級巨星形成競爭。要拿到超級巨星的薪酬，只有一條路：在實力上達到超級巨星的水平，也就是具備硬解能力。

好像所有人都不喜歡姆總，但是姆總到了世界杯就是能進球，而奧利塞就是能給他喂球，所以這兩人就高居巨星身價榜的前列。等到有一天，姆總不能進球了，或者進球也改變不了命運了，那不用任何人罵他，他自己會從神壇下來的。在皇馬其實有點這個意思，不過還早。

底線是：就算姆總走下神壇了，替換他的肯定是另一個1億乃至2億歐元身價的超級前鋒，而不會是好幾個3000萬身價的前鋒之和。皇馬用何塞盧、拜仁用舒波莫廷都是權宜之計，否則球迷會造反，球隊也不可能維持最高水平的競爭力。

西甲拜仁喬丹英超大模型皇家馬德里世界杯小組賽托馬斯·圖赫爾

上一篇：波黑將帥回應美國前國門嘲諷：不在乎對手怎么評論，他們總會道歉

下一篇：不到一年5次換帥，歐洲冠軍主帥無緣曼聯(lián)米蘭，將加入英超保級隊

看了幾場世界杯淘汰賽，我對大模型競爭的認識加深了

看了幾場世界杯淘汰賽，我對大模型競爭的認識加深了