看了幾場世界杯淘汰賽,我對大模型競爭的認識加深了
今天凌晨1點多,當英格蘭隊到了下半場60多分鐘還落后于剛果(金)時,我們世界杯看球群的朋友已經(jīng)開始嚴肅討論“圖赫爾是否該下課”,以及“英國足球流氓會怎么鬧事”的問題了。然后,凱恩天神下凡,攻入一球。我們又開始討論“能不能90分鐘結束戰(zhàn)斗,別打加時賽了”。懂球的朋友表示,可能性不大,剛果(金)的防線扎得很牢固、防守意志堅決,看樣子還是得120分鐘決勝負。
然后,凱恩又天神下凡了,英格蘭涉險過關。巧在兩次都是剛換上場的戈登助攻。圖赫爾一下子從下課邊緣到了封神邊緣,相當于從跌停板被驟然拉到漲停板。不過,公允的說,決定比賽的因素很簡單:巨星的個人能力。
前天姆巴佩的雙響,以及哈蘭德的進球,道理是一樣的。嚴格地說,巴西VS日本那場比賽,維尼修斯起到了類似作用:雖然他沒有進球,但每次沖進日本隊防守三區(qū)都會引發(fā)一陣混亂,充分顯示了個人能力的碾壓。日本沒有巨星,第一檔次的球星都很少,哪怕守進了加時賽,勝率也是渺茫的——這一點應承認。
這是世界杯淘汰賽,一場定勝負,90-120分鐘結束之后,一個繼續(xù)前進、一個打道回府。這種場合只有團隊精神是不夠的,必須有超級巨星的靈光一閃。我想起了《點球成金》(Moneyball),男主角依靠數(shù)據(jù)分析在常規(guī)賽高歌猛進,到了季后賽卻始終拿不下最終的錦標,電影本身給出了解答:
最優(yōu)秀的球員都有溢價,依靠數(shù)據(jù)分析去淘性價比高的球員,意味著你的每個位置都不是最頂尖的。優(yōu)秀與頂尖之間,是一道鴻溝。
在淘汰賽中,你必須有能力戰(zhàn)勝任何對手,關鍵時刻一定需要球星“硬解”。這種“硬解”能力很昂貴,沒有任何高性價比的替代品。
我很喜歡《最后之舞》(The Last Dance)這部紀錄片,其中整整一集都用來描述1998年NBA總決賽的第六場——喬丹封神之戰(zhàn)。皮蓬一開場就受傷了,主場作戰(zhàn)的爵士士氣高昂,喬丹下半場體力不支,好幾個投射都投短了,只能依靠突破和罰球得分。最后時刻,喬丹在自己投丟過好幾次的區(qū)域拔地而起,最后一投,拿下了第六個總冠軍。
爵士輸了。講道理嗎?不講。所以喬丹值3000萬美元年薪,所有人得圍繞他建隊。其實馬龍和斯托克頓是很偉大的球員,可惜凡人和籃球之神之間確實是有差距的,不講道理的硬解能力就是最大的差距。
說了這么多競技體育,跟大模型有什么關系?關系可大了。最近幾天,我在朋友圈看到了好幾篇討伐Anthropic的文章,甚至直斥其為“邪惡勢力”。天下苦Anthropic久矣:定價太高,客服很差,對某些國家的用戶很不友好,新出的模型還不讓人用,等等。你用Claude的頻率越高,就越是容易對它的開發(fā)商一肚子火,十分期待有人能取而代之。
DeepSeek V4, Kimi K2.5, GLM 5.2...誕生之時均被AI開發(fā)者社區(qū)追捧為“Claude殺手”。這除了說明它們有一定實力,還說明Anthropic何等不得人心。哪怕是提價之后的DeepSeek,API價格也只有Claude的一個零頭。至于我,一個普通的Claude Pro用戶,最痛苦的就是模型額度用的太快,哪怕你不編程、只做文本分析,也跟沙漠里的降雨一樣,稍微看到個影子就沒了。
要不是Claude實在太強大,我懷疑世界上不會有任何人用它。這是句真話,也是句廢話,我們還可以這樣改寫:
要不是凱恩太強大,不會有人花1億歐元在他29歲時買他;
要不是姆巴佩太強大,不會到哪個球隊都混成“總監(jiān)”,主宰更衣室運作;
要不是梅西太強大,2022年哪里輪得到阿根廷奪冠?
要不是哈蘭德太強大,挪威在世界杯淘汰賽贏球恐怕是癡人說夢。
我是GPT的重度用戶,有27個月不間斷的付費歷史;就連我也從2個月前開始叛逃到Claude(盡管還保留了GPT Plus)。因為有些任務就是只有Claude能完成,準確的說,只有Claude Opus 4.7/4.8(再加上剛剛恢復使用的Fable 5)能完成。GPT就是差那么一點點意思,至于其他模型,我不想說。
除了大家公認的編程和Agent能力之外,對于復雜的長文本,例如小說、劇本、哲學著作、非虛構作品的語義分析,Claude給我的答案也是最好的。從前有一陣子,GPT是最好的(尤其是GPT 4o時代),但是最近半年越來越不好,不是說它退步了,而是它趕不上Claude的進步速度。有一些言外之意只有Claude Opus看得出來。我還想指出一點:Opus對于“互文”,即文本之間的互相引用、化用、戲仿,看得非常準,已經(jīng)接近相關文科專業(yè)博士生的水平,而且它看到這些事情只需要幾秒鐘而非幾天。

更便宜的模型能用嗎?能。
更便宜的模型有用嗎?有。
更便宜的模型方便嗎?方便,至少不會像Anthropic這個神經(jīng)病舉著大棒看誰都不順眼。
更便宜的模型能完成任務嗎?嗯,這個問題就復雜了,得看是什么任務……
萊萬走后,舒波莫廷一度在拜仁大殺四方,為什么拜仁還要買凱恩?是舒波莫廷沒有用嗎?還是舒波莫廷不夠便宜、性價比不夠?
阿森納花1億英鎊買了賴斯,是這個世界上沒有高性價比的后腰了嗎?這個夏天,好像所有英超豪門都在以1億英鎊爭奪安德森,是腦子都進水了嗎?價值3000-5000萬英鎊的后腰不好用嗎?
還有在拜仁剛打了兩個賽季好球的奧利塞,怎么皇馬突然就2億歐元求購了?如果拜仁愿意賣,相信愿意以類似價格買入的絕不止皇馬。
答案從來不在數(shù)據(jù)分析表上,而在球場上。今天凌晨凱恩的兩個進球,昨天奧利塞的兩次助攻,還有賴斯和安德森能上能下、跑滿整個球場的表現(xiàn),證明他們就是關鍵時刻具備硬解能力的球星。別忘了本屆歐冠,賴斯對陣皇馬竟然單場攻入兩粒任意球,這種不講道理的硬解能力值不值1億英鎊?
所以Anthropic就算再邪惡、再傲嬌,大家捏著鼻子也得受著。今天早上Claude Fable 5剛恢復使用,我馬上就狠狠消耗了一波模型額度。除非GPT-5.6全面發(fā)布并且水平大幅提升,否則我覺得今年之內(nèi),我最重要的生產(chǎn)力+生活輔助雙料工具仍然是Claude. 因為我不養(yǎng)龍蝦、沒有多少日常Agentic Worflow任務,所以更便宜的大模型API對我用處不大,還是得忍痛給Anthropic送錢。
附帶說一句,在對Gemini失去信任一個多月后,我再次成為了Google AI的付費用戶,唯一原因是Nano Banana Pro的生圖能力。我對比了GPT Image-2和Nano Banana Pro,認為前者在很多方面都很強大,但比后者還是差一點點。我希望生成國風或日漫二次元風格的人設和場景圖片,不知道為什么,GPT在這方面比較拙劣。幾乎所有專業(yè)AI漫劇公司的主力生圖模型都是Nano Banana Pro,不是因為其他模型沒有用,而是因為都不能穩(wěn)定的達到最高要求。
現(xiàn)在最尷尬的反而是OpenAI. 據(jù)說Sam Altman決定推遲IPO的原因,是難以保證獲得1萬億美元以上的估值。那么問題來了,Anthropic上一輪融資的估值已經(jīng)是9620億美元,離1萬億只有一步之遙;為何早在今年年初就達到8600億美元估值的OpenAI,不能更進一步呢?
因為GPT不再是“最優(yōu)秀的模型”,只是“優(yōu)秀的模型之一”。在文本任務和Coding方面比Claude略遜一籌,在多模態(tài)方面顯然打不過Gemini(以及Seedance)。這就好比一個球員的定位不是“超級巨星”,不具備無條件硬解能力,只是“合格的一流球員”——實際能力可能只有5-10%的差距,但這就是天與地的區(qū)別。
因為最強的模型具備定價權,整個市場的大部分利潤將注定被它吃掉。競爭對手可以走性價比路線,但是嚴格地說,這種路線不會對“最強的模型”形成競爭,就像球隊里的輪換球員不會對超級巨星形成競爭。要拿到超級巨星的薪酬,只有一條路:在實力上達到超級巨星的水平,也就是具備硬解能力。
好像所有人都不喜歡姆總,但是姆總到了世界杯就是能進球,而奧利塞就是能給他喂球,所以這兩人就高居巨星身價榜的前列。等到有一天,姆總不能進球了,或者進球也改變不了命運了,那不用任何人罵他,他自己會從神壇下來的。在皇馬其實有點這個意思,不過還早。
底線是:就算姆總走下神壇了,替換他的肯定是另一個1億乃至2億歐元身價的超級前鋒,而不會是好幾個3000萬身價的前鋒之和。皇馬用何塞盧、拜仁用舒波莫廷都是權宜之計,否則球迷會造反,球隊也不可能維持最高水平的競爭力。