
AI初創(chuàng)企業(yè)Anthropic的CEO稱(chēng)百億美元量級(jí)AI(人工智能)模型的訓(xùn)練可能在明年開(kāi)始。
近日,Anthropic的CEO兼總裁達(dá)里奧·阿莫代(Dario Amodei)在播客節(jié)目In Good Company中表示,目前公司正在開(kāi)發(fā)的AI模型訓(xùn)練成本高達(dá)10億美元,他預(yù)計(jì),AI模型的訓(xùn)練成本將在2027年之前提升到100億美元,甚至是1000億美元。
被視為OpenAI頭號(hào)競(jìng)爭(zhēng)對(duì)手的Anthropic由一群OpenAI前員工創(chuàng)立。阿莫代在OpenAI工作了五年,在離開(kāi)時(shí),他已經(jīng)做到了OpenAI副總裁的位置。Anthropic旗下最知名的模型是在2023年3月發(fā)布的Claude模型,今年3月,Claude 3系列正式發(fā)布。
在采訪中,阿莫代談到了自己對(duì)于AGI(通用人工智能)的看法,稱(chēng)自己不認(rèn)為AGI會(huì)在某一個(gè)時(shí)間點(diǎn)突然出現(xiàn),而是會(huì)以循序漸進(jìn)的方式逐漸現(xiàn)身:“我認(rèn)為,這就像一個(gè)能夠?qū)W習(xí)和成長(zhǎng)的人類(lèi)孩子一樣,他們會(huì)變得越來(lái)越好、越來(lái)越聰明,知識(shí)越來(lái)越豐富。”
為了讓模型越變?cè)胶茫托枰絹?lái)越多的資金投入。據(jù)報(bào)道,GPT-4o的訓(xùn)練“僅”花費(fèi)了不到1億美元,谷歌Gemini Ultra模型的訓(xùn)練成本則為1.91億美元。阿莫代預(yù)計(jì),100億美元量級(jí)模型的訓(xùn)練可能會(huì)在2025年的某個(gè)時(shí)候開(kāi)始,一個(gè)充滿(mǎn)活力的下游生態(tài)系統(tǒng)也會(huì)隨之出現(xiàn)。目前,公司已經(jīng)籌集了超過(guò)80億美元的資金。
阿莫代指出,模型推出的速度和模型的成本與質(zhì)量之間存在一定關(guān)系,可以把它想象成一條“權(quán)衡曲線”。公司正在努力推動(dòng)這條曲線“向外移動(dòng)”,以同時(shí)實(shí)現(xiàn)模型的快速推出、高質(zhì)量和低成本:“曲線在變化,我們可以用更少的資源做更多的事情,也可以用更多的資源做更多的事情。我認(rèn)為這兩種趨勢(shì)是共同存在的。”
當(dāng)主持人問(wèn)到“誰(shuí)會(huì)在AI上賺最多的錢(qián)”時(shí),阿莫代認(rèn)為,盡管有先后順序,所有人都會(huì)分得一杯羹:“蛋糕會(huì)變得很大。就像現(xiàn)在,芯片公司肯定賺得最多,我認(rèn)為這是因?yàn)槟P偷挠?xùn)練先于模型的部署,而模型的部署先于其收入。所以我認(rèn)為,芯片公司的估值是一個(gè)先行指標(biāo),AI公司的估值可能是一個(gè)當(dāng)前指標(biāo),而下游很多東西的估值是滯后指標(biāo),但這股浪潮將影響到每個(gè)人。”
隨后,阿莫代也談到了AI芯片龍頭英偉達(dá)。面對(duì)越來(lái)越激烈的競(jìng)爭(zhēng),英偉達(dá)將產(chǎn)品發(fā)布間隔從隔一年發(fā)布大幅縮短至每年發(fā)布一次,今年市值已漲到三萬(wàn)億美元以上。阿莫代指出,為了構(gòu)建AI集群,包括Anthropic在內(nèi)的AI企業(yè)正在為英偉達(dá)的芯片支付大筆金額;雖然尚未看到AI產(chǎn)生的大量收入、依然存在泡沫破滅的可能,但Anthropic選擇繼續(xù)押注看漲。
目前,以GPU為主的硬件需求仍是決定AI訓(xùn)練成本的一大因素。今年6月,紅杉資本分析師David Cahn表示,AI行業(yè)每年需要為數(shù)據(jù)中心等基礎(chǔ)設(shè)施支付6000億美元的費(fèi)用。在過(guò)去的采訪中,阿莫代曾提到,有足夠資金來(lái)訓(xùn)練專(zhuān)業(yè)等級(jí)AI模型的公司依然不多。
今年6月,Anthropic發(fā)布了旗下性能最強(qiáng)的AI模型Claude 3.5 Sonnet,稱(chēng)其為“迄今為止最智能的模型”。據(jù)介紹,在覆蓋閱讀、編程、數(shù)學(xué)和視覺(jué)等領(lǐng)域的多項(xiàng)性能測(cè)試中,Claude 3.5 Sonnet的性能基本全面超越了包括GPT-4o在內(nèi)的一眾知名AI模型,僅在MMLU(大規(guī)模多任務(wù)語(yǔ)言理解)和MATH(數(shù)理)數(shù)據(jù)集上略遜于GPT-4o,且優(yōu)于自家此前最強(qiáng)的模型Claude 3 Opus。