中新經緯4月25日電 (常濤 鄧芷若)如何判斷一個新事物是不是徹底火了,除了要去CBD的咖啡店聽聽人們在聊什么,有時候大佬之間的“口水仗”也是很好的證明。至少大模型是這樣。

新晉創業者王小川與百度的隔空互懟,折射出大模型賽道里熱鬧的景象。據中新經緯不完全統計,截至目前中國已有超過40家公司、機構發布了大模型產品或公布了大模型計劃。玩家紛紛涌入,這些大模型含金量究竟如何?是否會上演“一地雞毛”的終局?


(資料圖片)

資本躁動

除了搜狗創始人王小川,選擇在大模型賽道再創業的還有已退休的美團聯合創始人王慧文、創新工場董事長李開復等名人。面對大模型這一“燒錢”賽道,他們下場后的第一件事也便有了答案。

近日,王小川和前搜狗COO茹立云創辦的百川智能表示,已獲得5000萬美元啟動資金,來自王小川與其業內好友的個人支持,面向機構的融資會在近期啟動。

據媒體報道,王小川透露,目前的資金足夠訓練出一個好的千億模型,“至少到今年年底是夠用的”。不過緊接著王小川又說,這還遠遠不夠。他認為,產品從0到1,5000萬美元夠用,但若要持續做到最好,成本估計應該在3億至20億美元之間。

2月,王慧文在離開美團兩年后通過社交平臺發布了“英雄帖”,個人出資5000萬美元設立北京光年之外科技有限公司,稱要打造中國的OpenAI。王慧文還表示,下輪融資已經有頂級VC(風險投資)認購2.3億美金。

不過,創業者和企業也明白,除了大筆資金,大模型研發的關鍵還在于人才。誰能在人才方面拔得頭籌,誰就能在大模型的洪流中搶占先機。

王慧文在“英雄帖”中表示要拿出75%的股份邀請頂級研發人才;李開復則親自籌組Project Al 2.0,發朋友圈招攬全球范圍內的人才。

此外,大模型相關的人才招聘需求也激增。招聘平臺數據顯示,2023年1-2月份發布的AIGC崗位數量同比增長35%。在熱招崗位中,圖像識別、算法研究員、深度學習等崗位的年薪均已達百萬元。

在BOSS直聘上,北京市奇點智源科技有限公司(下稱奇點智源)給AIGC方向的NLP(自然語言處理)算法研究員崗位開出143萬元年薪。昆侖萬維4月10日的公告顯示,該公司就ChatGPT、圖像視頻生成等AIGC技術與奇點智源進行全面技術合作,但后續能否順利實現商業化存在較大的不確定性。

一位常年為企業招聘AI人才的獵頭告訴中新經緯,他現在幫多家北京、杭州的公司招聘大模型相關工程師,年薪多在50萬元至80萬元之間,優秀的可以突破100萬元,“算比較高的”。

不少上市公司也因為涉足大模型而股價大漲。Wind數據顯示,截至4月24日收盤,三六零、昆侖萬維、云從科技今年以來股價漲幅達153.52%、287.23%、155.58%。

昆侖萬維宣布聯合奇點智源共同研發國產大語言模型“天工”3.5后,次日股價最高漲近16%,兩個交易日累計最大漲幅超22%。

三六零股價也終于擺脫了長期的低迷狀態,今年股價最高時達20.85元/股,現在市值也來到了1185億元。不過截至24日收盤,該公司股價4月累計下跌4.99%。

云從科技股價今年累計最大漲幅一度達284.98%,股價曾達61.8元/股的歷史高點,但近期股價已回調超三成。不過,云從科技對大模型產品依舊寄予厚望。3月31日,云從科技披露了定增募資計劃,擬募資36.35億元用于“行業精靈”大模型研發項目。

不是所有模型都叫大模型

大模型賽道里數量更多的是公司、機構的身影。這里面既有百度、騰訊、阿里這樣的大型互聯網公司,也有科大訊飛、商湯科技這樣的AI公司,還有中科院自動化研究所、上海人工智能實驗室這樣的科研機構。

不少AI創業公司,也趁這波浪潮單方面宣布進軍大模型賽道。

什么樣的模型才能稱之為“大”?如此多的大模型,含金量究竟如何?

國家人工智能標準化總體組副組長、北京航空航天大學人工智能研究院教授吳文峻對中新經緯表示,一般認為參數規模在百億以上的是大模型?!坝醒芯勘砻?,百億規模以上的大模型,就可能會出現所謂的‘涌現’現象,具備一定的自主學習、自我優化和自我進化能力,相較于百億以下規模的模型在邏輯推理、做數學題等方面有明顯提升?!眳俏木f。

中國新一代人工智能發展戰略研究院首席經濟學家、南開大學經濟研究所所長劉剛接受中新經緯采訪時表示,大模型的判定標準主要在于它是否能在不同的專業領域使用,以及參數規模的大小?!拔艺J為億級參數規模是大模型的入門門檻,現在國際上一些大模型參數規??蛇_到百億甚至千億?!?/p>

大模型發展的背后除了百億級的參數規模、海量數據外,還需要龐大的智能算力支撐。而智能算力的水平又與算力芯片、算力規模息息相關。這些都決定了大模型的研發不是容易的事,并非通過召開一場發布會或展示幾頁PPT就能實現。

盡管目前大模型的應用有很大局限,具備對文本、圖片理解生成能力的都是少數,但有些公司已將一些此前推出的產品歸為大模型應用。

3月,小米集團總裁盧偉冰在財報電話會議上就表示,“小愛同學就是一個典型的大模型的應用產品”。公開資料顯示,小愛同學發布于2017年。

在市場研究機構IDC中國研究總監盧言霞看來,之前大部分AI應用都不是基于大模型的?!按竽P褪菍υ兴惴P偷募夹g升級,基于海量數據開發預訓練模型,到最終用戶環境中使用少量數據即可獲得比之前的算法模型更好的結果,相比上一代的算法模型有更高的預測準確度?!北R言霞說,“主要有三個要點,一是預訓練模型學習了多少數據,遷移學習的效果如何以及部署的整體成本如何?!?/p>

不過,劉剛認為,只要是應用產品基于人工智能,且參數規模、訓練量在不斷增大,不斷迭代演化,盡管參數規模沒有達到千億級別,也依然可以叫做大模型應用產品。

落地的不確定性

在人們預想中,大模型落地應用以后除了在C端變成人們的智慧助手,還將在B端給千行百業帶來研發能力與生產效率的指數提升。

但現實是,目前,具備對文本、圖像、音頻和視頻綜合理解生成能力,且具備學習和使用“工具”能力的多模態大模型仍在路上,這意味著如何將這些能力落地到具體的應用場景更加遙遠。而這個過程,充滿了諸多不確定性。

劉剛表示,大模型落地的不確定性首先在市場,其次是技術?!笆袌龅倪x擇對大模型至關重要,要看最后誰的模型大家用起來更容易、成本更低,讓市場接受并使用。落地的關鍵在于能否適應市場,有時候技術先進未必適應市場?!?/p>

吳文峻也提到了使用推廣方面的問題,他認為,廣泛部署大模型要占據一定的計算資源,很多人同時使用也會帶來資源消耗,大模型的訓練和運維也需要很多云資源。在云上部署后,怎樣在提供大規模服務的情況下保持良好的性價比,是推動大模型落地的過程中需要解決的問題。

吳文峻還提到,大模型相關技術本身還存在一些缺陷,比如事實錯誤、邏輯推理的前后矛盾,這些問題通常被稱為“幻覺”。要把大模型運用在一些對輸出內容的客觀性、準確性要求比較高的場景還存在一定技術障礙?!霸诒WC服務內容正確性、客觀性的前提下怎樣節能增效、降低運行成本是大模型在應用推廣的時候需要重點關注的?!?/p>

吳文峻認為,對于這些問題,要通過一定的技術手段加上算力的支撐才能解決,還可以通過人的反饋來強化學習,發現錯誤后進行修正?!坝行┻€需要增強專業領域的知識,對模型可能存在的問題進行檢查,然后定制成為可以在專業領域內用的模型?!?/p>

盧言霞表示,大模型落地的不確定性在于,是否真的能產出比之前的AI更好的效果,需要多久才能落地,“當然也在于到底能不能成功落地”。

針對大模型應用場景,吳文峻表示,B端和C端對大模型的需求不同,B端的技術要求會更高?!癈端的應用目前主要在聊天對話、客服、文本生成、圖片生成等。不過我認為大模型未來盈利的方向在B端,因為B端是面向企業進行定制服務的,部署的空間會更大,當然技術要求也會更高?!?/p>

警惕最終“一地雞毛”

面對科技公司對大模型的追逐戰愈演愈烈,業內也有質疑聲音:我們需要這么多大模型嗎?瘋狂上線大模型,是否會導致最終“一地雞毛”?

盧言霞表示,“從大模型的開發到落地,需要的算力、數據、人才,都是持續且較大規模的投資,另外當前技術也不成熟,確實有可能產生泡沫?!?/p>

吳文峻認為,在目前宣布進軍大模型的約40家企業、機構中,有一些企業本身在自然語言處理方面就有比較雄厚的積累,也有人工智能的技術儲備,他們做大模型沒有問題。

“但也有企業是為了蹭熱點,爭取投資才來做大模型。國外有一部分模型已經開源,如果這些企業是基于開源的模型,自己再重新訓練,這樣做出來的模型可能在技術能力、指標上達不到真正有用的大模型的要求?!眳俏木嵝?,“在目前宣布了做大模型的企業中,最后能做成的或許不超過一半?!?/p>

劉剛對此持較為中立的態度,他表示,大模型在各行各業都有很大應用前景,而且不同的行業也會產生不同的大模型,大模型也有語義、語音、文字等各種類型。劉剛說,“大模型即使是同質化,我認為也并非很嚴重的問題,就是要允許多個模型之間的競爭,最后有一個勝出了,就是找到了最優的道路,也是完成了一個創新的進化篩選過程?!?中新經緯APP)

關鍵詞: