21世紀經濟報道記者 申俊涵 北京報道
今年以來,ChatGPT的火爆出圈正引領新一波的AI浪潮。從國外的谷歌、微軟、Meta,到國內的百度、阿里、騰訊、字節跳動,各大科技巨頭紛紛加入這場AI軍備賽。
能夠帶來偉大成就和巨量財富的地方,時常伴隨著創新創業熱潮的翻涌。王慧文、李開復、王小川等在科技領域、創投領域富有號召力的大拿們悉數登場,將這份AI創業的“英雄榜”變得越來越長。
其實從1956年人工智能的概念首次提出以來,人工智能行業經歷過多次從高潮到幻滅的過程。此次ChatGPT的出現,再次讓大家內心受到震撼。不少創投圈人士對記者表示,AI大時代所帶來新鮮感和振奮感,比十年前移動互聯網時代到來時還要更加強烈,而這或許也是諸多業內大咖選擇跳出舒適圈奮力一搏的主要原因。
“我們驚嘆于AI大語言模型的能力,讓人工智能比以往任何時候都更接近人類、更加智能化,這讓我們充滿期待?!苯?,創世伙伴資本CCV合伙人梁宇在接受21世紀經濟報道專訪時說。
在他看來,現在是通用人工智能(AGI)的奇點時刻,同時也是商業化應用的前夜。AI大模型還沒有經過大量的商業包裝和訓練,需要從業者像園藝師一樣去修剪,形成符合行業規律的商業化產品,這也正是創新創業的機會所在。
創業門檻急劇拉高,機構出手更加謹慎
《21世紀》:業界許多人把今年稱之為AGI元年,您怎樣看待ChatGPT所引領的這波AI新浪潮?
梁宇:倒推來看,2017年是真正的AI元年。當時Google團隊發表論文《Attention is All You Need》,該論文提出了一種新的網絡架構,稱為Transformer。它僅僅采用注意力機制,不需要循環或卷積。
此前,機器學習的主流方法是深度神經網絡帶監督的學習。這篇論文出現以后,方法論開始轉向。ChatGPT的GPT模型、谷歌的LaMDA大模型和百度的文心大模型都是基于谷歌的開源Transformer模型,在其基礎上不斷迭代。一直到OpenAI蟄伏五六年后,率先推出現象級應用ChatGPT。
其實內心最受震撼的不是普通用戶和投資機構,而是產業人士。在上一波的人工智能創業浪潮中,大家預期很高,但實際產品效果根本達不到。一直到去年,很多人內心是存絕望的,也找不到突破的方向。ChatGPT出來后,大家才醒悟過來,原來人工智能可以做到這個程度,美國硅谷的熱鬧程度比中國還要早六個月左右。
《21世紀》:2016年AlphaGo打敗李世石是上一輪AI創業熱潮中的標志性時間節點,后來國內也出現AI四小龍等明星創業公司?,F在我們再次看到很多投資界、創業界人士進入AI領域創業,這兩輪熱潮有哪些不同?
梁宇:首先,這一輪AI創業的目標更加精確。上一輪的AI創業大致集中在兩個方向,機器視覺和無人駕駛,大家基于想象,不知道真正的工程能力能做成什么樣。這一輪的創業更加聚焦,OpenAI給大家打了個樣,所有的人才和資源都在向大語言模型的方向聚集。
第二,這輪AI創業的門檻被急劇拉高。構建大模型的算力成本更高,同時對底層大模型有真知灼見的算法人才非常稀缺。當然,經過上一輪AI產業的大浪淘沙,成功的創業者積累了深厚的根基,失敗的創業者也積累了足夠的經驗,整體創業者的素質會更高。
第三,大環境本身也發生了很大的變化。上一輪AI創業熱潮中,政策市場和創投市場環境都更加開放?,F在創業者和投資機構都變得更加理性,有些人確實是在上一輪的狂歡中被傷到了。
現在凡是跟AI沾邊的公司估值都比較高,因為需要的投入確實很大,行業天花板都很高,行業中也會有人去追逐高估值。但優秀創業者和優秀投資人的結合還是比較理性的,我們不能脫離事實的想象構建商業未來。整體來說,目前還是Gartner曲線(技術成熟度曲線)向上爬坡的前夜,大家都很興奮,對產業的未來充滿期待,但出手比較謹慎。
國內大模型追趕ChatGPT仍需時間,應用層創業機會更多
《21世紀》:您是否看好國內的類ChatGPT應用?跟OpenAI相比,國內做大語言模型的團隊差距主要在哪些方面?
梁宇:我們是非??春脟鴥華I創業的,相信在中文語言環境和法律法規下,一定會出現中國的類ChatGPT應用,它們在中國市場也會更具競爭優勢。但跟OpenAI相比,國內團隊做大語言模型在三方面仍存在差距。
首先是經過優秀標注的數據集。目前中文數據集還在追趕階段,隨著業界共同努力,花錢、花時間來做這件事,這是能夠趕上的。
第二是算力層面。去年,美國政府要求芯片廠商英偉達停止向中國銷售部分高性能GPU芯片。這種對算力的封鎖,拉長了大模型訓練的時間。
第三是算法層面。語言模型能否做到像OpenAI那么智能,算力并不是最重要的因素,最重要的是算法層面。語言模型該怎樣調參才能達到好的效果,這有點像可口可樂的秘方,需要不斷的探索和研究。
更重要的是,我們希望大模型公司可以把平臺留給開發者,就像IOS做的一樣,讓應用層參與者更多去做垂直領域的事情。如果這件事實現了,中國就很有優勢。因為中國的公司在應用場景的開發上,在應用場景的豐富度上是遠遠超過美國公司的。中國公司在應用場景豐富度開發上和商業落地上,是走得非??斓?。
《21世紀》:目前國內語言大模型市場的競爭格局是怎樣的,您看好哪一派?
梁宇:首先是百度、阿里、騰訊、字節跳動等巨頭公司。大廠的優勢在于他們有實力不斷投入資金、資源,有可能最先形成數據飛輪。
第二是國內一些技術實力雄厚的研究院。比如創世伙伴CCV聊過的兩個團隊,一個是北京智源人工智能研究院,他們幾年前就開始專注在做語言大模型,語言訓練的效果非常出色。2019年,他們成立了獨立公司智譜AI,由清華大學唐杰教授擔任首席科學家。另一個是沈向洋博士創立的IDEA研究院(粵港澳大灣區數字經濟研究院),同樣具有競爭力。我們很欣賞這種在大模型上扎實做了幾年研究工作的公司。
第三,大家看到的王慧文、李開復、王小川等創業老兵,同樣有機會做這件事。在科技領域、創投領域有影響力的人進軍這個市場,能夠幫助中國市場快速產出有價值的大模型。越是在競爭的環境中,創業企業的進化是越快的。
《21世紀》:我們注意到還有些公司基于數據集、算力、算法方面的困難,會戰略性放棄做語言大模型,而是在特定的領域做相對的小模型,您怎么看待這件事的前景?
梁宇:大語言模型市場的競爭確實已經進入到白熱化階段,我認為除了百度這樣的巨頭之外,還會誕生一兩家大語言模型公司。對大模型的投資是具備高風險、高天花板的,也是值得投入的,我們會支持跑在前面的大語言模型創業者。
同時值得注意的是,當百度、阿里等大公司專注在語言大模型戰場時,基于Transformer的小模型對創業公司來說是更富有機會和商業前景的,我們也很關注這個領域的投資機會。
比如橫向來看,在美國有家AI繪畫公司Midjourney,它的底層模型是以文生圖的模型,目前已經是10億美元估值的獨角獸公司。除了圖片,3D領域的3D模型、3D環境生成,以及聲音、視頻領域同樣富有機會,市場中還沒有形成領頭羊的局面。
縱向來看,做獨立語言模型的公司必須跟產業結合才能拿到精確的數據,去幫助訓練各種場景,這是未來商業化的根基。醫療、金融、汽車、游戲場景都具有產業機會,能夠形成產業壁壘。
創業團隊須兼具商業化能力和底層模型研發壁壘
《21世紀》:在ChatGPT所屬的AIGC領域,創世伙伴資本近年做了哪些投資?
梁宇:在AIGC爆發的前夜我們已經投資了一些公司,他們所做的事情可以歸為AIGC領域。比如我們在2017年A輪領投玩美移動PERFECT,這家公司成立于2015年,是一家人工智能(AI)和增強現實(AR)美妝與時尚技術商業解決方案提供商,去年已經在紐交所上市。玩美移動在3D空間生成人臉,為企業和消費者提供虛擬試妝及智能肌膚偵測等服務。
另外,我們還投資了AI醫療公司數坤科技,目前正在IPO進程中。它用自創的底層模型大量閱讀CT影像和MR影像,生成人的數字三維模型。延伸來看,我們在垂直的無人車感知、3D環境生成領域也在進行投資。對我們來說,AIGC將是今年非常重要的投資賽道。
《21世紀》:在具體投資過程中,您傾向于投資什么樣的創業團隊?
梁宇:我們非??粗毓镜漠a品商業化能力和行業認知,它要知道如何設計垂直領域的產品,如何抓住用戶、增強用戶黏性。同時在這個基礎上,公司還需要在底層模型上有自己的研發能力,建立起高壁壘。
比如美國有一家成立兩年的公司叫Jasper,它的底層技術模型來自ChatGPT,基于它進行產品化,做自動營銷文案生成。Jasper的應用反饋情況非常好,很多文字工作者愿意付費訂閱,公司也很快成長為獨角獸公司。但ChatGPT出來以后,這項服務免費提供給用戶,Jasper的價值是急劇下降的,它向用戶收費變得不再容易。
所以創業公司要有自己的模型能力,否則即便前端應用包裝得再好,當大象稍微踏過來一腳,它的腳指頭就把你踩死了。當底座足夠扎實,即便遇到浪的沖擊,也沒那么容易被擊倒。
另外,創業者要理解產業,積累在垂直領域的數據。如果能夠得到國家隊的支持,獲得來自政府的數據資源,或許能夠真正幫助公司實現騰飛。比如政府部門有行政數據、公民數據、醫療數據等,這些數據脫敏之后開放給公司,將幫助語言模型訓練得更好。