核心提示:說出來你可能不信,這篇文章可是AI寫的。人類擅長分析,但機器做得更好。機器可以分析數據,并針對不同用例需求找到相應
說出來你可能不信,這篇文章可是AI寫的
人類擅長分析,但機器做得更好。機器可以分析數據,并針對不同用例需求找到相應的規律——不管是詐騙信息識別、垃圾郵件檢測、預測快遞送達時間還是為你推薦可能感興趣的短視頻——而且它們還在不斷迭代,變得越來越聰明。這種機器被稱為“分析式人工智能”(Analytical AI),或者傳統AI。
但人類不僅擅長分析,還擅長創造——比如寫詩、設計產品、制作游戲與編寫程序代碼。以前,機器在這些方面無法與人類抗衡,它們只能做些分析型或機械式的認知計算。但現在不一樣了,AI發展到了新的階段,機器已經開始可以創造有意義并具備美感的東西了。這一新型的AI被稱為“生成式人工智能”(Generative AI),也就是說,機器并非如之前那樣僅分析已有的數據,而是生成了全新的東西。
生成式AI不僅正在變得更快、更便宜,而且在某些情況下,其生成的結果比人類手工創造的還要好。從社交媒體到游戲,從廣告到建筑,從編程到平面設計,從產品設計到法律,從市場營銷到銷售,每一個需要人類原創力的行業都將有可能會被顛覆。某些崗位將完全被生成式AI取代,有些則會在生成式AI的幫助下更好地促進人機協作——但總體來說,生成式AI將有非常廣泛的終端應用市場,幫助人們更好、更快并以成本更低的方式去創作。最理想的情況是,生成式AI將會把創作與知識類勞動的邊際成本降為零,極大提升生產力并創造巨大的經濟價值——當然還有相應的市場價值。
本文由紅杉合伙人Sonya Huang、Pat Grady與生成式AI預訓練模型 GPT-3共同創作完成,正文中的兩幅插圖是由Midjourney生成的,希望這篇人機合作的文章能為你打開一個充滿創造力的新世界。
每期監測和精編中文視野之外的全球高價值情報,為你提供先人一步洞察機會的新鮮資訊,為你提供升級思維方式的深度內容,是為[ 紅杉匯內參 ]。
為什么是現在?
和更廣泛意義上的AI一樣,生成式AI也需要思考“為什么是現在”這樣的問題——因為現在有了更好的模型、更多數據、可以做更多的計算。這一方向的發展變化遠比我們想象的要快,為了更好理解它當下的發展進程,我們不妨先梳理一下它最近的發展歷史。
第一波發展浪潮:小模型至上階段(2015年以前)
2015年以前,小模型被認為是理解語言的“最先進的技術”。這些小模型更擅長分析型任務,因此被用于從“預測送達時間”到“欺詐信息分類”等各類任務中。然而,對于通用的生成任務來說,它們的表達能力還不夠,生成人類水平的文章或代碼仍然是白日做夢。
第二波發展浪潮:規模化競賽階段(2015年-今天)
谷歌研究院的一篇里程碑式的論文《只要注意力機制就夠了》( 《Attention is All You Need》),向人們描述了一種用于自然語言理解的新型神經網絡架構——Transformers模型(有時翻譯為“變換器”模型),它不但能生成質量上乘的語言模型,同時具有更高的可并行性,大大降低了所需的訓練時間。這些小樣本學習模型,可以相對更容易地針對特定領域做定制修改。
隨著AI模型逐漸發展壯大,它們已經開始超越人類的基準水平。
當然,隨著模型越來越大,它們開始匹敵人類,然后超越人類。從2015年到2020年,用于訓練這些模型的計算量增加了6個數量級,其表現在手寫、語音和圖像識別、閱讀理解和語言理解方面超過了人類的基準水平。其中OpenAI的GPT-3模型的表現尤為突出:不僅性能相較上一代的GPT-2有了巨大的飛躍,從他們發布的示例也能看到,不管是生成編程代碼還是寫冷笑話,其表現都讓人吃驚。
盡管所有的基礎研究都取得了進展,但這些模型在應用方面卻都沒有鋪得太開。它們龐大且難以運行(需要GPU編排)、缺乏廣泛應用(沒有公開可用的版本,或僅有封閉測試版),而且作為云服務的使用成本極高。盡管如此,最早期的生成式AI已經開始進入公眾視野。
第三波發展浪潮:更好、更快、更便宜階段(2022年之后)
首先是計算成本開始下降。新的技術,如擴散模型,縮減了訓練和運行推理所需的成本。與此同時,研究學界也在持續開發更好的算法與規模更大的模型。而開發者的權限也有了變化,從封閉測試版擴大到開放測試版,甚至有些模型還開放了源代碼供開發人員調用。
對于那些一直渴望使用大型語言模型(LLM)的開發人員來說,探索和應用開發的大門已經打開,基于這些技術的應用開始大量涌現。
第四波發展浪潮:殺手級應用涌現階段(現在)
隨著各大平臺發展成熟,AI模型繼續變得更好、更快、更便宜,越來越多的模型免費、開源,應用層面將出現大爆發。
正如當初移動通信技術在結合了GPS定位、相機及隨身連接等新功能與特點后,催生了一系列新型的應用程序,我們預計當下AI模型的發展也將推動新一輪生成式AI應用的爆發。正如十年前移動通信的拐點為少數幾個殺手級應用創造了市場機會一樣,我們預計殺手級應用也將出現在生成式AI領域中。大家爭相發力,前景讓人期待。
市場格局
下圖為不同細分方向應用的格局分布圖,可以看到各個細分方向的應用平臺與應用模型。
模型
● 文本領域。文本是發展最完備的領域。然而,想要語言表達自然流暢是個十分高的標準。如今,這些模型在通用的中、短篇寫作方面表現還算不錯(但即便如此,它們通常也只是被用來生成初稿或對初稿做迭代完善)。隨著時間的推移,模型越來越好,我們有望可以看到更高質量及更長篇的內容,并且針對各垂直領域有特定的優化。
● 代碼生成。正如GitHub CoPilot所顯示出的效果,很快,代碼生成就會變得十分普遍,它能極大提高程序開發者的生產力。而對于非專業人員,借由這些工具,編寫代碼也將不是難事。
● 圖像領域。圖像領域的應用爆發是新近之事,但也可謂勢不可擋:畢竟,在社交媒體上分享生成的圖像比文字要有趣得多。而且我們也看到,市面上出現了非常多不同審美風格的圖像模型,以及編輯和修改生成圖像的不同技術。
● 語音合成。語音合成的應用已經有段時間了(比如蘋果設備上的語音助手Siri),但消費與企業級的應用才剛剛起步。對于像電影和播客這樣的高端應用來說,要想一次性生成與配音演員或主播錄音一樣不機械、有自然質感的作品,還有很長的路要走。但就像圖像領域一樣,現在的模型也將成為將來更優秀模型的發展基礎。
● 視頻和3D模型領域。這一領域的進步則要緩慢不少,人們期待AI模型在這些創意領域(如電影、游戲、VR、建筑和實體產品設計)的進一步應用潛力。預計在未來1-2年內,我們將能看到一些基礎的3D和視頻生成模型。
● 其它領域。其它許多領域還處于基礎模型的研發階段,如音頻、音樂到生物與化學領域。
下圖是這些基本模型的進展與相關應用的發展進程時間表,2025年之后的時間為預估時間。
應用
接下來為你介紹的是一些讓我們感覺十分興奮的應用場景。但實際上,可應用范圍將遠比本文所描述的多,創始人和開發人員對于各路應用場景的奇思妙想讓我們連連贊嘆。
● 文案寫作。日益增長的個性化網頁、電子郵件等網絡空間,用以支持銷售和營銷戰略,甚至提供更好的售后服務,都將催生大量的文案寫作需求。這些短小精悍、格式相對固定的宣傳式話語,再加上相關從業人員工作壓力大、預算不高等特點,這一領域將是文案寫作型AI實現自動化與寫作增強方案的最佳用武之地。
● 特定垂直領域的寫作助手。如今大部分寫作都是橫向的;但我們相信,對于特定的終端市場,從擬定法律合同到劇本創作,都有可能借助生成式AI的力量獲得更長足的發展。在這一領域,產品差異化的主要發力點將是對特定工作流程模型和用戶體驗模式的細節打磨。
● 代碼生成。如今在該領域,生成式AI的應用已經帶來了質的提升,程序開發人員的生產力和創造力都被極大增強:如今使用GitHubCopilot生成的程序中,有近40%的代碼是由AI生成的。但如果打開想象,我們甚至可以設想,將來借助更好的生成式AI,普通消費者(非專業程序開發人員)也將有能力自行創作程序代碼。基于提示的學習(Learning to prompt,譯注:一種新的AI訓練方式)將有可能成為最終的高級編程語言。
● 藝術作品生成。如今,不少大型的AI已經將整個藝術史和流行文化的作品數據編碼進了模型當中,任何人都可以隨意生成——以前可能需要人花一輩子才能掌握的——想要的藝術風格的作品。
● 游戲。最理想的應用狀態是人們可以使用自然語言來創建復雜的場景或可操縱的模型;我們離這樣的夢想還有很遙遠的距離,但在短期范圍內,還是有不少可實現的場景應用,比如生成游戲場景的紋理或Skybox VR場景的圖像等。
● 媒體/廣告。我們大可暢想自動化廣告代理的潛力——它將能針對不同的消費者來優化廣告文案與創意。而多模態生成的應用將能更好地針對不同的銷售信息生成互補性視覺效果廣告。
● 設計。數字和實體產品的原型設計是一個勞動密集且往往需要不斷反復修改的過程。現在的生成性AI已經實現了根據粗略的草圖與文字描述生成高保真渲染圖。隨著這一技術往3D模型的方向發展,生成設計過程將打通從文字到具體產品實物的全流程。你的下一款手機應用程序,或將來的某雙運動鞋,說不定都將是AI設計生成的。
● 社交媒體與數字社區。會不會有人借助AI生成的方式來自我表達呢?當然,現在像Midjourney這樣的新應用便正在創造新的社交體驗——消費者可以學著生成獨具個性的作品來做公共表達。
生成式AI應用解剖
生成式AI應用會是什么樣子呢?這里有一些預測可供參考。
智能化與模型微調
生成式AI應用的底層技術其實都是GPT-3或Stable Diffusion等大型AI模型。而隨著應用程序不斷獲得更多用戶數據,這些數據便可用來對模型做更精細的改進,以實現針對特定問題空間改進模型質量和表現、縮小模型尺寸或降低成本。
我們可以把生成式AI應用程序看作UI層(用戶交互界面層)或“小腦”,支撐它運行的底層大型通用AI模型才是“大腦”。
實現形式方面
如今,生成式AI應用在很大程度上是以插件的形式存在于現有軟件生態系統中,通過IDE(集成開發環境)運行代碼,而通過Figma或Photoshop之類的應用程序來生成圖像;我們甚至可以設想,將來Discord機器人也將能通過生成式AI的技術實現更廣泛的用途。
此外還有數量較少的獨立的生成式AI網絡應用,比如用于文案寫作的Jasper和Copy.ai,用于視頻編輯的Runway,以及用于記筆記的Mem。
插件可能會是個非常有效的切入口,一方面不需要引入新的應用程序,另一方面也以非常聰明的方式避開了“先要有雞還是先要有蛋”的問題(改善模型需要大量的用戶使用數據,但另一方面,要有好的模型才能吸引到足夠多的用戶使用)。而目前我們已經在消費者/社交領域看到了這種推廣策略帶來的非常好的效果。
交互模式范例
如今,我們看到的大多數生成式AI的演示都是“一次性作品”:提供一個輸入量,機器會生成一個輸出,然后你再決定是否保存結果或者棄掉重來。隨著越來越多的模型不斷迭代而變得更強,將來我們能實現對輸出作品的修改、完善、升級或生成不同版本等操作。
現在的生成式AI通常被用來生成產品原型或初稿。生成式AI通常都很擅長生成多個不同版本的作品,人們可以在此基礎上進一步創作(如生成多個不同的圖標或建筑設計模型);此外,它們也很擅長為初稿提修改建議,從而幫助用戶更好地完善作品(如博客文章或代碼自動補全)。隨著模型變得越來越智能(當然離不開大量的用戶使用數據),我們有理由期待它們將來能生成越來越好的初稿,甚至可以直接生成可作為終稿使用的作品來。
持續的細分類目引領者
通過不懈加速“更多用戶參與/更多數據—更好的模型”這一發展飛輪,生成式AI公司可以獲得持續的競爭優勢并最終成長為行業最佳。當然要注意維護這一良性循環:①獲得極高的用戶參與度→②獲得更多用戶數據以訓練出更好的模型(提示改進、模型微調、將用戶行為作為標記的訓練數據等)→③優秀的模型吸引更多的用戶并提升參與度。此外,這些AI公司還可以往特定的問題空間發展(如代碼領域、設計領域或游戲領域等),而不是非要做得大而全。還可以如前所述,通過插件的形式整合進當下目標用戶的生產流程中,以此實現用戶增長和產品分發,之后再嘗試打造AI原生的工作流程來替代現有的應用程序。找到正確的方式來打造這些應用,積累用戶與數據,這些都需要時間,但我們相信,好的產品必然持久,也終將發展壯大。
困難與風險
盡管生成式AI具有巨大潛力,但在商業模式和技術方面仍有許多問題需要解決。如版權、信任與安全以及成本等重要問題還遠未解決。
打開想象的邊界
生成式AI仍然處于非常早期的階段。平臺層面剛剛有些起色,真正的應用程序其實還處于萌芽階段。
但也要知道,我們并不需要大型語言模型寫出一部托爾斯泰小說,才說生成式AI獲得了非常好的應用。當下這些模型已經足夠好了,足以用來生成博客文章的初稿,或商標與產品界面原型。而在不遠的中短期未來,它們也有望創造更大的價值。
生成式AI應用的第一波浪潮有點類似于iPhone剛出現時的移動應用格局,多少偏于噱頭,顯得單薄,競爭差異化與商業模式也不明確。然而,其中一些應用的確為我們提供了有趣的視角,讓我們可以一窺未來的可能。一旦你看到過AI可以生成復雜的代碼或精彩的圖像,你就很難回到沒看過的狀態,因為你知道這些技術將來一定會成為我們工作與創造的基礎,發揮更重要的作用。
假如盡情暢想幾十年后的未來,我們不難想象彼時的生成式AI已經深刻融入我們的工作、創造與游戲中:自動生成的備忘錄;3D打印任何你想象出來的東西;文字直接生成皮克斯電影;靠想象來實時生成世界場景的游戲體驗等等。這些事情如今看來像是科幻小說一般,但我們還是要對技術進步的速度有信心。要知道,短短幾年時間,我們便從狹窄的語言模型發展到了代碼自動補全,沿著這樣的發展思路,如果大型模型也有所謂“摩爾定律”,那么天馬行空般的未來想象也并非沒有實現的可 能。
人類擅長分析,但機器做得更好。機器可以分析數據,并針對不同用例需求找到相應的規律——不管是詐騙信息識別、垃圾郵件檢測、預測快遞送達時間還是為你推薦可能感興趣的短視頻——而且它們還在不斷迭代,變得越來越聰明。這種機器被稱為“分析式人工智能”(Analytical AI),或者傳統AI。
但人類不僅擅長分析,還擅長創造——比如寫詩、設計產品、制作游戲與編寫程序代碼。以前,機器在這些方面無法與人類抗衡,它們只能做些分析型或機械式的認知計算。但現在不一樣了,AI發展到了新的階段,機器已經開始可以創造有意義并具備美感的東西了。這一新型的AI被稱為“生成式人工智能”(Generative AI),也就是說,機器并非如之前那樣僅分析已有的數據,而是生成了全新的東西。
生成式AI不僅正在變得更快、更便宜,而且在某些情況下,其生成的結果比人類手工創造的還要好。從社交媒體到游戲,從廣告到建筑,從編程到平面設計,從產品設計到法律,從市場營銷到銷售,每一個需要人類原創力的行業都將有可能會被顛覆。某些崗位將完全被生成式AI取代,有些則會在生成式AI的幫助下更好地促進人機協作——但總體來說,生成式AI將有非常廣泛的終端應用市場,幫助人們更好、更快并以成本更低的方式去創作。最理想的情況是,生成式AI將會把創作與知識類勞動的邊際成本降為零,極大提升生產力并創造巨大的經濟價值——當然還有相應的市場價值。
本文由紅杉合伙人Sonya Huang、Pat Grady與生成式AI預訓練模型 GPT-3共同創作完成,正文中的兩幅插圖是由Midjourney生成的,希望這篇人機合作的文章能為你打開一個充滿創造力的新世界。
每期監測和精編中文視野之外的全球高價值情報,為你提供先人一步洞察機會的新鮮資訊,為你提供升級思維方式的深度內容,是為[ 紅杉匯內參 ]。
為什么是現在?
和更廣泛意義上的AI一樣,生成式AI也需要思考“為什么是現在”這樣的問題——因為現在有了更好的模型、更多數據、可以做更多的計算。這一方向的發展變化遠比我們想象的要快,為了更好理解它當下的發展進程,我們不妨先梳理一下它最近的發展歷史。
第一波發展浪潮:小模型至上階段(2015年以前)
2015年以前,小模型被認為是理解語言的“最先進的技術”。這些小模型更擅長分析型任務,因此被用于從“預測送達時間”到“欺詐信息分類”等各類任務中。然而,對于通用的生成任務來說,它們的表達能力還不夠,生成人類水平的文章或代碼仍然是白日做夢。
第二波發展浪潮:規模化競賽階段(2015年-今天)
谷歌研究院的一篇里程碑式的論文《只要注意力機制就夠了》( 《Attention is All You Need》),向人們描述了一種用于自然語言理解的新型神經網絡架構——Transformers模型(有時翻譯為“變換器”模型),它不但能生成質量上乘的語言模型,同時具有更高的可并行性,大大降低了所需的訓練時間。這些小樣本學習模型,可以相對更容易地針對特定領域做定制修改。
隨著AI模型逐漸發展壯大,它們已經開始超越人類的基準水平。
當然,隨著模型越來越大,它們開始匹敵人類,然后超越人類。從2015年到2020年,用于訓練這些模型的計算量增加了6個數量級,其表現在手寫、語音和圖像識別、閱讀理解和語言理解方面超過了人類的基準水平。其中OpenAI的GPT-3模型的表現尤為突出:不僅性能相較上一代的GPT-2有了巨大的飛躍,從他們發布的示例也能看到,不管是生成編程代碼還是寫冷笑話,其表現都讓人吃驚。
盡管所有的基礎研究都取得了進展,但這些模型在應用方面卻都沒有鋪得太開。它們龐大且難以運行(需要GPU編排)、缺乏廣泛應用(沒有公開可用的版本,或僅有封閉測試版),而且作為云服務的使用成本極高。盡管如此,最早期的生成式AI已經開始進入公眾視野。
第三波發展浪潮:更好、更快、更便宜階段(2022年之后)
首先是計算成本開始下降。新的技術,如擴散模型,縮減了訓練和運行推理所需的成本。與此同時,研究學界也在持續開發更好的算法與規模更大的模型。而開發者的權限也有了變化,從封閉測試版擴大到開放測試版,甚至有些模型還開放了源代碼供開發人員調用。
對于那些一直渴望使用大型語言模型(LLM)的開發人員來說,探索和應用開發的大門已經打開,基于這些技術的應用開始大量涌現。
用Midjourney生成的插圖。
第四波發展浪潮:殺手級應用涌現階段(現在)
隨著各大平臺發展成熟,AI模型繼續變得更好、更快、更便宜,越來越多的模型免費、開源,應用層面將出現大爆發。
正如當初移動通信技術在結合了GPS定位、相機及隨身連接等新功能與特點后,催生了一系列新型的應用程序,我們預計當下AI模型的發展也將推動新一輪生成式AI應用的爆發。正如十年前移動通信的拐點為少數幾個殺手級應用創造了市場機會一樣,我們預計殺手級應用也將出現在生成式AI領域中。大家爭相發力,前景讓人期待。
市場格局
下圖為不同細分方向應用的格局分布圖,可以看到各個細分方向的應用平臺與應用模型。
模型
● 文本領域。文本是發展最完備的領域。然而,想要語言表達自然流暢是個十分高的標準。如今,這些模型在通用的中、短篇寫作方面表現還算不錯(但即便如此,它們通常也只是被用來生成初稿或對初稿做迭代完善)。隨著時間的推移,模型越來越好,我們有望可以看到更高質量及更長篇的內容,并且針對各垂直領域有特定的優化。
● 代碼生成。正如GitHub CoPilot所顯示出的效果,很快,代碼生成就會變得十分普遍,它能極大提高程序開發者的生產力。而對于非專業人員,借由這些工具,編寫代碼也將不是難事。
● 圖像領域。圖像領域的應用爆發是新近之事,但也可謂勢不可擋:畢竟,在社交媒體上分享生成的圖像比文字要有趣得多。而且我們也看到,市面上出現了非常多不同審美風格的圖像模型,以及編輯和修改生成圖像的不同技術。
● 語音合成。語音合成的應用已經有段時間了(比如蘋果設備上的語音助手Siri),但消費與企業級的應用才剛剛起步。對于像電影和播客這樣的高端應用來說,要想一次性生成與配音演員或主播錄音一樣不機械、有自然質感的作品,還有很長的路要走。但就像圖像領域一樣,現在的模型也將成為將來更優秀模型的發展基礎。
● 視頻和3D模型領域。這一領域的進步則要緩慢不少,人們期待AI模型在這些創意領域(如電影、游戲、VR、建筑和實體產品設計)的進一步應用潛力。預計在未來1-2年內,我們將能看到一些基礎的3D和視頻生成模型。
● 其它領域。其它許多領域還處于基礎模型的研發階段,如音頻、音樂到生物與化學領域。
下圖是這些基本模型的進展與相關應用的發展進程時間表,2025年之后的時間為預估時間。
應用
接下來為你介紹的是一些讓我們感覺十分興奮的應用場景。但實際上,可應用范圍將遠比本文所描述的多,創始人和開發人員對于各路應用場景的奇思妙想讓我們連連贊嘆。
● 文案寫作。日益增長的個性化網頁、電子郵件等網絡空間,用以支持銷售和營銷戰略,甚至提供更好的售后服務,都將催生大量的文案寫作需求。這些短小精悍、格式相對固定的宣傳式話語,再加上相關從業人員工作壓力大、預算不高等特點,這一領域將是文案寫作型AI實現自動化與寫作增強方案的最佳用武之地。
● 特定垂直領域的寫作助手。如今大部分寫作都是橫向的;但我們相信,對于特定的終端市場,從擬定法律合同到劇本創作,都有可能借助生成式AI的力量獲得更長足的發展。在這一領域,產品差異化的主要發力點將是對特定工作流程模型和用戶體驗模式的細節打磨。
● 代碼生成。如今在該領域,生成式AI的應用已經帶來了質的提升,程序開發人員的生產力和創造力都被極大增強:如今使用GitHubCopilot生成的程序中,有近40%的代碼是由AI生成的。但如果打開想象,我們甚至可以設想,將來借助更好的生成式AI,普通消費者(非專業程序開發人員)也將有能力自行創作程序代碼。基于提示的學習(Learning to prompt,譯注:一種新的AI訓練方式)將有可能成為最終的高級編程語言。
● 藝術作品生成。如今,不少大型的AI已經將整個藝術史和流行文化的作品數據編碼進了模型當中,任何人都可以隨意生成——以前可能需要人花一輩子才能掌握的——想要的藝術風格的作品。
● 游戲。最理想的應用狀態是人們可以使用自然語言來創建復雜的場景或可操縱的模型;我們離這樣的夢想還有很遙遠的距離,但在短期范圍內,還是有不少可實現的場景應用,比如生成游戲場景的紋理或Skybox VR場景的圖像等。
● 媒體/廣告。我們大可暢想自動化廣告代理的潛力——它將能針對不同的消費者來優化廣告文案與創意。而多模態生成的應用將能更好地針對不同的銷售信息生成互補性視覺效果廣告。
● 設計。數字和實體產品的原型設計是一個勞動密集且往往需要不斷反復修改的過程。現在的生成性AI已經實現了根據粗略的草圖與文字描述生成高保真渲染圖。隨著這一技術往3D模型的方向發展,生成設計過程將打通從文字到具體產品實物的全流程。你的下一款手機應用程序,或將來的某雙運動鞋,說不定都將是AI設計生成的。
● 社交媒體與數字社區。會不會有人借助AI生成的方式來自我表達呢?當然,現在像Midjourney這樣的新應用便正在創造新的社交體驗——消費者可以學著生成獨具個性的作品來做公共表達。
用Midjourney生成的插圖。
生成式AI應用解剖
生成式AI應用會是什么樣子呢?這里有一些預測可供參考。
智能化與模型微調
生成式AI應用的底層技術其實都是GPT-3或Stable Diffusion等大型AI模型。而隨著應用程序不斷獲得更多用戶數據,這些數據便可用來對模型做更精細的改進,以實現針對特定問題空間改進模型質量和表現、縮小模型尺寸或降低成本。
我們可以把生成式AI應用程序看作UI層(用戶交互界面層)或“小腦”,支撐它運行的底層大型通用AI模型才是“大腦”。
實現形式方面
如今,生成式AI應用在很大程度上是以插件的形式存在于現有軟件生態系統中,通過IDE(集成開發環境)運行代碼,而通過Figma或Photoshop之類的應用程序來生成圖像;我們甚至可以設想,將來Discord機器人也將能通過生成式AI的技術實現更廣泛的用途。
此外還有數量較少的獨立的生成式AI網絡應用,比如用于文案寫作的Jasper和Copy.ai,用于視頻編輯的Runway,以及用于記筆記的Mem。
插件可能會是個非常有效的切入口,一方面不需要引入新的應用程序,另一方面也以非常聰明的方式避開了“先要有雞還是先要有蛋”的問題(改善模型需要大量的用戶使用數據,但另一方面,要有好的模型才能吸引到足夠多的用戶使用)。而目前我們已經在消費者/社交領域看到了這種推廣策略帶來的非常好的效果。
交互模式范例
如今,我們看到的大多數生成式AI的演示都是“一次性作品”:提供一個輸入量,機器會生成一個輸出,然后你再決定是否保存結果或者棄掉重來。隨著越來越多的模型不斷迭代而變得更強,將來我們能實現對輸出作品的修改、完善、升級或生成不同版本等操作。
現在的生成式AI通常被用來生成產品原型或初稿。生成式AI通常都很擅長生成多個不同版本的作品,人們可以在此基礎上進一步創作(如生成多個不同的圖標或建筑設計模型);此外,它們也很擅長為初稿提修改建議,從而幫助用戶更好地完善作品(如博客文章或代碼自動補全)。隨著模型變得越來越智能(當然離不開大量的用戶使用數據),我們有理由期待它們將來能生成越來越好的初稿,甚至可以直接生成可作為終稿使用的作品來。
持續的細分類目引領者
通過不懈加速“更多用戶參與/更多數據—更好的模型”這一發展飛輪,生成式AI公司可以獲得持續的競爭優勢并最終成長為行業最佳。當然要注意維護這一良性循環:①獲得極高的用戶參與度→②獲得更多用戶數據以訓練出更好的模型(提示改進、模型微調、將用戶行為作為標記的訓練數據等)→③優秀的模型吸引更多的用戶并提升參與度。此外,這些AI公司還可以往特定的問題空間發展(如代碼領域、設計領域或游戲領域等),而不是非要做得大而全。還可以如前所述,通過插件的形式整合進當下目標用戶的生產流程中,以此實現用戶增長和產品分發,之后再嘗試打造AI原生的工作流程來替代現有的應用程序。找到正確的方式來打造這些應用,積累用戶與數據,這些都需要時間,但我們相信,好的產品必然持久,也終將發展壯大。
困難與風險
盡管生成式AI具有巨大潛力,但在商業模式和技術方面仍有許多問題需要解決。如版權、信任與安全以及成本等重要問題還遠未解決。
打開想象的邊界
生成式AI仍然處于非常早期的階段。平臺層面剛剛有些起色,真正的應用程序其實還處于萌芽階段。
但也要知道,我們并不需要大型語言模型寫出一部托爾斯泰小說,才說生成式AI獲得了非常好的應用。當下這些模型已經足夠好了,足以用來生成博客文章的初稿,或商標與產品界面原型。而在不遠的中短期未來,它們也有望創造更大的價值。
生成式AI應用的第一波浪潮有點類似于iPhone剛出現時的移動應用格局,多少偏于噱頭,顯得單薄,競爭差異化與商業模式也不明確。然而,其中一些應用的確為我們提供了有趣的視角,讓我們可以一窺未來的可能。一旦你看到過AI可以生成復雜的代碼或精彩的圖像,你就很難回到沒看過的狀態,因為你知道這些技術將來一定會成為我們工作與創造的基礎,發揮更重要的作用。
假如盡情暢想幾十年后的未來,我們不難想象彼時的生成式AI已經深刻融入我們的工作、創造與游戲中:自動生成的備忘錄;3D打印任何你想象出來的東西;文字直接生成皮克斯電影;靠想象來實時生成世界場景的游戲體驗等等。這些事情如今看來像是科幻小說一般,但我們還是要對技術進步的速度有信心。要知道,短短幾年時間,我們便從狹窄的語言模型發展到了代碼自動補全,沿著這樣的發展思路,如果大型模型也有所謂“摩爾定律”,那么天馬行空般的未來想象也并非沒有實現的可 能。