這幾天,估計不少朋友都被一款叫Sora的“文生視頻”工具狠狠地刷屏了。馬斯克、楊立昆、賈揚清、Jim Fan、謝賽寧、周鴻祎、李志飛等科技大佬紛紛下場評論。馬斯克感嘆“人類愿賭服輸”;正在AI infra賽道創業的前阿里高管賈揚清直呼:真的非常牛;360的周鴻祎預言“AGI實現將從10年縮短到1年”……國內外社交平臺上,人們也對Sora的橫空出世展開熱烈討論,“炸裂”“史詩級”“現實不存在了”等言辭溢滿屏幕。眼下文生視頻蔚然成風,成為全球新一輪AIGC競賽的焦點。盡管Sora尚未面向公眾開放,但其帶來的顛覆性的影響卻已在路上。
-1-
Sora橫空出世,大佬們怎么看?
一位穿著時尚的女性走在東京街頭,時長將近60秒,畫面質感堪比廣告片。無論是人物臉上的雀斑,還是水中的倒影都顯得極其逼真。
讓人難以置信,這竟然是AI生成的,而且只需要輸入一段文字提示詞就可以達到這樣的效果。正如有人所總結的,如果此前的AI“文生視頻”工具是“模擬現實”,而Sora則是“構建現實”,也就是為真實世界建模。而OpenAI也沒有單純地把Sora叫做視頻模型,而是稱為“世界模擬器”。馬斯克、楊立昆、賈揚清、Jim Fan、謝賽寧、周鴻祎、李志飛等科技大佬紛紛下場評論。馬斯克在社交平臺X上留言,“人類愿賭服輸(gg humans)”。出門問問創始人李志飛感嘆:“LLM ChatGPT是虛擬思維世界的模擬器,以LLM為基礎的視頻生成模型Sora是物理世界的模擬器,物理和虛擬世界都被建模和模擬了,到底什么是現實?”前阿里巴巴副總裁,Lepton AI公司創始人賈揚清則直接評價Sora“真的非常?!?他表示“對標OpenAI的公司有一波被其他大廠fomo(害怕錯過機會而導致的收購)收購的機會”。賈揚清認為,開源大模型仍然需要一段時間才能追趕上,從算法小廠的角度來看,要么在算法上與OpenAI媲美,要么深耕垂直領域的應用,要么選擇開源;最后,基礎設施的需求將繼續猛增。在周鴻祎看來,Sora展現的不僅僅是視頻制作能力,而是大模型對真實世界有了理解和模擬之后,會帶來新的成果和突破。他認為,AGI(通用人工智能)的到來,不是10年20年的問題,可能一兩年就可以實現。有人贊美,也有人唱衰。Meta首席AI科學家楊立昆并不怎么看好Sora,他在twitter上表示,一個AI模型可以生成逼真的視頻,但并不代表這個AI可以理解世界。紐約大學助理教授謝賽寧高贊Sora是“難以置信的、將重塑視頻生成社區”,發長文分析Sora基于DiT架構、可能用到谷歌NaViT技術,推算Sora參數量約30億。多倫多大學計算機科學AI助理教授Animesh Garg說Sora像是“模型質量的飛躍,它不需要快速的工程來實現隨時間一致的RTX渲染質量生成”。英偉達高級研究科學家Jim Fan評價Sora是“視頻生成的GPT-3時刻”“數據驅動的物理引擎”,認為它通過一些去噪、梯度下降去學習復雜渲染、長鏡頭推理和語義基礎等。
-2-
Sora的出現,意味著什么?
幾個月前,不少大佬都還在談論實現AGI,需要10年甚至20年的時間。這才沒過多久,OpenAI帶來的Sora又一次顛覆人們的想象。有人說,Sora的出現是向AGI前進路上的“里程碑”,它意味著AGI正在加速到來。OpenAI也在Sora的技術文檔寫道,“我們的結果表明,視頻生成模型是有希望向構建通用物理世界模擬器邁進的路徑”。就在所有人都在為Sora驚嘆狂歡時,大量AI視頻創業者、投資人,傳統影視、廣告等行業從業人員或許正思考著新的出路。Sora問世之前,Runway、Pika、Stable Video Diffusion等大量創業公司還在百家爭鳴,Sora發布之后,這些公司瞬間黯然失色。要知道,就在Sora直接可以生成60秒既流暢又逼真的視頻時,全球最火的兩家AI視頻公司Runway和Pika還在把生成15秒的流暢視頻當夢想。這簡直是“降維打擊”。難怪有人說,ChatGPT的出現終結了那些AI文本生成的創業公司,現在輪到Sora終結AI視頻生成公司了。不過,面對Sora的沖擊,Pika創始人郭文景卻表現得很淡定。她在回應鈦媒體采訪時稱,“我們覺得這是一個很振奮人心的消息,我們已經在籌備直接沖,將直接對標Sora?!?/section>周鴻祎預言,Sora可能給廣告業、電影預告片、短視頻行業帶來巨大的顛覆。美國舊金山早期投資人Zak Kukoff預測:一個不到5人的團隊將在5年內用文生視頻模型和非工會的勞動力。制作一部票房收入超過5000萬美元的電影。這也讓一些視頻、影視、營銷從業者開始擔心自己的飯碗。有國內導演表示,Sora對電影行業的影響只是一個時間問題,它已經把畫面做到非常真實、有細節。它對廣告、宣傳片行業的沖擊可能會更快到來。未來大量的廣告和短視頻將由AI生成,對設計師、攝影師、后期制作崗位的需求會大量減少。Sora可能被應用于建模、生成游戲動畫和場景等,游戲開發者的門檻也將被大大降低。據說,連某總臺臺長都開始焦慮了。連夜把Sora發布的視頻轉發到工作群里,讓大家學習并討論,Sora可能在未來對他們所在行業的影響。Sora的出現,再次說明了贏者通吃的道理。OpenAI又一次“走自己的路讓其他人都無路可走”。在巨頭的陰影和壓力之下,AI創業者需要重新思考自己能力施展的生存和機會空間究竟在哪里。
-3-
Sora尚未開啟公測
第一波靠Sora賺錢人已經出現了
面對AI帶來的機會,總有人猴急地想要賺錢。Sora才亮相,一些嗅覺靈敏的人就看到了新的造富曙光。有人整理出了業務涉及文生視頻的A股上市公司名單。一批AIGC概念股又開始在資本市場“狂飆”。最搞笑的是,Sora還尚未開啟公測,OpenAI還沒靠Sora賺到錢,已經有人“賣課”了。據說,有人已經賣了2w多份,一天到手200萬元。有網友表示,該課程主打人群是內容創作者、廣告營銷從業者、教育工作者等。其教授的主要內容為Sora專屬詞庫、專屬提示詞教程、30個專用提示詞技巧。在文生視頻市場真正成熟之前,部分掘金者已經通過知識付費掘到了第一桶金。如今Sora又帶動了其他GPT相關知識付費課程的售賣。只是,販賣焦慮的,都是為了賺你的錢。大家還是要擦亮眼,避免被割韭菜。事實上,就單點突破來看,Sora具有里程碑意義。但從商業化角度來說,其本身價值還有待驗證。OpenAI明確表示,在模擬復雜的物理環境下,Sora會出現明顯的邏輯和因果關系推理錯誤。比如,跑步時方向搞反、人吹蠟燭火光不滅、塑料椅子會變形飄起來等。目前Sora尚未全面放開使用,想要制作出高質量的長視頻,或者電影、電視劇,肯定還有漫長的路要走。此外,在看完了Sora生成的視頻之后,在震驚之余,也不免讓人憂慮,未來Sora可能帶來的風險。
比如,造假問題。AI生成的視頻越真實,造假就越容易。由于人們在日常生活中通常不會逐幀分辨視頻真偽,以假亂真的AI視頻生成和深度偽造技術,帶來的AI欺詐案件已經越來越頻發。還有版權問題。比如,對版權的爭論的焦點之一在于,AI通過學習別的藝術家的風格在此基礎上進行的創作,和人類以同樣方式進行的創作,本質上有沒有區別?這些問題一個比一個難解決,這也意味著Sora在短時間內或許不會向公眾開放。有分析認為,此前OpenAI花了大約半年來測試其大語言模型GPT-4。如果測試Sora需要差不多的時長,可能會在8月份開放。不過,考慮到深偽技術帶給美國大選的負面影響,OpenAI估計會謹慎考慮正式公開Sora的時間。從某種角度來看,這或許是個好消息。相關創業者或從業者至少有了更多的緩沖時間,來思考如何應對Sora帶來的沖擊。