自8月31日文心一言宣布全面開放之后,百度公司(9888.HK/BIDU.O)在大模型應用上打了一個漂亮的開頭炮。數據顯示,文心一言開放首日,對話頻次就超過3342萬次,文心一言App登錄各大應用商店榜首。文心一言一役的成功,讓聚光燈再次聚焦到百度和其創始人李彥宏身上。近期,《時代》首次評選全球百大AI人物,李彥宏和馬斯克、黃仁勛、薩姆·奧特曼等一同被評為全球AI領袖,不僅僅是對他長期以來在人工智能領域的貢獻和影響力的認可,同時也代表了中國人工智能領域的實力與在國際上的影響力。但和用戶對話的文心一言App,從戰略全局來看,只是百度在大模型應用層大棋盤中的第一手棋。李彥宏在早些時候的公開講話中重點提到,百度所有的應用都值得用大模型重構一遍,這個定調有一個關鍵詞——“重構”,而非“升級”。9月13日,百度發布文心一言插件平臺“靈境矩陣”。這是百度在大模型應用層面的一次重要動作。當日,百度集團資深副總裁、百度移動生態事業群組總經理何俊杰在接受媒體采訪對中國大模型競爭做了一個階段性判斷。他認為,基礎大模型的競爭結果已趨于明顯,接下來將從“燒錢做大模型”進入“應用層之戰”。靈境矩陣,簡單來說,是百度對外輸出大模型能力的平臺,開發者可以通過該平臺低成本地使用文心大模型的能力,不需要自己從頭開始搭建大模型。對于百度來說,文心大模型相當于大腦,靈境則是大模型的手和腳,讓大模型能夠觸及到更多場景,從而不斷提升相應的能力。百度已經在一些應用上進行“重構”,最典型的是百度文庫。何俊杰告訴《財經十一人》,原有的功能就是搜索和下載,用戶停留時長非常短。大模型“重構”文庫后,現在變成了一個一站式智能文檔平臺,用戶通過文庫生成創意、編輯內容、管理,能實現做PPT、文檔、圖片、內容分析等功能。鏈路變長后,用戶留存率和付費率都有明顯增長。百度文庫之外,百度搜索、百度輸入法、百家號、百度地圖等產品都在用大模型能力“重構”。百度移動生態內部正在進行一場“賽馬”運動,讓用戶投票,哪個產品用戶量大、留存長,百度就加大“重構”的投入力度。沒有人愿意失去這個機會。但用大模型去重構一個成熟的應用,既簡單也不簡單。不僅百度,目前還沒能出現一個大模型時代的超級應用,也很難預測會是什么樣的超級應用。何俊杰認為,大模型時代會有新的類似打車、外賣、短視頻應用,一旦出現就是大模型發展的拐點。百度在盡可能的嘗試和試錯,不局限于C端和B端、自研和開放。
百度集團資深副總裁、百度移動生態事業群組(MEG)總經理何俊杰,圖片來源:百度
今年年初至今,大模型從爆發到應用,僅用了幾個月的時間。大模型的優化依賴于更多高質量的數據和場景,這意味著只有越來越多的人用起來,才能讓大模型越來越好用。多位科技行業人士告訴《財經十一人》,技術之爭和應用之爭是兩條不同的路徑,用戶會選擇“好用”的應用,而非“技術很強”的應用。技術能力一直是百度的優勢,但要在大模型應用層建立絕對優勢,則是對百度的一個新考驗。
今年3月16日,文心一言開放內測,8月底上線各大應用商店向所有人開放。多位百度人士告訴《財經十一人》,大模型是目前百度最看重的事情,為了盡快在最短時間內升級大模型“智商”,內部的重要資源都撲在這件事情上。技術范疇內的事情,進行的相對順利。大模型的算力、數據、模型算法層面,百度此前就有深厚積累,可謂按部就班。算力層面,早在2021年6月,百度就在規劃高性能GPU集群建設,且還在不斷擴充算力能力。數據層面,除了過去的自然語言數據的積累,百度還于今年4月在??诼涞亓舜竽P蛿祿俗⒒?專門用于大模型標注。模型層面,百度一直在做模型迭代,文心一言剛發布時是1.0版本,到今天文心一言已經是3.5版本,預計今年年底會更新至4.0版本。應用的重構則需要一步步探索?!敦斀浭蝗恕妨私獾?百度各業務條線在大模型重構應用方面的探索,最早在今年2月啟動。何俊杰將文心一言App定位為“人人可用的AI助手”,但所有人都清楚明白,大模型應用不能只停留在“對話”上。一個好的應用是要能滿足用戶的訴求,而訴求與場景密切關聯。例如,百度有搜索功能,但用戶想購物時,可能會去電商平臺或是內容平臺搜索相關信息;用戶想看娛樂八卦時,可能會去微博上搜。大模型的基礎功能是內容生成,非常符合辦公、學習場景的訴求。百度副總裁、互娛和垂類平臺負責人王穎介紹,事實上,從今年2月開始,她的團隊就開始思考文庫能怎么和大模型結合,3月,部分功能甚至已經開始測試。想滿足用戶訴求就要先了解用戶。王穎發現,當用戶想寫一篇文章或是做一個PPT時,會先打開網站搜索資料,閱讀資料就要花很長時間,選出可用的素材放到文檔中,還要編輯修改,這個過程會反復多次。最后還要調整格式,會涉及到不同類型的文檔要切換不同的軟件,許多用戶其實并不能熟練掌握每個辦公軟件,來精細調整格式。這些都是用戶痛點,而大模型剛好能解決這些問題。用戶只需要簡單的口令,即可快速生成相關的內容文檔。發現了用戶訴求,還需要有技術能力支持,這是一個相輔相成的過程。以生成PPT為例,看似很簡單,實際的技術細節很復雜。實際場景中,用戶通常會有兩種需求,一是用戶給主題,大模型生成PPT;二是用戶給素材,例如給一份Word文檔,要求大模型轉成PPT?!蓖醴f說。百度副總裁、互娛和垂類平臺負責人王穎,圖片來源:百度但如果要求基于文檔生成PPT的用戶是有明確預期的,既要遵從內容,還要超出原有內容,甚至能夠發現內容中的漏洞,補充相關信息,修改相關錯誤,這樣的能力就不簡單了。如果用戶給的文檔很長,大模型要先做解析、分段、切片,再理解、合并、優化,而這個還過程必須足夠快,不能卡住。何俊杰提到,文庫的重構不僅是產品形態,整個團隊都基于業務流程做了重組。原來的檢索、存檔、存儲能力需求下降,對用戶個性化需求理解,提示詞工程相關的人員數量大幅增加。一位百度人士告訴《財經十一人》,目前看來用戶對于新版文庫的反饋整體還不錯。例如,有一家公司老板要對外交流,需要做一個PPT,除了公司的基本介紹,還有一個部分是“技術會如何改變這個行業”?!邦愃七@樣的內容就很適合用文庫直接生成?!彼谀谴谓涣鲿习l現,現場沒有人發現PPT是大模型做的。在自身業務上先用上大模型,也是百度對外開放大模型能力的準備?!爸挥邢茸约河蒙狭?才能發現應用時會遇到哪些問題?!卑俣燃瘓F副總裁、百度移動生態事業群組搜索平臺負責人肖陽提到。事實上,“把藥先用在自己身上”也是大型科技公司對外教育市場的一個通用手段——對于很多企業用戶來說,大模型還是一個新物種,很多人并不知道應該怎么用好大模型,百度需要用實際的案例來向用戶展示。
大模型是一個創新技術,技術本身并不直接產生價值,落到具體的應用場景中,技術才能創造價值。對于開發者們來說,做大模型時代的應用會遇到幾個現實難題。一是大模型本身很“燒錢”,自己做大模型對于很多公司來說性價比并不高,他們更需要的是低門檻且足夠可用的大模型插件;二是流量,不少開發者都提到,無論是現有的應用或是開發一款新應用,都很難快速獲得流量;三是商業化,即使有了流量,如何更好的把流量變現,也是難題。這意味著大模型生態是一個“多邊邏輯”,底層是模型能力,再往上是用戶需求,而用戶需求是在不斷變化甚至還未被挖掘的。另外,在這些之上,還有商業化的需求,如果整個生態中沒有廣告和付費的空間,就難以持續運轉。何俊杰說,靈境矩陣就是重點幫助開發者解決這三大問題。插件是長在文心大模型上的,不需要開發者使用任何百度的其他產品,可以在不同的終端、應用上調用大模型的能力。目前大模型的硬通貨是算力,百度靈境矩陣會給首批合作開發者提供算力扶持。同時,也會有流量扶持,并開放百度移動聯盟的變現能力。目前,靈境平臺的插件類型包括數據、能力和應用三類。數據是不同類型的數據庫,能力是垂直模型能力和多模態能力,應用則是封裝好的各類應用。開發者可以根據需求選擇多個插件。例如,中國司法大數據研究院和攜程旅行在第一時間就進駐,他們在法律和旅游兩個垂直領域發布了示范性的插件?;谶@兩款插件提供的數據能力,幫助百度的兩個行業助手“法律智能助手”和“旅游智能助手”在關鍵決策場景大幅提升用戶的體驗。短視頻生產平臺井英科技通過大模型插件,實現了用AI將小說變成短劇的功能。景區信息化公司鼎游接入了AI導覽數字人插件,用戶可以通過語音或文字與AI導覽系統實時互動,獲取景區的各類信息和服務。大模型現在依然處于“燒錢”階段,如果用戶量越來越大,交互頻次越來越高,對于算力的壓力會陡增。何俊杰說,他現在完全不擔心這個問題,這是“幸福的煩惱”,百度愿意也有耐心在現階段做大規模投入。對于百度來說,開放生態更大的價值是能夠補充大模型的能力。大模型已經開始從通用大模型進化到垂直大模型,這需要多樣化的生態來參與。不同的場景能帶來不同的新數據,更多的用戶能檢驗大模型能力,讓模型增長更快。而這些場景百度很難自己做,“百度能做200個應用,但是做不出1萬個應用?!焙慰〗苷f。OpenAI的商業化一直是大模型領域重點關注的方向。今年2月,OpenAI推出付費版ChatGPT Plus,是商業化的第一步。隨后OpenAI又在其大股東微軟的各類應用中上線了大模型相關能力。今年5月,OpenAI推出插件商店,共有超過80款插件,開發者付費調用。今年8月,OpenAI推出企業版,目前還未透露具體的收費標準。大模型的應用基于兩個方向,一是解決過去很難解決的問題;二是激發出新的需求。只有解決了問題,才有機會談商業化路徑。百度的一個商業化探索路徑是廣告行業——大模型的主要能力是內容生成,再加上和用戶互動的過程中,能夠快速學習,更了解用戶。這對于廣告行業來說,能有效提升效率。在廣告場景中,“關鍵詞”是搜索引擎廣告投放的核心技術。廣告主將產品、服務與營銷策略拆解為關鍵詞,輸入系統,決定符合條件的用戶在搜索哪些詞句時,能夠看到廣告。更多的關鍵詞意味著更多的曝光與流量,也意味著更高的運維成本,因此,廣告主需要盡可能精準地找到、動態調整關鍵詞來得到精準流量,提高ROI,而這并不容易。搜索營銷系統因此添加了更多的功能、更多的層級、越來越復雜,廣告主學習和使用成本越來越高。何俊杰提到,廣告行業里一直有一個痛點,就是難以檢測投放效果,原因包括廣告目標不明確,渠道不夠合理,內容不夠創新等多種因素。大模型剛好是能解決這一問題的工具?!皩υ挕北人阉麝P鍵詞更能精準體現用戶的需求。其次,大模型可以讓廣告主快速生成海量內容,來匹配不同用戶,還能根據用戶反饋實時優化。百度集團副總裁、移動生態商業體系負責人王鳳陽提到,他的團隊不斷根據客戶需求去豐富功能?!?投放系統)繁雜到一定程度,客戶記不住操作方式,我們就簡化;簡化到一定程度,滿足不了客戶,又開始變繁雜。過去20年,數字廣告平臺一直在重復這個過程?!?/section>為了解決這些問題,百度營銷推出AI營銷平臺“輕舸”。輕舸以文心大模型為基礎,界面左側是類似于文心一言的對話頁,右側是方案預覽區。廣告主無需提煉關鍵詞,可以使用自然語言表明投放需求。例如,“幫我把廣告投放給想學IT找工作的年輕人”,輕舸會自動選中人群,并生成相關創意,以此提高投放效率——輕舸內測期間,IT教育集團達內的轉化量提升23.3%,廣告ROI提升 22.7%;百度服務商品眾創新日均轉化新增32.4%,成本同比降低20.2%。除了廣告,商業化的另一條路徑是C端付費。目前百度文庫的發展方向就是基于C端收費,何俊杰也提到,文心一言App未來也會有用戶付費的空間,但核心還是在于是否能把握用戶的核心需求。多位業內人士提到,大模型會改變很多應用的商業模式,最典型的就是搜索。傳統的搜索場景中,用戶搜索關鍵詞會出來很多相關內容,廣告也得以展示。大模型時代的搜索,內容會更精準,也會限制廣告的出現。一位百度人士提到,“目前還沒有明顯影響,但未來搜索的商業模式一定會改變?!?/section>肖陽認為,搜索技術和大模型是能結合起來發揮更大價值的,并非“顛覆”。大模型技術能更好地滿足用戶的搜索需求,搜索價值提升后,商業化的空間會更大。
百度集團副總裁、百度移動生態事業群組搜索平臺負責人肖陽表示,大模型和搜索技術結合,能解決更多問題,圖片來源:百度
大模型究竟能解決什么問題,帶來怎樣的新商業機會,現在還很難看清楚。大模型或許能帶來比移動互聯網更大的產業浪潮,但在此之前,還需要更多的挖掘和試錯。做好技術系統,探索應用“重構”,找到商業化路徑,百度已經大模型時代走上了一條屬于自己的道路上。“不要溫和地走進那良夜”。在聯盟大會的現場,何俊杰提到《星際穿越》里的這句臺詞。這代表百度的態度,對于整個大模型時代的創業者來說,或許也是如此——持續往前走,即是進化。