2009 年 4 月,硅谷創業教父保羅·格雷厄姆(Paul Graham)撰文記錄了五位對自己影響最大的創業者。他將時年 24 歲的山姆·阿爾特曼(Sam Altman)與蘋果、Google 的創始人們并列?!拜o導創業公司的時候,提到設計問題,我會問 ‘史蒂夫(喬布斯)會怎么做?’ 但關于戰略或者野心,我會問 ‘山姆會怎么做?’”
阿爾特曼當時只創辦過一家公司——Loopt,一個沒能建立網絡效應的社交網絡公司。之后十幾年,他在硅谷創業圈的人氣隨著格雷厄姆的孵化器 YC 一同壯大。但直到 OpenAI,更具體來說,從去年 11 月 OpenAI 發布 ChatGPT 至今的這一年,全世界才第一次見證了他的野心以及與之匹配的戰略能力。
11 月 6 日,OpenAI 舉辦了成立以來的第一場開發者活動。在類似早年蘋果發布會的小會場里,阿爾特曼沒有提及太多新技術,更像是過去一年的發展總結,全面展示了 OpenAI 大模型上的技術實力。
過去一年,ChatGPT 從一個只能處理文字信息的網頁端應用,變成了一個可以同時處理文字、語音、圖像信息的 App,吸引上億人每周使用。
OpenAI 從一個研究機構變成了估值 900 億美元的超級創業公司,聚攏了 200 萬開發者用它的技術開發各種應用。
世界也因為 ChatGPT 掀起的浪潮發生改變。根據柯林斯詞典統計,人們在 2023 年提及 “AI” 的次數,是去年的四倍。紅杉資本稱,他們的收件箱被 “AI Salesforce”“AI Adobe”“AI Instagram” 等各種創業想法填滿,整個科技行業陷入到了人才爭奪和采購 GPU 狂潮中。
在中國,幾乎每個大點的互聯網或科技公司都要研發大模型。已經退休的互聯網公司高管、賣掉公司已經開啟新創業的創業者,以及有技術積累的年輕學者看到 ChatGPT 后迅速采取行動,要擁抱大模型時代。過去一年,中國誕生了多家獨角獸公司,以及近百個大模型。
經歷過互聯網公司的大膨脹和反壟斷之后,全球政府對這次 AI 浪潮都保持警覺。過去一年,歐盟、中國和美國都以前所未有的速度推動針對人工智能的監管。
整個行業和 OpenAI 的距離,在快速縮短也在拉大 去年 ChatGPT 剛發布時,它只是一個處理信息比較有限的聊天機器人,輸入文字或代碼組成的句子,反饋文字和代碼。憑借著它背后吞掉海量數據、靠著大學生們反復調教的大模型,ChatGPT 超越了以往所有的聊天機器人。用戶拋來的各種各樣的問題,它大多能給出媲美人類的回復。 盡管有時候會胡說八道(行業內一般稱之為 “幻覺”),但憑借著一次次令人驚訝的回復,讓人們見識到了人工智能向萬能的通用助手靠近是什么情況。 今年 9 月,ChatGPT 根據病情描述和檢查報告結果,幫助一位母親給她的孩子找到了病因——新生兒發病率最高只有 0.025% 的脊髓栓系綜合征(TCS),再次刷新了人們對 ChatGPT 能力的認知。在 ChatGPT 給出結果前,這個母親已經帶著孩子求醫三年,找了 17 個醫生,都沒有診斷出真正的病因。 一年時間,ChatGPT 背后的大語言模型從 GPT 3.5 進化到 GPT-4。它能處理的不再只是代碼、文字,還能處理各種文件,自動調用 Python 代碼把繁雜的數據變成圖表;處理一本長達 300 頁的小說,并用其中的信息回答問題。而且出現幻覺的情況減少了。 9 月份,OpenAI 向付費用戶開放 GPT-4 Vision(GPT-4V),能把圖像當做一種信息處理,理解圖片中的內容,并對提問給出回復。 “大模型時代的黎明?!?微軟的研究人員今年 10 月在一篇長達 166 頁的報告中提出,“GPT-4V 在處理任意交錯的多模態(文字、圖像)信息方面具有前所未有的能力,是當今最強大的多模態通用人工智能系統?!?/p> 自動駕駛公司圖森中國 CTO 王乃巖測試了 GPT-4V 在自動駕駛場景中的應用。他給了 GPT-4V 7 張真實駕駛環境中的圖片,讓它給出駕駛建議,多數情況得到了安全的回復?!斑m當的提示詞應當可以完全發揮出 GPT-4V 的實力?!?他認為,盡管存在 “幻覺” 問題,“合理使用這樣的大模型可以大大加快 L4 乃至 L5 自動駕駛的發展?!?/p> OpenAI 成立之初是一個開放的研究機構,它在 2020 年發布 GPT-3 時詳細公開了技術細節。ChatGPT 點燃人工智能市場后,GPT-3 降低了整個行業追趕的難度。 與 GPT-3.5 同等水平的 Meta Llama 2 在今年 7 月發布。Meta 將其開源,并允許商用。整個行業一夜之間來到了一個新的起點。今年 10 月,中國一批研發大模型的公司,比如科大訊飛、阿里巴巴、騰訊都在不同場合宣布自研的大模型(中文)能力達到了 GPT-3.5 的水平。 還有一些公司宣稱在一些能力上追上了 GPT-4,比如 Google 的 PaLM 2、OpenAI 最大競爭對手 Anthropic 的 Claude 2,以及百度的文心大模型 4.0。 在一些特定的功能上,追趕者甚至比 OpenAI 做的更突出。今年 5 月,Anthropic 發布了大模型 Claude-100k,把大模型處理文本的長度擴充到了 100k,在當時 GPT-4 最多處理 32k 文本的情況下,開辟了大模型處理更長文本的研究方向。處理更長的文本可以把大模型用到更多的場景中,比如金融、法律等。 中國大模型創業公司圍繞文本長度競賽。今年 10 月,清華大學助理教授楊植麟創辦的月之暗面宣布其大模型可以處理 20 萬字。緊跟著王小川創辦的百川智能宣稱能處理 35 萬字(192k)。本周,李開復牽頭創辦的零一萬物宣城可以處理 40 萬字(200k)。直到今天 OpenAI 發布 GPT-4 Turbo,ChatGPT 處理的文本長度才到 128k。 但目前沒有哪個大模型在理解圖片、視頻時,能與 GPT-4V 相比。追趕者面前也沒有明確的實現路徑,因為 ChatGPT 成功后,OpenAI 開放的信息越來越少。GPT-4 不但不開源,甚至連數據來源、參數規模都不再公開。 “我們知道大的方向是做多模態大模型,但具體要怎么做?用什么樣的算法做?還不算特別清楚?!?一位中國頭部互聯網公司的大模型開發者說。 今年 5 月,Google 宣布已經開始研發多模態大模型 Gemini。一些大模型從業者在接受媒體采訪時提出,YouTube 擁有互聯網上最大、最豐富的圖像、音頻和字幕(文本)數據,是 Google 研發多模態大模型的 “王牌”。不過 Google 到現在也沒有發布 Gemini 。 而且 OpenAI 的實際進展可能比已經公開的更顯著。根據 OpenAI 公布的技術報告,GPT-4、包括 9 月發布的 GPT-4V,在 2022 年就完成訓練。山姆·阿爾特曼在 10 月初的一場活動上說,OpenAI 已經啟動 GPT-5、GPT-6 的訓練,會繼續沿著多模態方向更進一步,不只是多模態輸入,還會做多模態輸出,提升模型的可靠性,開發個性化的大模型。 ChatGPT 正在變成超級應用,但大模型的成本問題還沒解決 OpenAI 成立八年,至少試過 6 種不同的技術產品,從機器手到 AI 游戲機器人,以尋找 AI 普及的突破口。在 ChatGPT 火了之后,成為了 OpenAI 大多數技術產品的載體。過去一年,OpenAI 圍繞著它全力投入,不斷把過去多年研發的技術投入其中。 剛發布時,ChatGPT 不過是一個臨時的產品,只能通過網頁使用?,F在 OpenAI 開發了一個界面直觀、交互簡單的手機應用,一步步增加功能,把它變成一個超級應用: 5 月,上線 iOS 應用;增加聯網等插件功能,以增強 ChatGPT 的能力。比如用搜索引擎等工具,彌補 ChatGPT 模型學習的知識截至 2021 年 9 月的短板。 7 月,上線 “代碼解釋器” 功能,付費用戶可以調用它分析各種繁雜的數據,并生成圖片等。 8 月,上線 “提示詞示例” 功能,支持用戶上傳多個文件發起提問。 9 月,增加文生圖功能 DALL-E3,用戶輸入文字就可以自動生成符合要求的圖片;增加聽、說的功能,用戶可以直接用語音與 ChatGPT 交流;增加圖片輸入功能,ChatGPT 可以理解用戶輸入的圖片,并回答問題;付費用戶可以免費邀請新用戶體驗 GPT-4。 10 月,支持用戶上傳 PDF 等各種格式的文件,在一個對話中可以自動切換不同插件解決問題。 11 月,分析用戶提出的問題,自動調用最合適的插件回答;學習的知識更新到今年 4 月。 在這個思路下,一眾給 ChatGPT 做外殼,改善用戶體驗的產品已無活路。阿爾特曼在 10 月初的一場活動中說,“做一個 UI 更好的 ChatGPT,并不是一個好主意?!?/p> 一年時間,ChatGPT 從一個網頁變成了每周有 1 億人使用的產品。用戶數量超過 ChatGPT 的互聯網生產力工具寥寥無幾。第一年能到如此規模的互聯網服務,在這之前也只有 TikTok。 阿爾特曼將自己在 YC 時期教創業者的增長方法論用于 ChatGPT。他快速迭代產品,要讓 ChatGPT 留住最廣泛的用戶?;ヂ摼W創業的經驗是,只有用一個入口抓住最多用戶才有機會建立平臺經濟,獲得無限收入。ChatGPT 就是目前最大的 AI 入口。 構建入口的過程里,OpenAI 與最大投資方微軟直接沖突。 今年 2 月,微軟上線 New Bing,讓用戶在使用 Bing 搜索時調用 ChatGPT。但三個月后,OpenAI 上線插件,讓用戶在 ChatGPT 提問時能調用搜索引擎。都是 GPT 大模型與 Bing 搜索的組合,但入口不同決定了用戶歸屬哪家公司。ChatGPT 手機應用吸引到大批用戶的同時,Bing 搜索在全球搜索引擎市場的份額跌回了 2018 年水平。 今天的開發者活動中,OpenAI 推出了 GPTs 功能。根據阿爾特曼的演示,用戶只需要輸入要求、上傳特定的數據文件等,就可以借助 ChatGPT 做出來一個定制版本的 ChatGPT,全程不用任何代碼。 OpenAI 還計劃上線一個 GPT Store,讓用戶上傳 / 下載各種定制的定制版 GPT,就像蘋果為手機應用開發了 App Store 那樣。一個 AI 時代的平臺產品野心完全公開。 除了 ChatGPT 快速壯大,還沒有哪家公司或創業者靠著大模型挑戰一個行業既定的商業規則。原本已經有用戶或建立付費商業模式的大公司,比如微軟 Office、Salesforce、Adobe 等,都在將大模型融入到成熟的產品中,讓用戶每個月多交 10-20 美元。 還有一些公司寄希望于用大模型給萎靡的創新業務找到新故事。最典型的例子就是 Meta,今年 9 月發布了一款搭載人工智能助手的硬件產品 Meta Smart Glasses。 “去年人工智能突破前,我認為只有引入更強的屏幕、全息影像這些技術,智能眼鏡才會無處不在?!盡eta CEO 馬克·扎克伯格(Mark Zuckerberg)說?!艾F在,我認為人工智能技術對于智能眼鏡的普及和其他 AR 技術一樣重要?!?/p> 本身有云計算業務的大公司進入大模型市場,主要還是賣資源。比如微軟、Google、亞馬遜、阿里巴巴、騰訊等,它們都會投資大模型公司,將其作為平臺上的大模型 API 對外出售。它們也會訓練一個大模型,但主要作為獲客手段,吸引客戶利用它們的云計算資源訓練、部署大模型。 至少目前為止,大公司對 AI 大模型的投資額遠超過風險資本。 在 OpenAI 與微軟之外,Anthropic 先后拿了 Google、亞馬遜的投資;李開復的創業公司拿了阿里云的投資;智譜拿了騰訊、阿里的投資等。 過去一年,一批創業公司開始探索大模型的具體應用。比如用大模型做各種虛擬角色的 Character.AI、做個人超級助理的 Inflection AI、虛擬英語教師 Speak、用大模型做營銷方案的 Jasper、人工智能法律助手 Harvey。 不管是大公司做產品,還是小公司創業做 AI 應用,當前面臨的最大問題都是大模型使用成本太高。微軟的基于 GPT-4 開發的編程助手 GitHub Copilot 吸引了超過 100 萬付費用戶,但使用算力太多,最后導致平均每個用戶虧損 20 美元。 大模型與其他軟件應用不同,不僅訓練起來費錢,運行起來更燒錢。大模型想要處理用戶輸入問題,基本上每個字都要跑一遍大模型。參數上千億的大模型,每次跑一遍都要調用多個 A100 GPU,每個價值 1 萬美元。比如大模型想要處理 100 個字的問題,就要運行 100 遍大模型。給出回復時,類似的情況還要再來一遍,成本更高。 為了吸引開發者進入自己的平臺,OpenAI 今天大幅降低開發者使用 GPT-3.5 和 GPT-4 的成本。 GPT-3.5 是當前最便宜的大模型,用它處理一個 500 字的問題,并給出 500 字的回復,價格大概是 0.003 美元,約等于人民幣 0.022 元——一個看上去微不足道的數字,但如果每天處理 1000 萬條,這個數字就會抬升到 22 萬元,相當于一年 8000 多萬。如果換成 GPT-4,一年成本就會超過 10 億元。 行業技術水平快速提升后,一些原本計劃與 OpenAI 合作的公司轉向開源。Salesforce 曾計劃以 GPT-4 改造自己龐大的企業服務業務,現在已經開始自己研發大模型或使用開源大模型替代 GPT-4,以降低成本。它的一位高級副總裁說,“隨著人工智能產品達到更大的規模,我們開始關注成本效益,成本只會變得更加重要?!?/p> 中國想用大模型改造業務的公司類似,他們雖然研發出了千億參數的大模型,但在具體應用中,大多使用參數只有數十億參數或者百億參數的模型,也因此影響了最終效果。 OpenAI 等公司也在持續調整大模型算法降低大模型的運行成本,但最終繞不開的是英偉達的 “稅”。根據咨詢機構 The Information Network 總裁羅伯特·卡斯特拉諾(Robert Castellano)等人的報告,英偉達以不到 4000 美元的成本向臺積電、SK 海力士采購關鍵元件、造出 H100 芯片,然后以 40000 美元的單價售出,毛利率超過 90%。 現在整個大模型行業大致找到了兩個解決辦法。一種是科技巨頭自己下場研發芯片,比如 Google、亞馬遜、微軟,甚至 OpenAI 都在考慮針對 AI 運算自研芯片。 另一種則是讓消費者買更適合大模型計算的手機和電腦,分擔算力成本。高通、蘋果近期發布新款筆記本電腦芯片時,都會強調可以運行百億參數的大模型,并創造了一個新的名詞:AI PC。 過去一年,從 AI 熱里收益最多的不是 OpenAI 根據麥肯錫今年 4 月發起的調研報告,40% 的公司因為生成式人工智能出現,決定加大對人工智能投資。高盛在 8 月預測,全球的企業今年朝人工智能領域投資 1102 億美元,比去年增長 20%。 據媒體報道,靠著 ChatGPT,OpenAI 的年收入達到了 13 億美元,是它去年收入的 43 倍,超過了商湯。OpenAI 第一次證明,不用做短視頻鼓勵娛樂至死,也不用像商湯那樣做安防 “集成商”,一家公司單憑先進的人工智能技術也可以獲得可觀收入。 同時,OpenAI 的估值也從去年 10 月的不到 200 億美元增長到了近 900 億美元,成為全球第三大獨角獸,僅次于字節跳動和造火箭的 SpaceX。 不過 OpenAI 不是最大的受益者。資本市場現在更相信科技巨頭在 AI 里的潛力。 它們掌握著人工智能領域必不可少的數據、算力、使用場景,以及客戶群體。相比著 OpenAI 領先的大模型技術,這些基礎設施一樣的資源,要比技術本身更稀缺。 “護城河在于客戶,而不是數據?!?紅杉資本在今年 9 月發布的生成式人工智能報告中寫道,他們之前認為,最好的生成式人工智能公司可以憑借數據建立領先優勢,但后來發現并不穩固:“生成式人工智能應用產生的數據,并沒有創造出不可逾越的護城河,而工作流程、用戶網絡,正在創造更持久的競爭優勢?!?/p> 自去年 ChatGPT 發布到現在,標普 500 只漲了 10%,微軟的股價增長近 50%,市值增加了 7400 多億美元。它給 OpenAI 投資 100 億美元,已經約等于不用花錢。 一開始被認為可能遭受巨大沖擊的 Google,市值增加了 3200 多億美元;靠著開源大模型追上來的 Meta,市值增加了近 5000 億美元。 當然也少不了英偉達,憑借著對 GPU 壟斷的市場地位,過去一年其市值增加了 7100 多億美元,成為了芯片行業第一家市值萬億美元的公司。一年前,它還在為顯卡滯銷發愁,不得不降價促銷。 中國大模型行業聲量最大的百度、科大訊飛,一年來市值分別增加了 27 億美元和 45 億美元。而作為上一代人工智能公司的代表,商湯雖然也發布了大模型,但股價這一年下跌超 16%。 在人工智能投資方面,中國與美國是全球投入最多的兩個國家。根據斯坦福大學統計的數據,在 2019 年之前,中美之間人工智能投資差別不算太大,而到了 2020 年、2021 年,美國對人工智能領域投資已經從原本超中國 70%,變成了是中國的 2.7 倍、3.1 倍。 這兩年正值 OpenAI 發布 GPT-3,證明了更大的模型可以有更好效果,并堅定追加投入,去研發 ChatGPT。不過在 2022 年,全球對人工智能的信心都減少了,整體投資額相比上一年明顯減少。 過去一年,隨著 ChatGPT 發布,全球加大人工智能領域投入,中美在人工智能領域投資的差距再次縮小,但能多大程度上彌合技術差距,還是一個未知數。 對大模型監管的不同態度,對話語權的爭奪 2021 年,歐盟已經提出監管人工智能的框架,但沒有推進下去。畢竟那時的人工智能還不算過時的浪潮。 ChatGPT 發布后,全世界的人工智能立法都加速了。歐盟的主要立法機構歐洲議會在 6 月投票通過了提出兩年的《人工智能法案》(A.I. Act)草案,嚴格限定了人工智能技術的使用場景和范圍,要求 ChatGPT 等生成式人工智能,需要披露哪些內容是人工智能生成的,需要設計模型防止生成有害內容,需要披露訓練模型時用了哪些有版權的數據等。 中國在今年 4 月發布《生成式人工智能服務管理辦法(征求意見稿)》,8 月正式實施,要求每一個在中國境內提供服務的大模型,都要報告訓練數據,經過有關部門備案和安全評估后,才能公開提供服務。目前有 10 多家大模型公司通過備案。 上個月,美國總統拜登(Joe Biden)簽署通過關于人工智能的監管法令。根據白宮發布的情況說明,美國把監管重心放在了下一代大模型上,要求大型 AI 公司開發對 “國家安全、國家經濟安全等構成嚴重風險” 的大模型時要通知政府。 顛覆性的新技術與監管政策常常對立,逐漸在沖突中找到平衡?;ヂ摼W誕生之初,加密傳輸數據曾被認為會保護恐怖主義,連瀏覽器在不同國家都要用不同級別的加密技術。網約車在全球各地都經歷過違規時期,加密貨幣至今還在灰色地帶。 人工智能是少數主動擁抱監管的新興行業。ChatGPT 發布半年后,阿爾特曼就坐到了美國參議院聽證會的證人席上,呼吁議員們監管人工智能:“如果這項技術出了問題,后果可能會非常嚴重?!?現場的一名議員聽到阿爾特曼的發言后說:“很少有公司在國會面前說,請監管我們?!?/p> 5 月底,非營利組織 Center for AI Safety 發布了一篇公開信,呼吁政府機構應該把 “減輕人工智能帶來的滅絕風險” 當作優先事項,像對待流行病和核戰爭那樣慎重。OpenAI 的高管們、Google DeepMind 的負責人戴米斯·哈薩比斯(Demis Hassabis)、Anthropic 的 CEO 達里奧·阿莫迪(Dario Amodei)都在名單上。他們羅列了一些大模型可能用于作惡的證據,比如助長虛假信息傳播等、可以幫助制造毒藥。 反對 AI 強監管的聲音同樣強大,最主要的代表是 Meta 人工智能項目負責人楊立昆(Yann LeCun)、風投 a16z 合伙人馬克·安德森(Marc Andreessen)、斯坦福大學計算機系教授吳恩達等人。吳恩達近期與楊立昆等人共同簽署了一封呼吁人工智能開放的公開信。他們和開源運動的積極支持者們都相信,當技術向所有人徹底開放,就能化解危險。 安德森在一篇文章中稱,尋求嚴格監管的 CEO 與從禁酒令中獲益的私酒販子沒什么區別,“形成監管壁壘,建立政府支持的人工智能供應商聯盟,他們會免受創業公司和開源競爭的影響,就能賺更多錢”。 嚴格的監管后,新進入者、小公司往往難以負擔合規成本。銀行、能源、煙草等行業轉向強監管后都沒什么新公司。原本領先的公司因此受益。 在今年 5 月的美國國會聽證會上,一位參議員質疑:“少數幾家公司控制、影響著所有人的生活”,會不會有危險? 阿爾特曼承認,最終只有少數公司能制造強大的模型,這有利有弊,因為 “你們需要盯著的公司也少了”。 題圖來源:視覺中國
本文由 貴州做網站公司 整理發布,部分圖文來源于互聯網,如有侵權,請聯系我們刪除,謝謝!
c語言中正確的字符常量是用一對單引號將一個字符括起表示合法的字符常量。例如‘a’。數值包括整型、浮點型。整型可用十進制,八進制,十六進制。八進制前面要加0,后面...
2022年天津專場考試原定于3月19日舉行,受疫情影響確定延期,但目前延期后的考試時間推遲。 符合報名條件的考生,須在規定時間登錄招考資訊網(www.zha...
:喜歡聽,樂意看。指很受歡迎?!巴卣官Y料”喜聞樂見:[ xǐ wén lè jiàn ]詳細解釋1. 【解釋】:喜歡聽,樂意看。指很受歡迎。2. 【示例】:這是...
在一個夏天的下午,我看到了上海的黎明。在中潭陶瓷公司的院子里,三輛貨車正在加緊裝貨,準備連夜將一批陶壇送往茅臺鎮。負責裝車的司機都是在這條運輸線上來回跑了幾年甚至20年的師傅,但當被問及這些陶壇的具體去向時,他們只回答“剛來這里,不了解?!迸俑鶈柕椎脑?,一個好脾氣的司機會暗地告訴你:“茅臺鎮的一個小酒廠”。在這里,每批貨物的流向都是商業秘密——尤其是當買家是大酒廠的時候。土陶小鎮中坦陶瓷位于“中國...
建設銀行信用卡積分多少錢一分?持卡人使用龍卡信用卡,每消費人民幣1元積1分(按交易金額四舍五入取整);每消費美元1元積7分;持歐洲旅行卡消費1歐元積9分。持上海大眾龍卡每消費人民幣166元(或等值外幣)積1分(按1分的整數倍累計)。積分計算日期為該筆消費的銀行記賬日。另外東航龍卡,南航龍卡,深航龍卡,國航龍卡等航空聯名卡的消費積分每月自動轉至航空會員賬戶或轉換為航空里程。如需查詢可登錄相應航空公司...
定向增發股票價格怎么定的?按照規定,定向增發股票的發行價格一般是發行前某一階段的平均價的某一比例。一般情況下,定向增發股票的發行價格是不低于定價基準日前二十個交易日股票均價的90%。比如個股定向增發前二十個交易日的均價為100元,那么定增股票的發行價格應該是在90元到100元之間的。另外根據國家相關規定,定向增發發行價格根據發行對象不同定價也可以不同:控股股東、實際控制人、戰略投資者或認購者將成為...