每日經(jīng)濟(jì)新聞 2024-12-14 14:03:13
◎ 本周,AI界展開“軍備賽”,OpenAI、谷歌和馬斯克旗下xAI等科技巨頭相繼發(fā)布重磅AI產(chǎn)品,引發(fā)業(yè)界關(guān)注。這些創(chuàng)新涵蓋了AI視頻生成、多模態(tài)輸出和屏幕共享等多個領(lǐng)域。在第七天的活動上,OpenAI還故意放了個AGI(通用人工智能)的“彩蛋”。隨著AI大廠之間的競爭日趨白熱化,2025年AI的發(fā)展將呈現(xiàn)什么新的趨勢呢?《每日經(jīng)濟(jì)新聞》記者采訪復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院副教授鄭驍慶進(jìn)行解讀。
每經(jīng)記者 鄭雨航 每經(jīng)實(shí)習(xí)記者 宋欣悅 岳楚鵬 每經(jīng)編輯 蘭素英
本周,一場激烈的“軍備競賽”在AI界上演。
OpenAI自12月5日開啟的12天特別活動已經(jīng)過去了一半,期間發(fā)布了不少驚喜,包括期待已久的AI視頻生成模型Sora、解鎖高級視頻對話和屏幕共享的ChatGPT,以及ChatGPT接入蘋果“全家桶”,賺足了外界的眼球。在第七天的活動上,OpenAI還故意放了個“彩蛋”:一個項(xiàng)目標(biāo)注著“AGI(即通用人工智能,請勿現(xiàn)場演示)”,吸引了大量關(guān)注。
科技巨頭谷歌、馬斯克旗下xAI自然不會坐以待斃,也競相發(fā)布新產(chǎn)品。尤其是谷歌新推出的人工智能大模型Gemini 2.0 Flash,除了能生成文字外,還能直接生成圖片和語音,而且延遲還特別低。
在一系列新品的“轟炸”之下,用戶也是激動不已,紛紛涌入各大平臺,希望搶得一手體驗(yàn)。哪知道,ChatGPT、Sora,以及Meta的一系列產(chǎn)品卻在本周出現(xiàn)了全球范圍的宕機(jī),持續(xù)了數(shù)小時,讓用戶叫苦不迭。但OpenAI和Meta都沒有詳細(xì)說明服務(wù)中斷的原因,但據(jù)猜測,這與算力和服務(wù)器的需求激增有關(guān)。有行業(yè)人士介紹,在大模型時代,算力需求每2個月就要翻倍。
隨著AI大廠之間的競爭日趨白熱化,2025年AI的發(fā)展將呈現(xiàn)什么新的趨勢呢?復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院副教授鄭驍慶在接受《每日經(jīng)濟(jì)新聞》采訪時表示,“個性化”將是關(guān)鍵詞之一。
借著12天12場的新品活動,OpenAI在科技界掀起了一場前所未有的波瀾。xAI和谷歌自然也不會缺席這場盛宴,也相繼發(fā)布新產(chǎn)品,在這場年末狂歡中刷了一波存在感。
圖片來源:每經(jīng)制圖
截至目前,OpenAI的這場圣誕特別活動已經(jīng)過去一半,期間發(fā)布的產(chǎn)品不乏重磅之作,例如被OpenAI稱為“今年最重要的AI功能之一”的Projects In ChatGPT、等了300天才上線的視頻生成模型Sora 和“裝上眼睛”的ChatGPT。
Sora與今年2月發(fā)布的預(yù)覽版相比,則增加了文本生成視頻、動畫圖像和混合視頻等功能。用戶可生成分辨率高達(dá)1080p、時長最長為20秒的視頻。此外,用戶還可以導(dǎo)入自己的素材,用于擴(kuò)展、重新混合或融合內(nèi)容,甚至直接從文本生成全新的視頻。
知名數(shù)碼科技博主馬克·布朗利(Marques Brownlee)表示,Sora在風(fēng)景鏡頭處理方面表現(xiàn)出色,能生成媲美專業(yè)素材的無人機(jī)航拍鏡頭。然而,這款產(chǎn)品仍存在一些局限性。比如,在物理模擬方面,模型對物體運(yùn)動的理解還不夠深入,常常出現(xiàn)動作不自然、物體突然消失等問題。
ChatGPT的高級語音(Advanced Voice)模式也無疑是一大“王炸”,不僅支持實(shí)時視頻通話,還能實(shí)時共享屏幕和上傳圖像。這一技術(shù)迭代使得ChatGPT不僅能聽會說,還解鎖了視覺能力,通過攝像頭睜眼“看”世界,可以說“人味”十足。
在強(qiáng)化AI視覺理解能力方面取得進(jìn)展的還有谷歌。在ChatGPT高級語音模式發(fā)布的前一天,多次在新品發(fā)布上遭遇OpenAI狙擊的谷歌也“放了大招”,官宣了新模型Gemini 2.0系列的“先頭兵”——Gemini 2.0 Flash。憑借強(qiáng)大的多模態(tài)輸出功能和良好的用戶體驗(yàn),Gemini 2.0總算是給谷歌扳回了一局。
有科技博主體驗(yàn)后直接驚呼:這絕對是世界上首個真正把語音 + 視覺全模態(tài)能力做到實(shí)時、無卡頓感交互的AI模型。
面對競爭對手的強(qiáng)勁勢頭,OpenAI在接下來的活動中還將釋放什么驚喜呢?
在第七天(12月14日)的發(fā)布會上,OpenAI埋了個“彩蛋”:一個項(xiàng)目標(biāo)注著“AGI(請勿現(xiàn)場演示)”,吸引了大量關(guān)注。此外,在用于演示的iPhone上,還似乎設(shè)置了一個名為“超級秘密AGI”的日歷活動,進(jìn)一步增添了神秘色彩。
而在11日,OpenAI研究人員卡琳娜·阮(Karina Nguyen)在社交平臺上發(fā)布帖子時附上了一張新功能展示界面截圖,界面上出現(xiàn)了一個陌生的名字——ChatGPT ε。網(wǎng)友猜測,這極可能就是之前被傳出的下一代模型“獵戶座”(Orion)。網(wǎng)友還給出了“充分”的理由:天文學(xué)中,獵戶座腰帶上的中心恒星Anilam,用巴耶命名法表示正是獵戶座ε。
圖片來源:Reddit
新產(chǎn)品發(fā)布如火如荼,渴望搶先體驗(yàn)的用戶也躍躍欲試。然而,讓人意想不到的是,OpenAI和Meta旗下產(chǎn)品卻出現(xiàn)了全球范圍的服務(wù)中斷。
當(dāng)?shù)貢r間12月11日下午3點(diǎn)左右,ChatGPT、Sora及API開始出現(xiàn)中斷。15分鐘后,OpenAI在X平臺上致歉。直到晚上9點(diǎn),OpenAI才宣布基本恢復(fù)了服務(wù)。
圖片來源:X平臺截圖
中斷期間,一些用戶不停發(fā)出抱怨之聲,稱OpenAI嚴(yán)重耽誤了他們的工作了。有用戶不無調(diào)侃地表示:“ChatGPT宕機(jī)了,我現(xiàn)在不得不像個山頂洞人一樣備戰(zhàn)期末考試。”
而在ChatGPT和Sora宕機(jī)前約6小時,Meta旗下多個產(chǎn)品也出現(xiàn)“宕機(jī)”。上午10點(diǎn),中斷數(shù)據(jù)追蹤網(wǎng)站Downdector報告的Facebook中斷數(shù)量激增至超過九萬七千份,Instagram的中斷報告數(shù)量激增至六萬七千份以上,其他Meta產(chǎn)品也出現(xiàn)了不同程度上的中斷。數(shù)小時后,問題得以解決。
圖片來源:X平臺截圖
OpenAI和Meta都沒有詳細(xì)說明服務(wù)中斷的原因,但有人猜測與算力和服務(wù)器的需求激增有關(guān)。
本周早些時候,Sora 一經(jīng)開放便吸引了大量用戶,導(dǎo)致服務(wù)器一度被“擠爆”。許多注冊用戶無法生成視頻,并收到一條消息,稱“OpenAI的服務(wù)器已滿負(fù)荷”。
算力資源的不足在AI領(lǐng)域已經(jīng)不是什么新鮮話題。有行業(yè)人士介紹,在“深度學(xué)習(xí)”時代之前,算力需求每24個月翻倍;在“深度學(xué)習(xí)”時代,算力需求每3至4個月翻倍;在大模型時代,算力需求每2個月就要翻倍。
目前,算力需求和算力基礎(chǔ)設(shè)施存在供需缺口。上個月,阿爾特曼就曾透露,由于計(jì)算能力的明顯短缺,GPT-5的發(fā)布將被推遲至明年。
隨著AI大廠之間的競爭日趨白熱化,2025年AI的發(fā)展將呈現(xiàn)什么新的趨勢呢?
復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院副教授鄭驍慶在接受《每日經(jīng)濟(jì)新聞》記者采訪時表示,“個性化”將是2025年AI發(fā)展的關(guān)鍵詞之一。
他對記者補(bǔ)充稱,要實(shí)現(xiàn)個性化和數(shù)據(jù)隱私之間的平衡,云+端的協(xié)作模式將成AI發(fā)展的趨勢。如果所有數(shù)據(jù)都在云端,會消耗大量算力。未來,需要快速響應(yīng)的、涉及個人隱私的數(shù)據(jù)可能會在端側(cè)(如PC、智能手機(jī)),而需要更強(qiáng)計(jì)算能力才能解決的復(fù)雜問題,會上傳至云端進(jìn)行計(jì)算。
美國硅谷風(fēng)險投資公司a16z近期綜合公司50位合伙人洞察而發(fā)布的“Big Ideas in Tech for 2025”報告也對明年AI領(lǐng)域的發(fā)展進(jìn)行了展望。
Justine Moore表示,AI將成為你的“第二大腦”。借助大語言模型(LLMs),每天產(chǎn)生的大量數(shù)字信息可以被整合為一個“數(shù)字大腦”。在未來,AI將成為一個無限記憶庫,記錄我們的想法,提供建議,指導(dǎo)個人成長。AI可以整理總結(jié)信息,生成數(shù)字日記,幫助我們進(jìn)行更明智的決策。
而James da Costa提到,2025年,每個白領(lǐng)都將有一個AI助手幫助處理繁瑣任務(wù),讓人們專注于更具創(chuàng)造性或戰(zhàn)略性的工作。未來,某些角色可能幾乎完全由AI agents(智能體)自動化完成。
Sarah Wang認(rèn)為,2025年將是AI原生應(yīng)用層崛起的一年。在大多領(lǐng)域內(nèi),最佳的創(chuàng)始團(tuán)隊(duì)本質(zhì)是應(yīng)用AI的工程團(tuán)隊(duì)。他們探索與模型互動的最佳方法,以解決客戶“最后一公里”難題。成功的AI應(yīng)用可能會結(jié)合多個大模型+自訓(xùn)練的小模型,提供從通用到有價值的AI體驗(yàn)。未來成功的AI應(yīng)用公司,絕不會被簡單視為“GPT套殼”。
Guido Appenzeller則表示,生成式AI將無處不在,AI不再僅運(yùn)行在云端大服務(wù)器,也會運(yùn)行在小型設(shè)備和應(yīng)用上。
封面圖片來源:視覺中國-VCG31N2008742366
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP