亚洲欧美日韩文无线码,亚洲国产呦萝小初,欧美日韩亚洲日本,最新中文国产一区二区

<dd id="ie4w4"><s id="ie4w4"></s></dd>
  • <strike id="ie4w4"></strike>
    <strike id="ie4w4"></strike>
    每日經(jīng)濟(jì)新聞
    AI快訊

    每經(jīng)網(wǎng)首頁(yè) > AI快訊 > 正文

    中國(guó)銀河給予傳媒互聯(lián)網(wǎng)行業(yè)推薦評(píng)級(jí):VideoWorld模型開(kāi)源,探索模型訓(xùn)練新路徑

    每日經(jīng)濟(jì)新聞 2025-02-12 11:06:01

    每經(jīng)AI快訊,中國(guó)銀河02月12日發(fā)布研報(bào),給予傳媒互聯(lián)網(wǎng)行業(yè)推薦評(píng)級(jí)。

    事件:2 月 10 日,豆包大模型團(tuán)隊(duì)聯(lián)合北京交通大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)共同開(kāi)發(fā)的視頻生成實(shí)驗(yàn)?zāi)P?VideoWorld"開(kāi)源。

    純視覺(jué)訓(xùn)練模型,擺脫語(yǔ)言模型依賴:現(xiàn)有的各類(lèi)多模態(tài)模型如 GPT、Sora 等大多較為依賴語(yǔ)言或標(biāo)簽數(shù)據(jù)學(xué)習(xí)知識(shí),較少涉及純視覺(jué)信號(hào)的學(xué)習(xí)。VideoWorld可以通過(guò)純視覺(jué)的方式進(jìn)行學(xué)習(xí)訓(xùn)練:團(tuán)隊(duì)構(gòu)建了一個(gè)包含大量視頻演示數(shù)據(jù)的離線數(shù)據(jù)集,讓模型以"觀看"的方式進(jìn)行訓(xùn)練學(xué)習(xí),最終得到一個(gè)可以根據(jù)過(guò)往觀測(cè)到的視覺(jué)輸入來(lái)推演、預(yù)測(cè)未來(lái)畫(huà)面的視頻生成器。我們認(rèn)為,VideoWorld擺脫了以往模型對(duì)語(yǔ)言模型的依賴,通過(guò)純視覺(jué)的方式進(jìn)行學(xué)習(xí),改變了以往的模型需要對(duì)語(yǔ)言文本進(jìn)行理解后再進(jìn)行推理的定式,有望簡(jiǎn)化模型的輸入﹣理解﹣推理﹣輸出鏈條。

    引入潛在動(dòng)態(tài)模型,提高視頻學(xué)習(xí)效率:目前,傳統(tǒng)的視覺(jué)的訓(xùn)練方式由于需要將畫(huà)面轉(zhuǎn)換為離散標(biāo)記后進(jìn)行學(xué)習(xí)。例如,在圍棋的訓(xùn)練過(guò)程中,模型只需通過(guò)少量的棋子位置標(biāo)記,但在數(shù)據(jù)的編碼過(guò)程中,編碼器會(huì)產(chǎn)生過(guò)多冗余標(biāo)記,不利于模型對(duì)復(fù)雜知識(shí)的快速學(xué)習(xí),使得視頻序列的知識(shí)挖掘效率顯著落后于文本形式。VideoWorld 引入了一個(gè)潛在動(dòng)態(tài)模型(Latent Dynamics Model, LDM),可將幀間視覺(jué)變化壓縮為緊湊的潛在編碼,提高模型的知識(shí)挖掘效率。最終,VideoWorld 在僅有 300M 參數(shù)量且不依賴任何獎(jiǎng)勵(lì)函數(shù)機(jī)制的條件下,達(dá)到9x9圍棋專(zhuān)業(yè)五段的水平,在機(jī)器人任務(wù)上也展現(xiàn)出了復(fù)雜環(huán)境下的泛化能力。

    LDM具備前規(guī)劃能力,模型生成的編碼具備因果關(guān)系:在圍棋相關(guān)的訓(xùn)練中,LDM 建模了訓(xùn)練集中常見(jiàn)的走棋模式,并能將短期和長(zhǎng)期數(shù)據(jù)模式壓縮至潛在空間中。對(duì) LDM 的模型推理過(guò)程進(jìn)行 UMAP 可視化后發(fā)現(xiàn),LDM模型生成的潛在編碼按照時(shí)間步(Time-step)進(jìn)行分組,使得模型能夠從更長(zhǎng)遠(yuǎn)視角進(jìn)行圍棋決策。此外,用隨機(jī)標(biāo)記替換不同時(shí)間步的潛在編碼的實(shí)驗(yàn)從側(cè)面說(shuō)明模型可生成因果相關(guān)編碼,理解因果關(guān)系。

    投資建議:我們認(rèn)為,近期國(guó)內(nèi)AI行業(yè)取得多項(xiàng)進(jìn)展。VideoWorld的純視覺(jué)訓(xùn)練方式在LDM的加持下具有較好的訓(xùn)練效果,且訓(xùn)練方式更貼近生物的視覺(jué)學(xué)習(xí)的模式。展望未來(lái),其開(kāi)源的策略有望推動(dòng)視覺(jué)訓(xùn)練的快速發(fā)展,為行業(yè)帶來(lái)了新的可能性,同時(shí)AI模型端的進(jìn)步有望加速推動(dòng)在影視、廣告、社交陪伴等多個(gè)領(lǐng)域應(yīng)用落地。在應(yīng)用層面,建議關(guān)注受 AI賦能的與C端用戶體驗(yàn)密切相關(guān)的行業(yè):1)AI+游戲:游戲內(nèi)NPC互動(dòng)、互動(dòng)影游;2)AI+教育:智教系統(tǒng)、虛擬實(shí)驗(yàn)室;3)AI+辦公:內(nèi)容生成、非結(jié)構(gòu)化數(shù)據(jù)處理;4)AI+出版:校對(duì)修改、智慧發(fā)行;5)AI+專(zhuān)業(yè)咨詢:情感陪護(hù),應(yīng)用場(chǎng)景專(zhuān)業(yè)解答等。

    風(fēng)險(xiǎn)提示:政策及監(jiān)管環(huán)境的風(fēng)險(xiǎn)、AI 技術(shù)發(fā)展不及預(yù)期的風(fēng)險(xiǎn)、AI應(yīng)用落地不及預(yù)期的風(fēng)險(xiǎn)等。

    每經(jīng)頭條(nbdtoutiao)——太突然!知名“獨(dú)角獸”陷危機(jī),高管早已集體離職,不知情員工除夕還在加班!總部斷水?dāng)嚯?,CEO已不在公司,他曾稱:留下來(lái)一起戰(zhàn)斗

    (記者 王曉波)

    免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
    未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

    讀者熱線:4008890008

    特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

    中國(guó)銀河 證券 北京市 國(guó)企改革 央企國(guó)企改革 證金持股 文化傳媒 模型

    歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

    每經(jīng)經(jīng)濟(jì)新聞官方APP

    0

    0