亚洲欧美日韩文无线码,亚洲国产呦萝小初,欧美日韩亚洲日本,最新中文国产一区二区

<dd id="ie4w4"><s id="ie4w4"></s></dd>
  • <strike id="ie4w4"></strike>
    <strike id="ie4w4"></strike>
    每日經(jīng)濟(jì)新聞
    要聞

    每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

    Kimi、豆包領(lǐng)跑,國(guó)產(chǎn)AI迎來(lái)新格局

    每日經(jīng)濟(jì)新聞 2024-11-25 21:05:11

    每經(jīng)記者 楊昕怡    每經(jīng)編輯 蒙錦濤    

    一道步驟難懂的數(shù)學(xué)奧賽試題、一場(chǎng)組會(huì)中的“頭腦風(fēng)暴”、一個(gè)需要做大量“功課”才能做出的生活決策——當(dāng)大模型能像人類(lèi)一樣思考時(shí),你會(huì)發(fā)現(xiàn),這一切都將在一次回車(chē)的敲下后迎刃而解。

    “什么樣的場(chǎng)景最適合讓AI鍛煉思考能力?我們認(rèn)為是數(shù)學(xué)場(chǎng)景?!?strong>11月16日,月之暗面創(chuàng)始人楊植麟發(fā)布了新一代數(shù)學(xué)能力可對(duì)標(biāo)OpenAI o1系列的數(shù)學(xué)推理模型k0-math,在中考、高考、考研以及包含競(jìng)賽題的MATH等數(shù)學(xué)基準(zhǔn)測(cè)試中,k0-math初代模型成績(jī)已經(jīng)超過(guò)o1-mini和o1-preview模型。

    “這可以說(shuō)是,在OpenAI o1發(fā)布后,國(guó)內(nèi)首個(gè)摸索出并實(shí)現(xiàn)o1思路的公司?!睂?duì)于k0-math的推出,一位國(guó)內(nèi)頭部互聯(lián)網(wǎng)公司的大模型技術(shù)人員表示,k0-math模型采用的全新強(qiáng)化學(xué)習(xí)和思維鏈(CoT)推理技術(shù),正是業(yè)內(nèi)普遍認(rèn)為OpenAI o1系列的技術(shù)關(guān)鍵所在,國(guó)內(nèi)多家互聯(lián)網(wǎng)巨頭均在破解這一“新思路”,但在k0-math發(fā)布時(shí),尚未有其他類(lèi)似模型問(wèn)世。

    在“百模大戰(zhàn)”開(kāi)戰(zhàn)的一年多里,新技術(shù)、新團(tuán)隊(duì)、新應(yīng)用不斷涌現(xiàn),戰(zhàn)況也隨之頻繁變動(dòng)。從月之暗面、零一萬(wàn)物等“新AI六小龍”和字節(jié)跳動(dòng)、阿里等互聯(lián)網(wǎng)大廠團(tuán)隊(duì)在混戰(zhàn)中脫穎而出,到如今應(yīng)用最廣的AI智能助手陸續(xù)上線,可以觀察到的是,豆包和Kimi的領(lǐng)先讓AI智能助手領(lǐng)域逐漸呈現(xiàn)出了“兩超多強(qiáng)”的新格局。

    CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

    新模型登場(chǎng)

    Kimi對(duì)標(biāo)o1

    “如果你有100枚硬幣,每枚硬幣正面朝上。每次翻轉(zhuǎn)包含當(dāng)前正面朝上的硬幣和它相鄰的兩枚硬幣。最少需要翻轉(zhuǎn)多少次才能使所有硬幣反面朝上?”

    仿佛一個(gè)數(shù)學(xué)天才型選手,Kimi數(shù)學(xué)版在40秒鐘里完成了對(duì)該題的問(wèn)題分解、3種思路嘗試、解法驗(yàn)證并正確作答的全套解題流程。

    值得注意的是,其中,“意識(shí)到逐個(gè)翻轉(zhuǎn)硬幣不可行,我開(kāi)始思考如何最大化每次翻轉(zhuǎn)的效果”“意識(shí)到翻轉(zhuǎn)之間隔兩枚硬幣會(huì)導(dǎo)致重疊,我考慮增加間隔”等對(duì)思維鏈推理的展示,均是模型自我思考能力的體現(xiàn)。

    今年9月,被Open AI創(chuàng)始人Sam Altman喻為“新范式開(kāi)始”的o1誕生,以模仿人類(lèi)思維過(guò)程進(jìn)行的強(qiáng)化學(xué)習(xí)和思維鏈技術(shù),突破了AI推理瓶頸。自此,行業(yè)的技術(shù)焦點(diǎn)也從預(yù)訓(xùn)練轉(zhuǎn)向了推理和強(qiáng)化學(xué)習(xí)。

    11月16日,Kimi率先交出國(guó)內(nèi)首份答卷。據(jù)介紹,相較于以盡快提供答案為關(guān)鍵目標(biāo)的常規(guī)模型,新推出的k0-math模型在做題過(guò)程中會(huì)花更長(zhǎng)的時(shí)間來(lái)推理,包括思考和規(guī)劃思路,并且在必要時(shí)自行反思改進(jìn)解題思路,提升答題的成功率。

    發(fā)布會(huì)上,月之暗面公布了k0-math的目前測(cè)評(píng)得分:在業(yè)界最常使用的數(shù)學(xué)能力基準(zhǔn)測(cè)試MATH中,k0-math模型得分93.8分,超過(guò)o1-mini的90分和o1-preview的85.5分,且k0-math這一成績(jī)僅次于o1完全版的94.8分。

    在兩個(gè)難度更大的競(jìng)賽級(jí)別的數(shù)學(xué)題庫(kù)OMNI-MATH和AIME基準(zhǔn)測(cè)試中,k0-math初代模型的表現(xiàn)分別達(dá)到了o1-mini最高成績(jī)的90%和83%。

    從線上AI社區(qū)的討論中選取一道數(shù)學(xué)題進(jìn)行實(shí)測(cè),Kimi數(shù)學(xué)版用時(shí)2分10秒完成了對(duì)該題的正確解答。從線上該帖的評(píng)論區(qū)反饋來(lái)看,在求解該題時(shí),o1-mini和o1-preview在用時(shí)上有約30秒的優(yōu)勢(shì),但多次測(cè)試均未得出正確答案。

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E072z5v5GbILvo2wQB5wNHqgJibaF7vBBOkiaAom1l6icFn1WObLCKlpbyg.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0PadMrTpKYqhEuicZLT0wEsodKW3Imv43NSctyFXfsnGAxNmkV76S2oQ.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0DccmMkkXNCHgicTjLVIx1kjHGyJBg8yYTyMRibQNnDV9bm9ibBktViaNlQ.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0lZoP0ibO0iadqX56p6WncSCfiax853KJAiarQEjFnP988Acgictbx5XVqeA.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0tnu6A6YUklHjRjv5PnT7ibXREnibHUsYJiaWhRTgcaUyfu08mecCXmfkg.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0tt7nLK5HqJWnHAX224Yk0ErUvgevDiapw5icN1pre5ibFllNqengaczibw.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0fVvpTPkkrHTrZxI2NmGCvPT65iaLIZ1rNdevEyt2cn1iaSspibG1otLyg.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E01mC9694YgOYLueIssNIb2CpBX64kg4e9vsaaltjGY4dibPEpZcK3WZA.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0icPRJXyeAcEbDMAibtIsne7J8TBrLicETHZP9zNzZSTZBmGeV4L1uBXug.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0awodA17oXmwkP4LJSIB38D9RBLqBPVukrCOs2iccHOaMvroKdDuspNw.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E05kiaoQj6PHRDfMJeNTPibDa4bb6kREZzicDLXA9DgwiaEtAJKJ8vyga4bQ.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E04CT1lYLOV1QmfbhGdicMISu6pUUW4O2AKKLKib5ficszeKwXgjwcOqibTw.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0jWSIk85g6Bgvr8Nibb6uh2koqcibBhRvSrry0mwJoM8O6t7C5lVvtUnQ.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0C3ZYcEabJFwKOM0fv0rakAJfFPyMJy9HjKXPl324Z3qKATjRrSuB8A.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0zA1PMdiaSNtzfEX1zNTQqicvBNTk7aTE7WCeELkaIjmDtmPymMBPFBEA.jpg

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E00vSAX24YKLH7N5YJuOHG3SpY7QiciavI7njzkmibx7T0jJAth2Athg0Jg.jpg

    左右滑動(dòng)查看更多

    “該數(shù)學(xué)推理模型上的技術(shù)也可以被放進(jìn)更多的場(chǎng)景里,例如讓Kimi探索版去做更多的探索。”正如楊植麟在發(fā)布會(huì)上所言,全新技術(shù)范式帶來(lái)的推理能力提升,也能泛化到更多日常任務(wù)上。

    編輯就“找到北上廣深的各個(gè)市轄區(qū)內(nèi),有重點(diǎn)初中,還有直升高中并且每年至少20個(gè)清北,告訴我這個(gè)區(qū)最適合的學(xué)區(qū)房”這一較為復(fù)雜的指令,對(duì)Kimi探索版、Kimi普通版和另兩款知名AI產(chǎn)品進(jìn)行測(cè)試。

    CFF20LXzkOx16PXLKczRGiaNdpR1AF3E01AwT2XH0Z1813YNxOibxNZvwk8UsNEncmmiciaMpCCuGQlvJtff1ZzEMg.png

    測(cè)試結(jié)果顯示,Kimi探索版在搜索量、搜索內(nèi)容和生成內(nèi)容上優(yōu)勢(shì)明顯,甚至出現(xiàn)了對(duì)1311個(gè)網(wǎng)頁(yè)的分析,直觀感受到Kimi探索版在意圖增強(qiáng)、信源分析和鏈?zhǔn)剿伎忌系哪芰μ嵘?/span>

    CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

    豆包、Kimi的領(lǐng)先

    分水嶺明顯

    Kimi領(lǐng)先的每一步,都在一次次搜索中被用戶清晰地感知著。“以前2、3個(gè)小時(shí)才能看懂的文章,用Kimi幾分鐘就能得到所有關(guān)鍵信息,現(xiàn)在也會(huì)在實(shí)驗(yàn)中讓探索版給出研究設(shè)計(jì)、方法論選擇上的建議。”一位江南大學(xué)的在讀工科博士表示。

    基于Kimi對(duì)學(xué)術(shù)研究、市場(chǎng)分析等專(zhuān)業(yè)應(yīng)用場(chǎng)景的不斷深耕和所體現(xiàn)出的明顯優(yōu)勢(shì),其用戶群體涵蓋了學(xué)生、科研人員、職場(chǎng)人士和內(nèi)容創(chuàng)作者等知識(shí)需求型人群。月之暗面也表示,Kimi探索版發(fā)布后,受到了程序員、科學(xué)家、咨詢(xún)顧問(wèn)、投資人、律師等專(zhuān)業(yè)人群的喜愛(ài)。

    從用戶體量來(lái)看,根據(jù)量子位智庫(kù)統(tǒng)計(jì)的數(shù)據(jù),截至今年10月,在國(guó)內(nèi)現(xiàn)有的68款A(yù)I智能助手產(chǎn)品中,只有豆包和Kimi邁過(guò)“5000萬(wàn)大關(guān)”,其中豆包歷史累計(jì)下載量破億,Kimi智能助手下載總量超過(guò)5700萬(wàn)。

    榜單中,排名第3、4位的產(chǎn)品下載總量各超過(guò)2000萬(wàn)。同時(shí),10月新增用戶超1400萬(wàn)的Kimi還在將身后的差距逐漸拉大,有望成為“破億俱樂(lè)部”的下一位成員。

    第三方平臺(tái)點(diǎn)點(diǎn)數(shù)據(jù)也顯示,今年10月,ChatGPT、豆包和Kimi智能助手位列全球AI APP蘋(píng)果端下載量前三,占據(jù)了全球蘋(píng)果端AI APP下載量的51%。

    在用戶黏性方面,量子位智庫(kù)指出,我國(guó)AI智能助手產(chǎn)品今年10月的留存率基本與上月持平,豆包和Kimi仍穩(wěn)居前二,兩者平均三日留存率超27%,平均七日新增留存率約18%。而其他AI助手產(chǎn)品的平均三日留存率均在25%以下。

    此外,從用戶活躍度來(lái)看,Kimi的10月日活用戶量也僅次于豆包。月之暗面公布的數(shù)據(jù)顯示,截至今年10月,Kimi的月活已超3600萬(wàn)人,而且數(shù)據(jù)仍在持續(xù)增長(zhǎng)。

    從用戶體量、活躍度和黏性等多個(gè)重要維度來(lái)觀察,豆包和Kimi已處于第一領(lǐng)跑集團(tuán),并與隨后各梯隊(duì)間出現(xiàn)鮮明的分水嶺。

    “競(jìng)爭(zhēng)本身并不產(chǎn)生價(jià)值,我們做好模型思考推理能力,給用戶帶來(lái)價(jià)值,做正確的事情,而不是專(zhuān)門(mén)做不一樣的事情?!痹趉0-math的發(fā)布會(huì)上,楊植麟談及和以交互能力見(jiàn)長(zhǎng)的豆包的競(jìng)爭(zhēng)時(shí),再度以“聚焦”作為回應(yīng)。

    學(xué)會(huì)“聚焦”,這是楊植麟過(guò)去一年中的一個(gè)大課題。如今,這個(gè)“創(chuàng)業(yè)明星”和他的團(tuán)隊(duì)決定眼看前方,繼續(xù)以加速度向月之暗面邁步前去。

    記者|楊昕怡

    編輯|蒙錦濤

    CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

    CFF20LXzkOyuoQNVLRGWjVfciaeNyib50W3Y9TDLicWBibJKOzIkD8GjeQ1UXS4mD9ONYY5AAMMOvRlWic9Oh3K3Lrw.jpg

    如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
    未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

    讀者熱線:4008890008

    特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

    歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

    每經(jīng)經(jīng)濟(jì)新聞官方APP

    0

    0