亚洲欧美日韩文无线码,亚洲国产呦萝小初,欧美日韩亚洲日本,最新中文国产一区二区

<dd id="ie4w4"><s id="ie4w4"></s></dd>
  • <strike id="ie4w4"></strike>
    <strike id="ie4w4"></strike>
    每日經(jīng)濟(jì)新聞
    要聞

    每經(jīng)網(wǎng)首頁 > 要聞 > 正文

    清華教授孫茂松:大模型已經(jīng)是AI巔峰對(duì)決的戰(zhàn)場(chǎng),成都不能缺席

    每日經(jīng)濟(jì)新聞 2023-09-12 16:30:51

    “我覺得成都的人工智能發(fā)展還是不錯(cuò)的,但是大模型相關(guān)的研究相對(duì)落后。我們好像一下子想不出有支團(tuán)隊(duì)在做大模型,這是一個(gè)短板,所以成都應(yīng)該著重考慮這個(gè)問題?!睂O茂松認(rèn)為,成都應(yīng)該主打模型,特別是大模型在垂直領(lǐng)域的應(yīng)用,通過應(yīng)用要培育一支有這種能力的科研隊(duì)伍。

    每經(jīng)記者 淡忠奎    每經(jīng)編輯 楊歡

    Flzchxghnk1694506942278.thumb_head

    歐洲人文和自然科學(xué)院外籍院士,清華大學(xué)人工智能研究院長(zhǎng)聘教授、常務(wù)副院長(zhǎng)孫茂松 圖片來源:每經(jīng)記者 淡忠奎 攝

    “大模型已經(jīng)成為目前人工智能巔峰對(duì)決的一個(gè)終極戰(zhàn)場(chǎng),如果我們沒有能力去參與,這肯定是一個(gè)短板,對(duì)成都的人工智能產(chǎn)業(yè)發(fā)展會(huì)帶來不利影響。”9月11日,第二十一屆中國(guó)西部海外高新科技人才洽談會(huì)開幕式暨天府論壇上,歐洲人文和自然科學(xué)院外籍院士,清華大學(xué)人工智能研究院長(zhǎng)聘教授、常務(wù)副院長(zhǎng)孫茂松分享了對(duì)ChatGPT為代表的生成式人工智能的最新觀察和思考。

    今年5月發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,我國(guó)已有79個(gè)10億級(jí)以上參數(shù)規(guī)模的大模型,被外界稱作進(jìn)入“百模大戰(zhàn)”時(shí)代。不論是人工智能企業(yè),還是地方政府,都紛紛入局“新賽道”。

    那么,現(xiàn)階段大模型的發(fā)展邏輯是怎樣的,如何才能讓它“說真話”?“百模大戰(zhàn)”時(shí)代,國(guó)內(nèi)大模型企業(yè)如何才能制勝未來?像成都這樣布局較晚的城市,又該如何加速塑造自己的競(jìng)爭(zhēng)優(yōu)勢(shì)?孫茂松在論壇期間,接受了《每日經(jīng)濟(jì)新聞》記者采訪。

    策略:下一個(gè)詞預(yù)測(cè)

    “以ChatGPT為代表的生成式人工智能,這一年來火爆全球。但它的算法其實(shí)非常簡(jiǎn)單,就是一個(gè)策略——下一個(gè)詞預(yù)測(cè)(自監(jiān)督學(xué)習(xí))。”孫茂松舉出一個(gè)例子,就像“我昨天晚上吃了飯”這句話,可以讓機(jī)器在任何一個(gè)位置停下來,比如,“我今天吃了—”,讓機(jī)器預(yù)測(cè)下一個(gè)詞。

    人共享智能算法就會(huì)調(diào)動(dòng)它內(nèi)在的機(jī)制,讓機(jī)器去確定應(yīng)該就是“飯”,這個(gè)策略就叫自監(jiān)督學(xué)習(xí)。機(jī)器可以在互聯(lián)網(wǎng)上任意規(guī)模的語料上做這件事,進(jìn)而覆蓋整個(gè)互聯(lián)網(wǎng)。在這種條件下,你給出一個(gè)上文“我昨天吃了”,它就會(huì)給出下一個(gè)詞的概率分布——

    比如,“吃飯”概率是4.5%,“餃子”概率是3.5%,“桌子”的概率很低,但也不至于是0,“因?yàn)橛性⒀哉f大象可能吃了桌子”。倘若上文換成“我昨天晚上吃了北京”,可能35%的概率是“北京烤鴨”。

    孫茂松認(rèn)為,方法看似簡(jiǎn)單,但要做到準(zhǔn)確的估計(jì)非常難。就像我們平常去擲骰子,必須擲足夠多的次數(shù)才能確定骰子每個(gè)面出現(xiàn)的概率。這里涉及兩個(gè)關(guān)鍵因素,一個(gè)是骰子有6個(gè)面,但是我們?cè)~語有五六萬個(gè),也就是五六萬面。更麻煩的是,上文是無限的,所以它的面實(shí)際上是兩個(gè)因素相乘,“就是五六萬個(gè)詞,再加上幾乎無限數(shù)量的上文”。

    這就要依靠“三駕馬車”——大模型+大數(shù)據(jù)+大算力。與此同時(shí),AIGC(人工智能生成內(nèi)容)的特點(diǎn)就是強(qiáng)大的內(nèi)容生產(chǎn)能力,以及天馬行空般的創(chuàng)造性。假設(shè)句子中每個(gè)位置平均有100種“合理”的字接續(xù),則可能形成“比較通順”的五律數(shù)量約為10^80個(gè)。

    憑借強(qiáng)大的內(nèi)容生成能力和創(chuàng)造性,生成式AI能夠有力助推數(shù)字經(jīng)濟(jì)的發(fā)展,甚至可能帶來產(chǎn)業(yè)生態(tài)的重新洗牌。比如,在內(nèi)容輔助生產(chǎn)方面,生成式AI從商業(yè)應(yīng)用到文化創(chuàng)意產(chǎn)業(yè)的應(yīng)用,能夠顯著降低制作成本、準(zhǔn)入門檻,顯著提升生產(chǎn)效率、產(chǎn)品質(zhì)量;芯片設(shè)計(jì)領(lǐng)域,生成式AI的使用能夠強(qiáng)化學(xué)習(xí)優(yōu)化半導(dǎo)體芯片設(shè)計(jì)(布圖規(guī)劃)中的元件位置,將產(chǎn)品開發(fā)周期從幾周(使用人類專家)縮短到幾小時(shí)。

    這正是生成式AI賦能千行百業(yè)的縮影。

    機(jī)會(huì):“大地基上蓋房子”

    8月31日,首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的大模型百度文心一言、百川智能、商湯商量SenseChat宣布面向全社會(huì)開放服務(wù)。在商用之外,大模型面向普通人開放被視作人工智能產(chǎn)業(yè)的一個(gè)里程碑。

    這不僅是面向普通人開放賦能工具、生活助手,更是意味著大模型將獲得龐大規(guī)模的中文語料投喂和更豐富的原生應(yīng)用場(chǎng)景。“大模型有點(diǎn)像水電,它是一種智能信息處理的一個(gè)基礎(chǔ)設(shè)施,現(xiàn)在只要垂直領(lǐng)域需要用到信息處理,只要是數(shù)字化高度發(fā)達(dá)的應(yīng)用場(chǎng)景,它就有可能(發(fā)揮作用)”。

    就像是一個(gè)通用的底座,孫茂松告訴《每日經(jīng)濟(jì)新聞》記者,就像你要蓋房子,它實(shí)際上是一個(gè)地基,可以在上面蓋各種各樣的房子。以前,相當(dāng)于每個(gè)應(yīng)用都要打一個(gè)自己的地基,蓋一個(gè)小房子,“現(xiàn)在是搞了一個(gè)特別大的地基,你就只需要考慮房子怎么蓋。”

    這也給大模型的發(fā)展帶來新的想象空間。根據(jù)IDC預(yù)測(cè),2026年我國(guó)AI市場(chǎng)規(guī)模有望達(dá)264.4億美元,2023-2026年CAGR約21.5%。而被比喻為目前階段“A終極戰(zhàn)場(chǎng)”之一的大模型,更是其中的引領(lǐng)性力量。

    中信證券研報(bào)稱,大模型是連接底層算力和上層應(yīng)用的重要一環(huán),成熟的大模型能力和生態(tài)是真正的實(shí)現(xiàn)涌現(xiàn)人工智能和未來應(yīng)用端繁榮的基礎(chǔ),擁有更強(qiáng)計(jì)算和推理能力、更高通用性的大模型企業(yè)有望把握AI時(shí)代的流量入口和話語權(quán)。

    從國(guó)內(nèi)來看,大模型已經(jīng)是人工智能企業(yè)的必爭(zhēng)之地,“百模大戰(zhàn)”漸成趨勢(shì)。不過,孫茂松認(rèn)為,“百模”也不一定多。這些大模型可以分為兩類,一類是真正有實(shí)力做底座的,另一類實(shí)際上是拿別人開源的大模型去做應(yīng)用訓(xùn)練,“這兩塊的‘質(zhì)’是不一樣的,真正有實(shí)力能和國(guó)際上PK的可能一個(gè)都沒有。”

    他指出,很多大模型企業(yè)都會(huì)轉(zhuǎn)到垂直應(yīng)用,甚至可能進(jìn)入的時(shí)候就沒準(zhǔn)備要做底座,而是要做垂直領(lǐng)域應(yīng)用,“如果進(jìn)入聚焦做垂直應(yīng)用,還是值的鼓勵(lì)的。”大模型歸根究底要落地于具體的行業(yè)應(yīng)用,細(xì)分領(lǐng)域還有更多機(jī)會(huì)。

    城市:要發(fā)揮應(yīng)用場(chǎng)景優(yōu)勢(shì)

    “我覺得成都的人工智能發(fā)展還是不錯(cuò)的,但是大模型相關(guān)的研究相對(duì)落后。我們好像一下子想不出有支團(tuán)隊(duì)在做大模型,這是一個(gè)短板,所以成都應(yīng)該著重考慮這個(gè)問題。”孫茂松認(rèn)為,成都應(yīng)該主打模型,特別是大模型在垂直領(lǐng)域的應(yīng)用,通過應(yīng)用要培育一支有這種能力的科研隊(duì)伍。

    這是他在天府論壇上給成都開出的一劑“藥引”。孫茂松告訴《每日經(jīng)濟(jì)新聞》記者,現(xiàn)在國(guó)內(nèi)基礎(chǔ)大模型主要在北京、上海、深圳等城市,要想現(xiàn)在來做已經(jīng)有些晚。后發(fā)城市應(yīng)該著重來做大模型在垂直領(lǐng)域的應(yīng)用,這一塊四川和成都是有優(yōu)勢(shì)的,“有很多獨(dú)特的應(yīng)用場(chǎng)景,別的地方不一定有。”

    換句話說,不論是AI企業(yè),還是競(jìng)逐大模型的城市,都應(yīng)該重點(diǎn)把握垂直領(lǐng)域的機(jī)會(huì)。不久前,2023世界人工智能大會(huì)也傳遞出這樣的信號(hào)。多位人工智能專家告訴記者,大模型是AI爆發(fā)式成長(zhǎng)的基石,要著重引導(dǎo)既有大模型技術(shù)與垂直領(lǐng)域經(jīng)濟(jì)發(fā)展深度融合。

    與此同時(shí),上海市徐匯區(qū)副區(qū)長(zhǎng)俞林偉亦指出,“全面推動(dòng)生成式人工智能在醫(yī)療、金融、智能網(wǎng)聯(lián)汽車、社交等領(lǐng)域率先發(fā)力,所有的行業(yè)都值得用大模型再做一遍。”在這種背景下,大模型的“應(yīng)用戰(zhàn)”成為城市無法缺席的一場(chǎng)角逐。

    “現(xiàn)在大家都在爭(zhēng)大模型,我們?nèi)绻麤]有這方面人才,可能就會(huì)喪失一些發(fā)展機(jī)會(huì),而且跟成都的城市地位是不符的。”孫茂松認(rèn)為,這一塊的短板應(yīng)該盡快補(bǔ)上,畢竟成都是有這個(gè)實(shí)力的,“成都要跟北京、上海去比,而不是跟中游城市比”。

    在他看來,有些省份或城市培養(yǎng)不出這樣的人才,所以需要想方設(shè)法去引進(jìn)人才。但成都不一樣,川大、電子科大等高校水平都很高,但是可能因?yàn)閷?duì)相關(guān)領(lǐng)域的重視程度不夠高,做這方面研究的人相對(duì)較少。當(dāng)?shù)匦枰M(jìn)一步提高對(duì)大模型相關(guān)研究和人才的重視程度。

    “現(xiàn)在像美國(guó)那些最重要的幾個(gè)(大模型)公司,都還在致力于打地基,今年也已經(jīng)開始努力建‘大房子’。但是這些小房子它還沒顧上,成都其實(shí)可以去做不同領(lǐng)域的‘小房子’。這要蓋好也是很有挑戰(zhàn)性的。”他說。

    如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
    未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

    讀者熱線:4008890008

    特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

    模型 大模型 成都市 成都

    歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

    每經(jīng)經(jīng)濟(jì)新聞官方APP

    1

    0