每日經(jīng)濟(jì)新聞 2024-09-20 16:43:20
“前期更多出現(xiàn)的是通用大模型,無(wú)所不能,但缺乏深度無(wú)法滿足具體需求。因?yàn)轭A(yù)期缺少回報(bào),市場(chǎng)對(duì)通用大模型的投資越來(lái)越謹(jǐn)慎,但同時(shí)越來(lái)越看好在具體領(lǐng)域的發(fā)展,因此,所謂‘下半場(chǎng)’的重心應(yīng)該在垂直大模型,比如醫(yī)療、教育、交通或者某個(gè)制造業(yè)垂類(lèi)?!?/p>
每經(jīng)記者 楊棄非 每經(jīng)編輯 楊歡
圖片來(lái)源:攝圖網(wǎng)_402624474
短短一年時(shí)間,國(guó)內(nèi)大模型從“百模大戰(zhàn)”,到如今被認(rèn)為格局漸成。而“牌桌”上僅剩“大模型五虎”和互聯(lián)網(wǎng)大廠等少數(shù)“牌手”。越來(lái)越多的人開(kāi)始發(fā)問(wèn),有關(guān)大模型競(jìng)爭(zhēng)的“下半場(chǎng)”是否正在逼近?
在9月19日由成都市政府港澳辦主辦的“智匯天府AI啟航”蓉港澳三地交流活動(dòng)上,電子科技大學(xué)(深圳)高等研究院執(zhí)行院長(zhǎng)湯志偉在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí),對(duì)此論斷的態(tài)度顯得較為謹(jǐn)慎。在他看來(lái),從技術(shù)上講,現(xiàn)有大模型并不夠成熟、且仍在快速發(fā)展,相關(guān)技術(shù)還需要不斷創(chuàng)新,難論“下半場(chǎng)”的出現(xiàn)。
但反觀應(yīng)用層面,一些改變確實(shí)正在發(fā)生。“前期更多出現(xiàn)的是通用大模型,無(wú)所不能,但缺乏深度無(wú)法滿足具體需求。因?yàn)轭A(yù)期缺少回報(bào),市場(chǎng)對(duì)通用大模型的投資越來(lái)越謹(jǐn)慎,但同時(shí)越來(lái)越看好在具體領(lǐng)域的發(fā)展,因此,所謂‘下半場(chǎng)’的重心應(yīng)該在垂直大模型,比如醫(yī)療、教育、交通或者某個(gè)制造業(yè)垂類(lèi)。”而在他看來(lái),這也將是我國(guó)在大模型領(lǐng)域能夠快速產(chǎn)生價(jià)值的重要方向。
自ChatGPT3.5問(wèn)世以來(lái),國(guó)產(chǎn)大模型層出不窮,有人統(tǒng)計(jì),至少有300余個(gè)國(guó)產(chǎn)大模型已對(duì)外發(fā)布。但從話題度上看,似乎尚未出現(xiàn)絕對(duì)超越ChatGPT的國(guó)產(chǎn)大模型。
湯志偉指出,在通用大模型領(lǐng)域,美國(guó)優(yōu)勢(shì)較為明顯,我國(guó)還處于跟隨和學(xué)習(xí)階段。但在垂直大模型領(lǐng)域,因?yàn)槲覈?guó)場(chǎng)景更加豐富,有助于對(duì)大模型進(jìn)行垂直場(chǎng)景訓(xùn)練,更好地促進(jìn)大模型的性能評(píng)估和部署落地。
他格外強(qiáng)調(diào)“實(shí)體經(jīng)濟(jì)”的價(jià)值。“大模型最終目的是要為大家解決實(shí)際問(wèn)題,它不僅要能推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型,還要能帶來(lái)收益。因此,應(yīng)用場(chǎng)景對(duì)于大模型來(lái)說(shuō)十分重要。因?yàn)槲覈?guó)非常強(qiáng)調(diào)實(shí)體經(jīng)濟(jì)和數(shù)字經(jīng)濟(jì)的深度融合發(fā)展,且實(shí)體經(jīng)濟(jì)是我國(guó)的強(qiáng)項(xiàng),因此,在這一點(diǎn)上,我國(guó)擁有其他國(guó)家難以比擬的優(yōu)勢(shì)。”
向垂直大模型深入,也有助于解決企業(yè)智能化改造過(guò)程中面臨的成本問(wèn)題。
湯志偉特別提到了去年國(guó)內(nèi)的“百模大戰(zhàn)”。在他看來(lái),通用大模型領(lǐng)域,主要仍需靠世界級(jí)的頂尖龍頭企業(yè)進(jìn)行突破,并向外開(kāi)源共享。
而對(duì)于大部分面向行業(yè)細(xì)分應(yīng)用場(chǎng)景的小型公司來(lái)說(shuō),無(wú)須重走高成本研發(fā)的道路,更多資源可以投向訓(xùn)練垂直大模型,使其能符合企業(yè)獨(dú)特的發(fā)展需要。從這個(gè)意義上說(shuō),不同企業(yè)能開(kāi)發(fā)出大量的行業(yè)垂直大模型。這一思路能降低企業(yè)使用大模型的成本,政府也應(yīng)出臺(tái)相應(yīng)政策鼓勵(lì)這類(lèi)行業(yè)垂直大模型的開(kāi)發(fā)。
垂直大模型的發(fā)展還將推動(dòng)國(guó)內(nèi)大模型行業(yè)形成新的格局。在當(dāng)天活動(dòng)上,來(lái)自港澳的專(zhuān)家均提到對(duì)于推進(jìn)與成都在人工智能領(lǐng)域的科研和產(chǎn)業(yè)合作的期望,大模型也是雙方關(guān)注的焦點(diǎn)。
如湯志偉所說(shuō),基于超算中心的平臺(tái)優(yōu)勢(shì),成都算力水平在全國(guó)名列前茅,而成都萬(wàn)億級(jí)電子信息產(chǎn)業(yè)中,不少環(huán)節(jié)與人工智能發(fā)展緊密相關(guān),多所高校也為當(dāng)?shù)胤e累了大量電子信息領(lǐng)域的人才。更重要的一點(diǎn)是,不同于港澳金融服務(wù)業(yè)的比較優(yōu)勢(shì),成都在發(fā)展實(shí)體經(jīng)濟(jì)上明顯更勝一籌,雙方合作可以推動(dòng)大模型的快速發(fā)展。
但同時(shí),大模型發(fā)展也面臨多重掣肘。
無(wú)論是通用大模型還是垂直大模型,都需要強(qiáng)大算力支撐。而湯志偉提到,尤其是我國(guó)芯片面臨“卡脖子”以后,算力資源的獲得難度進(jìn)一步增大。目前,國(guó)內(nèi)已經(jīng)有公司進(jìn)行科技攻關(guān)和市場(chǎng)轉(zhuǎn)化,提升算力供給能力,但一來(lái)其與國(guó)外相比差距仍然不小,二來(lái)也需要進(jìn)一步提升芯片性能、降低價(jià)格,讓更多實(shí)體經(jīng)濟(jì)企業(yè)“用得起、用得上”。
而在聚焦解決芯片“卡脖子”問(wèn)題的基礎(chǔ)上,他還提醒,要注意整個(gè)生態(tài)的完善。
“計(jì)算芯片不是孤立的,與之相關(guān)的還有相應(yīng)的軟硬件驅(qū)動(dòng)、軟件開(kāi)發(fā)框架、操作系統(tǒng)、數(shù)據(jù)庫(kù)、硬件環(huán)境等關(guān)鍵技術(shù)。”他指出,目前,我國(guó)對(duì)各環(huán)節(jié)的突破并不同步,部分器件不匹配當(dāng)下所需,而各環(huán)節(jié)之間也存在不匹配的問(wèn)題。因此,即便相關(guān)芯片單看性能或許已經(jīng)接近甚至達(dá)到國(guó)際一流水平,但生態(tài)缺失導(dǎo)致整體效應(yīng)和系統(tǒng)效應(yīng)不足,很多環(huán)節(jié)還是以進(jìn)口為主。
這還可能造成一種“惡性循環(huán)”。如湯志偉分析,通過(guò)數(shù)十年的使用,這些主要依賴(lài)進(jìn)口的環(huán)節(jié)得以創(chuàng)新迭代并實(shí)現(xiàn)發(fā)展,相比之下,國(guó)產(chǎn)化環(huán)節(jié)則剛起步,同樣需要經(jīng)歷創(chuàng)新迭代的過(guò)程。我們?cè)诃h(huán)境“倒逼”下可能縮短周期,但無(wú)論如何要“先用起來(lái)”。
總而言之,軟硬件驅(qū)動(dòng)、軟件開(kāi)發(fā)框架、操作系統(tǒng)、數(shù)據(jù)庫(kù)和其他硬件環(huán)節(jié)的突破也應(yīng)同步推進(jìn)。而若放在信創(chuàng)產(chǎn)業(yè)下來(lái)講,同樣需要一種整體性的思路,“現(xiàn)在是部分局部問(wèn)題解決了,但只有整體問(wèn)題解決了,才能算是真正解決問(wèn)題。”
而當(dāng)談及國(guó)產(chǎn)大模型的迭代時(shí),湯志偉還提到數(shù)據(jù)方面的難點(diǎn)。他指出,大量高質(zhì)量訓(xùn)練數(shù)據(jù)是提升大模型準(zhǔn)確性和廣泛適用性的關(guān)鍵因素。我們?cè)跍?zhǔn)備高質(zhì)量數(shù)據(jù)的時(shí)候,既要保證數(shù)據(jù)本身的準(zhǔn)確性,還要考慮數(shù)據(jù)的多樣性和代表性。這樣才能更好地消除大模型普遍存在的偏見(jiàn)問(wèn)題。
在國(guó)家“數(shù)據(jù)二十條”基礎(chǔ)上,2024年1月,國(guó)家數(shù)據(jù)局出臺(tái)的《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026年)》明確提出了數(shù)據(jù)要素的放大、疊加、倍增作用,以及帶動(dòng)數(shù)據(jù)要素高質(zhì)量供給、合規(guī)高效流通,這為各行各業(yè)的發(fā)展提供了堅(jiān)實(shí)的數(shù)據(jù)政策支持。湯志偉認(rèn)為,這對(duì)于我國(guó)數(shù)據(jù)規(guī)模和質(zhì)量的提升均將起到重要作用,也將是推動(dòng)大模型快速發(fā)展的又一關(guān)鍵利好。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP