騰訊云發(fā)力行業(yè)大模型,有幾分勝算?

來源:證券之星

自BERT出現(xiàn)之后,大模型成為AI領(lǐng)域的主流技術(shù)趨勢,業(yè)界也因此掀起兩輪熱潮。國內(nèi)外眾多大廠、創(chuàng)業(yè)公司都在爭先推出各自的大模型,字節(jié)跳動亦被認為將在今年年中推出大模型。


(資料圖片)

如今騰訊也出手了。6月19日,騰訊云發(fā)布MaaS(模型即服務)能力全景圖,計劃打造一站式行業(yè)大模型精選商店,以協(xié)助客戶構(gòu)建專屬大模型及應用。騰訊云的入場,會給賽道帶來什么?在激烈的競爭中,騰訊云有幾分勝算?

助力大模型落地

目前市面上谷歌、微軟、百度、阿里等大廠公布的都是一個基礎(chǔ)的通用大模型。與此前諸多公司急切高調(diào)推出的通用大模型不同,騰訊將更多的關(guān)注放在了面向B端的行業(yè)大模型身上。

騰訊云MaaS的技術(shù)底座是一系列的行業(yè)大模型,包括金融、政府、文旅、傳媒、教育等。

基于這些基礎(chǔ)模型,騰訊云的客戶只要加入自己的場景數(shù)據(jù),就可以生成契合自身業(yè)務需要的專屬模型;同時也可根據(jù)自身業(yè)務場景需求,“量體裁衣、按需定制”不同參數(shù)、不同規(guī)格的模型服務。

如在醫(yī)療健康領(lǐng)域,騰訊云可以幫助醫(yī)療機構(gòu)構(gòu)建和部署自己的疾病預測模型,提高診斷準確率和治療效果;在金融領(lǐng)域,騰訊云可以幫助銀行和保險公司構(gòu)建和部署自己的風險評估模型,提高風險控制能力。

騰訊選擇這個思路,也不難理解。通用大模型需要利用大規(guī)模數(shù)據(jù)和先進的機器學習技術(shù)來訓練和優(yōu)化大型神經(jīng)網(wǎng)絡(luò)模型,但由于很多企業(yè)的業(yè)務數(shù)據(jù)等都是非常隱私的核心數(shù)據(jù),他們根本不會將其放在數(shù)據(jù)集上進行公開訓練,因此訓練模型的專業(yè)、且高質(zhì)量的數(shù)據(jù)收集是非常難的。

同時在通用大模型時,需要大量計算資源和漫長的訓練周期。但是并非每家企業(yè)都有足夠的資源,讓大模型完成訓練和推理,這對企業(yè)來說昂貴且耗時。英偉達曾公布數(shù)據(jù)顯示,訓練一次大模型,大約100多萬美金。

但大模型在國內(nèi)落地的需求卻已刻不容緩,為了解決落地問題,推出更有針對性的行業(yè)大模型,并利用數(shù)據(jù)精調(diào)來滿足業(yè)務需要,已經(jīng)成為國內(nèi)云服務商曲線解決當下困境的一種選擇。

中金公司指出,騰訊AI大模型內(nèi)外兼修,騰訊云的大模型能力可應用于騰訊會議等SaaS產(chǎn)品當中,將進一步加強產(chǎn)品的優(yōu)勢及提升變現(xiàn)潛力。

大模型落地挑戰(zhàn)重重

在行業(yè)大模型落地的過程中,仍然有不少困難和挑戰(zhàn)需要去解決。

一是計算資源問題。訓練大型模型需要大量的計算資源和存儲資源,與一般服務器相比,GPU服務器的穩(wěn)定性比較低,大模型訓練需要的GPU經(jīng)常達到上千張卡。

對于許多企業(yè)來說,這可能是一個巨大的負擔,因此尋找更高效的算法和硬件優(yōu)化是解決這一問題的關(guān)鍵。

二是數(shù)據(jù)質(zhì)量問題。訓練大型模型需要大量的高質(zhì)量數(shù)據(jù),可現(xiàn)實情況卻是,這些數(shù)據(jù)往往存在噪聲、缺失值等問題,如果導入的數(shù)據(jù)質(zhì)量低,那訓練出來的模型也會有問題。

因此,研究人員需要采用各種方法來解決這些問題,例如數(shù)據(jù)清洗、去噪等,這也導致數(shù)據(jù)質(zhì)量或不準確。

三是大模型的應用問題。當把大模型的能力落到某個實際場景的應用產(chǎn)品上時,由于沒有參照,其實是并不好判斷具體該如何用這些模型的。

雖然大模型在某些領(lǐng)域表現(xiàn)出色,但是它們并不一定適用于所有場景。因此,需要根據(jù)具體應用場景選擇合適的模型。

此外,大型模型可能會泄露用戶的敏感信息,如醫(yī)療記錄、財務信息等。因此,保護用戶隱私是非常重要的,這需要采取措施確保數(shù)據(jù)的安全性和隱私性,例如使用加密技術(shù)、限制訪問權(quán)限等。

總之,大模型的落地面臨著許多挑戰(zhàn),需要克服這些挑戰(zhàn)才能實現(xiàn)其潛力。但從邏輯上講,行業(yè)大模型一定會是在精度相對較低、容錯率較高的行業(yè)先引用,再到精度要求高的地方去。

騰訊云有幾分勝算?

在當前的大模型賽道中,谷歌、微軟、亞馬遜等科技巨頭已經(jīng)占據(jù)了主導地位,他們擁有龐大的數(shù)據(jù)集和先進的算法技術(shù),能夠訓練出具有極高準確性和泛化能力的模型。

此外,國內(nèi)的百度、阿里巴巴、騰訊等企業(yè)也在積極布局大模型賽道,通過自主研發(fā)和收購等方式獲取更多的技術(shù)和數(shù)據(jù)資源。

騰訊的優(yōu)勢主要是其過去積累的龐大的業(yè)務數(shù)據(jù)和算力基礎(chǔ)設(shè)施,如今騰訊云的解決方案,就是基于這些過去的積累,解決大模型應用落地的痛點。

一方面,騰訊旗下有多個不同的業(yè)務板塊,多年來在金融、傳媒、文旅、工業(yè)等不同領(lǐng)域積累了大量的數(shù)據(jù)和經(jīng)驗。以此為養(yǎng)料,騰訊云才能構(gòu)建起一系列針對不同行業(yè)的行業(yè)大模型,同時針對一些特定的任務進行優(yōu)化,從而確保使用時僅需少了數(shù)據(jù)就可以達到較好的精調(diào)效果。

另一方面,騰訊云在大模型算力方面擁有領(lǐng)先優(yōu)勢。早在今年4月,騰訊云便發(fā)布了面向大模型訓練的新一代HCC高性能計算集群,采用最新一代騰訊云星海自研服務器,結(jié)合多層加速的高性能存儲系統(tǒng),具備3.2Tbps業(yè)界最高互聯(lián)帶寬,算力性能提升3倍。

騰訊還有自己的升級框架加速能力太極Angel,是其在人工智能領(lǐng)域的技術(shù)積累和創(chuàng)新成果之一,它采用了先進的異步調(diào)度優(yōu)化、顯存優(yōu)化、計算優(yōu)化等技術(shù)手段,可以顯著提升大模型的訓練和推理速度。

總之,騰訊入場大模型賽道將會對整個行業(yè)產(chǎn)生深遠的影響,推動技術(shù)的進步和商業(yè)的發(fā)展。

標簽:

推薦

財富更多》

動態(tài)更多》

熱點