日韩视频日韩视频日韩视频日韩视频,一个人看的WWW视频免费观看

清華聯(lián)合字節(jié)，開(kāi)源聽(tīng)覺(jué)大語(yǔ)言模型SALMONN

2023-08-22 17:44:40 來(lái)源：DoNews快訊

【資料圖】

清華大學(xué)電子工程系日前與字節(jié)跳動(dòng)的火山語(yǔ)音團(tuán)隊(duì)攜手合作，推出一款開(kāi)源大語(yǔ)言模型 SALMONN。SALMONN 模型支持語(yǔ)音、音頻以及音樂(lè)輸入，它可以感知和理解不同類(lèi)型的音頻內(nèi)容輸入，并具備多語(yǔ)言語(yǔ)音識(shí)別和翻譯以及語(yǔ)音推理等功能。

官方表示，SALMONN 支持語(yǔ)音、音頻以及音樂(lè)輸入，可以感知和理解不同類(lèi)型的音頻內(nèi)容輸入，并具備多語(yǔ)言語(yǔ)音識(shí)別和翻譯以及語(yǔ)音推理等功能。

目前 SALMONN 能夠勝任英語(yǔ)語(yǔ)音識(shí)別、英語(yǔ)到中文的語(yǔ)音翻譯、情感識(shí)別、音頻字幕生成、音樂(lè)描述等重要的語(yǔ)音和音頻任務(wù)，同時(shí)又涌現(xiàn)出多種在模型訓(xùn)練中沒(méi)有專(zhuān)門(mén)學(xué)習(xí)過(guò)的多語(yǔ)言和跨模態(tài)能力，涵蓋非英語(yǔ)語(yǔ)音識(shí)別、英語(yǔ)到（中文以外）其他語(yǔ)言的語(yǔ)音翻譯、對(duì)語(yǔ)音內(nèi)容的摘要和關(guān)鍵詞提取、基于音頻的故事生成、音頻問(wèn)答、語(yǔ)音和音頻聯(lián)合推理等任務(wù)。

目前該模型已經(jīng)發(fā)布于 GitHub 中。

標(biāo)簽：