您的位置: 首頁 > 新聞 > 智能家居 > 新聞詳情

英偉達推全新視覺AI語音模型 可以直接看圖聊天

時間:2024-09-02 16:59:40
  • 來源:互聯(lián)網(wǎng)
  • 作者:硅星人
  • 編輯:陶笛

如今AI大時代,世界各大巨頭都有自己的特色AI產(chǎn)品計劃,日前據(jù)英偉達官方消息,英偉達聯(lián)合 Georgia Tech、UMD 和 HKPU 的研究團隊推出了全新的視覺語言模型 ——NVEagle。

英偉達推全新視覺AI語音模型 可以直接看圖聊天

據(jù)悉,NVEagle 能夠理解復雜的現(xiàn)實場景,通過視覺輸入進行更好的解讀和回應。它的設計核心在于將圖像轉化為視覺標記,再與文本嵌入相結合,進而提升了對視覺信息的理解。

NVEagle包括了三個版本:Eagle-X5-7B、Eagle-X5-13B 以及 Eagle-X5-13B-Chat。其中,7B 和13B 版本主要用于一般的視覺語言任務,而13B-Chat 版本則專門針對對話式 AI 進行了微調(diào),能夠更好地進行基于視覺輸入的互動。

NVEagle 的一個亮點在于采用了混合專家(MoE)機制,能夠根據(jù)不同任務動態(tài)選擇最合適的視覺編碼器,這極大提升了對復雜視覺信息的處理能力。該模型已在 Hugging Face 上發(fā)布,方便研究人員和開發(fā)者使用。

英偉達推全新視覺AI語音模型 可以直接看圖聊天

0

玩家點評 0人參與,0條評論)

收藏
違法和不良信息舉報
分享:

熱門評論

全部評論

他們都在說 再看看
3DM自運營游戲推薦 更多+