【資料圖】
微軟研究院近日公開了其最新研究項目——Project Rumi。該項目旨在通過結合文本、音頻和視頻數據,運用多模態方法,提升人工智能系統的理解能力,使其更能理解人類的意圖。 近年來,人工智能系統在自然語言處理(NLP)領域取得了顯著的進步。然而,現有的NLP AI主要依賴于文本輸入輸出,忽略了人類在自然交流中的語調、面部表情、手勢和肢體語言等線索,這在一定程度上導致了其在理解方面的偏差。在AI專業術語中,這些線索被統稱為副語言。 為了解決這個問題,微軟研究院開發了Project Rumi。這是一個新穎的框架,旨在通過多模態副語言提示來增強人工智能的理解。該項目包括兩個主要部分:多模式副語言編碼器和多模式副語言解碼器。
世界熱資訊!僅189元!小米智能多模網關2 8.16眾籌
【世界熱聞】為防止黃牛 日本索尼經銷商規定 PS4 老用戶才能買 PS5
環球速訊:20年內建成一座自給自足城市 馬斯克重申殖民火星想法
天天速看:僅推數字版 任天堂宣布《卡比的美食節》8月17日發售
滾動:得力推出國產自主研發彩色打印機 首發僅售 1299 元
全球滾動:設立54個推薦上車點 “蘿卜快跑”合肥開啟商業化試點
觀察:小米推新品電動牙刷,比普通牙刷還耐用?
世界百事通!CITE2022明日開展:智電生活成熱點
熱門:再也不怕找耳機了 AirPods Pro 2耳機盒能夠發聲
環球熱點!不管你是否愿意 蘋果iPhone廣告將越來越多