本文來自合作媒體 聯合新聞網 ,INSIDE 授權轉載
人工智能再取得重大突破!觀察者網報導,1 月 11 日,由史丹福大學發起的機器閱讀理解領域頂級賽事 SQuAD 刷新排名,人工智能的閱讀能力歷史上首次超越人類。阿里巴巴憑借 82.440 的精確率打破了世界紀錄,並且超越了人類 82.304 的成績。
據報導,SQuAD 的負責人 Pranav Rajpurkar 難掩興奮之情。他在社交媒體上表示,2018 年一個強勁的開始,第一個模型(阿里巴巴 iDST 團隊提交的 SLQA +)在精確度匹配上超越人類表現!下一個挑戰:模糊匹配,人類仍然領先 2.5 分!
SQuAD 比賽構建了一個大規模的機器閱讀理解數據集 (包含 10 萬個問題),文章來源於 500 多篇維基百科文章。人工智能在閱讀完數據集中的一篇短文之後,需要回答若干個基於文章內容的問題,然後與標準答案進行比對,得出精確匹配 (Exact Match) 和模糊匹配 (F1-score) 的結果。
SQuAD 是行業內公認的機器閱讀理解頂級賽事,吸引了包括谷歌、卡內基美隆大學、史丹佛大學、微軟亞洲研究院、艾倫研究院、IBM、Facebook 等知名企業研究機構和高校的深度參與。
報導指出,此次技術的重大突破源於阿里巴巴研究團隊提出的「基於分層融合注意力機制」的深度神經網絡模型。該模型能夠模擬人類在做閱讀理解問題時的一些行為,包括結合篇章內容審題,帶著問題反覆閱讀文章,避免閱讀中遺忘而進行相關標注等。
模型可以在捕捉問題和文章中特定區域關聯的同時,借助分層策略,逐步集中注意力,使答案邊界清晰;另一方面,為避免過於關注細節,採用融合方式將全局信息加入注意力機制,進行適度糾正,確保關注點正確。
阿里巴巴自然語言處理首席科學家司羅表示,對於解決 wiki 類客觀知識問答,機器已經取得非常好的結果,將繼續向對通用內容的「能理解會思考」的終極目標邁進。今後,研發的重點在於把這項技術真正應用在廣大實際場景,讓機器智能普惠生活。
事實上,這項技術已經在阿里巴巴內部被廣泛使用。比如,每年雙 11 都會有大量的顧客對活動規則進行咨詢。阿里小蜜團隊通過使用司羅團隊的技術,讓機器直接對規則進行閱讀,為用戶提供規則解讀服務,是最自然的交互方式。
from INSIDE 硬塞的網路趨勢觀察 http://ift.tt/2EHrt28
沒有留言:
張貼留言