微軟AI可基于圖片回答問(wèn)題,比蘋(píng)果siri更強大
微軟AI技術(shù)新進(jìn)展,未來(lái)可提供更多服務(wù)。
大家可能都用過(guò)蘋(píng)果siri,還記得第一次用的時(shí)候,都覺(jué)得很神奇吧!然而,近日,微軟在卡耐基梅隆大學(xué)的一個(gè)研究小組開(kāi)發(fā)出了一個(gè)新的AI系統,這個(gè)系統可以訓練機器識別圖像的內容,并回答自然語(yǔ)言提出的問(wèn)題。
當你拿著(zhù)一張圖片去問(wèn)它時(shí),這個(gè)新的系統就會(huì )回答你所問(wèn)的問(wèn)題,當然這只局限于圖片上的信息。研發(fā)人員表示,其實(shí)當系統回答用戶(hù)所問(wèn)的問(wèn)題,其過(guò)程是很復雜的。它需要多步驟推理,具體解決方案是 “堆棧注意力網(wǎng)絡(luò )(Stack Attention Networks)”,圖片經(jīng)過(guò)多層深度神經(jīng)網(wǎng)絡(luò )進(jìn)行“注意力”分析,計算出哪些區域與問(wèn)題有關(guān)。另外,圖像自動(dòng)字幕和機器翻譯都用到了單層 “注意力” 分析技術(shù)。
其實(shí)在去年,微軟就已經(jīng)研究院創(chuàng )造了一個(gè)自動(dòng)字幕系統,可以讓機器觀(guān)察圖像和描述其中內容。自那時(shí)以來(lái),該項目持續發(fā)展,而且現在成為微軟研究院整體戰略的一個(gè)核心部分。機器智能,或者說(shuō)創(chuàng )建一個(gè)真正的AI,一直是微軟多年來(lái)的既定目標。在云計算和機器學(xué)習技術(shù)進(jìn)步的幫助下,現在這方面的工作已取得突破。
在未來(lái),這項技術(shù)或許可以用于實(shí)時(shí)識別并預測人的需求,給你提供更多的服務(wù)。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
