40題只答對14題,DeepMind的AI系統贏(yíng)了圍棋輸了數學(xué)

韓璐 6年前 (2019-04-13)

100分的題目,DeepMind的AI系統答對了35分。

日前,Alphabet旗下的DeepMind團隊讓AI系統當了一回“高中生”,并進(jìn)行了一場(chǎng)同等程度的數學(xué)考試。

最終成績(jì)顯示,這個(gè)智能水平處于世界領(lǐng)先地位、曾經(jīng)數度打敗圍棋頂尖選手的AI系統只答對了40道題中的14題。按照100分制,該AI系統只考了35分,遠遠不及格。

40題只答對14題,DeepMind的AI系統贏(yíng)了圍棋輸了數學(xué)

據了解,這40道題目中覆蓋了算術(shù)、幾何、概率、測量和微積分。而令人驚訝的是,AI系統甚至答錯了“1+1+1+1+1+1+1”這一題,給出了錯誤答案“6”,連小學(xué)生都不如。

對于這個(gè)錯誤答案是如何產(chǎn)生的,研究人員解釋稱(chēng),DeepMind神經(jīng)模型最長(cháng)可以計算出現次數6次以下的數值,但如果次數為7,就算不出來(lái)了。因為AI碰到同一數字出現多次,會(huì )認為輸入值是出錯的。然而較為奇怪的是,AI卻能算出更長(cháng)的加法題目。對此,研究人員承認還找不出很好的解釋?zhuān)苡锌赡苁且驗锳I神經(jīng)網(wǎng)絡(luò )不斷觀(guān)察每道問(wèn)題,從而做出正確的解答。

此外,當研究人員要求DeepMind在一長(cháng)串數字中找出“位值”,它就能答得很好,因為它可以按數字大小排出順序,也能將小數四舍五入。只不過(guò),這種數學(xué)題都是偏簡(jiǎn)單的。

從整體結果來(lái)看,AI系統在考試中答錯的多是那些由碰上文字、加減乘除符號、函數等組成的問(wèn)題,因為它看不懂這個(gè)問(wèn)題,所以無(wú)法作答。這個(gè)問(wèn)題也是過(guò)往考試中,AI系統一直面臨的問(wèn)題。待這一問(wèn)題得到解決,AI的“智力水平”或將能夠媲美中學(xué)生。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到