谷歌Waymo與DeepMind合作,開(kāi)發(fā)出新訓練方法提高自動(dòng)駕駛訓練質(zhì)量和效率

溫暖 6年前 (2019-07-27)

兩家公司最終希望訓練出一個(gè)能夠保持99%以上的總體障礙物識別率,并且減少誤報的AI模型。

Alphabet旗下的兩家公司終于合作了。

日前據媒體報道,Alphabet旗下的Waymo公司和DeepMind公司進(jìn)行了合作,他們開(kāi)發(fā)出一種模擬進(jìn)化論的新訓練方法,以此提高訓效率和質(zhì)量。

首先要知道一個(gè)AI算法模型是通過(guò)成千上萬(wàn)次的實(shí)驗來(lái)自我改進(jìn)的。通常工程師會(huì )給一個(gè)模型制定一個(gè)任務(wù),模型通過(guò)多次實(shí)驗以及收到的反饋來(lái)進(jìn)行調整,然后學(xué)習并執行任務(wù)。執行任務(wù)的表現主要依賴(lài)于訓練方案,因此對于研究人員和工程師來(lái)說(shuō),尋找最合適的訓練方案是其主要工作。他們會(huì )精心挑選接受培訓的AI模型,將表現差的模型剔除并釋放資源,然后從零開(kāi)始訓練新算法,這需要消耗研究人員和工程師的大量精力與時(shí)間。

據悉DeepMind基于PBT(基于人口的訓練)中設計出了一種勞動(dòng)密集度低的方法,該法法從隨機變量生成的多個(gè)機器學(xué)習模型開(kāi)始。模型會(huì )被定期評估,多個(gè)機器學(xué)習模型之間則會(huì )以進(jìn)化的方式互相競爭,表現不佳的模型會(huì )被“進(jìn)化”更好的、表現更好的模型副本取代,這個(gè)副本則被稱(chēng)為“后代”。每個(gè)后代會(huì )繼承父網(wǎng)絡(luò )的狀態(tài),因此PBT也就不需要從零開(kāi)始重新訓練,而整個(gè)訓練過(guò)程中,后代將會(huì )積極更新超參數?;诖?,最終PBT可以將其大量的資源用來(lái)訓練“好的”超參數值。

不過(guò)PBT也并不完美,這種方法側重于短期、當前的優(yōu)化,但并不是從長(cháng)期出發(fā),因此不利于后期發(fā)展的AI模型。為了解決這種情況,DeepMind的研究人員又培育了大量模型(人口),并創(chuàng )建名為“利基”的子人口,算法只會(huì )和其自己子群中的模型競爭。

目前,DeepMind和Waymo已經(jīng)將PBT應用到AI對行人、自行車(chē)和摩托車(chē)的識別任務(wù),希望以此來(lái)檢驗算法是否能夠得到進(jìn)一步提升。對于測試結果,Waymo表示PBT算法的精度更好,與手工調整的等效物相比,誤報率能夠減少24%,并且識別率仍然能夠維持比較高的水平,此外該算法還能夠節省時(shí)間和資源。Waymo稱(chēng),已經(jīng)將PBT納入了Waymo的技術(shù)基礎架構,公司的研究人員可以通過(guò)點(diǎn)擊按鈕來(lái)應用該算法。

兩家公司最終希望訓練出一個(gè)能夠保持99%以上的總體障礙物識別率,并且減少誤報的AI模型。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到