人工智能開(kāi)源的重要性為什么被華為、小米一再強調?

Lynn 7年前 (2018-10-19)

在寄希望于A(yíng)I為整個(gè)世界賦能時(shí),我們還需思考如何為AI賦能?

卡內基梅隆計算機科學(xué)院院長(cháng)安德魯·摩爾(Andrew Moore)曾提到過(guò)這樣一組數據:現在,在提交給大型人工智能會(huì )議的論文,50%都來(lái)自中國,而在十年前,這個(gè)數據是5%。其實(shí)除學(xué)術(shù)研究,在過(guò)去一年,中國的AI初創(chuàng )公司在全球人工智能領(lǐng)域的融資占比也從2016年的11%迅速增長(cháng)為現在的48%。

當下,無(wú)論是技術(shù)的積累,還是資本的投入,國內AI產(chǎn)業(yè)發(fā)展都達到了一個(gè)新的量級,整個(gè)行業(yè)呈現出一種爆發(fā)式的增長(cháng)態(tài)勢。然而隨著(zhù)商用的推動(dòng)以及眾多AI企業(yè)對應用場(chǎng)景的不斷深入,技術(shù)與應用之間無(wú)法避免的“嫌隙”愈發(fā)被放大?,F實(shí)場(chǎng)景給出的反饋明確告訴我們,現在的AI技術(shù)短板十分明顯。

在剛剛過(guò)去的2018AIIA人工智能開(kāi)發(fā)者大會(huì )上,微軟中國首席技術(shù)官韋青就直言,當下人們對于A(yíng)I的態(tài)度過(guò)于樂(lè )觀(guān),整個(gè)社會(huì )的產(chǎn)業(yè)只有進(jìn)入智能再造過(guò)程,人工智能才算做到真正的賦能,而這還需要技術(shù)進(jìn)一步的發(fā)展。

寄希望于A(yíng)I為整個(gè)世界賦能之前,我們更應該思考的是,如何為AI賦能?

人工智能開(kāi)源的重要性為什么被華為、小米一再強調?

想要AI全面賦能,為什么要強調開(kāi)源?

所謂開(kāi)源,它本質(zhì)上是一種人才、智慧的聚合,是產(chǎn)業(yè)升級的強大助推器。不可否認,無(wú)論是上世紀九十年代的Linux開(kāi)源社區,還是當下的TensorFlow,它們在推動(dòng)各自行業(yè)發(fā)展的過(guò)程中舉足輕重??梢院敛豢鋸埖恼f(shuō),如果沒(méi)有開(kāi)源社區,蘋(píng)果、谷歌、Facebook都不會(huì )發(fā)展為現在的體量;如果沒(méi)有Linux,現在的互聯(lián)網(wǎng)格局也不會(huì )有今天的盛況。

而在“AI賦能”概念被廣為人知的這一年,AI企業(yè)卻無(wú)可避免得要讓市場(chǎng)失望。一邊是AI企業(yè)“大肆炫技”,一邊是民眾吐槽產(chǎn)品并非剛需,業(yè)內最戲謔的現象莫過(guò)于此。事實(shí)上,在市場(chǎng)中跌打滾爬后,人工智能的技術(shù)瓶頸話(huà)題也已經(jīng)不止一次被提起。種種跡象表明,AI技術(shù)全面賦能現實(shí)場(chǎng)景時(shí)機尚未成熟,技術(shù)研發(fā)還需探索。

以現在火熱的自動(dòng)駕駛為例,在開(kāi)發(fā)者大會(huì )上中國工程院院士鄭南寧就從技術(shù)的角度解讀了這一領(lǐng)域現存的問(wèn)題。他認為“當投入路測后,在復雜的場(chǎng)景和多樣的交互條件下,原本考慮各種狀況而設計出的系統根本無(wú)法應對。經(jīng)過(guò)推理分析,我們把問(wèn)題總結歸納為不確定性、約定條件和先驗知識的局限性,追本溯源,這主要來(lái)自神經(jīng)網(wǎng)絡(luò )和符號化的模型搭建固有的弊端。”

換言之,鄭南寧院士直指的其實(shí)是現有的神經(jīng)網(wǎng)絡(luò )技術(shù)問(wèn)題,即當下AI技術(shù)固有的弊端阻礙了自動(dòng)駕駛等領(lǐng)域進(jìn)一步的發(fā)展和應用。

人工智能開(kāi)源的重要性為什么被華為、小米一再強調?

圖 |中國工程院院士鄭南寧

紫光執行副總裁楚慶在大會(huì )演講上也毫不留情面的揭開(kāi)AI技術(shù)繁榮的面紗:“目前人工智能能力盡數彰顯,即當下技術(shù)的價(jià)值已經(jīng)完全顯露,想要為產(chǎn)業(yè)帶來(lái)新的增長(cháng)力,我們恐怕只能回本溯源,求助于自然科學(xué)。”

顯然,當前的AI技術(shù)能力不足以支撐進(jìn)一步的場(chǎng)景研發(fā),回歸技術(shù)、回歸開(kāi)發(fā)者已經(jīng)成為共同的認知。而當這一問(wèn)題在整個(gè)行業(yè)發(fā)展中凸顯時(shí),開(kāi)源這一解決辦法帶來(lái)的集思廣益必然是優(yōu)于閉門(mén)造車(chē)的。

小米首席架構師崔寶秋在演講中就以小米的產(chǎn)品佐證了開(kāi)源的重要性。“通過(guò)開(kāi)源可以驗證模型的質(zhì)量,AI巨頭也可以通過(guò)開(kāi)源快速占領(lǐng)市場(chǎng),處于領(lǐng)先地位。如小米的Cloud-ML平臺就是一款基于TensorFlow等開(kāi)源網(wǎng)站搭建的架構產(chǎn)品。”

如何更好協(xié)作和推進(jìn)開(kāi)源,推進(jìn)國內AI的未來(lái)?

開(kāi)源的好處諸多。顯而易見(jiàn),同行的智慧可以啟發(fā)開(kāi)發(fā)者,讓后輩的代碼寫(xiě)作高度一開(kāi)始就可以站在前人的肩膀上。對于公司而言,開(kāi)源也可以幫助企業(yè)擴大在特定領(lǐng)域的優(yōu)勢,形成差異化競爭。同時(shí),外部工作者的參與,對提高產(chǎn)品的用戶(hù)體驗也起到積極的推動(dòng)作用。

不過(guò),在開(kāi)源這件事上,基于利益和知識產(chǎn)權考慮,AI公司不可避免的需要格外謹慎。崔寶秋指出,“雖然開(kāi)源對整個(gè)行業(yè)有諸多裨益,但是對于公司而言,在展開(kāi)開(kāi)源項目時(shí),要平衡好開(kāi)源、業(yè)務(wù)和兩方投入比重的問(wèn)題。”

事實(shí)上,在開(kāi)源方面的投入,小米一直是不遺余力,也是國內成功推進(jìn)開(kāi)源工作的典范之一,如它推出的專(zhuān)用于移動(dòng)端異構計算平臺優(yōu)化的神經(jīng)網(wǎng)絡(luò )計算框架MACE、適用分布式KV存儲系統的算法架構Pegasus等,都給開(kāi)發(fā)者一定啟發(fā),被他們廣泛使用。

人工智能開(kāi)源的重要性為什么被華為、小米一再強調?

圖 | 小米首席架構師崔寶秋

而看見(jiàn)了當下AI能力的局限以及因其催生的需求后,為了助力產(chǎn)業(yè)發(fā)展,填補開(kāi)發(fā)平臺的空缺和需求,華為也是將重心放在賦能AI上。某種層面上,也是在服務(wù)開(kāi)發(fā)者。

對公司剛剛發(fā)布的全棧架構,華為基礎云服務(wù)開(kāi)源生態(tài)總經(jīng)理蔣曉黎做了解釋。“我們通過(guò)研究觀(guān)察發(fā)現,不同于傳統算法開(kāi)發(fā),現在A(yíng)I開(kāi)發(fā)者們遇見(jiàn)了許多新的問(wèn)題,如難以找到適度的數據集和適度的模型訓練,邊緣計算、端的復雜性帶來(lái)的邏輯推理和開(kāi)發(fā)速度大幅降低,以及繁雜的數據標注等工作等。華為推出的全棧架構在做的就是讓AI開(kāi)發(fā)者的開(kāi)發(fā)工作更簡(jiǎn)單,普惠AI。”

值得一提,華為方面雖未明確此架構是否開(kāi)源,但在全聯(lián)接發(fā)布現場(chǎng),徐直軍強調這是一款開(kāi)發(fā)者朋友“用得起,用得好,用的放心”的架構??梢?jiàn),華為一開(kāi)始就沒(méi)有將過(guò)多業(yè)務(wù)壓力放在此架構產(chǎn)品上,也算是無(wú)限接近開(kāi)源了。

人工智能開(kāi)源的重要性為什么被華為、小米一再強調?

圖 |華為基礎云服務(wù)開(kāi)源生態(tài)總經(jīng)理蔣曉黎

雖然如此,國內開(kāi)源工作也還是處于非常不成熟的階段。

反觀(guān)開(kāi)源發(fā)展史,從1983年的開(kāi)源操作系統GNU到2017年由英偉達和Facebook共同推出的開(kāi)源深度學(xué)習框架Caffe,國際科技巨頭在開(kāi)源工作上一直處于領(lǐng)先地位,作為后來(lái)的新人,國內的開(kāi)源推進(jìn)任務(wù)著(zhù)實(shí)艱巨。

對此,作為一位資深的開(kāi)源愛(ài)好者和國內開(kāi)源工作推進(jìn)的重要參與者,崔寶秋給出了自己的方向性建議。“第一步,我們要讓國內的開(kāi)源資源能夠走向模塊化和標準化道路,同時(shí),在人工智能時(shí)代這一獨特的大背景下,推進(jìn)數據的開(kāi)源也成為一件必須的事情。”

最后

事實(shí)上,開(kāi)源算法社區是互聯(lián)網(wǎng)時(shí)代背景下孕育出的一種特殊的技術(shù)孵化器,它需要需要開(kāi)發(fā)者和企業(yè)協(xié)作助力。當然,為AI全面賦能,不僅僅是發(fā)展算法架構,在硬件層面,AI加速硬件設計、測試過(guò)程也是十分必要。

和Arm有著(zhù)異曲同工之妙,新思科技一直在做的就是為芯片設計者提供更好的EDA工具。在大會(huì )上,該公司人工智能智能實(shí)驗室主任廖仁億在演講中就指出:“在當下的高度發(fā)展時(shí)代背景下,硬件設計過(guò)程耗時(shí)長(cháng)無(wú)疑成為了急需改進(jìn)的“短板”。因此,新思科技現在亟需要做的就是收集硬件設計過(guò)程中的各方面數據,開(kāi)發(fā)出更好用、更高效的人工智能EDA工具。”

為AI賦能需要更高效的硬件開(kāi)發(fā)工具和算法架構,而這要求行業(yè)內各個(gè)層面人士合力推進(jìn),國內稍顯落后的開(kāi)源工作無(wú)疑也需要提上日程。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到