AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國科技企業(yè)的角色

巫盼 7年前 (2018-07-27)

京東金融四篇論文入選KDD2018,打通學(xué)術(shù)和產(chǎn)業(yè)多端口。

近日,數據挖掘和數據科學(xué)領(lǐng)域最頂級的學(xué)術(shù)年會(huì )KDD(國際數據挖掘與知識發(fā)現大會(huì ))正式對外宣布了今年論文收錄情況:2018KDD總共收錄295篇論文,其中來(lái)自中國企業(yè)和研究機構的論文為103篇。

這個(gè)數據背后的意義耐人尋味,它標志著(zhù)我國AI學(xué)術(shù)再上一個(gè)臺階,意味著(zhù)即使是在KDD這樣論文錄取極為嚴格的國際頂尖AI學(xué)術(shù)會(huì )議上,中國高校和企業(yè)的身影已經(jīng)無(wú)疑是其中最濃墨重彩的一筆。

AI學(xué)術(shù)浪潮已來(lái)

在斯坦福大學(xué)發(fā)布的2017年人工智能指數年度報告中,學(xué)術(shù)方面,計算機科學(xué)領(lǐng)域的論文數量自1996年以來(lái)增長(cháng)了6倍,同時(shí)期內,AI領(lǐng)域的學(xué)術(shù)論文增長(cháng)了9倍。兩者相比,凸顯了學(xué)術(shù)界對AI的關(guān)注和重視程度。

伴隨著(zhù)人工智能技術(shù)應用而起的AI學(xué)術(shù)浪潮已來(lái)。

談及國內的AI學(xué)術(shù)發(fā)展,繞不開(kāi)的話(huà)題就是去年7月國務(wù)院正式印發(fā)的《新一代人工智能發(fā)展規劃》,其中重點(diǎn)之一就是:

聚焦人工智能重大科學(xué)前沿問(wèn)題,以突破人工智能應用基礎理論瓶頸為重點(diǎn),超前布局可能引發(fā)人工智能范式變革的基礎研究,促進(jìn)學(xué)科交叉融合,為人工智能持續發(fā)展與深度應用提供強大科學(xué)儲備。

AI學(xué)術(shù)理論研究作為產(chǎn)學(xué)研的基礎,很快得到了國內各大高校的積極響應。

隨后,諸多高校開(kāi)始相機設立了AI學(xué)院或者相關(guān)的研究機構,一方面培養AI方面人才,另一方面從“小”開(kāi)始,攻堅AI學(xué)術(shù)研究。

截止到2018年7月份,我們統計了已經(jīng)設立AI學(xué)院的部分高校:

AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國AI企業(yè)的角色

高校之外,在一些國際性大會(huì )上,來(lái)自中國的面孔更是不容忽視。

據了解,目前全球AI相關(guān)的頂級會(huì )議主要如下:

AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國AI企業(yè)的角色

其中,在2017年AI界頂級會(huì )議AAAI大會(huì )上,有2571篇投稿論文,其中,中國和美國的投稿數量分別占到31%和30%,雖然在被接收論文數量上,中國還是低于美國,但數量已經(jīng)大幅提升。

而根據美國白宮此前發(fā)布的《國家人工智能研究與發(fā)展策略規劃》來(lái)看,從2013年到2015年,以SCI收錄的論文數量計算,在增加“文章必須至少被引用過(guò)一次”附加條件后,中國在2014年和2015年都超過(guò)美國,位居前列。

同樣在KDD上,作為數據挖掘領(lǐng)域的頂級學(xué)術(shù)會(huì )議,大會(huì )每年的論文接收嚴格度非常高,僅約200篇,接收率不超過(guò)20%。然而值得注意的是,近幾年的KDD上,收錄的國內高校和企業(yè)的論文數量逐年增加,比如今年接收的中國論文總數更是達到103篇,超過(guò)論文總數(295篇)三分之一,這股來(lái)自東方的學(xué)術(shù)力量不容小視。

KDD上中國AI力量的崛起

確實(shí),在KDD 20多年的歷史中,從參與度到科研成就,從影響力到活動(dòng)組織,越來(lái)越多的中國的元素體現在其中。

在KDD2016大會(huì )的“Data Science of China(數據科學(xué)在中國)”分論壇上,當時(shí)有業(yè)內專(zhuān)家統計了近7年來(lái)KDD文章錄用情況和參會(huì )人員數據。從2010年至今,第一作者為華人的錄用文章占總錄用文章的45%左右,并呈上升趨勢,今年該比例更是高達56%。

AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國AI企業(yè)的角色

圖 | 歷年華人第一作者文章數量占總數比

另外,兩岸三地的參會(huì )人數也從2013年的102人增長(cháng)到今年的168人,如下表所示,表示了國內的研究水平和能力的提升。

AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國AI企業(yè)的角色

圖 | 歷年KDD兩岸三地參會(huì )人數

此前,微軟學(xué)術(shù)搜索分析了最近五年(2013年到2017年)的KDD論文數量,參考了KDD發(fā)表文章的引用次數以及作者之間互相引用情況,總結了其中最具影響力的作者,圖上提到的21名學(xué)者中,華人有13名,占據了其中的62%。其中,圖表的橫軸表明了作者總體在數據挖掘領(lǐng)域的聲望排名,越靠右的排名越高;縱軸則表明了作者在KDD的威望排名,位置越高排名就越高。值得注意的是,最右上角圓圈所代表的的學(xué)者正是京東金融副總裁、首席數據科學(xué)家、城市計算事業(yè)部總經(jīng)理鄭宇。

AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國AI企業(yè)的角色

圖 | 2013年到2017年KDD上最具影響力的作者

在2017年的KDD大會(huì )中,KDD 2017杰出服務(wù)獎(Service Award)則授予給了香港科技大學(xué)的楊強教授,以表彰他在數據挖掘和人工智能領(lǐng)域非凡的服務(wù)和貢獻。

同時(shí),KDD在近幾年和中國的合作也非常密切,除了楊強教授領(lǐng)銜的SIGKDD China,在7月21日,由京東金融承辦的2018 KDD Summer School暨KDD18 Pre-Conference在四川召開(kāi),而在今年3月,京東金融就已經(jīng)參與承辦了國際數據挖掘領(lǐng)域頂級賽事KDD Cup 2018。

AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國AI企業(yè)的角色

圖 | 2018 KDD Summer School活動(dòng)現場(chǎng)的Poster交流環(huán)節

值得注意的是,今年京東金融也有四篇論文被KDD大會(huì )收錄,作者均來(lái)自京東金融城市計算事業(yè)部(京東金融于2018年成立的全新一級事業(yè)部),占京東集團論文收錄總數量的接近一半。

其四篇論文主題分別為《共享單車(chē)動(dòng)態(tài)調度:時(shí)空數據上的強化學(xué)習模型》、《基于深度分布式融合網(wǎng)絡(luò )的空氣質(zhì)量預測》、《利用共享單車(chē)軌跡數據的違章停車(chē)檢測》、《基于對等和時(shí)間感知的表示學(xué)習的駕駛行為分析》,都是依托城市計算這一多學(xué)科融合的新興領(lǐng)域,通過(guò)不斷獲取、整合和分析城市中多種大數據來(lái)解決城市所面臨的交通、環(huán)境等挑戰。

頂級學(xué)術(shù)會(huì )議上的中國企業(yè)之光

· 做學(xué)術(shù)也要“接地氣”

如前文所述,KDD作為數據挖掘和數據科學(xué)領(lǐng)域最頂級的學(xué)術(shù)年會(huì ),來(lái)自學(xué)術(shù)界,工業(yè)界和政府部門(mén)的研究人員都希望在KDD上發(fā)表和展示自己的有影響力的工作,因而每年的投稿量都特別大,所以KDD的接收率一直非常低。

據了解,以KDD的應用數據科學(xué)論文為例,每篇投稿文章由至少3到4名審稿人評審及1名相應領(lǐng)域的高級程序委員協(xié)調討論并推薦,最終由程序委員會(huì )主席決定是否錄取。

所以國內企業(yè)能夠從其中脫穎而出,更是實(shí)屬不易,這背后反映的不僅僅是科研能力的提升,也是企業(yè)解決實(shí)際問(wèn)題的能力。

以每一年KDD的重要競賽環(huán)節KDD CUP為例,其題目范圍基本上圍繞與數據科學(xué)相關(guān)的現實(shí)問(wèn)題,許多試題都有很強的應用背景。

比如簡(jiǎn)單統計了歷年了KDD CUP的賽題:

AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國AI企業(yè)的角色

學(xué)術(shù)研究最終還是要落地到解決實(shí)際問(wèn)題,像KDD這樣的頂級學(xué)術(shù)會(huì )議,也非常注重企業(yè)用數據去解決現實(shí)問(wèn)題的能力,這也凸顯了學(xué)術(shù)在“束之高閣”的同時(shí),也不斷地向產(chǎn)業(yè)落地延伸。

從京東金融被收錄的四篇論文也能明顯看出這個(gè)趨勢。

· 企業(yè)科研的強落地能力

仔細研讀今年京東金融被收錄的四篇論文,就很好體現了學(xué)術(shù)研究和產(chǎn)業(yè)落地的緊密融合。比如《利用共享單車(chē)軌跡數據的違章停車(chē)檢測》這篇論文,研究背景就是國內共享單車(chē)爆發(fā)所產(chǎn)生的騎行軌跡數據,給檢測違章停車(chē)帶來(lái)新機遇。

論文中提到的基于共享單車(chē)軌跡數據的違章停車(chē)檢測技術(shù)通過(guò)預處理和檢測模塊,綜合軌跡清洗、路網(wǎng)匹配、軌跡索引方案等技術(shù),已經(jīng)成功應用在部分地區的違停檢測上。據悉,京東金融也已經(jīng)和北京摩拜科技公司完成內部部署,并展示給交管部門(mén),為交警進(jìn)行違停管理提供幫助,并為停車(chē)場(chǎng)的增建提供建議。

而在21日舉辦的2018 KDD Summer School上,京東金融副總裁、首席數據科學(xué)家、城市計算事業(yè)部總經(jīng)理鄭宇提到“城市計算是用大數據和人工智能打造未來(lái)城市,具體也就是對數據不斷的采集、管理、分析、挖掘,來(lái)解決城市的痛點(diǎn),比如交通擁堵和環(huán)境污染。從城市的規劃、運維到預測,形成一個(gè)閉環(huán),推動(dòng)城市可持續發(fā)展。”

AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國AI企業(yè)的角色

圖 | 京東金融副總裁、首席數據科學(xué)家、城市計算事業(yè)部總經(jīng)理鄭宇

這也是學(xué)術(shù)研究到產(chǎn)業(yè)落地的完美閉環(huán)。

從企業(yè)的角度來(lái)看,在推動(dòng)城市可持續發(fā)展中,一方面是企業(yè)對經(jīng)濟利益的追求,更重要的也是對社會(huì )利益的重視。

以當前嚴重的空氣污染問(wèn)題為例,預測未來(lái)空氣質(zhì)量不僅可以幫政府更好地做出決策,也可以幫助人們規劃未來(lái)出行計劃。

在KDD收錄的四篇論文中,京東金融就提出了一種基于深度學(xué)習的預測方法DeepAir來(lái)預測未來(lái)48小時(shí)細粒度空氣質(zhì)量。其采用深度分布式架構來(lái)融合異構數據,對所有影響空氣質(zhì)量的直接和間接因素進(jìn)行建模。對比于傳統預測模型的結果(2014.10.1-2016.12.30),DeepAir的模型準確率比它們高22%。

AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國AI企業(yè)的角色

AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì )議上中國AI企業(yè)的角色

當然,這也是現在科技企業(yè)做學(xué)術(shù)研究的一大趨勢——體現他們的強科研落地能力。比如今年騰訊旗下醫療AI實(shí)驗室共有3篇論文分別被KDD 2018、SIGIR 2018、COLING 2018三個(gè)國際頂尖學(xué)術(shù)會(huì )議收錄,其論文的主要研究方向為醫療知識圖譜中實(shí)體關(guān)系的發(fā)現和應用,就是通過(guò)大數據以及知識圖譜,輔助臨床決策,賦能基于A(yíng)I的醫療產(chǎn)品。

· 學(xué)術(shù)研究,決定了企業(yè)的另一面

越來(lái)越多的企業(yè)注重技術(shù)研發(fā)以及學(xué)術(shù)研究,也表現了大公司在擴大商業(yè)版圖的同時(shí),非常注重技術(shù)的深耕和持續研究等等,這是一個(gè)雙向互利的過(guò)程。

此前馬斯克曾發(fā)表過(guò)90%的學(xué)術(shù)論文無(wú)用的言論,一石激起千層浪。誠然,在一些商人眼里,寫(xiě)論文是燒錢(qián)的事情,沒(méi)有什么價(jià)值。但是如業(yè)內專(zhuān)家所說(shuō),一篇論文,經(jīng)過(guò)同行評議、修改、發(fā)表出來(lái)。這個(gè)過(guò)程本身就是一種價(jià)值,光看最后的論文,當然90%賺不到錢(qián)。但也是為研究從量變到質(zhì)變添了一塊磚。

同樣,就像浙江工業(yè)大學(xué)計算機科學(xué)與技術(shù)學(xué)院院長(cháng)王萬(wàn)良所說(shuō),要明確認識企業(yè)做論文的正確作用,“論文不是設計圖紙,許多只是實(shí)用技術(shù)的前期研究中間結果,企業(yè)的研發(fā)和高??蒲性核难邪l(fā)是不同的研發(fā)階段,難以互相取代。許多事情關(guān)鍵是正確認識。”

而企業(yè)在頂級學(xué)術(shù)會(huì )議中扮演著(zhù)越來(lái)越關(guān)鍵的角色,同樣以京東金融為例,其城市計算事業(yè)部的一篇論文此前也被人工智能領(lǐng)域國際頂級學(xué)術(shù)會(huì )議IJCAI2018錄用。

頂級的學(xué)術(shù)會(huì )議不僅僅是學(xué)術(shù)界展示自身學(xué)術(shù)實(shí)力的機會(huì ),也正在成為大公司展現科研實(shí)力的重要舞臺。

以深度學(xué)習為例,在平臺、算力和數據系統的基礎之上,無(wú)論高校還是企業(yè)的實(shí)驗室,做出來(lái)的研發(fā)成果近乎可以在產(chǎn)業(yè)端即插即用,這也是為什么大公司需要在A(yíng)I時(shí)代參加這些學(xué)術(shù)會(huì )議發(fā)表論文、以及技術(shù)比賽。

據了解,在科研成果的應用轉化方面,京東金融城市計算事業(yè)部就已經(jīng)為國家發(fā)改委城市和小城鎮改革發(fā)展中心、環(huán)保部、水利部、交通部等多個(gè)中央部委提供科技服務(wù),并與國家能源集團、中國聯(lián)通、北控集團、摩拜、鏈家等企業(yè)開(kāi)展深度合作。

最后

在英國政府與圖靈研究院發(fā)布的《2017AI產(chǎn)業(yè)報告》中,就指出過(guò)這樣一個(gè)問(wèn)題:今天整個(gè)AI產(chǎn)業(yè)中,最急切需要的,是學(xué)術(shù)與產(chǎn)業(yè)多個(gè)端口之間的流通與聚合能力。

無(wú)論是KDD,還是IJCAI,亦或是其他AI頂級學(xué)術(shù)會(huì )議上,國內高校和企業(yè)的身影越來(lái)越多,一方面這是中國AI學(xué)術(shù)能力的體現,另一方面也凸顯了在學(xué)術(shù)和科研上,大家都在一步步穩扎穩打,共同助推產(chǎn)學(xué)研一體化,用AI解放生產(chǎn)力、創(chuàng )造更多的社會(huì )價(jià)值。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到