專(zhuān)訪(fǎng)澳鵬田小鵬博士:以AI數據服務(wù),賦能各行業(yè)AI商業(yè)化進(jìn)程
2020中國國際數字經(jīng)濟大會(huì )暨展覽會(huì )。
隨著(zhù)人工智能行業(yè)的高速發(fā)展,數據作為AI算法的重要基石,如何為機器學(xué)習算法訓練、優(yōu)化提供數據采集、標注等高質(zhì)量的服務(wù),成為人工智能熱潮中必不可少的一環(huán)。如何正確獲取數據、標注數據、應用數據?
10月28日,在由深圳市工業(yè)與信息化局、深圳市福田區人民政府指導,高科技行業(yè)門(mén)戶(hù)OFweek維科網(wǎng)主辦的“2020中國國際數字經(jīng)濟大會(huì )暨展覽會(huì )”上,澳鵬(Appen)全球高級副總裁、大中國區總經(jīng)理田小鵬博士接受了OFweek維科網(wǎng)的專(zhuān)訪(fǎng),暢談人工智能的基礎以及數據為社會(huì )、為行業(yè)、為企業(yè)的進(jìn)步所作出的貢獻。
圖:澳鵬(Appen)全球高級副總裁、大中國區總經(jīng)理田小鵬博士
人工智能助力新基建
最近,新型基礎設施建設,即“新基建”一詞備受關(guān)注?;A設施是經(jīng)濟社會(huì )發(fā)展的重要基石。在數字經(jīng)濟時(shí)代,5G、人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、數據中心等新技術(shù),正在驅動(dòng)新一輪科技革命和產(chǎn)業(yè)變革,成為數字經(jīng)濟發(fā)展的基石。
關(guān)于新基建,田博士表示,今年三月,國家再次提出要加快推進(jìn)包括5G 網(wǎng)絡(luò )、人工智能、數據中心等新型基礎設施的建設進(jìn)度。本次“新基建”的提出,不僅為經(jīng)濟增長(cháng)提供新的動(dòng)力,更為人工智能領(lǐng)域帶來(lái)了更廣泛的關(guān)注。人工智能不再僅僅是科技前沿,它已被列入了新基建的七大領(lǐng)域之一。
“國家把人工智能作為新的基礎設施來(lái)建設,可以說(shuō)是一項立足長(cháng)遠的規劃。”田博士稱(chēng)。
在“新基建”與“舊基建”兩方面的對比上,田博士指出,曾經(jīng)的前沿技術(shù)已被納入國家基礎設施建設。“發(fā)生這種轉變的原因,一是科技已經(jīng)發(fā)展到了可以被日常應用,并且能夠切實(shí)改善人們生產(chǎn)生活的程度,二是社會(huì )已經(jīng)發(fā)展到了需要科技產(chǎn)物的助力來(lái)進(jìn)一步提升生產(chǎn)效率和抗風(fēng)險能力的程度。”
人工智能作為這個(gè)時(shí)代科技發(fā)展的偉大產(chǎn)物,早已滲透到了人們工作和生活中的方方面面。如何解決民生剛需、解除民生痛點(diǎn)?這是人工智能應該做到的事情。在這一點(diǎn)上,田博士舉例指出:“在智能語(yǔ)音和智能語(yǔ)義的加持下,音響不再是單向輸出音頻的工具,而是能夠進(jìn)行人機互動(dòng)的智能設備;密碼解鎖在很多場(chǎng)景中,已經(jīng)被指紋、人臉識別替代。”
“可以說(shuō),人工智能是時(shí)代發(fā)展的新型燃料,通過(guò)高效挖掘數據價(jià)值,賦能各行業(yè)各領(lǐng)域智慧升級。”田博士說(shuō)道。
人工智能助力后疫情時(shí)代產(chǎn)業(yè)發(fā)展
人工智能作為支撐經(jīng)濟社會(huì )數字化、網(wǎng)絡(luò )化、智能化轉型的關(guān)鍵新型基礎設施,不僅在助力疫情防控、復工復產(chǎn)等方面作用突出,同時(shí),在穩投資、促消費、助升級、培植經(jīng)濟發(fā)展新動(dòng)能等方面潛力巨大。
那么,人工智能如何作出貢獻?
田博士指出,在這場(chǎng)使人與人之間保持距離、把人們社交活動(dòng)頻次降至最低的新冠疫情中,“左手支撐疫情防控,右手支撐復工復產(chǎn)”的人工智能,在抗疫人力不足時(shí)挺身而出,將防疫和工作效率提升數倍。“疫情的影響還在持續,而人工智能帶來(lái)的健康碼、AI醫生、送藥送餐機器人等各種高效管理和便民服務(wù),已經(jīng)同水、電、氣、網(wǎng)絡(luò )一樣,成了城市必不可少的‘基礎設施’。”
田博士進(jìn)一步指出,社會(huì )對于人工智能的需求遠遠不止于抗擊疫情。“此次疫情作為一個(gè)推手,已經(jīng)正式將人工智能全面推向社會(huì )的方方面面。智慧金融、智慧教育、智慧醫療、智慧交通等等都有著(zhù)人工智能在其中發(fā)光發(fā)熱。需求已然成熟,后疫情時(shí)代的人工智能產(chǎn)業(yè),絕不僅僅指向其自身的發(fā)展,而是要推動(dòng)各行業(yè)完成智能化轉型升級,實(shí)現新舊動(dòng)能的轉換。”
事實(shí)上,作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅動(dòng)力量,人工智能正在對經(jīng)濟發(fā)展、社會(huì )進(jìn)步、國際政治經(jīng)濟格局等多個(gè)方面產(chǎn)生重大而深遠的影響。根據德勤此前發(fā)布的《全球人工智能發(fā)展白皮書(shū)》預測,到2025年,世界人工智能市場(chǎng)規模將超過(guò)6萬(wàn)億美元,2017年至2025年復合增長(cháng)率達30%。
中國的人工智能舞臺更是潛力巨大。我國《新一代人工智能發(fā)展規劃》提出:到2030年,中國人工智能核心產(chǎn)業(yè)規模將超過(guò)1萬(wàn)億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規模超過(guò)10萬(wàn)億元。
AI算法是車(chē),數據是油
根據國際數據公司(IDC)2018年末的測算,2018年至2025年,全球的數據總量將由33ZB增加至175ZB。其中,中國的數據增長(cháng)量將保持30%的增長(cháng)速度,將是所有地區中增長(cháng)速度最快的。同樣,數據量的激增也催生出了數據服務(wù)行業(yè)這一龐大的市場(chǎng)。
機器強于人的地方在于它能夠存儲、處理大量數據。過(guò)去,機器得到的數據是人類(lèi)獲取并選擇性錄入,它所產(chǎn)出的結論充滿(mǎn)局限性。而現在,在人工智能的幫助下,機器能夠自己聽(tīng)、自己看,海量數據信息的記錄與分析為各行各業(yè)的日常決策與長(cháng)遠發(fā)展帶來(lái)前所未有的改變。
但問(wèn)題來(lái)了——機器存儲、處理的大量數據,從何處獲取,如何獲取成了關(guān)鍵。人工智能商業(yè)化在算力、算法和技術(shù)方面基本達到階段性成熟,想要加速落地,解決行業(yè)具體痛點(diǎn),就需要大量經(jīng)過(guò)標注處理的相關(guān)數據做算法支撐。
數據決定了AI的落地程度,是商業(yè)化過(guò)程中重要的一環(huán)。
田博士舉了一個(gè)生動(dòng)的例子。同樣是看月亮,在不同的經(jīng)度,不同的緯度中,會(huì )有差異。如果采用在一個(gè)國家的不同地方所觀(guān)察到的月亮,而不是在全球各個(gè)地方實(shí)地觀(guān)察,那么其標注的數據一旦應用于全世界數據中,錯誤的數據將會(huì )給后續一系列應用帶來(lái)錯誤的結果。
用AI來(lái)服務(wù)AI,賦與AI最初始的、準確的數據是基礎。“如果把AI中的算法比作是車(chē),那么數據便是油,想要車(chē)跑得更快、更好,‘喂’給它高質(zhì)量的油必不可少。”田博士稱(chēng)。
智能化轉型的機遇與挑戰
今年6月,在澳鵬(Appen)全球發(fā)布的2020年AI現狀年度報告《AI與機器學(xué)習的現狀》中,近四分之三的調研企業(yè)組織表示AI對他們的業(yè)務(wù)而言至關(guān)重要,越來(lái)越多的企業(yè)開(kāi)始將負責任的初始數據作為其實(shí)現業(yè)務(wù)成功的因素之一,這是機遇。
然而,人工智能項目的成功部署并沒(méi)有那么容易。據研究機構Gartner的調研顯示,在2019年,只有不到20%的人工智能項目成功部署。其中,數據問(wèn)題正是部署失敗的主要原因之一,這對于企業(yè)而言是一個(gè)無(wú)法避免的挑戰。
隨著(zhù)技術(shù)的不斷發(fā)展,傳統企業(yè)一定會(huì )走向AI的道路,在這條道路上,他們對于數據的需求相較于以往提出了更高的要求:第1是需要大量的高質(zhì)量數據;第2是數據的安全性、保密性、私密性及無(wú)歧視要求;第3是要求采標一體化。
田博士指出,企業(yè)自己完成這些數據任務(wù)是具有挑戰性的,并且成本高昂,處理不當時(shí)甚至可能弊大于利。對于希望高效完成AI部署的企業(yè)而言,與專(zhuān)業(yè)的數據伙伴開(kāi)展合作尤為重要。
“20多年以來(lái),澳鵬與全球領(lǐng)先的AI公司合作,提供高質(zhì)量的多樣化可擴展標注選擇,包括:先進(jìn)的人工智能輔助數據標注平臺、遍布全球的多語(yǔ)言專(zhuān)家、全球超過(guò)一百萬(wàn)的眾包資源,滿(mǎn)足180多種語(yǔ)言、方言和多樣化安全需求,以及符合道德規范的數據來(lái)源及公平的眾包報酬,降低品牌可能面臨的潛在風(fēng)險。我們的部署速度比市場(chǎng)平均速度快三倍以上。”田博士如是說(shuō)。
澳鵬的未來(lái)
關(guān)于澳鵬未來(lái)的戰略規劃,田博士稱(chēng),澳鵬將對其人工智能輔助數據標注平臺的幾個(gè)重點(diǎn)領(lǐng)域加大投入:
1. 標注工具箱,繼續優(yōu)化部分高復雜度的數據交付場(chǎng)景,比如自動(dòng)駕駛2D、3D標注;
2. 模型輔助平臺,研發(fā)行業(yè)一流的基于遷移學(xué)習和主動(dòng)學(xué)習框架的在線(xiàn)預標注平臺,大幅提升人機協(xié)同效率,為客戶(hù)創(chuàng )造價(jià)值;
3. 企業(yè)級數據API和可視化分析平臺,研發(fā)企業(yè)級數據API和可視化分析平臺,將平臺無(wú)縫接入客戶(hù)的模型研發(fā)流程,進(jìn)一步提升數據+模型的迭代效率。
田博士說(shuō):“去年10月,澳鵬中國首個(gè)數據服務(wù)交付中心——澳鵬科技(無(wú)錫)有限公司正式成立,投資200萬(wàn)美元;今年5月,澳鵬數據科技(上海)有限公司正式成立,投資200萬(wàn)美元。剛剛建成不久的大連服務(wù)交付站點(diǎn),則可以更多地為面向日語(yǔ)、韓語(yǔ)、俄羅斯語(yǔ),包括覆蓋東北領(lǐng)域的公司提供服務(wù)。未來(lái),澳鵬還將向更多的行業(yè)邁進(jìn),不斷砥礪前行,深耕細作。”
“澳鵬希望到2025年,可以做到10億美元的收入、上萬(wàn)人規模的企業(yè),真正開(kāi)始在大中華區的市場(chǎng),包括大陸、香港、臺灣等提供各種各樣的高質(zhì)量AI數據服務(wù)。”田博士稱(chēng)。
關(guān)于澳鵬
澳鵬(Appen)是全球領(lǐng)先的人工智能數據服務(wù)提供商,主要價(jià)值體現在擁有成熟的數據工程管理方法論和技術(shù)輔助保證穩定的高質(zhì)量交付;AI 數據平臺具備優(yōu)良的用戶(hù)體驗和領(lǐng)先機器學(xué)習輔助標注技術(shù),可大大提升數據標注和工程效率;規?;乃接谢捅姲鼣祿俗?,能使工程人員快速響應顧客的交付需求。
澳鵬(Appen)通過(guò)其超過(guò)100萬(wàn)名經(jīng)嚴格驗證的全球眾包資源群體——覆蓋130多個(gè)國家超過(guò)180種語(yǔ)言——支持公司的全球客戶(hù)。
澳鵬(Appen)持續不斷創(chuàng )新,以全球領(lǐng)先經(jīng)驗,力爭成為頂尖的AI數據服務(wù)公司,服務(wù)AI機器學(xué)習,并為全球高科技、汽車(chē)、消費電子、電子商務(wù)、金融服務(wù)、醫療健康及科研機構等行業(yè)提供高質(zhì)量、高效的、安全的數據服務(wù)。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
