數據先行,迎難而“下”,這才是AI革命的正確打開(kāi)方式!
智能的第一步是什么?
在鎂客網(wǎng)主辦的“M-TECH主題論壇”蘇州站會(huì )議中,無(wú)論是專(zhuān)注于前端成像芯片的眼擎科技商務(wù)總監代勇,還是致力于人臉識別研發(fā)與服務(wù)的云從科技高級副總裁孫慶凱,都不約而同得談到了一個(gè)話(huà)題:怎樣讓AI技術(shù)真正落地,為整個(gè)產(chǎn)業(yè)賦能?
智能的開(kāi)始,源自應用場(chǎng)景的“數據”
提到“智能”,AI領(lǐng)域的標志性人物Michael I. Jordan就曾直言不諱地給出否定:“我不喜歡用‘智能’這個(gè)詞,我認為我們現在還沒(méi)造出‘智能’,也不知道‘智能’是什么。”
盡管“智能”一詞盛行,但要在真正意義上實(shí)現它,并不容易。以發(fā)展成熟的智能音箱為例,連美國官員都在吐槽其“智障”。顯然,用戶(hù)用實(shí)際態(tài)度告訴我們,現在的AI產(chǎn)品還沒(méi)有達到我們心中對“智能”的定義。這也導致了從去年就喊起的“AI賦能”口號遲遲未能落實(shí)。
“機器要想像人類(lèi)、動(dòng)物一樣智能,首先需要做的就是獲得大量知識。”Michael I. Jordan說(shuō)。
眾所周知,這里的“知識”指的是有價(jià)值的數據,而它也是當前AI企業(yè)在做任何研究和產(chǎn)品之前所必須的“養分”。
對此,孫慶凱就在會(huì )議中特意介紹了他們的數據庫--云從大腦:
“云從大腦就是基于智力資源構建的,這些資源來(lái)源于海內外的專(zhuān)家資源和重要的平臺資源。如我們在美國有兩個(gè)很重要的分支機構;在國內,我們也和公安部一起合作搭建了應用平臺,并與公安部、四大行和民航總局建立了聯(lián)合實(shí)驗室。這些數據可以打造真正的 云從大腦,以用于提高識別的精準度。”
迎難而“下”,深入行業(yè)
盡管都知道數據極其重要,但是卻沒(méi)有幾家公司真正投入到數據挖掘的事業(yè)中,這一點(diǎn)在現有AI產(chǎn)業(yè)發(fā)展上表現得尤為明顯。
談及AI產(chǎn)業(yè)鏈上下游的企業(yè),人們喜歡將更多的目光投射在上中游的芯片、算法大公司,因為它們代表著(zhù)真正的技術(shù)和未來(lái)。甚至連AI獨角獸它們自己都常常忽視了最接近用戶(hù)、產(chǎn)品端的下游產(chǎn)業(yè)。
但隨著(zhù)AI產(chǎn)業(yè)退去熱潮,資本也逐漸趨于冷靜,此時(shí),注重商業(yè)化落地、AI賦能被提上了日程。2017年7月,國務(wù)院也迅速做出了反應,發(fā)布了《新一代人工智能發(fā)展規劃》,并在十九大中強調將人工智能和實(shí)體經(jīng)濟深度融合。
值此之際,在行業(yè)發(fā)展上,孫慶凱結合自身企業(yè)的發(fā)展給出了建議:“只有深入行業(yè),深入到各種應用場(chǎng)景中,我們才能夠真正了解行業(yè)的需求,做出真正的解決方案。對上游廠(chǎng)商來(lái)說(shuō),這也是真正的解決辦法。”
在這一點(diǎn)上,眼擎科技與云從不謀而合,它也是通過(guò)打入下游的方式,探索行業(yè)的真正需求。其產(chǎn)品--前端成像芯片,就是上下游交集的產(chǎn)物。他們通過(guò)收集和處理前端數據,并用高質(zhì)的信息來(lái)優(yōu)化自己的芯片設計。
“我們自己開(kāi)車(chē),有這樣的體驗:兩邊有路燈,汽車(chē)有大燈,前方的行人肯定能被駕駛員看見(jiàn)。但對于機器,情況就有所不同。只要機器本身的識別能力不夠,就做不到像人類(lèi)一樣輕松判斷。”
而這是只有貼近前端才會(huì )發(fā)現的問(wèn)題。
“這時(shí)如果不解決其在日常生活中弱光、逆光、反光燈環(huán)境的自適應成像能力問(wèn)題,AI視覺(jué)產(chǎn)品就無(wú)法大規模落地。”代勇表示。
產(chǎn)業(yè)化落地,現在的首要難點(diǎn)在哪里?
其實(shí)前端成像只是眾多行業(yè)里一個(gè)微小應用場(chǎng)景。盡管大家一致認為要通過(guò)場(chǎng)景的應用倒逼產(chǎn)業(yè)的發(fā)展,但要實(shí)現技術(shù)的產(chǎn)業(yè)化落地,AI巨頭們不僅需要耐下心來(lái)走入行業(yè),更要根據行業(yè)的實(shí)際發(fā)展情況找準正確的切入點(diǎn)。
事實(shí)是,因為發(fā)展速度的不同,監管力度的差異,各個(gè)行業(yè)(如金融、醫療、電商、教育等)正在經(jīng)歷的智能化階段不盡相同,因而其數據可利用的程度也是參差不齊。
在眾多細分化場(chǎng)景下,金融、電商無(wú)疑是數據最為成熟的領(lǐng)域。無(wú)論是從監管層面,還是數據積累上,它們都足以支撐AI產(chǎn)品和技術(shù)的發(fā)展。以金融領(lǐng)域為例,中國的金融體制已經(jīng)改革,并建立了一個(gè)相對完善的征信和信用體系,所以現在金融科技企業(yè)可獲取的數據幾乎是透明且相同的,因而他們的重點(diǎn)自然就落在了AI應用產(chǎn)品的探索上了。
而與此同時(shí),醫療領(lǐng)域卻正在經(jīng)歷一個(gè)“跑馬圈地”的階段。對此,專(zhuān)注于語(yǔ)音識別及語(yǔ)言處理技術(shù)的云知聲?創(chuàng )新事業(yè)部總經(jīng)理陳吉勝就毫不避諱的指出:醫療最重要的就是數據。
“我們?yōu)榱四玫较鄳臄祿?,做了很多努力,無(wú)論是跟協(xié)和醫院,還是和平安好醫生的合作,包括和平安好醫生成立合資公司,都是希望雙方在數據方面進(jìn)行更深入的共享。”
至于教育,因學(xué)生的行為極其復雜,目前甚至還沒(méi)有一家公司可以找到合適的方式去定義它們,真正“智能”的教育機器人就更加無(wú)從談起。
總結
數據統計顯示,與沒(méi)有使用大數據、云計算的同行們相比,采用這些技術(shù)和移動(dòng)戰略的企業(yè)發(fā)展速度要超過(guò)其53%。
當人人都想脫穎而出時(shí),真正的AI企業(yè)們應該耐下心來(lái)投身到自己所在的行業(yè)中,去探索數據中不為人知的秘密,從而設計出真正適合人類(lèi)使用的產(chǎn)品。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
