慧安金科黃鈴:減少對標注數據的依賴(lài),做規避用戶(hù)隱私的AI風(fēng)控
慧安金科主要通過(guò)自主研發(fā)的半監督主動(dòng)式機器學(xué)習技術(shù)來(lái)構建金融風(fēng)控方面的預測模型和決策引擎。
洗錢(qián)、金融欺詐、各種黑產(chǎn)……
移動(dòng)互聯(lián)網(wǎng)帶來(lái)諸多便利的同時(shí),也是懸在我們頭上的達摩克利斯劍,稍有不慎,便會(huì )跌入圈套損失慘重。
“金融領(lǐng)域新的應用場(chǎng)景和產(chǎn)品不斷涌現,隨之而來(lái)的各種風(fēng)險、欺詐行為也是層出不窮。”這些促成了慧安金科的創(chuàng )始人黃鈴回國投身于AI風(fēng)控事業(yè)。
確實(shí),在越來(lái)越頻繁的金融欺詐行為下,智能風(fēng)控是趨勢,也是必然,借助AI技術(shù)的特性,它能做到及時(shí)預警、將損失最小化。
國內有AI技術(shù)的極佳落地場(chǎng)景
2017年,國內的創(chuàng )業(yè)氛圍都彌漫著(zhù)AI的味道,彼時(shí)還在國外從事大數據、計算機安全工作的黃鈴,也看到了國內發(fā)展智能風(fēng)控的機會(huì )。
“當時(shí)很多國內用的方法,在面對這些新型的應用場(chǎng)景時(shí)存在不足,我們的機會(huì )還是很大。”
作為AI領(lǐng)域的創(chuàng )業(yè)者,黃鈴的個(gè)人履歷可以說(shuō)非常亮眼,這也是諸多AI明星創(chuàng )企的標配。黃鈴是美國加州大學(xué)伯克利分校的計算機科學(xué)博士,師從Anthony Joseph和Michael Jordan,一直從事機器學(xué)習算法研究以及計算機網(wǎng)絡(luò )建模應用,在英特爾研究院擔任過(guò)資深科學(xué)家……所以,他極為擅長(cháng)借助AI技術(shù)解決網(wǎng)絡(luò )、數據和業(yè)務(wù)安全問(wèn)題,這也是慧安金科專(zhuān)注于智能風(fēng)控的原因。
圖 | 慧安金科創(chuàng )始人黃鈴
“我們希望把在硅谷、加州伯克利研究積累的技術(shù),應用在國內的風(fēng)控場(chǎng)景下。”黃鈴表示。
正好當時(shí)國內移動(dòng)支付之類(lèi)的線(xiàn)上金融產(chǎn)品面臨著(zhù)風(fēng)控上的巨大挑戰,天時(shí)地利人和下,黃鈴果斷與另外兩位伯克利的同窗,成立了主打金融風(fēng)控的慧安金科。
黃鈴強調,回國創(chuàng )業(yè)最關(guān)鍵的不是把國外現成的模式拷貝到國內,“我們更重要的是創(chuàng )新,國外有很好的技術(shù),但是在國內有更好的應用和落地場(chǎng)景。”
一方面是國外積累多年的機器學(xué)習研究,一方面是國內移動(dòng)互聯(lián)網(wǎng)發(fā)展下不斷涌現出的金融領(lǐng)域新場(chǎng)景、新應用,黃鈴領(lǐng)導下的慧安金科發(fā)展迅猛。
成立一年后,他們就完成了由創(chuàng )新工場(chǎng)領(lǐng)投,高瓴資本、丹華資本、長(cháng)風(fēng)智清等投資機構跟投的1億元A輪融資。
高額融資背后也是對他們技術(shù)特性的肯定,目前,慧安金科主要通過(guò)自主研發(fā)的半監督主動(dòng)式機器學(xué)習技術(shù)來(lái)構建金融風(fēng)控方面的預測模型和決策引擎。
減少數據標注的需求,用技術(shù)說(shuō)話(huà)
正所謂道高一尺魔高一丈,傳統的風(fēng)控方式已經(jīng)無(wú)法對抗現在全球范圍內的團伙作戰、狡猾多變的風(fēng)險行為。
黃鈴舉了個(gè)例子,“以前你需要大量的人工,以及歷史風(fēng)險樣本來(lái)訓練模型,積累黑白名單生成風(fēng)控的規則系統,這種方法面對新的風(fēng)險威脅和攻擊,防范起來(lái)非常吃力。”
他進(jìn)一步指出,如果我們采用黑白名單、IP信譽(yù)庫、規則系統這些方法,會(huì )涉及到大量數據的收集,也必然會(huì )關(guān)乎個(gè)人隱私問(wèn)題。所以,慧安金科采用了半監督主動(dòng)式機器學(xué)習技術(shù),在盡可能少的數據標注下,融合圖關(guān)聯(lián)分析、用戶(hù)行為建模等方法,準確快速地判斷交易行為和賬戶(hù)可能存在的風(fēng)險,進(jìn)行預警和控制。
所謂的半監督學(xué)習,也就是讓學(xué)習器不依賴(lài)外界交互、自動(dòng)地利用未標記樣本來(lái)提升學(xué)習性能,它的關(guān)鍵就在于利用少量的標注樣本和大量的未標注樣本進(jìn)行數據模型的訓練。
同時(shí),由于風(fēng)控反欺詐領(lǐng)域里每個(gè)標注過(guò)的案例都意味著(zhù)血淋淋的代價(jià),所以從這個(gè)角度看,AI風(fēng)控也應該用盡量少的歷史案例訓練出合適的機器學(xué)習模型。
“用標注很少的數據進(jìn)行建模,就得對海量未標注的數據進(jìn)行交叉分析查詢(xún)、異常檢測,相應的計算復雜度會(huì )比有監督機器學(xué)習高的多,從而對算力提出更高的要求。所以我們需要設計很好的算法,既能夠利用沒(méi)有標注數據的特性,又能夠降低處理這些數據的計算量。”這也是慧安金科獨特在算法上的獨特優(yōu)勢。
AI公司更要接地氣
黃鈴對公司的定位非常清晰明確,他強調AI只是一種技術(shù)手段,一個(gè)公司賴(lài)以生存的根本還是要“接地氣”,即用技術(shù)解決客戶(hù)的實(shí)際業(yè)務(wù)問(wèn)題,這樣才能體現技術(shù)的價(jià)值。
目前,慧安金科的業(yè)務(wù)也非常聚焦,主要集中在金融風(fēng)控場(chǎng)景,包括交易反欺詐、反洗錢(qián)、營(yíng)銷(xiāo)風(fēng)控和操作風(fēng)險識別等等,他們也和不少股份制銀行、電商平臺達成了深度合作。
“在這些場(chǎng)景里我們有自己核心的產(chǎn)品和平臺,既能兼顧客戶(hù)的需求,也會(huì )在解決方案的基礎上做一些定制。”黃鈴認為,智能風(fēng)控的核心就是讓數據說(shuō)話(huà),但是我們也急需好的制度去規范管理這些數據。
而且金融領(lǐng)域最為敏感的便是個(gè)人的數據隱私安全,智能風(fēng)控系統做到“監守不自盜”尤為重要,這也是黃鈴再而三強調的,不涉及個(gè)人數據隱私的情況下去建立好的風(fēng)控模型,通過(guò)算法提高對抗狡猾多變的欺詐行為的能力。
所以,慧安金科的目標是在不完全依賴(lài)歷史數據情況下,或者存在數據孤島的情況下,依然能夠建立出非常準確的風(fēng)控模型。
“我們一直朝這個(gè)方向努力,現在用的模型會(huì )更關(guān)注用戶(hù)的行為數據,你不需要知道這個(gè)人是誰(shuí)、他的電話(huà)等等信息,我們是根據他一系列行為去建模,而不是根據本人的身份來(lái)判斷風(fēng)險。”
黃鈴之前在采訪(fǎng)中曾舉過(guò)一個(gè)例子,用戶(hù)填寫(xiě)賬號或者輸入密碼時(shí)的速度、填寫(xiě)的順序、手指按下的力度等行為數據,都可以作為“數據原料”,通過(guò)對這些數據進(jìn)行特征的衍生處理和關(guān)聯(lián)分析,可以檢測出不同緯度上的異常。
從鎂客網(wǎng)和黃鈴的采訪(fǎng)中可以明顯感受到,這是一家強技術(shù)驅動(dòng)的公司,真正做到用人工智能技術(shù)解決傳統方法無(wú)能為力的問(wèn)題。不過(guò),當前智能風(fēng)控到底能規避多少可能存在的風(fēng)險行為,還是亟待更為先進(jìn)的技術(shù)去推動(dòng)。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
