寫(xiě)給初創(chuàng )公司的話(huà):數據權限是最有利的IP保護

Lynn 8年前 (2017-10-19)

在人工智能發(fā)展的初期,你們都是初創(chuàng )公司。

【編者按】本文編譯自”Data rights are the new IP rights”,作者為Mark Gorenberg和Ivy Nguyen兩人。

Mark Gorenberg是Zetta Venture Partners的董事總經(jīng)理。他擁有26年的風(fēng)險投資經(jīng)驗,資助并在眾多初創(chuàng )公司的董事會(huì )任職。在創(chuàng )業(yè)之前,他曾擔任過(guò)Sun Microsystems的第一個(gè)SparcStation團隊的軟件執行官。

Ivy Nguyen是Zetta Venture Partners的投資者。 她曾在NewGen Capital擔任高級助理,并在Imagine H2O管理啟動(dòng)加速程序。

以下為正文:

現在,很多開(kāi)發(fā)者將其開(kāi)發(fā)的代碼、算法等資源公開(kāi),導致科技領(lǐng)域很多算法服務(wù)類(lèi)的仿制品可以在數小時(shí)之內做出來(lái)。軟件專(zhuān)利為這方面的原創(chuàng )產(chǎn)品提供了一定的保護,但是雷同產(chǎn)品之爭仍然很激烈。

不過(guò),值得注意的是,沒(méi)有數據的軟件本質(zhì)上就是商品。

隨著(zhù)人工智能的發(fā)展,AI和數據的支持顯得越來(lái)越重要。但如果沒(méi)有數據,AI也沒(méi)有太大作用,如每一款AI類(lèi)的產(chǎn)品都先需要數據來(lái)訓練出算法的最基本性能(MAP),然后再向潛在客戶(hù)展示算法的性能表現,這樣新客戶(hù)帶來(lái)更多數據,用于提高算法性能,吸引更多新客戶(hù)等。

這種反饋循環(huán)的每一次迭代都會(huì )造成更多的競爭,因為繼續獲取可用數據對于保持此反饋循環(huán)的發(fā)展至關(guān)重要。因此,我們應當認識到,數據權限已經(jīng)成為新的知識產(chǎn)權。同時(shí),這為新興創(chuàng )業(yè)公司帶來(lái)了機遇和挑戰。

寫(xiě)給初創(chuàng  )公司的話(huà):數據權限是最有利的IP保護

初創(chuàng )公司具有“從頭開(kāi)始”的優(yōu)勢

此前,當很多用戶(hù)毫不猶豫的將自己的數據存儲在云盤(pán)等云平臺上,卻有多家公司因為數據存儲和維護的成本之高,而選擇放棄了管理用戶(hù)數據的權利。許多類(lèi)似的協(xié)議在今天仍然存在,因此造成了許多企業(yè)獲取的數據并不全面,從而阻礙他們將人工智能應用于其云產(chǎn)品的嘗試。

現在,我們步入了人工智能時(shí)代,更多的用戶(hù)讓第三方管理他們的數據,以確保其可以將更多的精力放在他們的領(lǐng)域。

人工智能的具體應用過(guò)程需要公司不間斷的獲取數據,然后對數據進(jìn)行清理、設置標簽、查詢(xún)和分析,以實(shí)現預測功能等。因而如今很多創(chuàng )業(yè)公司在已有的數據基礎上嘗試獲取更多的數據權限和資源。

并且許多將數據存儲到云供應商的企業(yè)認為初創(chuàng )公司構不成威脅,會(huì )共享其深入的數據訪(fǎng)問(wèn)權限,因此相對而言,初創(chuàng )類(lèi)公司擁有更多的自由和選擇。

一開(kāi)始就用好數據,進(jìn)入良性循環(huán)

對于A(yíng)I類(lèi)初創(chuàng )企業(yè),在最初與客戶(hù)談判數據權限方面問(wèn)題時(shí)應當搶占先機,拋出反饋循環(huán)帶來(lái)的數據需求問(wèn)題,利用其價(jià)值來(lái)要求盡可能多的數據權限。

在許多產(chǎn)品應用中,初創(chuàng )公司最初可以通過(guò)尋找優(yōu)質(zhì)的數據源來(lái)訓練學(xué)習算法,以此讓算法從一開(kāi)始就進(jìn)入一種良性循環(huán)。以下是一些可以嘗試的方法

1.針對中小企業(yè)和中端市場(chǎng)的客戶(hù),因為他們往往對數據權限持開(kāi)放態(tài)度,可以低價(jià)的優(yōu)質(zhì)產(chǎn)品來(lái)交換數據,此外,將這些小客戶(hù)的數據拿來(lái)訓練所花費的代價(jià),可以作為后期談判大客戶(hù)的參考。

2.雇用專(zhuān)人來(lái)負責對算法的訓練事宜。

3.找外部來(lái)源的數據,如來(lái)自政府機構的公開(kāi)數據集,或從Clearbit等第三方供應商處購買(mǎi)數據,還可以看看相關(guān)網(wǎng)站和社交媒體。

4.提供旗艦產(chǎn)品的免費增值版本,以捕獲用戶(hù)參與度數據。

5.以成本價(jià)出售優(yōu)質(zhì)的產(chǎn)品,以此獲得數據。如特斯拉,他采用的策略就是為了建立一個(gè)龐大的數據集來(lái)訓練自動(dòng)駕駛汽車(chē)。

事實(shí)證明,這些外部數據源中的數據,很多都可以將學(xué)習算法訓練到足夠高的性能水平,來(lái)讓初創(chuàng )公司向其客戶(hù)展示算法的價(jià)值,以吸引更多的客戶(hù)來(lái)使用。

但是,在人工智能的大背景下,創(chuàng )業(yè)公司擁有專(zhuān)有數據管道是必要的。因為這樣,公司的算法產(chǎn)品就可以從客戶(hù)網(wǎng)絡(luò )中的匯集學(xué)習中獲得復合效應,從而使新進(jìn)入該領(lǐng)域的公司和新興模擬者難以追趕。

現狀與策略

雖然初創(chuàng )公司在獲得更多數據權限方面比個(gè)人有優(yōu)勢,但想要達到目標并不容易。以下是一個(gè)典型案例:

一家初創(chuàng )公司具有令人難以置信的新型AI動(dòng)力工作流程演示,與傳統企業(yè)相比,這套系統可以節省企業(yè)數千個(gè)員工的工作時(shí)間。據該公司的演示,利用歷史銷(xiāo)售數據訓練了該算法,該系統可以幫助公司預測新的銷(xiāo)售潮流,并給出最佳的銷(xiāo)售時(shí)間點(diǎn)的建議。

但這個(gè)華麗的演示最終還是讓客戶(hù)企業(yè)離開(kāi)了,這筆交易就這樣不了了之。因為當企業(yè)已經(jīng)準備好購買(mǎi)并在全公司范圍內推出解決方案的時(shí)候,交易的審查過(guò)程中,因為數據安全等問(wèn)題,律師等人是不同意采用的。他們表示沒(méi)有辦法允許該初創(chuàng )公司訪(fǎng)問(wèn)他們的數據,以免數據落入競爭對手的手中。因此一旦沒(méi)有相關(guān)數據來(lái)進(jìn)行訓練,該產(chǎn)品對企業(yè)用戶(hù)來(lái)說(shuō)就不那么有價(jià)值。

所以交易開(kāi)始前,初創(chuàng )公司需明確表明,他們的興趣在于從數據和數據流中學(xué)習(如用戶(hù)參與度、交互數據、元數據、數據流量信息等),而不是聚合客戶(hù)的數據,然后將其轉售給第三方。開(kāi)始階段,數據權限的談判是最困難的,但隨著(zhù)時(shí)間的推移,隨著(zhù)大家對此方面認知的加深,這一過(guò)程會(huì )變得更加容易些。

總結

在云數據時(shí)代,公司通過(guò)發(fā)布新功能來(lái)進(jìn)行競爭,這些功能很容易復制,因此,絕對的市場(chǎng)占有率更難實(shí)現。從一開(kāi)始就進(jìn)入數據積累的良性循環(huán),這將為企業(yè)成為最后的贏(yíng)家提供一個(gè)保障。為了實(shí)現這一點(diǎn),初創(chuàng )公司的目標應該是獲得數據的獨家權利,積累客戶(hù)數據,形成合作伙伴關(guān)系。

大家需要明白的是,在積累了大量數據之后,現任和新興的競爭對手都無(wú)法通過(guò)其他方面來(lái)彌補這一方面的差距。數據使科技公司在歷史上第一次有機會(huì )建立強大的保護,防止傳統的老牌企業(yè)和新興的模仿者超越自身,并且這樣的保護能力也遠遠超出了傳統的知識產(chǎn)權戰略所能提供的保護。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到