AI與大數據融合時(shí)代來(lái)臨,DTCC2019 精彩內容不能錯過(guò)!
數據驅動(dòng)商業(yè)變革,創(chuàng )新引領(lǐng)行業(yè)未來(lái)。
2019年5月8日-5月10日,由IT168旗下ITPUB企業(yè)社區平臺主辦的第十屆中國數據庫技術(shù)大會(huì )(DTCC 2019),將在北京市新云南大酒店召開(kāi)。本次大會(huì )將以“數據風(fēng)云,十年變遷”為主題,采用“3+2”模式。即3天傳統技術(shù)演講+2天深度主題培訓。大會(huì )設置了超過(guò)100場(chǎng)的主題演講;另外,為了深化數據領(lǐng)域的項目落地,還提供了2天的深度課程培訓。
中國數據庫技術(shù)大會(huì )已經(jīng)成功舉辦了九屆,DTCC 2019是第十屆。十年的風(fēng)雨同舟,十年的相濡以沫!DTCC已成為中國數據庫領(lǐng)域最具影響力品牌,是CIO/CTO、數據庫系統管理員、DBA經(jīng)理/主管,數據庫架構師、數據分析師及系統管理員等人群的饕餮大餐。
AI與大數據應用、云時(shí)代的數據庫,NoSQL 技術(shù)與實(shí)踐,金融行業(yè)數據庫實(shí)踐、NewSQL 分布式數據庫實(shí)踐……DTCC 數據庫技術(shù)大會(huì )的議題設置,涉及與數據相關(guān)的各個(gè)層面,包括:數據架構、數據分析、數據治理等。其中,AI與大數據應用專(zhuān)場(chǎng),是此次大會(huì )的重點(diǎn),為了提高議題的深度和廣度,組委會(huì )特設置了上、下兩個(gè)專(zhuān)場(chǎng),分別于5月8日和5月9日下午,與您共聚一堂,共話(huà)行業(yè)未來(lái)!
在過(guò)去幾年,大數據行業(yè)的發(fā)展已足夠成熟,大數據落地案例隨處可見(jiàn);而最新的AI技術(shù),則是大數據發(fā)展的助推器,把大數據推向一個(gè)新的頂峰。進(jìn)入2018年以后,AI和大數據融合趨勢明顯,未來(lái)可能會(huì )成為企業(yè)挖掘商業(yè)價(jià)值的最大推動(dòng)力。過(guò)去,企業(yè)數據可用性不高,樣本容量也有限,無(wú)法在毫秒內分析大量數據;而人工智能和機器學(xué)習技術(shù),讓企業(yè)在數據容量和數據源可用性方面有了質(zhì)的飛越,才有了真正的大數據訪(fǎng)問(wèn)和實(shí)時(shí)處理能力。同樣,人工智能技術(shù)雖然已經(jīng)存在了幾十年,但是直到現在,當人們有了更強大的數據采集、存儲、計算能力后,才獲得了更先進(jìn)的算法和機器學(xué)習模型。
把人工智能和大數據技術(shù)結合在一起,將帶來(lái)意想不到的商業(yè)價(jià)值。以瓜子二手車(chē)為例,雖然二手車(chē)行業(yè)廣告營(yíng)銷(xiāo)非常密集,但是品牌廣告的獲客能力已達到瓶頸,存量市場(chǎng)的用戶(hù)運營(yíng)變得愈發(fā)重要。大數據時(shí)代,企業(yè)可以輕而易舉地獲取大量的用戶(hù)數據,比如用戶(hù)的登錄/注冊時(shí)間、搜索/瀏覽了哪些車(chē)源、實(shí)地查看了哪些車(chē)源等等。有了這些數據,再結合人工智能和機器學(xué)習算法,企業(yè)能夠深入分析和挖掘用戶(hù)的特征和偏好,并針對不同的用戶(hù)進(jìn)行個(gè)性化的精細運營(yíng)。屆時(shí),瓜子二手車(chē)資深研發(fā)工程師周家帥,將參加DTCC2019 數據庫大會(huì ),全面分享大數據和人工智能在瓜子精細化運營(yíng)平臺中的應用實(shí)踐和落地經(jīng)驗。
通過(guò)新一代信息技術(shù)推動(dòng)用戶(hù)增長(cháng),這也是快手能把競爭對手甩出幾條街的根本原因。前快手增長(cháng)技術(shù)負責人張翼認為,用戶(hù)增長(cháng)(user growth)和增長(cháng)黑客(growth hacking)不僅是一個(gè)炙手可熱的話(huà)題,更是全新的組織方式和企業(yè)推進(jìn)方式。用戶(hù)增長(cháng),強調以數據和技術(shù)為驅動(dòng)力,通過(guò)多角色的增長(cháng)團隊,做快速、極致的小步迭代,從而提升用戶(hù)的增長(cháng)速度、留存和活躍度;而增長(cháng)黑客,則依賴(lài)技術(shù)新渠道、大數據與數據分析,來(lái)實(shí)現快速測試產(chǎn)品開(kāi)發(fā)及營(yíng)銷(xiāo)的新想法,也是一種利用用戶(hù)行為數據驗證或尋求演進(jìn)的科學(xué)方法。簡(jiǎn)單理解,這兩種方法打破了傳統市場(chǎng),傳播,產(chǎn)品,運營(yíng)和技術(shù)的界限,讓用戶(hù)社交和分享得到高度重視,讓現有用戶(hù)來(lái)不斷帶來(lái)新用戶(hù)。那么,當用戶(hù)增長(cháng)以及增長(cháng)黑客遇到了人工智能,將碰撞出怎樣的火花?在5月8日的數據庫技術(shù)大會(huì )上,張翼將具體介紹人工智能,深度學(xué)習,個(gè)性化推薦等技術(shù),如何幫助一家互聯(lián)網(wǎng)企業(yè)實(shí)現用戶(hù)的增長(cháng)和產(chǎn)品提升。
人工智能和大數據技術(shù)帶來(lái)了強大的獲客能力,騰訊也是最大的獲益者。“騰訊廣告系統每天有上百億次請求量,以及上百T的數據,為保證數據流的穩定可靠和高性能,騰訊實(shí)施了一系列數據保護措施。”騰訊廣告數據系統總監李銳表示,對于數據分析場(chǎng)景,騰訊基于Spark和Hbase構建了一套實(shí)時(shí)離線(xiàn)統一的統計系統,還自研了一套基于ssd的多維數據透視分析系統,對萬(wàn)億行數據做實(shí)時(shí)查詢(xún)僅需秒級。同時(shí),借助于機器學(xué)習技術(shù),特征工程重點(diǎn)保障特征數據的正確性,確保訓練和預估使用的特征數據一致性,并且提升特征生產(chǎn)和調研的效率。此外,騰訊廣告系統還涉及數據安全以及整個(gè)平臺的架構問(wèn)題等等。具體內容細節,將在數據庫大會(huì )當天揭曉。
借助人工智能和大數據技術(shù)打造數字營(yíng)銷(xiāo)平臺,精碩科技也積累了很多寶貴經(jīng)驗。精碩科技高級架構師劉喆,將分享人工智能在數字營(yíng)銷(xiāo)領(lǐng)域的一些實(shí)踐,包括:平臺構建、算法落地和具體的案例等。
然而,挖掘數據價(jià)值,讓數據驅動(dòng)商業(yè)變革,具體涉及哪些關(guān)鍵技術(shù)?根本沒(méi)有標準答案可尋。字節跳動(dòng)大數據技術(shù)專(zhuān)家郭俊,將帶來(lái)《Spark Shuffle 穩定性與性能優(yōu)化》主題演講,具體介紹字節跳動(dòng)提升 Shuffle 性能的技術(shù)變遷過(guò)程。眾所周知,在 HDFS 與 Yarn 混合部署過(guò)程中,在長(cháng)期幾乎滿(mǎn)負載的數萬(wàn)節點(diǎn)的大數據集群上,由于部分節點(diǎn)故障或者負載過(guò)高造成 Shufffle Read 時(shí) SparkFetchException 的現象非常普遍。一旦發(fā)生問(wèn)題,必然會(huì )觸發(fā) Stage 重試,從而延長(cháng)整個(gè) Application 的執行時(shí)間,增加了資源占用,同時(shí)影響了 SLA。因此避免 Shuffle 失敗,提高 Shuffle 穩定性對保障 SLA 及提升資源利用效率具有重要意義。
當然,不管是大數據、人工智能,還是二者的結合體,只有適合自己、滿(mǎn)足業(yè)務(wù)需要的技術(shù),才能發(fā)揮實(shí)際價(jià)值。 58同城 AI Lab負責人詹坤林、華為高級技術(shù)專(zhuān)家時(shí)金魁、競技世界首席數據科學(xué)家巴川等重量級嘉賓,將分別就智能客戶(hù)、智能車(chē)聯(lián)網(wǎng)、互聯(lián)網(wǎng)游戲平臺業(yè)務(wù)模型構建等話(huà)題,展開(kāi)深入討論。
總之,DTCC2019是一場(chǎng)真正意義上的數據庫技術(shù)嘉年華,不管您是這一領(lǐng)域的創(chuàng )造者、架構者還是應用者,我們期待與您相聚,共同探索數據價(jià)值。DTCC 2019,我要參加,你要不要來(lái)?
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
