科大訊飛劉聰:由ChatGPT浪潮引發(fā)的深入思考與落地展望

IM2MakerOpr 2年前 (2023-02-15)

什么是ChatGPT,它強在哪里?會(huì )對未來(lái)世界帶來(lái)哪些顛覆性影響?

近期,以“生成式人工智能”(Generative AI)為核心技術(shù)的聊天機器人ChatGPT火爆全球。百度、阿里巴巴、科大訊飛、360等國內企業(yè)紛紛拋出ChatGPT相關(guān)進(jìn)展,打造中國版的ChatGPT。

科大訊飛此前在投資者互動(dòng)平臺表示,ChatGPT主要涉及到自然語(yǔ)言處理相關(guān)技術(shù),屬于認知智能領(lǐng)域的應用之一,公司在該方向技術(shù)和應用具備長(cháng)期深厚的積累。并稱(chēng)2022年12月已進(jìn)一步啟動(dòng)生成式預訓練大模型任務(wù)攻關(guān),類(lèi)ChatGPT技術(shù)將在今年5月率先落地科大訊飛AI學(xué)習機產(chǎn)品。

近日,科大訊飛副總裁、研究院執行院長(cháng)劉聰圍繞什么是ChatGPT,它強在哪里?會(huì )對未來(lái)世界帶來(lái)哪些顛覆性影響?進(jìn)一步闡述ChatGPT來(lái)的的模式創(chuàng )新與產(chǎn)業(yè)變革。

ChatGPT將會(huì )對未來(lái)世界帶來(lái)哪些重大影響?

在劉聰看來(lái),ChatGPT本質(zhì)上是一個(gè)由浮點(diǎn)數參數表示的深度神經(jīng)網(wǎng)絡(luò )大模型,屬于深度學(xué)習的框架。ChatGPT的推出是深度學(xué)習提出后又一個(gè)里程碑式的技術(shù)革命,將為以自然語(yǔ)言處理為核心的認知智能技術(shù)發(fā)展提供新的“歷史機遇期”。

這次ChatGPT引發(fā)全球學(xué)術(shù)界和產(chǎn)業(yè)界的熱議和關(guān)注,關(guān)鍵原因是ChatGPT通過(guò)至少以下五個(gè)維度能力的顯著(zhù)提升,實(shí)現了初步的“智慧涌現”:

1、海量高價(jià)值信息的全量在線(xiàn)記憶能力;2、自然語(yǔ)言輸入的任意任務(wù)和多輪對話(huà)理解能力;3、復雜邏輯的思維鏈推理能力;4、多角色多風(fēng)格的長(cháng)文本生成表達能力;5、即時(shí)新知識學(xué)習應用與進(jìn)化能力。此外,因為引入了代碼作為訓練語(yǔ)料,ChatGPT還額外產(chǎn)生了自動(dòng)寫(xiě)代碼和理解代碼的能力。

綜合來(lái)看,ChatGPT的能力之強已不僅是停留在單一場(chǎng)景的人機對話(huà),而是一個(gè)同時(shí)具備多種能力的通用“對話(huà)式AI系統”。與傳統認知智能需要針對各領(lǐng)域任務(wù)定制對應的系統不同,它不僅能完成多個(gè)場(chǎng)景、多輪的相當自然的人機對話(huà),更為重要的是以自然語(yǔ)言交互式學(xué)習的“類(lèi)人”新范式,能在多輪交互中以“類(lèi)人”的方式交流、學(xué)習和進(jìn)步,并可以自主、快速、不間斷地學(xué)習各領(lǐng)域專(zhuān)業(yè)知識并達到人類(lèi)專(zhuān)家水平。

他進(jìn)一步談到,ChatGPT的初步突破帶來(lái)的當前影響和未來(lái)想象空間是巨大的。在技術(shù)演化的基礎上,以自然語(yǔ)言處理為代表的人工智能算法有可能重構互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的產(chǎn)品形態(tài),促進(jìn)教育業(yè)、醫療業(yè)、汽車(chē)業(yè)、金融業(yè)、消費業(yè)、媒體業(yè)、服務(wù)業(yè)和制造業(yè)等眾多產(chǎn)業(yè)的升級,最終帶來(lái)對應商業(yè)模式的變革。

劉聰認為,類(lèi)ChatGPT模型的持續發(fā)展未來(lái)至少會(huì )從以下4個(gè)方面的能力提升推動(dòng)產(chǎn)業(yè)變革與模式創(chuàng )新:

一是改變現有人機交互模式。未來(lái)人們可能用自然對話(huà)的方式與智能產(chǎn)品交互,ChatGPT通過(guò)精準理解用戶(hù)意圖,調用系統的各種軟件或服務(wù)來(lái)滿(mǎn)足用戶(hù)需求,提高交互效率與任務(wù)成功率。這種人機交互模式的改變將可能改變當前的APP等應用的使用方式,例如多個(gè)功能的軟件能力被整合,甚至出現“大一統”能力的超級通用APP。

二是改變信息分發(fā)獲取模式。基于認知智能技術(shù)可實(shí)現更高效的信息整合和知識推薦等。以搜索為例,傳統搜索引擎根據關(guān)鍵字匹配內容,使用者需要在海量搜索結果中篩選出有用信息,而ChatGPT加持的必應直接給出答案,并提高了問(wèn)題與答案的匹配精準度,大大提升用戶(hù)體驗。信息分發(fā)獲取模式的改變將影響流量的分布,并改變流量變現的商業(yè)模式。

三是革新內容生產(chǎn)模式,提高生產(chǎn)力。作為AIGC(人工智能生成內容)技術(shù)的典型代表,ChatGPT一經(jīng)上線(xiàn)便被大量應用于公文寫(xiě)作、郵件編寫(xiě)、代碼編寫(xiě)等,ChatGPT的編程能力將極大拓展普通人利用電腦和網(wǎng)絡(luò )進(jìn)行創(chuàng )新和創(chuàng )意的能力。未來(lái)ChatGPT被集成到word、excel、ppt等工具軟件后,將提升內容生產(chǎn)效率與豐富度,變革人們的辦公方式,成為新的全行業(yè)生產(chǎn)力工具。ChatGPT還將帶動(dòng)圖像、音頻、視頻等形式的AIGC技術(shù)與產(chǎn)業(yè)發(fā)展,使得AIGC的內容既有“好看的外在”,更有“豐富的內涵”。

四是加速“AI for Science”的發(fā)展。對于科研人員,ChatGPT不僅可以輔助生成論文摘要與文獻綜述,隨著(zhù)其學(xué)習的科研數據越來(lái)越多,未來(lái)有可能提供專(zhuān)業(yè)的研究建議甚至主動(dòng)探索發(fā)現新的理論,帶來(lái)整個(gè)科學(xué)研究范式的全新變化,把“AI for Science”推上一個(gè)全新臺階。

這次ChatGPT所帶來(lái)的革命將會(huì )深刻地改變當今世界的生產(chǎn)和生活方式,重構產(chǎn)業(yè)格局,是人工智能領(lǐng)域推動(dòng)工業(yè)乃至社會(huì )變革的重大戰略機遇,是未來(lái)發(fā)展兵家必爭之地。

科大訊飛在ChatGPT方面有哪些布局?未來(lái)研發(fā)計劃如何?

在ChatGPT引發(fā)的AI技術(shù)新一輪熱潮背景下,科大訊飛基于認知智能全國重點(diǎn)實(shí)驗室,已在核心算法、行業(yè)數據、算力支撐及團隊組建等方面建立了優(yōu)勢保障。

核心算法上,在Transformer深度神經(jīng)網(wǎng)絡(luò )算法方面擁有豐富經(jīng)驗,已廣泛應用于科大訊飛的語(yǔ)音識別、圖文識別、機器翻譯等任務(wù)并達到國際領(lǐng)先水平;創(chuàng )新提出了知識與大模型融合統一的理解框架X-Reasoner,有望彌補大模型的模糊記憶技術(shù)短板,并在認知智能技術(shù)領(lǐng)域,2022年累計獲得了常識閱讀理解挑戰賽OpenBookQA等13項世界冠軍;開(kāi)源了6個(gè)大類(lèi)、超過(guò)40個(gè)通用領(lǐng)域的系列中文預訓練語(yǔ)言模型,相關(guān)模型庫月均調用量超1000萬(wàn),在Github平臺獲得星標數位列同類(lèi)中文預訓練語(yǔ)言模型第一并遠超第二名。

數據積累上,在嚴格遵守適用法律法規前提下,在多年認知智能系統研發(fā)推廣中積累了超過(guò)50TB的行業(yè)語(yǔ)料和每天超10億人次用戶(hù)交互的活躍應用,為訓練實(shí)現達到人類(lèi)專(zhuān)家水平的行業(yè)認知大模型提供了海量行業(yè)文本語(yǔ)料和用戶(hù)反饋數據,也為基于大模型的創(chuàng )新應用研發(fā)和試點(diǎn)推廣提供了場(chǎng)景保障。

算力支撐上,訊飛在總部自建有業(yè)界一流的數據中心,為大模型訓練平臺建設奠定了很好的硬件基石。此外,在工程技術(shù)方面實(shí)現了百億參數大模型推理效率的近千倍加速,為未來(lái)更大更多認知智能大模型技術(shù)經(jīng)濟實(shí)惠規?;瘧锰峁┝丝赡?。

劉聰表示:“結合我們多年來(lái)在深度學(xué)習算法、大模型技術(shù)、行業(yè)大數據、知識圖譜、多模態(tài)感知、系統工程技術(shù)方面優(yōu)勢積累,通過(guò)最近兩個(gè)多月的系統分析和快速驗證,我們非常有信心實(shí)現ChatGPT類(lèi)似的技術(shù)階躍進(jìn)步,并在中文認知智能領(lǐng)域達到國際領(lǐng)先水平。”

為了進(jìn)一步提高大模型在細分行業(yè)的實(shí)用性,劉聰說(shuō),訊飛計劃采用“1+N”架構,其中“1”是通用認知智能大模型算法研發(fā)及高效訓練底座平臺,“N”是應用于教育、醫療、人機交互、辦公、翻譯、汽車(chē)、工業(yè)等多個(gè)行業(yè)領(lǐng)域的專(zhuān)用大模型版本。例如,通過(guò)學(xué)習海量醫學(xué)教材、論文和病例,實(shí)現專(zhuān)業(yè)的醫療領(lǐng)域對話(huà)式AI系統,打造“每個(gè)醫生的AI診療助理,每個(gè)人的AI健康助手”。

此外,訊飛也非常希望基于認知大模型與各行各業(yè)的伙伴們在企業(yè)數字化、行業(yè)內容生產(chǎn)等方面開(kāi)展深入合作,基于行業(yè)數據與知識,形成智能化定制解決方案。我們的技術(shù)底座和行業(yè)積累合力共贏(yíng),能助力合作伙伴跨越認知智能技術(shù)壁壘,提高產(chǎn)品競爭力,實(shí)現協(xié)同創(chuàng )新,共同加快行業(yè)轉型升級,推進(jìn)數字中國建設。

此外談及資本市場(chǎng)當前的熱潮,劉聰認為,全球資本都在ChatGPT的技術(shù)突破后看到了人工智能對社會(huì )產(chǎn)生的重大產(chǎn)業(yè)機遇,眾多行業(yè)都有被深度重構的機會(huì ),重構過(guò)程中一定會(huì )產(chǎn)生巨大的全新商業(yè)價(jià)值,因此資本市場(chǎng)的興奮是可以理解的。

但是我們要踏踏實(shí)實(shí)把科研做好,把產(chǎn)品做好,把服務(wù)做好,最終還是要回到人工智能紅利能否兌現的三大標準:“有沒(méi)有看得見(jiàn)摸得著(zhù)的真實(shí)應用案例,有沒(méi)有能夠規?;茝V應用的產(chǎn)品,有沒(méi)有統計數據能夠證明的應用成效”,只有這些才能夠經(jīng)得起時(shí)間的考驗,才能夠真正把人工智能做實(shí)做透。

科大訊飛劉聰:由ChatGPT浪潮引發(fā)的深入思考與落地展望

注:劉聰,科大訊飛副總裁、研究院執行院長(cháng),語(yǔ)音及語(yǔ)言信息處理國家工程研究中心副主任,國家級領(lǐng)軍人才。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到