元乘象Chatimg3.0發(fā)布,多模態(tài)大模型助力產(chǎn)業(yè)應用再升級

zhouping 2年前 (2023-10-28)

通用人工智能時(shí)代,AI大模型技術(shù)成為數字經(jīng)濟下基礎設施建設的重要支撐,也成為產(chǎn)業(yè)智能化轉型的核心“引擎”,AI大模型+產(chǎn)業(yè)應用迎來(lái)了前所未有的發(fā)展機遇。

通用人工智能時(shí)代,AI大模型技術(shù)成為數字經(jīng)濟下基礎設施建設的重要支撐,也成為產(chǎn)業(yè)智能化轉型的核心“引擎”,AI大模型+產(chǎn)業(yè)應用迎來(lái)了前所未有的發(fā)展機遇。

在10月28日舉辦的CNCC 2023“超智融合AI大模型應用落地發(fā)展論壇”上,智子引擎發(fā)布了“元乘象Chatimg3.0”,展示了多模態(tài)通用生成模型“元乘象Chatimg3.0”的最新進(jìn)展與落地探索。

核心技術(shù)升級迭代

元乘象Chatimg3.0是一個(gè)超精細識別、少幻覺(jué)的多模態(tài)大模型,同時(shí)支持多圖理解、物體定位、OCR等功能。Chatimg3.0給硬件設備裝上了大腦,可實(shí)現更自然更流暢的人機交流,為AI多模態(tài)大模型賦能產(chǎn)業(yè)應用打下了堅實(shí)的基礎。與Chatimg2.0相比,Chatimg3.0主要進(jìn)行了兩方面的升級,包括第一階段的預訓練(描述、檢測、OCR等多任務(wù)訓練)以及第二階段的指令微調(高質(zhì)量的人工精篩指令集)。

為更好的評估多模態(tài)大模型的能力,我們構建了一個(gè)全新的多模態(tài)對話(huà)測試集,從描述、推理、檢測、問(wèn)答、業(yè)務(wù)五個(gè)方面對模型能力進(jìn)行評測,而且在問(wèn)答和業(yè)務(wù)兩個(gè)方面的能力上趕超GPT-4V,表現出優(yōu)秀的發(fā)展潛力。

 

以下是Chatimg3.0對比GPT-4V在測試中的具體表現:

描述:

   

推理:

 

檢測:

問(wèn)答:

 

重點(diǎn)領(lǐng)域探索應用

目前智子引擎已經(jīng)將“元乘象Chatimg3.0”應用于全域防控和無(wú)人機巡檢等領(lǐng)域,通過(guò)與無(wú)人機、電子探頭等前端感知設備的融合,升級傳統巡檢和安防,實(shí)現了AI缺陷識別、異常檢測、行為分析、重點(diǎn)監控、自主巡查、風(fēng)險預測等功能,推動(dòng)了AI工程化革新進(jìn)程。

 

作為國內首個(gè)多模態(tài)大模型研發(fā)團隊,智子引擎不僅在人才和技術(shù)上擁有先天的優(yōu)勢,多個(gè)知名投資機構和IT行業(yè)龍頭的天使投資,也使企業(yè)如虎添翼。在軟通動(dòng)力、華軟科技等知名企業(yè)的協(xié)同助力下,融合“元乘象Chatimg3.0”研發(fā)的“智子•天穹”和“智子•天巡”系統一經(jīng)面世便得到了行業(yè)的關(guān)注,產(chǎn)品被快速應用于城市治理、智慧電力、管道巡檢、園區管理、農業(yè)、金融等多行業(yè)應用場(chǎng)景,并逐步開(kāi)始試點(diǎn)部署。

為加速大模型產(chǎn)業(yè)應用落地,促進(jìn)數字經(jīng)濟可持續發(fā)展,智子引擎將繼續加強模型訓練,提高自身能力,匯聚行業(yè)人才和優(yōu)勢資源,為大模型助力產(chǎn)業(yè)升級鞠躬盡瘁。核心模型“元乘象Chatimg”未來(lái)還會(huì )在A(yíng)I agents、具身智能等方向持續發(fā)力,期待大家的關(guān)注。

元乘象Chatimg3.0體驗入口

本內容系原作者授權轉載,鎂客網(wǎng)僅提供信息存儲空間服務(wù)。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到