NVIDIA 通過(guò)企業(yè)級生成式 AI 微服務(wù)為聊天機器人、AI 助手和摘要工具帶來(lái)商業(yè)智能

zhouping 2年前 (2023-12-05)

Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優(yōu)化語(yǔ)義檢索,實(shí)現準確的 AI 推理

亞馬遜云科技 re:Invent — 太平洋時(shí)間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項生成式 AI 微服務(wù),支持企業(yè)將自定義大語(yǔ)言模型與企業(yè)數據相連接,使其 AI 應用能夠提供高度準確的響應。

NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一個(gè)用于構建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務(wù),通過(guò)企業(yè)級檢索增強生成(RAG)功能,幫助組織加強其生成式 AI 應用。

作為一項語(yǔ)義檢索微服務(wù),NeMo Retriever 借助經(jīng) NVIDIA 優(yōu)化的算法,幫助生成式 AI 應用作出更加準確的回答。使用該微服務(wù)的開(kāi)發(fā)者,可以將其 AI 應用與位于各個(gè)云和數據中心的業(yè)務(wù)數據相連通。該服務(wù)為 AI 代工添加了 NVIDIA 優(yōu)化的 RAG 功能,并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。

Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作,將生產(chǎn)就緒型 RAG 功能整合至其自定義生成式 AI 應用和服務(wù)中。

NVIDIA 創(chuàng )始人兼首席執行官黃仁勛表示:“具有 RAG 功能的生成式 AI 應用是企業(yè)的下一個(gè)殺手級應用。借助 NVIDIA NeMo Retriever,開(kāi)發(fā)者可以創(chuàng )建自定義生成式 AI 聊天機器人、AI 助手和摘要工具。它們能夠訪(fǎng)問(wèn)企業(yè)的業(yè)務(wù)數據,通過(guò)準確且有價(jià)值的生成式 AI 智能來(lái)提高生產(chǎn)力。”

全球頭部企業(yè)借助 NeMo Retriever 提高大語(yǔ)言模型(LLM)準確性

電子系統設計領(lǐng)導廠(chǎng)商 Cadence 為超大規模計算、5G 通信、汽車(chē)、移動(dòng)、航空航天、消費和醫療市場(chǎng)的企業(yè)提供服務(wù)。該公司正與 NVIDIA 合作,為工業(yè)電子設計領(lǐng)域的生成式 AI 應用開(kāi)發(fā) RAG 功能。

Cadence 總裁兼首席執行官 Anirudh Devgan 表示:“生成式 AI 引入了創(chuàng )新方法來(lái)滿(mǎn)足客戶(hù)需求,比如能在設計流程早期發(fā)現潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作,使用 NeMo Retriever 進(jìn)一步提高生成式 AI 應用的準確性和相關(guān)性,以便發(fā)現問(wèn)題,并幫助客戶(hù)更快地將優(yōu)質(zhì)產(chǎn)品推向市場(chǎng)。”

破解精確的生成式 AI 應用的“密碼”

與開(kāi)源 RAG 工具套件不同,NeMo Retriever 是通過(guò)具有商業(yè)可行性的模型、API 穩定性、安全補丁和企業(yè)級支持,來(lái)為生產(chǎn)就緒型生成式 AI 賦能。

經(jīng) NVIDIA 優(yōu)化的算法使 Retriever 的嵌入模型能夠產(chǎn)出準確性最高的結果。經(jīng)過(guò)優(yōu)化的嵌入模型能夠捕捉單詞之間的關(guān)系,使 LLM 能夠處理和分析文本數據。

企業(yè)可以使用 NeMo Retriever 將 LLM 連接到多個(gè)數據源和知識庫,這樣用戶(hù)就可以輕松地與數據交互,并通過(guò)簡(jiǎn)單的對話(huà)指令獲得準確且最新的答案。通過(guò)使用由 Retriever 驅動(dòng)的應用,企業(yè)可以使用戶(hù)安全地訪(fǎng)問(wèn)多種數據格式的信息,如文本、PDF、圖像和視頻等。

借助 NeMo Retriever,企業(yè)能夠以更少的訓練獲得更準確的結果,加快產(chǎn)品上市時(shí)間,并減少生成式 AI 應用開(kāi)發(fā)產(chǎn)生的能耗。

通過(guò) NVIDIA AI Enterprise 實(shí)現可靠、簡(jiǎn)單且安全的部署

企業(yè)可以在幾乎任何數據中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅動(dòng)的應用,以便在推理過(guò)程中運行。NVIDIA AI Enterprise 可支持通過(guò) NVIDIA Triton 推理服務(wù)器™、NVIDIA TensorRT™、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進(jìn)行加速的高性能推理。

供應情況

開(kāi)發(fā)者可以注冊并搶先體驗 NVIDIA NeMo Retriever。

關(guān)于 NVIDIA

自 1993 年成立以來(lái),NVIDIA(NASDAQ: NVDA)一直是加速計算領(lǐng)域的先驅。NVIDIA 1999 年發(fā)明的 GPU 驅動(dòng)了 PC 游戲市場(chǎng)的增長(cháng),并重新定義了現代計算機圖形,開(kāi)啟了現代 AI 時(shí)代,正在推動(dòng)跨市場(chǎng)的工業(yè)數字化。NVIDIA 現在是一家全棧計算公司,其數據中心規模的解決方案正在重塑整個(gè)行業(yè)。

本新聞稿中的部分聲明包括但不限于有關(guān)以下內容的聲明:我們的產(chǎn)品、服務(wù)和技術(shù),包括 NVIDIA NeMo Retriever、NVIDIA NeMo、NVIDIA AI Enterprise 的優(yōu)勢、影響、性能和供貨情況;部分企業(yè)率先與 NVIDIA 一起將生產(chǎn)就緒型 RAG 功能整合到其自定義生成式 AI 應用和服務(wù);具有 RAG 功能的生成式 AI 應用成為企業(yè)的下一個(gè)殺手級應用;企業(yè)擁有數百個(gè)自定義生成式 AI 聊天機器人、AI 助手和摘要工具,它們能夠通過(guò)訪(fǎng)問(wèn)企業(yè)的數據,提供準確和有價(jià)值的智能;全球頭部企業(yè)借助 NeMo Retriever 提高 LLM 的準確性,包括其帶來(lái)的好處和影響等均為前瞻性聲明,存在風(fēng)險與不確定性,且最終結果可能與預期存在極大差異??赡軐е聦?shí)際結果出現極大差異的重要因素包括:全球經(jīng)濟狀況;我們在制造、組裝、包裝和測試產(chǎn)品方面對第三方的依賴(lài)性;技術(shù)發(fā)展和競爭的影響;新產(chǎn)品和技術(shù)的發(fā)展或對我們現有產(chǎn)品和技術(shù)的改良;市場(chǎng)對我們的產(chǎn)品或合作伙伴產(chǎn)品的接受情況;設計、制造或軟件缺陷;消費者偏好或需求的變化;行業(yè)標準和界面的變化;將我們的產(chǎn)品或技術(shù)集成到系統中時(shí)意外損耗的性能;以及 NVIDIA 近期提交給美國證券交易委員會(huì ) (SEC) 的報告(包括但不限于 Form 10-K 年報及 Form 10-Q 季報)中屢次具體說(shuō)明的其他因素。提交給 SEC 的報告副本發(fā)布在公司網(wǎng)站上,且可免費從 NVIDIA 獲得。這些前瞻性聲明不能保證未來(lái)的表現,僅在規定日期有效。除非法律另有要求,否則 NVIDIA 對更新這些前瞻性聲明以反映未來(lái)事件或環(huán)境不承擔任何責任。

©2023 NVIDIA Corporation。版權所有。NVIDIA、NVIDIA 徽標、NVIDIA NeMo、NVIDIA Triton 推理服務(wù)器、NVIDIA TensorRT 是 NVIDIA Corporation 在美國和其他國家的商標和/或注冊商標。其他公司和產(chǎn)品名稱(chēng)可能為與之相關(guān)的各自公司的商標。功能、價(jià)格、供貨情況和規格如有變更,恕不另行通知。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到