搜索

NVIDIA 通過(guò)企業(yè)級生成式 AI 微服務(wù)為聊天機器人、AI 助手和摘要工具帶來(lái)商業(yè)智能

zhouping 2年前 (2023-12-05)

Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優(yōu)化語(yǔ)義檢索，實(shí)現準確的 AI 推理

亞馬遜云科技 re:Invent — 太平洋時(shí)間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項生成式 AI 微服務(wù)，支持企業(yè)將自定義大語(yǔ)言模型與企業(yè)數據相連接，使其 AI 應用能夠提供高度準確的響應。

NVIDIA NeMo™ Retriever 是 NVIDIA NeMo（一個(gè)用于構建、自定義和部署生成式 AI 模型的框架和工具系列）的一項全新服務(wù)，通過(guò)企業(yè)級檢索增強生成（RAG）功能，幫助組織加強其生成式 AI 應用。

作為一項語(yǔ)義檢索微服務(wù)，NeMo Retriever 借助經(jīng) NVIDIA 優(yōu)化的算法，幫助生成式 AI 應用作出更加準確的回答。使用該微服務(wù)的開(kāi)發(fā)者，可以將其 AI 應用與位于各個(gè)云和數據中心的業(yè)務(wù)數據相連通。該服務(wù)為 AI 代工添加了 NVIDIA 優(yōu)化的 RAG 功能，并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。

Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作，將生產(chǎn)就緒型 RAG 功能整合至其自定義生成式 AI 應用和服務(wù)中。

NVIDIA 創(chuàng )始人兼首席執行官黃仁勛表示：“具有 RAG 功能的生成式 AI 應用是企業(yè)的下一個(gè)殺手級應用。借助 NVIDIA NeMo Retriever，開(kāi)發(fā)者可以創(chuàng )建自定義生成式 AI 聊天機器人、AI 助手和摘要工具。它們能夠訪(fǎng)問(wèn)企業(yè)的業(yè)務(wù)數據，通過(guò)準確且有價(jià)值的生成式 AI 智能來(lái)提高生產(chǎn)力。”

全球頭部企業(yè)借助 NeMo Retriever 提高大語(yǔ)言模型（LLM）準確性

電子系統設計領(lǐng)導廠(chǎng)商 Cadence 為超大規模計算、5G 通信、汽車(chē)、移動(dòng)、航空航天、消費和醫療市場(chǎng)的企業(yè)提供服務(wù)。該公司正與 NVIDIA 合作，為工業(yè)電子設計領(lǐng)域的生成式 AI 應用開(kāi)發(fā) RAG 功能。

Cadence 總裁兼首席執行官 Anirudh Devgan 表示：“生成式 AI 引入了創(chuàng )新方法來(lái)滿(mǎn)足客戶(hù)需求，比如能在設計流程早期發(fā)現潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作，使用 NeMo Retriever 進(jìn)一步提高生成式 AI 應用的準確性和相關(guān)性，以便發(fā)現問(wèn)題，并幫助客戶(hù)更快地將優(yōu)質(zhì)產(chǎn)品推向市場(chǎng)。”

破解精確的生成式 AI 應用的“密碼”

與開(kāi)源 RAG 工具套件不同，NeMo Retriever 是通過(guò)具有商業(yè)可行性的模型、API 穩定性、安全補丁和企業(yè)級支持，來(lái)為生產(chǎn)就緒型生成式 AI 賦能。

經(jīng) NVIDIA 優(yōu)化的算法使 Retriever 的嵌入模型能夠產(chǎn)出準確性最高的結果。經(jīng)過(guò)優(yōu)化的嵌入模型能夠捕捉單詞之間的關(guān)系，使 LLM 能夠處理和分析文本數據。

企業(yè)可以使用 NeMo Retriever 將 LLM 連接到多個(gè)數據源和知識庫，這樣用戶(hù)就可以輕松地與數據交互，并通過(guò)簡(jiǎn)單的對話(huà)指令獲得準確且最新的答案。通過(guò)使用由 Retriever 驅動(dòng)的應用，企業(yè)可以使用戶(hù)安全地訪(fǎng)問(wèn)多種數據格式的信息，如文本、PDF、圖像和視頻等。

借助 NeMo Retriever，企業(yè)能夠以更少的訓練獲得更準確的結果，加快產(chǎn)品上市時(shí)間，并減少生成式 AI 應用開(kāi)發(fā)產(chǎn)生的能耗。

通過(guò) NVIDIA AI Enterprise 實(shí)現可靠、簡(jiǎn)單且安全的部署

企業(yè)可以在幾乎任何數據中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅動(dòng)的應用,以便在推理過(guò)程中運行。NVIDIA AI Enterprise 可支持通過(guò) NVIDIA Triton 推理服務(wù)器™、NVIDIA TensorRT™、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進(jìn)行加速的高性能推理。

供應情況

開(kāi)發(fā)者可以注冊并搶先體驗 NVIDIA NeMo Retriever。

關(guān)于 NVIDIA

自 1993 年成立以來(lái)，NVIDIA（NASDAQ: NVDA）一直是加速計算領(lǐng)域的先驅。NVIDIA 1999 年發(fā)明的 GPU 驅動(dòng)了 PC 游戲市場(chǎng)的增長(cháng)，并重新定義了現代計算機圖形，開(kāi)啟了現代 AI 時(shí)代，正在推動(dòng)跨市場(chǎng)的工業(yè)數字化。NVIDIA 現在是一家全棧計算公司，其數據中心規模的解決方案正在重塑整個(gè)行業(yè)。

本新聞稿中的部分聲明包括但不限于有關(guān)以下內容的聲明：我們的產(chǎn)品、服務(wù)和技術(shù)，包括 NVIDIA NeMo Retriever、NVIDIA NeMo、NVIDIA AI Enterprise 的優(yōu)勢、影響、性能和供貨情況；部分企業(yè)率先與 NVIDIA 一起將生產(chǎn)就緒型 RAG 功能整合到其自定義生成式 AI 應用和服務(wù)；具有 RAG 功能的生成式 AI 應用成為企業(yè)的下一個(gè)殺手級應用；企業(yè)擁有數百個(gè)自定義生成式 AI 聊天機器人、AI 助手和摘要工具，它們能夠通過(guò)訪(fǎng)問(wèn)企業(yè)的數據，提供準確和有價(jià)值的智能；全球頭部企業(yè)借助 NeMo Retriever 提高 LLM 的準確性，包括其帶來(lái)的好處和影響等均為前瞻性聲明，存在風(fēng)險與不確定性，且最終結果可能與預期存在極大差異?？赡軐е聦?shí)際結果出現極大差異的重要因素包括：全球經(jīng)濟狀況；我們在制造、組裝、包裝和測試產(chǎn)品方面對第三方的依賴(lài)性；技術(shù)發(fā)展和競爭的影響；新產(chǎn)品和技術(shù)的發(fā)展或對我們現有產(chǎn)品和技術(shù)的改良；市場(chǎng)對我們的產(chǎn)品或合作伙伴產(chǎn)品的接受情況；設計、制造或軟件缺陷；消費者偏好或需求的變化；行業(yè)標準和界面的變化；將我們的產(chǎn)品或技術(shù)集成到系統中時(shí)意外損耗的性能；以及 NVIDIA 近期提交給美國證券交易委員會(huì ) (SEC) 的報告（包括但不限于 Form 10-K 年報及 Form 10-Q 季報）中屢次具體說(shuō)明的其他因素。提交給 SEC 的報告副本發(fā)布在公司網(wǎng)站上，且可免費從 NVIDIA 獲得。這些前瞻性聲明不能保證未來(lái)的表現，僅在規定日期有效。除非法律另有要求，否則 NVIDIA 對更新這些前瞻性聲明以反映未來(lái)事件或環(huán)境不承擔任何責任。

©2023 NVIDIA Corporation。版權所有。NVIDIA、NVIDIA 徽標、NVIDIA NeMo、NVIDIA Triton 推理服務(wù)器、NVIDIA TensorRT 是 NVIDIA Corporation 在美國和其他國家的商標和/或注冊商標。其他公司和產(chǎn)品名稱(chēng)可能為與之相關(guān)的各自公司的商標。功能、價(jià)格、供貨情況和規格如有變更，恕不另行通知。

最后，記得關(guān)注微信公眾號：鎂客網(wǎng)（im2maker），更多干貨在等你！

鎂客網(wǎng)

科技 | 人文 | 行業(yè)

微信ID：im2maker

長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

zhouping運營(yíng)

zhouping運營(yíng)

294篇

文章總數

最新文章

工業(yè)互聯(lián)網(wǎng)平臺，如何實(shí)現“軟硬件結合” | 對話(huà)中天科技

2025 CES：從深情的智能，到AI的濫用

CHInano 2025第十五屆中國國際納米技術(shù)產(chǎn)業(yè)博覽會(huì )

2024年被稱(chēng)為“低空經(jīng)濟元年”！倒計時(shí)15天 | 2025中國eVTOL創(chuàng )新發(fā)展大會(huì )報名中

2025生物藥創(chuàng )新開(kāi)發(fā)峰會(huì )

janpanese日本护士tube_色欲久久久天天天_国产精品国产三级区别第一集_一色屋任你精品亚洲香蕉