這是用戶在 2025-7-1 18:38 為 https://36kr.com/p/3333740366636545 保存的雙語快照頁面,由 沉浸式翻譯 提供雙語支持。了解如何保存?

黃仁勳巴黎 GTC 最新演講:一個由 AI 工廠驅動的全新工業革命已經到來(附兩萬字實錄)

劃重點·2025 年 06 月 13 日 08:23
一文看懂 AI 工廠、Agent 和人形機器人的未來

6 月 11 日,英偉達創始人兼 CEO 黃仁勛出現在法國巴黎的 VivaTech 大會,帶來他標誌性的 GTC 主題演講。 演講全程近兩個小時,老黃用他特有的節奏,將 GPU、AI 工廠、代理智慧、人形機器人等看似分散的議題,抽絲剝繭般串成一條線索: 一個由 AI 工廠驅動的全新工業革命已經到來。

這次演講依舊乾貨滿滿,我們給您劃下重點:

1、GPU 不再是一塊晶元,而是一個集群式的“思考機器”

英偉達從 GPU 圖形處理起家,但黃仁勳現在更關心的是“如何構建一種能進行推理的計算平臺”。 這個目標如今已經具象化為 Grace Blackwell 架構下的 GB200 超級晶片:“它不是一塊晶片,而是一個集群式的”思考機器“ (Thinking Machine)。

這台被譽為「大號 GeForce」的設備,擁有超 120 萬個零件、每秒 130 TB 的通信頻寬,重達兩噸,價格高達 300 萬美元——幾乎像是一台現代的“人工智慧蒸汽機”。

黃仁勳甚至不再把它稱作計算機,而是稱之為推理引擎,設計之初就是為了解決當下 AI 模型中“自我思考”的計算瓶頸。 與過去追求速度不同,如今的大模型追求的是推理的深度、鏈式思維的廣度——模型要不斷反思、規劃、重試、對話,而這正是 GB200 的設計目標。

2、AI 已進入 Agent 時代:不只是回答問題,而是自己“解決任務”。

黃仁勳認為,生成式 AI 之後,AI 正在進入下一個階段:Agent 智慧體時代。 如果說 ChatGPT 是智慧的「百科全書」,那麼 Agent 更像是可以動手幹活的「數字員工」。。 它不僅能回答問題,還能理解語境、制定計劃、調用工具甚至與其他智慧體協作,完成複雜任務。

NVIDIA 提供了 Agent 構建的全套棧工具:從大型語言模型(NeMo、Nemotron)、多模態檢索(Retriever)、到部署管理平臺 Lepton。 整個流程就像 DevOps、MLOps 一樣,被打包進可部署的 NIM 容器,能夠在本地、雲端、私有環境一鍵運行。

一個簡單的演示中,黃仁勳向觀眾展示如何通過一條提示詞,指揮 Perplexity 智慧體代理,完成一套巴黎開設餐車的計劃書,從市場調研到財務規劃、到網站搭建,全程自動完成。

3、人形機器人將在類比世界中訓練,未來或成“最大的產業之一”。

但更令人驚喜的是,英偉達也將 AI 從螢幕世界帶入了現實世界。 黃仁勳推出了一款人形機器人 Grek,並展示了其在虛擬環境中模擬學習的全過程:在 Omniverse 世界中模擬風、重力、摩擦、阻力,Grek 學會了行走、跳躍、推門等一系列技能,並將這些技能遷移到現實中。

在黃仁勳眼中,人形機器人將是下一個「十億級設備平臺」,遠超智慧手機:它們將進入工廠、倉庫、手術室、甚至家庭; 程式設計門檻將從代碼降低到「示範教學」; 每一個機器人背後,都將是一台基於 NVIDIA Thor 晶片的 AI 超級電腦。

4、Omniverse 不只是渲染引擎,而是機器人、數位孿生訓練的核心平臺。

Omniverse 正是這一切的核心訓練平臺。 它不只是一個 3D 渲染引擎,而是一個真實世界的模擬器——構建真實感、建立物理規則,幫助機器人像人一樣學習與世界互動。

機器人是現實中最具象的「具身智慧」,而另一端,工業製造正全面進入 AI 化的進程。 演講中展示了多個企業在 Omniverse 中構建的數位孿生場景:寶馬在模擬工廠中規劃產線,賓士用來優化裝配流程,西門子實現工廠設計、運營、調度的自動化協同。

英偉達宣佈與施耐德、西門子等合作,將工廠數位孿生、自動駕駛、工業控制全面 AI 化。 還宣佈在歐洲落地第一個「工業 AI 雲」,將風洞實驗、工廠類比、機器人訓練一體化,提供即時高精度模擬支援。

總之,黃仁勳描繪一個由 AI 工廠驅動的新工業革命的藍圖,其中 Grace Blackwell 是核心計算引擎,Agentic AI 和具身機器人是下一波 AI 浪潮,而數位孿生(Omniverse)連接物理世界與虛擬世界的橋樑,所有這些都由 NVIDIA 強大的加速計算平臺和廣泛的生態系統所支援。 而歐洲,作為工業革命的起源地,正重新成為 AI 時代的實驗場。 在這條新的產業鏈上,計算就是生產力,智慧就是能源。

一個全新的時代,已經到來。

以下為黃仁勳演講完整實錄:

歡迎英偉達創始人兼首席執行官黃仁勳登臺。

黃仁勳: 你好,巴黎。 大家好。

NVIDIA 在巴黎舉辦的首次 GTC 大會。 這真是令人難以置信。 感謝所有與我們同行的合作夥伴。 多年來,我們合作過許多人。 事實上,我們在歐洲已經有很長時間的業務了。 儘管如此,這是我第一次參加巴黎 GTC。 我有很多話要告訴你。

英偉達,曾經,想要創造一個新的計算平臺,去做普通計算機無法完成的事情。 我們加速了 CPU,創造了一種稱為加速計算的新型計算方式。 我們的第一個應用之一是分子動力學。 從那時起我們已經走了很長的路。 有這麼多不同的庫。 事實上,使加速計算特別的原因是:它不僅僅是一個你編譯軟體的新處理器。 你必須重新構建你的計算方式。 你必須重新設計你的演算法。

事實證明,人們很難將軟體和演算法重新設計得高度並行化。 因此,我們創建了庫來幫助各個市場。 每個應用領域都得到了加速。 每一個庫都為開發者開闢了新的機遇。 這也為我們和我們的生態系統合作夥伴帶來了新的增長機會。

計算光刻,可能是當今半導體設計中最重要的應用之一,在台積電的工廠中運行三星,大型半導體製造廠。 晶元製造之前,它會通過逆物理演算法運行計算光刻。 直接稀疏求解器,代數多重網格求解器。 我們剛剛開源了。 令人難以置信的激動人心的應用庫。 該庫加速決策過程,以優化擁有數百萬變數和數百萬約束的問題,例如旅行推銷員問題。

Warp,一個用於表達幾何和物理求解器的 Python 框架。 非常重要。 cuDF、cuML、結構化資料庫、數據框、經典機器學習演算法。 cuDF 加速 Spark,無需修改代碼。 cuML 加速 scikit-learn,無需修改代碼。 Dynamo 和 cuDNN。 cuDNN 可能是英偉達迄今為止創建的最重要的庫。 它加速了深度神經網路的基本操作。 而 Dynamo 是我們全新的庫,使得調度成為可能:協調、分配極其複雜的推理工作負載,覆蓋整個 AI 工廠。

cuEquivariance 和 cuTensor,張量收縮演算法。 Equivariance 適用於遵循幾何法則的神經網路。 例如蛋白質、分子。 Ariel 和 Shona,是實現 AI 運行 6G 的非常重要的框架。 Earth-2,是我們用於天氣和氣候基礎模型的模擬環境。 平方公里級,解析度極高。 MONAI,我們的醫學影像框架,極受歡迎。 Parabricks,我們的基因組分析解決方案,取得了巨大成功。 cuQuantum,CUDA-Q,我稍後會談到,用於量子計算。 還有 cuPineumeric,加速 NumPy 和 SciPy。

正如你所見,這些只是庫的幾個例子。 還有另外 400 個。 它們中的每一個都加速了一個應用領域。 每一個都開闢了新的機遇。 其中最令人興奮的之一是 CUDA-Q。 CUDA-X 是一套庫,專為在 CUDA 基礎上加速應用和演算法而設計的庫套件。 我們現在有了 CUDA-Q。 CUDA-Q 是為量子計算設計的,適用於經典和量子基於 GPU 的量子經典計算。

一、量子計算的拐點與 CUDA-Q

我們已經在 CUDA-Q 上工作了好幾年了。 今天,我可以告訴你,量子計算正處於一個轉捩點。 正如你所知,近 30 年前首次展示了物理量子比特。 1995 年發明了糾錯演算法。 2023 年,近 30 年後,谷歌展示了世界上第一個邏輯量子比特。 從那以後,幾年過去了。 邏輯量子比特的數量——由大量帶有糾錯的物理量子比特組成——也有所增加。 邏輯量子比特的數量開始增長。

就像摩爾定律一樣,我完全可以預期每五年邏輯量子比特數量增加十倍。 每十年邏輯量子比特數量增加一百倍。 這些邏輯量子比特將具備更好的錯誤糾正能力:更加穩健,性能更高,更具彈性,當然將繼續具備可擴展性。 量子計算正達到一個拐點。

我們一直以多種方式與全球的量子計算公司合作,但在歐洲,這裡有一個龐大的社區。 我昨晚見到了帕斯卡爾,昨晚還見到了巴塞羅那超級計算中心。 現在很明顯,我們已經接近能夠應用量子計算的階段了:量子經典計算將在未來幾年內解決一些有趣的問題。 這是一個非常激動人心的時刻。

因此,我們一直在與所有超級計算中心合作。 現在非常清楚,在未來幾年內,或者至少在下一代超級計算機中,每一個都會分配一個量子處理單元(QPU),並且 QPU 會連接到 GPU。 量子處理單元當然會執行量子計算,而 GPU 則用於預處理:用於控制和糾錯,這將極其計算密集; 後期處理等。

在這兩種架構之間,就像我們加速了 CPU 一樣,現在有了 QPU 與 GPU 協同工作,推動下一代計算的發展。 今天我們宣佈,我們的整個量子演算法堆疊現已在 Grace Blackwell 200 上實現加速。 加速效果令人難以置信。

我們以多種方式與計算、通信和量子計算行業合作。 其中一種方式是使用 cuQuantum 來類比量子比特,或類比運行在這些量子計算機上的演算法。 基本上是使用經典計算機來類比或模擬量子計算機。 在另一個極端,極其重要的是 CUDA-Q:基本上是發明瞭一種新的 CUDA,將 CUDA 擴展到量子經典領域。 這樣,在量子計算機到來之前,基於 CUDA-Q 開發的應用可以以類比方式運行,或者在量子計算機到來后以協作方式運行:一種量子經典加速計算方法。

今天我們宣佈 CUDA-Q 已可用於 Grace Blackwell。 這裡的生態系統極為豐富,當然歐洲在科學領域深厚,在超級計算專業知識方面深厚,在這一領域有著深厚的傳承。 在這裡看到量子計算的進展並不令人驚訝。 在未來幾年,我們將看到一個真正精彩的轉捩點。

無論如何,對於所有在量子計算機行業工作了三十年的同仁們,我祝賀你們取得了如此令人難以置信的成就和今天的里程碑。 謝謝。

讓我們來談談人工智慧。 你可能會驚訝我會和你們談論人工智慧。 正是同一款 GPU 驅動並支援了我剛才提到的所有這些應用。 同樣的支援 GPU 的人工智慧技術將走向世界。

我們第一次接觸是在 2012 年,就在那之前。 與開發者合作,研究一種稱為深度學習的新型演算法。 它促成了 AI 的 AlexNet 大爆炸:2012 年。 在過去大約 15 年裡,人工智慧取得了令人難以置信的快速進展。

第一波人工智慧是感知,讓計算機識別資訊、理解資訊。 第二波,是我們大多數人都在討論的過去五年左右,是生成式人工智慧。 它是多模態的,意味著人工智慧能夠同時學習圖像和語言。 因此,你可以用語言提示它,它就能生成圖像。 人工智慧具備多模態能力以及翻譯和生成內容的能力,推動了生成式人工智慧的革命。 生成式人工智慧,即生成內容的能力,對我們的生產力至關重要。

那麼,我們有了一個新的...... 我們正在開啟新一波的人工智慧浪潮。 在過去的幾年裡,我們見證了人工智慧能力的巨大進步。 從根本上說,智慧就是理解、感知、推理和規劃任務:如何解決問題,然後執行任務。 感知、推理、規劃,智慧的基本迴圈。 它使我們能夠應用一些先前學到的規則來解決我們從未見過的問題。

這就是為什麼聰明人被認為聰明,因為他們能夠將一個複雜的問題一步步拆解...... 推理如何解決問題,或許還會進行研究:也許去學習一些新知識,尋求説明; 使用工具,逐步解決問題。 我剛才描述的這些話,基本上今天通過所謂的代理型人工智慧是可能實現的。 我馬上會給你展示更多內容。

在其物理實現中,即該代理智慧和運動的體現...... 現在,生成能力正在生成運動。 不是生成視頻,也不是生成圖像或生成文本; 這項人工智慧生成了運動能力,即行走能力或者伸手抓取某物,使用工具。 讓人工智慧具備實體形態的能力,基本上就是機器人技術。 這些能力,是實現智慧體的基礎技術。 它們基本上是資訊機器人和具身人工智慧:物理機器人,這兩項基本能力現在已經到來。

人工智慧的時代真是令人非常興奮。 但這一切,都是從 GeForce 開始的。 而 GeForce 帶來了電腦圖形技術。 這是我們曾經開發的第一個加速計算應用。 計算機圖形技術的發展令人難以置信。 GeForce 將 CUDA 推向世界,使火星機器學習研究人員和人工智慧研究人員能夠推動深度學習的發展。 隨後,深度學習徹底改變了計算機圖形技術,使我們能夠將計算機圖形提升到一個全新的高度。

我今天要展示的所有內容,我今天要展示的所有內容,我將為你預覽:我將展示的內容,但我今天展示的所有內容都是計算機類比,不是動畫。 是光子類比、物理類比、粒子類比。 一切本質上都是類比,不是動畫,也不是藝術。 它看起來非常美麗,因為事實證明世界本身就是美麗的,而且數學也是美麗的。 那麼,讓我們來看看。

數位在行動,數位在行動。 這基本上就是模擬的本質,看起來非常美妙。 但正因為我們現在能夠以如此規模和速度模擬幾乎所有事物,我們可以將一切轉化為數位孿生。 而且因為一切都可以成為數位孿生,它可以在投入物理世界之前,完全通過數位方式進行設計、規劃、優化和操作。 我們將一切都用軟體構建的理念如今已成為現實。

所有實體物品都將以數位方式構建。 所有巨集偉的建築都將以數位方式構建。 所有在巨大規模上運行的事物,都會首先以數位形式構建,並且會有數位孿生來操作它們。 所以今天我們將重點討論數位孿生。 這最初是作為一款 GeForce 顯卡開始的...... 這裡有人知道 GeForce 是什麼嗎? 知道。

好了。 好的。 最初的 GeForce 現在看起來是這樣的。 這是全新的 GeForce。 重達兩噸,甚至兩噸半。 由 120 萬個零件組成。 大約 300 萬美元。 120 千瓦。 在 150 家工廠製造。 200 家技術合作夥伴與我們共同努力實現這一目標。 可能是大約 400 億美元的研發預算,用於創造——什麼是 GB200,現在正在向 GB300 邁進。 它已經完全投入生產。

這台機器被設計成一台思考機器。 所謂思考機器,是指它能夠進行推理。 它有計劃。 它花很多時間自言自語,就像你一樣。 我們大部分時間都在為自己的思維生成文字,在我們表達之前,為自己的思維生成圖像。 因此,思考機器實際上就是 Grace Blackwell 設計的架構目標。 它被設計成一個巨大的 GPU。 我之所以這樣比喻,是有充分理由的。 GeForce 是一塊 GPU,GB200 也是。 它是一個巨大的虛擬 GPU。

現在,我們必須將其拆分成許多元件。 創建了一系列新的網路技術和 SerDes 技術。 極低功耗、高能效的互連技術,將所有這些晶元和系統連接成一個虛擬 GPU。 這是 Hopper 版本。 這是世界著名的 Hopper 系統。 這是八個通過 NVLINK 連接在一起的 GPU。 這裡沒有顯示的是一個 CPU 托盤:一個帶有雙 CPU 和系統記憶體的 CPU 托盤,位於上方。 這共同構成了一個人工智慧超級計算機的節點,大約五十萬美元。

這是霍普系統。 這就是——真正讓我們在人工智慧領域嶄露頭角的系統。 它長期以來一直處於資源不足的狀態。 因為市場發展得太快了。 但這是著名的霍普系統。 整個系統,包括 CPU,都被這個 Grace Blackwell 節點所取代。 這就是一個計算托盤,就在這裡,將取代整個系統。 它採用全液冷設計,CPU 直接集成與 GPU 相連,所以你可以看到或聽到兩個 CPU、四個 GPU。 它的性能超過了整個系統。

但令人驚訝的是,我們想要將一大批這樣的系統連接在一起。 如何將所有這些系統連接起來,對我們來說真的很難想像。 所以我們將其拆分了。 我們所做的是將整塊主機板拆分成了這個和這個。 這是革命性的 NVLINK 系統。 擴展計算並不難。 只需用乙太網連接更多 CPU。 橫向擴展並不難。 縱向擴展極其困難。

你只能建造出你能夠建造的最大規模的計算機。 將大量技術和電子設備集成到一個記憶體模型中是非常困難的。 因此,我們決定創建一種新的互連技術,稱為 NVLINK。 NVLINK 是一種記憶體語義互連。 它是一個計算結構,不是網路。 它直接連接到所有這些不同 NVLINK 系統計算節點的 CPU。

這是交換機。 這九個,這九個,站在最上面。 九個部分位於底部。 中間是 NVLINK 交換機,連接它們的是這個奇跡。 這就是 NVLINK 主幹。 這是 100%純銅,同軸銅線。 它將所有 NVLINK 晶片直接連接到所有 GPU。 在整個主幹線上直接連接,使每一個 144 個 Blackwell 晶片核都相連。 或者在 72 個不同的封裝中,同時相互通信,且不會阻塞貫穿整個 NVLINK 骨幹網路。 其頻寬約為每秒 130 太位元組。 132... 我-我知道。 不,等等——等等看。 等著瞧。 130 太位元組每秒。 如果是以比特計,130 太位元組每秒。 它的數據傳輸速率超過了全球整個互聯網峰值流量的總和,就在這個背板上。 而且——是的。 這就是——這就是你如何將互聯網縮小到 60 磅的重量。 NVLINK。

所以,我們做了所有這些,我們做了所有這些,因為計算機的工作方式被認為是你對計算機的看法將來會有根本性的不同。 我會花更多時間講這個。 但它的設計目的是讓 Blackwell 在性能上遠超 Hopper。 請記住,摩爾定律,半導體物理每三到五年只能帶來大約兩倍的性能提升。 我們如何能在一代產品中實現 30 到 40 倍的性能提升? 而我們需要的是 30 到 40 倍的性能提升。 因為推理模型在自言自語。

它不再是一次性完成的 ChatGPT,而是一個推理模型。 當你自我思考時,它會生成更多的標記。 你正在一步步地分解問題。 你在推理,嘗試各種不同的路徑。 也許是思維鏈,也許是思維樹。 最好的結局。 它正在反思自己的答案。 你可能看到...... 看到,這些研究模型,反思答案時會說「這是個好答案嗎? 你能做得更好嗎? “然後他們”哦,是的,我能做得更好。 “然後回去再多想想。 因此,那些思考模型、推理模型達到了驚人的性能,但這需要更多的計算能力。

而 NVLINK-72 Blackwell 架構的最終成果則帶來了性能的巨大飛躍。 閱讀方式是,X 軸表示思考的速度。 Y 軸表示工廠在同一時間支援大量用戶的產出能力。 因此,你希望工廠的輸送量盡可能高,以支援盡可能多的人,從而使工廠的收入達到最大化。 你希望這個軸盡可能大,因為人工智慧很聰明:這裡比這裡更聰明。 越多,它思考得越快,回答你的問題之前能思考得越多,這與 ASP 有關。 Token 的平均售價,這必須與工廠的輸送量有關。 這兩者結合在那個角落就是工廠的收入。 基於 Blackwell 的這家工廠由於其架構,可以產生更多的收入。

我們所建造的東西真是令人難以置信。 我們為你製作了一部電影,旨在讓你感受到打造 Grace Blackwell 所投入的巨大工程量。 請看。

(輕柔的音樂響起)布萊克韋爾是一項工程奇跡。 它始於一塊空白的矽片。 (機械運轉聲)數百道晶元加工和紫外光刻工序,在一塊 12 英寸的矽片上,一層層構建起 2000 億個晶體管。 晶圓被劃分成單個 Blackwell 晶片經過測試和分類,將良品晶片分離出來以便後續使用。 晶片-晶圓-基板工藝將 32 個 Blackwell 晶片和 128 個 HBM 堆疊安裝在定製的矽仲介層晶圓上。 (機械運轉聲)金屬互連線路直接蝕刻其中,將 Blackwell GPU 和 HBM 堆棧連接到每個系統和封裝單元中,確保所有部件牢固固定。

然後進行組裝,經過烘烤、成型和固化,打造出 Blackwell B200 超級晶片。 每個 Blackwell 晶片都在 125 攝氏度的烤箱中進行壓力測試,並在極限條件下運行數小時。 機器人全天候工作,將超過 10,000 個元件拾取並放置到 Grace Blackwell 的 PCB 上。 與此同時,定製的液冷銅塊正在準備中,以保持晶元在最佳溫度。 在另一處工廠,ConnectX-7 SUPERNIC 被製造出來,以實現擴展通信,BlueField-3 DPU 則用於卸載和加速網路處理、存儲和安全任務。

所有這些部分最終被精心集成到 GB200 計算托盤中。 NVLINK 是 NVIDIA 發明的突破性高速連接技術,用於連接多個 GPU,實現大規模虛擬 GPU 的擴展。 NVLINK 交換機托盤由 NVLINK 交換晶片構成,提供每秒 14.4 太位元組的全互聯頻寬。 NVLINK 主幹形成定製的盲插背板,使用 5000 根銅纜將全部 72 個 Blackwell 或 144 個 GPU 晶片連接成一個巨型 GPU,提供每秒 130 太位元組的全互聯頻寬——超過全球互聯網的峰值流量。

來自世界各地的零部件被熟練的技術人員組裝成機架規模的人工智慧超級計算機。 總共 120 萬個元件,兩英里的銅線、130 萬億個晶體管,重近兩噸。 Blackwell 不僅僅是一個技術奇跡。 它是全球合作與創新力量的見證,推動著將塑造我們未來的發現和解決方案遍佈各地。 我們致力於説明當代天才完成他們的畢生事業,迫不及待想看到你們帶來的突破。

Grace Blackwell 系統全部投入生產。 這真是一個奇跡。 從技術角度來看,這簡直是個奇跡,但能夠組裝這些 GB200 系統的供應鏈也功不可沒。 每台重達兩噸,我們現在每周生產一千台系統。 以前從未有人在如此規模上批量生產超級計算機。 每一個機架本質上就是一台完整的超級計算機。 僅在 2018 年,最大的 Volta 系統...... 2018 年的 CRS 超級電腦性能還不如其中一個機架。 而那個系統的功耗是 10 兆瓦。 這是 100 千瓦。 所以從 2018 年到現在,代際之間的差異:我們確實將超級計算、人工智慧超級計算提升到了一個全新的水準,我們現在正在大規模生產這些機械。

這僅僅是個開始。 事實上,你們看到的只是一個系統:格蕾絲·布萊克韋爾。 全世界都在談論這一個系統,紛紛呼籲儘快部署它於此地:進入全球數據中心,用於訓練、推理和生成式人工智慧。 然而,並非所有人,也並非所有數據中心都能應對這些液冷系統。 一些數據中心需要企業級堆疊,能夠運行 Linux Red Hat 或 Nutanix,或 VMware,以及來自 Dell EMC 的儲存系統。 日立、NetApp、VAST、Weka,如此多種不同的存儲系統、如此多不同的 IT 系統,而這些系統的管理必須與傳統 IT 系統保持一致。

我們有這麼多新計算機需要投入生產管理。 我很高興地告訴大家,這些產品現在全部進入量產階段。 你們還沒見過它們,它們正從貨架上迅速被搶購一空。 它們正從生產線快速下線,開始投產。 DGX Spark 讓您幾乎可以在桌面上擁有 Grace Blackwell 系統。 對於 Spark 來說,是桌面; 對於 DGX Station 來說,是桌邊。 這樣你在開發軟體時就不必坐在超級計算機旁了,在開發你的人工智慧時。 但你希望架構完全相同。 從架構角度來看,這些系統是完全相同的。 從軟體開發者的角度來看,介面完全一樣。 唯一的區別是規模和速度。

然後這邊是所有的 x86 系統。 全球的 IT 組織仍然偏愛 x86,並且在能夠利用最先進的 AI 原生系統時,都會選擇 x86。 他們確實如此。 在他們無法做到且希望整合進企業 IT 系統的地方,我們現在為他們提供了實現這一目標的能力。 其中一個最重要的系統,也是我們花費最長時間構建的系統,因為軟體和架構非常複雜:如何將原生 AI 架構引入並融合到傳統企業 IT 系統中。

這是我們全新的 RTX 專業伺服器。 這是一台令人難以置信的系統。 主板經過全面重新設計。 女士們,先生們,Janine Paul。 這塊主機板看起來非常簡單,但在這塊主機板上有八個 SUPER-NIX 交換機,通過一顆每秒 200 吉比特的最先進網路晶片連接八個 GPU,這些 GPU 是 Blackwell RTX Pro 6000。 全新產品,剛剛進入生產階段。 八個這樣的裝入一台伺服器。 那麼,它有什麼特別之處? 這台伺服器是世界上唯一一台能夠運行世界上所有已寫內容以及 NVIDIA 所有開發成果的伺服器。 它運行人工智慧、Omniverse 和用於視頻遊戲的 RTX; 它運行 Windows,運行 Linux,運行 Kubernetes; 它在 VMware 中運行 Kubernetes,基本上運行所有東西。

如果你想將 Windows 桌面從一台電腦流式傳輸到你的遠端設備,沒問題。 如果你想流式傳輸 Omniverse,也沒問題。 如果你想運行你的機器人系統,沒問題。 只是這台機器的品質保證簡直瘋狂。 它運行的應用基本上是通用的:世界上開發的所有東西都應該能在這裡運行,包括,如果你是視頻遊戲玩家,包括《孤島危機》。 所以... 如果你能運行《孤島危機》,你就能運行任何東西。 好了,這是 RTX 專業伺服器:全新的企業系統。

所以某些事情正在發生變化。 我們知道人工智慧是一項極其重要的技術。 我們現在確鑿無疑地知道,人工智慧是一種可能帶來革命性變革的軟體:改變每一個行業。 它能做到這些驚人的事情。 這是我們所知道的。 我們也知道,處理人工智慧的方式與我們過去處理手寫軟體的方式根本不同。 機器學習軟體的開發方式不同,運行方式也不同。 系統的架構,軟體的架構:完全不同。 網路的工作方式,完全不同。 訪問存儲的方式,完全不同。

所以我們知道這項技術可以做不同的事情:令人難以置信的事情。 它是智慧的。 我們也知道它的開發方式根本不同:它需要新的計算機。 真正有趣的是,這對各國意味著什麼? 對企業、對社會又意味著什麼? 這是我們近十年前就注意到的一個現象,而現在每個人都開始意識到這一點了:事實上,這些人工智慧數據中心根本就不是數據中心。 它們不是傳統意義上的資料中心,用來存儲你可以檢索的檔。 這些數據中心並不存儲我們的檔。 它只有一個任務,且僅此一個任務:那就是生成智慧標記,即人工智慧的生成。

這些人工智慧工廠,看起來像數據中心,因為裡面有大量計算機。 但這就是一切崩潰的地方。 它的設計方式、製造規模或規模化:設計和建造方式,以及它的使用、協調和配置方式; 如何運營它,你如何看待它。 例如,沒有人真正把他們的數據中心當作一個創收設施來考慮。 我說了一句話,大家都說,“是的,我覺得你說得對。 “沒人會把數據中心當作一個創收設施來考慮。 但他們把自己的工廠,汽車工廠,看作是創收設施:他們迫不及待地想建另一座工廠,因為每當你建一座工廠,收入很快就會增長。 你可以為更多人創造更多東西。

這些想法正是這些人工智慧工廠中的想法。 它們是創收設施,旨在製造 Token。 這些 Token 可以被重新構造成多種行業的生產性智慧,因此人工智慧工廠現在已成為一個國家基礎設施的一部分。 這就是為什麼你看到我奔走於世界各地,與各國元首會談的原因:因為他們都希望擁有人工智慧工廠。 他們都希望人工智慧成為他們基礎設施的一部分。 他們希望人工智慧成為他們的一個增長型製造業。 這確實意義深遠,我認為我們正在討論的是:因此,催生了一場新的工業革命:因為每一個行業都受到了影響,同時也誕生了一個新興產業。

正如電力最初被描述和展示為一項技術時,後來發展成為一個新興產業一樣:它被理解為一項技術,但後來我們意識到它也是一個龐大的產業。 然後是資訊產業,我們現在稱之為互聯網。 這兩者都影響了許多行業,成為基礎設施的一部分。 我們現在有了一個新的產業——人工智慧產業:它現在成為了被稱為智慧基礎設施的新基礎設施的一部分。 每個國家、每個社會、每家公司都將依賴它。

你可以看到它的規模。 這是一個被廣泛討論的話題。 這是星際之門。 這看起來不像數據中心。 更像是一座工廠。 這是一個千兆瓦。 它將容納大約 50 萬個 GPU 晶片,產生巨大的智慧,供所有人使用。 歐洲現在已經意識到這些人工智慧工廠的重要性。 人工智慧基礎設施的重要性,我非常高興看到這裡有如此多的活動。

這是歐洲電信公司與 NVIDIA 合作建設人工智慧基礎設施。 這是歐洲雲服務提供者與 NVIDIA 合作建設人工智慧基礎設施。 這就是歐洲超級計算中心正在與 NVIDIA 合作建設下一代人工智慧超級計算機和基礎設施。 這僅僅是個開始。 這還不包括即將在公共雲中推出的內容。 這還不包括公共雲。 所以這是由歐洲公司為歐洲市場本土打造的人工智慧基礎設施。 此外,還有 20 個正在規劃中的人工智慧工廠,其中幾個是千兆瓦級的超級工廠。 總共僅用兩年時間,我們將在歐洲將人工智慧計算能力提升 10 倍。 因此,研究人員、初創企業,你們的人工智慧短缺、你們的 GPU 短缺很快就會得到解決。 它正向你走來。

現在,我們正在與每個國家合作,發展他們的生態系統。 因此,我們正在七個不同的國家建立人工智慧技術中心。 這些人工智慧技術中心的目標是:第一,進行合作研究,與初創企業合作; 同時構建生態系統。 讓我向你展示一個生態系統的樣子。 我昨天剛剛在英國。 這些生態系統都是建立在 NVIDIA 技術棧之上的。 例如,正如你所知,每一台 NVIDIA 設備:NVIDIA 是唯一在所有雲平臺上可用的 AI 架構。 除了 x86 之外,它是唯一無處不在的計算架構。

我們與所有雲服務提供者合作。 我們加速全球最重要軟體開發商的應用:包括歐洲的西門子、Cadence、紅帽、ServiceNow。 我們重新定義了計算堆疊。 正如你所知,計算不僅僅是計算機:而是計算、網路和存儲的結合。 每一層,每一個堆疊都被重新定義了。 與思科的合作非常出色,他們昨天在會議上宣佈了基於 NVIDIA 的全新型號。 戴爾,出色的合作夥伴,NetApp,Nutanix,還有一大批優秀的合作夥伴。

正如我之前提到的,軟體開發的方式已經發生了根本性的變化。 現在不再只是編寫 C 程式,編譯 C 程式、交付 C 程式...... 現在是 DevOps、MLOps、AIOps。 整個生態系統正在被重新構建,我們在各地都有生態合作夥伴。 當然,還有解決方案集成商和供應商,他們可以説明每家公司整合這些能力。

在英國,我們有一些特別的合作公司:從研究人員到開發者,再到合作夥伴,這些真正了不起的公司幫助我們提升本地經濟和本地人才的技能; 使用這些技術的企業,當然還有雲服務提供者。 我們在英國有很棒的合作夥伴。 我們在德國有很棒的合作夥伴,德國的合作關係非常非常出色。 我們在義大利也有很好的合作關係,當然我們在法國這裡也有令人驚歎的合作夥伴。

沒錯,加油法國。 馬克龍總統稍後會到場。 我們將討論一些新的——一些新的公告,所以我們必須對人工智慧表現出一些熱情,好嗎? 是的。 就是這樣。 給他一些熱情。 所以這裡,在法國,有非常棒的合作夥伴關係。 我想特彆強調一個合作夥伴:我們與施耐德的合作。 編譯... 甚至建造這些人工智慧工廠,我們現在都是數位化建造的。 我們通過數位化設計它們,我們通過數位化製造它們; 我們通過數位化操作或優化它們,最終我們甚至會在數位孿生中完全數位化地優化和操作它們。

這些人工智慧工廠非常昂貴,有時高達 500 億美元,未來將達到 1000 億美元。 如果該工廠的利用率未達到最大化,工廠擁有者將面臨巨大的成本壓力。 因此,我們需要在任何可能的地方實現數位化並使用人工智慧:將一切都放入元宇宙,以便我們能夠獲得直接且持續的遙測數據。 我們今天宣佈了一項偉大的合作夥伴關係:一家年輕的公司,一位我非常喜歡的首席執行官,他正試圖打造一家歐洲的人工智慧公司。 這家公司的名字叫 Mistral。

今天我們宣布,我們將在這裡共同打造一個 AI 雲平臺,用於部署他們的模型,以及為 AI 生態系統中的其他初創企業提供 AI 應用,使他們能夠使用 Mistral 模型或任何他們喜歡的模型。 所以 Mistral 和我們將合作在這裡建設一個非常龐大的人工智慧雲平臺。 我們會講...... 今天稍後我們會和馬克龍總統詳細談論這件事。

人工智慧技術正以光速發展。 我這裡展示的是左側的專有模型,正以光速前進。 然而,開源模型也在以光速發展。 僅落後幾個月。 無論是 Mistral、LLaMA,還是即將推出的 DeepSeek R1、R2:第一季度,這些模型都非常出色。 每一個都非常出色。 因此,過去幾年裡,我們致力於彙聚世界頂尖的人工智慧研究人員,進一步提升這些人工智慧模型的性能。 我們稱之為 Nemotron。

基本上,我們所做的是採用開源模型(當然,這些模型無一例外都是基於 NVIDIA 構建的),然後我們進行後期訓練。 我們可能會進行神經網路架構搜索...... 我們可能會進行神經網路架構搜索,提供更優質的數據。 使用強化學習技術,增強這些模型,賦予其推理能力:擴展上下文,使其在與你互動之前能夠學習和閱讀更多內容。 大多數這些模型的上下文相對較短:我們希望它具備強大的上下文處理能力,因為我們想在企業應用中使用它,而我們希望進行的對話內容並不在互聯網上。 這些內容存在於我們公司內部,因此我們必須為它載入大量的上下文資訊。

所有這些能力隨後被打包成一個可下載的 NIM。 你可以訪問 NVIDIA 的網站,直接下載一個 API:一個最先進的 AI 模型,放置在你喜歡的任何地方,然後我們會大幅提升它的性能。 這是 Nemotron 相較於 LLaMA 的改進範例。 這是通過我們的後訓練能力改進的 LLaMA 8B、70B、405B 模型。 推理能力的擴展,我們提供的所有數據極大地增強了它。 我們將一代又一代地持續進行下去。

所以,對於所有使用 Nemotron 的人來說,你們將會知道未來還有一大批其他模型。 而且它們本來就是開源的,所以如果你想從開源模型開始,那太棒了。 如果你想從 Nemotron 模型開始,那太棒了。 Nemotron 模型的性能非常出色。 在一次又一次的基準測試中,Nemotron 的表現始終位居榜首。 所以現在你知道,你可以使用一個依然開放的增強型開放模型。 那是領導者榜單的頂端,你知道 NVIDIA 致力於此:所以我會一直做到生命的盡頭,好嗎?

這個策略太棒了,這個策略太棒了,以至於區域模型製造商——歐洲各地的模型構建者們現在都認識到這個策略的美妙之處:我們正在合作,共同調整和提升每一個區域語言的模型。 您的數據屬於您。 您的數據屬於您。 它是您民族的歷史,是您民族的知識。 你們民族的文化。 它屬於你們,對於許多公司來說:以 NVIDIA 為例,我們的大部分數據都存儲在內部。 33 年的數據。 我今天早上在查資料,西門子:180 年的數據,其中一些記錄在紙草上。 Roland Busch 來了。 我,我想捉弄一下 Roland Busch,我親愛的朋友。 所以,你得先把它數位化,AI 才能學習。 所以,是的,數據屬於你。 你應該使用這些數據,使用像 Limotron 這樣的開源模型和我們提供的所有工具套件,這樣你就可以為自己的用途進行增強。

我們還宣布,我們與 Perplexity 建立了良好的合作關係。 Perplexity 是一款推理搜尋引擎。 是的。 我使用的三個模型是 ChatGPT、Gemini Pro 和 Perplexity。 這三個模型我交替使用,Perplexity 非常出色。 我們今天宣佈,Perplexity 將整合這些區域模型,直接接入 Perplexity,讓你能夠用你的語言提問並獲得答案:以你所在國家的文化和感知方式,明白了嗎? 所以是 Perplexity 區域模型。

二、AI 已進入 Agent 時代

Agent 智慧體是一個非常重要的事情。 正如你所知,起初,使用預訓練模型時,人們說,“但它會產生幻覺。 它會編造內容。 “你說得完全正確。” 它無法獲取最新的新聞和數據資訊。 “完全正確。” 它在沒有推理分析問題的情況下就放棄了。 “”就好像每一個答案都必須從過去記憶中獲得。” 你說得完全正確。 所有這些事情,你知道的,為什麼它要試圖弄清楚如何加法或者計算計數數位並相加? 為什麼它不直接用計算機? 你說得完全正確。

因此,所有與智能相關的能力——每個人都能提出批評,但這完全正確,因為大家大致了解智慧是如何運作的。 但這些技術正在全球範圍內被開發建設:它們全部彙聚在一起,從增強檢索生成到網路搜索,再到多模態理解,這樣你就可以閱讀 PDF 檔、訪問網站,查看圖片和文字、聽視頻,觀看視頻,然後將所有這些理解融入你的語境中。 你現在當然也可以理解幾乎任何事物的提示。 你甚至可以說,“我要問你一個問題,但從這張圖片開始。 “我可以說:”從這個開始,先從這段文字開始再回答“,回答問題或執行我要求你做的事。 “然後它會自行推理、計劃和自我評估。

所有這些能力現在都已整合,你可以看到它們在市場上隨處可見。 具代理性的人工智慧是真實存在的。 自主智慧是一次從一次性人工智慧邁出的巨大飛躍。 一次性人工智慧是必要的基礎,它讓我們能夠教會智慧體如何成為智慧體。 你需要具備一定的知識基礎和推理能力,才能具備可教性。 預訓練關乎人工智慧的可教性。 后訓練、強化學習、監督學習、人類示範、上下文提供、生成式人工智慧,所有這些正在融合,形成如今的智慧代理人工智慧。

讓我們來看一個例子。 讓我給你展示點東西。 它基於 Perplexity 構建,非常酷。

(伴奏音樂播放)人工智慧代理是數位助理。 基於提示,它們進行推理並將問題分解為多步驟計劃。 它們使用合適的工具,與其他代理協作,並利用記憶中的上下文在 NVIDIA 加速系統上正確執行任務。 一切從一個簡單的提示開始。 讓我們請 Perplexity 幫忙在巴黎開一家餐車。

首先,Perplexity 代理通過提示進行推理並制定計劃,然後調用其他代理使用多種工具幫助解決每個步驟。 市場研究員閱讀評論和報告,以發現趨勢並分析競爭市場。 基於這項研究,概念設計師探索當地食材並提出包含準備時間估算的功能表,並研究調色板,生成品牌識別。 然後,財務規劃師使用蒙特卡洛類比來預測盈利能力和增長軌跡。 一名運營策劃人員制定了包含每個細節的發射時程表:從購買設備到獲取正確的許可。 市場專員制定了包含社交媒體活動的發射計劃,甚至編寫了一個包含地圖的互動網站、功能表和在線訂購。

每個代理的工作彙集成最終的方案提案。 一切都始於一個簡單的提示。 一個提示,就像那樣的一個提示,在原始聊天機器人中,可能只會生成幾百個標記。 但現在只需一個提示,交給代理去解決問題,它生成的標記數量必定多出一萬倍。 這就是為什麼需要 Grace-Blackwell 的原因:這就是為什麼我們需要性能以及系統在代際之間有更大提升的原因。 這就是 Perplexity 構建他們的智慧代理的方式。 每家公司都必須構建自己的智慧代理。

這太棒了,你將會從 OpenAI、Gemini、微軟 Copilot、Perplexity、Mistral 等平臺招聘代理。 也會有為你量身打造的代理。 他們可能會幫助你規劃一次假期,或者你知道,去做一些研究,諸如此類。 然而,如果你想創辦一家公司,你將需要專用的代理和專用的工具,以及使用專用的工具和專用的技能。 那麼問題是,你如何構建這些代理?

因此,我們為你創建了一個平臺。 我們創建了一個框架和一套工具供您使用,還有一大批合作夥伴説明您實現目標。 這一切從最底層開始,最底層:我之前提到的推理模型能力。 NVIDIA 的 NeMo、NeMotron 推理大型語言模型是世界一流的。 我們有 NeMo Retriever,這是一款多模態搜尋引擎。 語義搜尋引擎。 令人難以置信。 我們構建了一個藍圖,一個可運行的演示,基本上是一個通用智慧體。 我們稱之為 IQ,AI,AIQ。

最上層,我們有一套工具,允許你引入一個代理:一個通用代理,整理數據來教它; 評估它,設定安全邊界,監督訓練它,使用強化學習直到部署; 保持安全,確保保障。 這套工具包已經集成,這些庫也已集成到 AIOps 生態系統中。 你也可以直接從我們的網站下載。 但它主要集成在 AIOps 生態系統中。 基於此,你可以創建自己的專屬代理。

許多公司都在這樣做。 這是思科,他們昨天宣佈,「我們正在共同構建用於安全的人工智慧平臺。 “現在,看看這個。 人工智慧代理,而不是一個模型完成所有這些驚人的任務:它是一個模型集合,一個系統。 它是一個由大型人工智慧語言模型組成的系統。 其中一些經過專門優化,適用於某些特定類型的任務。 檢索,正如我提到的,使用計算機執行技能。 你不想把所有這些東西捆綁成一個龐大的,你知道的,人工智慧整體,而是將其拆分成小部分,然後可以隨著時間推移部署持續集成/持續交付。 這是思科的一個例子。

現在的問題是,如何部署這個? 因為正如我之前提到的,NVIDIA 的計算資源存在於公共雲中。 有區域雲,我們稱之為 NCP。 這裡,比如說 Mistral。 你可能因為安全需求和數據原因擁有私有雲。 數據隱私要求。 你甚至可能會決定桌子上放些什麼東西。 那麼問題是,你如何運行所有這些? 有時它們位於不同的地方,因為這些都是微服務:這些是能夠相互交流的人工智慧,它們顯然可以通過網路相互通信。

那麼,如何部署所有這些微服務呢? 現在,我們有了一個很棒的系統。 我很高興能為大家宣佈這一消息。 這就是我們的 DGX Lepton。 DGX Lepton,你現在看到的是各種不同的雲。 這裡是 Lambda 雲,AWS 雲,你知道的。 這是你自己的開發者機器,你自己的系統:可以是一台 DGX 工作站。 NeBS、Yotta、Nscale。 可能是 AWS,也可能是 GCP。 NVIDIA 的架構無處不在。

因此,您可以決定在哪裡運行您的模型。 你通過一個超級雲來部署它,所以它是一個雲中之雲。 一旦你讓它運行起來,一旦你將這些 NIMs 部署到 Lepton 中,它就會在你選擇的各種雲上託管和運行。 一種模型架構,一次部署,隨處運行。 你甚至可以在這台小小的機器上運行它。 你知道,這個 DGX Spark,它是, 它是...... 這是,現在是咖啡時間嗎? 看看這個。

這台電梯有 2000 馬力。 這是我最喜歡的小機器。 DGX Spark。 第一個...... 人工智慧超級計算機,我們在 2016 年建造了一台人工智慧超級計算機。 它被稱為 DGX-1。 它是我剛才提到的所有技術的第一個版本。 八個 Volta GPU 透過 NVLink 互聯。 我們花費了數十億美元來建造它,而在我們宣佈它的那一天:DGX-1,沒有客戶。 沒有興趣,沒有掌聲。 百分之百的困惑。 為什麼有人會造那樣的電腦? 它能運行 Windows 嗎? 不能。

所以我們還是造了它。 謝天謝地,是一家年輕的公司,一家初創企業:三藩市的一家非營利初創公司看到這台電腦時非常高興,他們說:“我們能要一台嗎? “我當時想:”天哪,我們賣出一台了。 “但後來我發現那是一家非營利組織。 但是它...... 我把一台電腦,呃——一台 DGX-1 放進了我的車裡,然後我開車把它帶到了三藩市。 那家公司的名字叫 OpenAI。

所以我不知道這其中的生活教訓是什麼。 有很多非營利組織,你知道的。 所以下次,下次...... 但是...... 也許教訓是:如果有開發者聯繫你:“需要,需要一個 GPU,”答案是肯定的。 所以,所以...... 沒錯。

想像一下你擁有 Lepton。 它就在你的瀏覽器中,你擁有,你擁有,這個,這個 Helm Chart。 你開發了一個人工智慧代理,想在這裡運行它:其中一部分你想在 AWS 上運行,還有一部分你想在其他地方運行,知道嗎? 在某個區域雲中。 你使用 Lepton,部署你的 Helm Chart,它就神奇地出現在這裡。 好嗎? 如果你想在這裡運行它,直到完成並準備好部署到雲端:太好了。 但美妙之處在於,這一架構基於 Grace Blackwell。 GB10 對比 GB200 對比 GB300,以及所有這些不同版本的... 但這一架構正是 Grace Blackwell。 這真是令人驚歎。

所以我們正在為 Lepton 做這件事,但接下來:Hugging Face 和 NVIDIA 已經將 Lepton 連接在一起。 因此,每當你在 Hugging Face 上訓練模型時,如果你想將其部署到 Lepton:並直接部署到 Spark,也沒問題。 只需輕輕一擊。 無論你是在訓練還是推理,我們現在都已接入 Hugging Face,Lepton 將説明你決定部署位置。 讓我們來看看。 開發者需要輕鬆且可靠地訪問計算資源,以跟上他們的工作節奏:無論他們身處何地,無論他們在構建什麼。

DGX Cloud Lepton 提供按需訪問跨雲的全球 GPU 網路:地區和合作夥伴,如 YOTA 和 Nebious。 多雲 GPU 集群通過單一統一介面進行管理。 資源配置速度快。 開發者可以快速擴展節點數量,無需複雜設置,使用預集成工具和訓練就緒的基礎設施立即開始訓練。 進度實時監控。 GPU 性能、收斂性和輸送量盡在掌握。 您可以直接在主控台內測試您的微調模型。

DGX Cloud Lepton 可以在多個雲或區域部署 NIM 端點或您的模型,實現快速分散式推理。 就像網約車應用連接乘客和司機一樣,DGX Cloud Lepton 連接開發者與 GPU 計算能力:驅動虛擬全球 AI 工廠。 DGX Cloud Lepton。

好了,這就是思科。 這是 SAP 的做法,他們正在 NVIDIA 上構建一個人工智慧平臺。 Sana 正在 NVIDIA 上構建一個人工智慧業務應用自動化系統。 DeepL 正在基於 NVIDIA AI 構建他們的語言框架和平臺。 Photoroom,一款視頻編輯和人工智慧編輯平臺:他們的平臺基於 NVIDIA 構建。 這是 KODO,我記得以前是,應該是 Codium,基於 NVIDIA 構建的令人難以置信的編碼代理。 這是 Iola,一個基於 NVIDIA 構建的語音平臺。 這個是一個,臨床試驗平臺:全球最大的基於 NVIDIA 的臨床試驗自動化平臺。

所以所有這些,基本上都是建立在同一個理念之上:NIMS,將其封裝並打包在一個虛擬容器中,您可以在任何地方部署。 Nemotron 大型語言模型,或其他大型語言模型:比如 Mistral 或其他。 我們隨後整合了涵蓋 AI 整個生命週期的庫:一個人工智慧代理。 你對待人工智慧代理的方式有點像對待數字員工。 所以你的 IT 部門需要對他們進行入職培訓:微調它們,訓練它們,評估它們,保持它們的安全防護; 你知道,保持它們的安全,並不斷改進它們。 整個框架平臺就叫做 Nemo,所有這些現在都被整合到全球一個又一個的應用框架中。 這隻是其中幾個的例子。

現在我們讓您能夠在任何地方部署它們。 如果你想在雲端部署它:你在雲端有 GB2 00s。 如果你想在本地部署,因為你有 VMware 或 Red Hat Linux 或者 Nutanix,如果你想在本地的虛擬機上部署它:你可以這麼做。 如果你想把它部署成私有雲:你可以做到這一點。 你可以將它全部部署在你的 DGX Spark 或 DGX Station 上。 沒問題。 所以 Lepton 會説明你完成所有這些。

三、AI 工業革命與數位孿生

讓我們來談談工業人工智慧。 這是我最喜歡的時刻之一。 這是羅蘭·布施。 他剛剛,這真是一個非常有趣的時刻。 他想提醒我,神經計算機:神經網路計算機是在歐洲發明的。 這就是整張幻燈片的內容。 Le- 我只是,真的是一個非常棒的時刻。 這是 Synapse I。 這真是太不可思議了,大家。 Synapse I。 這是 1992 年的 Synapse I,它運行神經網路的速度比當時的 CPU 快 8000 倍。 這難道不可思議嗎? 這就是世界上最強的人工智慧計算機。

而且,Roland 只是想,想說:“永遠不要忘記這一點,Jensen。 “永遠,永遠不要忘記這一點。” 我說,“好的,我會記住的。 “好吧。 我會告訴的,甚至會告訴所有人。 西門子 1992 年。 西門子 1992 年。 我們與西門子有著良好的合作關係——西門子,還有,羅蘭·布希,首席執行官:就是,給公司注入超級動力,使他們能夠實現飛躍:完全跨越上一輪資訊技術產業革命,融合歐洲的工業能力:將西門子的工業能力和實力與人工智慧結合起來,並創造所謂的工業人工智慧革命。

我們在許多不同領域與西門子合作:從設計、模擬、工廠數位孿生到工廠中人工智慧的運營,涵蓋方方面面。 從頭到尾的一切。 這讓我想起,也讓我自己想起:歐洲的工業能力是多麼令人難以置信; 這對你來說是一個非凡的機會。 多麼非凡的機會,因為人工智慧不同於傳統軟體。 人工智慧實際上是非常非常智能的軟體。 這款智慧軟體終於能夠做一些可能徹底改變您所服務行業的事情。

所以我們製作了一段情書視頻,如果你願意這麼說的話。 讓我們開始吧。

視頻: 一切始於此地。 第一次工業革命。 瓦特的蒸汽機和機械織機引入了自動化和工廠的出現:工業由此誕生。

電氣時代。 安培揭示了電磁學的奧秘。 法拉第製造了第一台電動發電機,麥克斯韋奠定了現代電氣工程的基礎。 西門子和惠斯通的發電機,電力的引擎:讓機器、火車、工廠和城市煥發生機,為地球通電,點燃現代製造業。

而今天,源自計算與信息時代:第四次工業革命,人工智慧時代:重新構想工業的每一個環節。

在整個大陸,工業人工智慧正在迅速普及。 從設計到工程,您正在開闢通往理解與創新的新路徑。 您將物理世界引入虛擬空間,以規劃和優化全球現代工廠。

您正在構建下一個前沿,那裡所有移動的事物都是機器人。 每輛汽車都是一個智慧的自主代理,同時也是一支新的協作工作力,助力彌合全球工作力短缺的缺口。

整個大陸的開發者們正在打造各種類型的機器人:在數位孿生世界和機器人管道中教它們學習新技能; 讓他們準備好與我們一起在工廠工作:倉庫、手術室以及家中。

第四次工業革命就在這裡,正是在第一次工業革命的發源地。

黃仁勳: 你怎麼看? 我喜歡那個視頻。 是你做的。 太棒了。 你成功了。 我們正在與一家又一家公司合作,致力於工業人工智慧的開發。 這是寶馬在元宇宙中建設他們的下一代工廠。 這個,我不知道該怎麼說。 有人能教我嗎? Buges? 聽起來不錯。 嗯...... 完全正確。 完全正確。 幹得好。 幹得好。 完全正確。 他們,他們當然是在建他們的工廠。 Omniverse 中的數位孿生。 這是他們的一個關鍵,呃:他們用於倉庫物流的數字孿生。

這是梅賽德斯-賓士及其在 Omniverse 中構建的工廠數位孿生。 這是舍弗勒及其在 Omniverse 中構建的倉庫數位孿生。 這是你們在法國的火車站:在 Omniverse 中構建他們火車站的數位孿生。 這是豐田在 Omniverse 中構建他們倉庫的數位孿生。 當你在 Omniverse 中構建這些倉庫和工廠時,那麼你可以,你可以設計... 你可以設計... 你可以設計它,你可以規劃它,你可以改變它。 在綠地環境中它很棒,在棕地環境中也很棒。 你可以在實際搬動和調整之前類比其效果,避免發現它並非最優。

因此,在數位孿生中實現一切數位化的能力是令人難以置信的。 但問題是,為什麼數位孿生必須看起來像照片一樣真實? 為什麼它必須遵守物理定律? 原因是我們最終希望成為一個數位孿生體,讓機器人能夠學習如何作為機器人操作。 而機器人依賴光子來實現其感知系統。 這些光子是通過 Omniverse 生成的。 機器人需要與物理世界互動,這樣它才能知道自己是否在做正確的事情,並且能夠...... 學會如何正確地去做,因此這些數字孿生必須看起來真實,行為也要逼真。 明白了嗎? 這就是構建 Omniverse 的原因。

這,太棒了。 這是一個聚變反應堆的數位孿生。 這是一件極其複雜的儀器,正如你所知:沒有人工智慧,下一代聚變反應爐是不可能實現的。 我們正在...... 我們今天宣布,我們將在歐洲這裏建設世界上第一個工業人工智慧雲。 我要宣佈——是的。

這些工業人工智慧雲,確實是大量的計算資源...... 雲端有大量的計算機。 然而,它在性能和安全性方面的要求根本不同。 所以我將在週五向大家詳細介紹。 今天我只是先賣個關子。 但這個工業雲將用於設計和模擬。 虛擬風洞,你只需走進去:虛擬風洞,你只需把車開進去,就能看到它的表現。 開門、開窗、改變設計,所有操作完全實時進行。 實時設計,數位風洞中類比:風洞的數位孿生,實時呈現:在數字工廠中建造它。 實時數位孿生。

所有這些,以及機器人如何學習成為優秀的機器人並打造我們未來的機器人。 自動駕駛汽車等。 我們這裡已經擁有了龐大的生態系統。 正如你所知,我們已經在這裡待了很長時間。 NVIDIA 已有 33 年歷史。 我們第一次來到歐洲,是在工作站和產品數位化興起的時候。 CAD,CAD 革命開始的時候。 我們經歷了 CAE 革命,現在正處於數位孿生革命時期。 這裡在歐洲有大約兩萬億美元的生態系統,我們與之合作...... 並且有幸為其提供支援。

由此產生的是一場正在發生的新革命。 正如你所知,所有會動的東西都將是機器人。 所有會動的東西都將由人工智慧驅動。 而汽車是最明顯的下一個領域。 英偉達打造用於訓練模型的人工智慧超級計算機:用於 Omniverse 數位孿生的人工智慧超級計算機。 我們還為機器人本身打造人工智慧超級計算機。 無論是在雲端:用於 Omniverse,還是在汽車中,我們都提供完整的技術棧:包括計算機本身,以及運行在這台電腦上的操作系統:每一種情況都不同。

這台電腦高速且感測器豐富,必須具備功能安全性。 在任何情況下都絕不能完全失效。 因此,安全要求極高。 現在我們有了一個令人難以置信的模型,運行在其之上。 這個運行在其之上的模型是一個變換器模型。 它是一個推理模型,能夠接收感測器輸入:你告訴它你想做什麼,它就會帶你去那裡。 接收圖元輸入並生成路徑規劃輸出。 所以它是一個基於變換器的生成式人工智慧模型。 令人難以置信的技術。 英偉達的人工智慧團隊,AV 團隊,令人難以置信。 這是我所知道的唯一一支連續兩年在 CVPR 端到端自動駕駛汽車挑戰賽中獲勝的團隊:所以他們今年再次獲勝。 讓我們來看一下視頻。 是的,謝謝。

(器樂音樂)像任何司機一樣,自動駕駛車輛在一個充滿不可預測且可能危及安全的場景中運行。 NVIDIA DRIVE,基於 HALO 安全系統構建:讓開發者使用多樣的軟體堆疊、感測器和冗餘計算機構建安全的自動駕駛車輛。

一切始於訓練。 安全的自動駕駛車輛需要大量多樣化的數據,以應對各種邊緣情況。 但現實世界的數據有限。 開發者使用 NVIDIA Omniverse 和 Cosmos 重建現實世界,生成逼真的合成訓練數據,為自動駕駛模型帶來多樣性。 該模型能夠感知並推理其環境。 預測未來結果,並生成運動計劃.... 以及用於決策多樣性。 一個獨立的經典堆疊並行運行。 安全護欄監控安全性能,在出現異常時會調用仲裁器進行緊急停止。 感測器和計算架構中還內置了更多的多樣性和冗餘。 每個感測器都連接到冗餘計算機,因此即使感測器或計算機發生故障,車輛仍然保持安全並正常運行。 在發生關鍵故障的情況下,系統可以執行最低風險的操作,比如靠邊停車。 安全是自動駕駛的基礎。 NVIDIA DRIVE 讓全球開發者能夠將 HALOS 整合到他們自己的產品中,打造下一代安全的自動駕駛汽車。

十億輛汽車上路,平均每年行駛一萬英里,一萬億英里。 自動駕駛的未來顯然是巨大的,它將由人工智慧驅動和支援。 這是下一個巨大的機遇,我們正在與全球眾多大型且卓越的公司合作,使這一切成為可能。 在我們所有與自動駕駛相關的工作中,安全始終是核心。 我們對我們的 HALOS 系統感到非常自豪。 它始於晶元的架構,然後是晶元設計和系統設計,操作系統、人工智慧模型以及軟體開發的方法論,我們測試的方式,從訓練模型的方法到為模型提供的數據,再到評估模型的方式。 NVIDIA 的 HALOS 系統以及我們的自動駕駛安全團隊和能力在全球享有盛譽。 這台電腦是第一台軟體定義的電腦。 全球首個完全 100%軟體定義的、由人工智慧驅動的軟體,面向自動駕駛汽車的增強現實人工智慧驅動堆疊。 我們已經從事這項工作將近十年了,這一能力享譽全球,我對此感到非常自豪。

汽車行業正在發生的變化,同樣也正在一個新興產業中上演。 正如我之前提到的,如果你能根據提示生成視頻,如果人工智慧能夠感知,它就能推理,還能生成視頻、文字和圖像,剛才提到的汽車、路徑、方向盤路徑,為什麼它不能同時產生局部運動能力和關節活動能力? 因此,人工智慧徹底改變機器人領域最難問題之一的基本能力即將到來。 類人機器人將成為現實。 我們現在知道如何構建這些東西,訓練這些東西,以及操作這些東西。 人形機器人可能將成為有史以來最大的產業之一,這需要那些懂得製造東西的公司,製造具有非凡能力的東西。 這指的是歐洲國家。 世界上許多產業都基於這裡。 我認為這將是一個巨大的機遇。 好吧,假設全球有十億台機器人。 擁有十億機器人是一個非常合理的想法。 那麼,為什麼這還沒有發生呢? 原因很簡單。 如今的機器人程式設計太複雜。 只有最大的公司才能負擔得起安裝機器人。 讓機器人學習,程式設計使其執行完全正確的操作。 保持足夠的包圍以確保安全。 這就是為什麼世界上最大的汽車公司都配備了機器人。 它們體積足夠大,工作足夠重複。 確實,行業已經達到足夠的規模,可以在這些工廠部署機器人。 幾乎所有中小型企業都是如此,無論是夫妻店、餐館、商店還是倉庫。 直到現在,實現那種程式設計能力是不可能的。 我們將為你提供本質上可以教導的機器人。 它們會向你學習。

正當我們在討論自主智慧時,我們現在擁有能夠通過教學學習的人形智慧,使用的工具包與 Nemo 工具包非常——非常一致,我——我剛才提到了。 NVIDIA HERE 同樣是建立在三層堆疊之上。 我們打造了這台計算機,名為 Thor,Thor 計算機。 開發套件看起來大致是這樣的。 這是一台完全自給自足的機器人電腦。 開發套件放在你的桌面上。 這些都是感測器,內部是一顆小型超級計算機 Thor 晶片。 真是非常,非常令人難以置信。 這些——...... 是的。 我可以,我可以想像把這個插進去,就像那樣。 好的。 謝謝你,珍妮。 (清嗓子)這就是 Thor 處理器。 上面是為機器人設計的作業系統。 此外,變換器模型接收感測器數據和指令並進行轉換,生成飛行路徑或軌跡,以及手臂關節的運動控制,手指關節的運動控制,當然還有你的腿部關節運動控制。

現在,人形機器人面臨的最大挑戰是訓練所需的數據量非常、非常難以獲取。 那麼問題是你如何做到這一點? 解決這個問題的方法是回到 Omniverse,一個遵循物理定律的數位孿生世界。 這是我們正在做的一項令人難以置信的工作。 別做。 別...... (詭異音樂響起)哦,天哪,是我的錯。 好的,這些是機器人。 我們有...... 我們開發了計算機來類比,來訓練它們。 計算機來模擬它們,以及裝在它們內部的計算機。 全球正在建立大量的人形機器人公司。 他們都看到了徹底變革這一新領域的巨大機遇。 可以說是一種新設備,進展非常迅速。 它們學習的方式是在一個虛擬世界中學習,而這個虛擬世界必須遵守物理定律。 最近,我們宣佈了與迪士尼研究院和 DeepMind 的一項重大合作,我們將共同努力,打造世界上最複雜的物理類比。

此刻,我只是在努力弄清楚如何切換到那張幻燈片。 教我。 誰和我一起? (詭異的音樂響起)這就是只排練一次的後果。 好吧,這個,這個令人難以置信的系統,就是一個人工智慧學習如何成為人工智慧的地方。 讓我給你展示一下。

(歡快的音樂播放)(鳥鳴)(嗶嗶聲)(口哨聲)(水花聲)(雷聲)(吱吱聲)(口哨聲)我們有一位特別嘉賓。 你的名字是格雷克。 你是,你是...... 你是小男孩還是小女孩? 好的。 他是...... 格瑞克是一個小女孩。 現在,看這個。 Grek 學會了在 Omniverse 中行走,遵守物理定律。 而在 Omniverse 中,我們創建了成千上萬個場景。 最後,當 Grek 學會了如何在那些環境中操作、行走和操控時,在沙地上,在礫石上,在滑溜的地板上,在混凝土上,在地毯上,那麼當涉及到當 Grek 進入物理世界時,物理世界只是世界的第 100,001 個版本。 所以你學會了在虛擬世界中行走,看看你現在的樣子。 你能...... 你能跳嗎? 哇。 你會跳舞嗎? (嗶嗶聲)(電子薩克斯演奏)我覺得...... 我覺得,嗯...... 我只是想讓你知道,我是主旨演講者。 所以我需要你...... 我需要你表現得規規矩矩。 我需要你乖一會兒。 我需要你乖一會兒,S-... 你能坐下嗎? 坐下。 (電子音樂播放)嘿,你知道我們應該做什麼嗎? 我們來給大家拍張照片。 (相機快門聲)是的。 砰,砰。 你願意跟我回家嗎? 你想跟我回家嗎? 我有點—(嗶)是的,我知道。 是的,我有寵物。 他們想把你當作寵物。 不想嗎? (esqmas 音樂播放)哦,哦。 不。 你真聰明。 你真聰明。 太不可思議了,對吧? 你是世界上最棒的機器人,總有一天我們都會擁有一個像你這樣的。 他們會跟著我們到處走。 但如果我需要...... 如果我需要一杯威士卡,你得去告訴別人幫我拿杯威士卡,因為你沒有手臂。 (電子音樂播放)哦,哦。 是的。 你真可愛。 好了,小姑娘,你在這裡等一會兒。 我們收尾吧。

(清嗓子)好了。 這非常清楚。 非常清楚,一場工業革命已經開始。 下一波人工智慧浪潮已經開始。 Grek 是機器人技術現階段可能實現的完美範例。 教機器人操作所需的技術,進行類比,當然,一個令人難以置信的機器人現在就展現在我們面前。 我們有實體機器人,也有信息機器人。 我們稱它們為代理。 下一波人工智慧已經開始。 這將需要...... 推理工作負載的爆炸式增長。 它基本上將呈指數增長。 使用推理的人數已經從八百萬增加到八億。 僅僅幾年時間就增長了一百倍。 令牌生成的提示數量和數量,正如我之前提到的,從幾百個標記到幾千個標記,當然,我們現在比以往任何時候都更多地使用人工智慧。 比以往任何時候都更多。 所以我們需要一台專門為思考設計的計算機,專為推理設計,這就是 Blackwell,一台思考機器。

這些 Blackwells 將被用於新型數據中心,本質上是人工智慧工廠,專為一件事而設計,這些人工智慧工廠將生成 Token,這些 Token 將成為你的食物,小格雷克。 是的,我知道。 我知道。

真正令人難以置信的是,我很高興看到歐洲正在全力投入人工智慧。 這裡建設的人工智慧基礎設施將在未來幾年內增加一個數量級。 我要感謝大家的合作夥伴關係。 祝你們在 VivaTech 活動中度過愉快時光。 (鼓掌)謝謝。 說再見。 說再見。 拍一堆照片。 拍一堆照片。 拍一堆照片。 是嗎?

本文來自微信公眾號 「劃重點 KeyPoints」,作者:重點君,36 氪經授權發佈。

+1
106

好文章,需要你的鼓勵

參與評論
評論千萬條,友善第一條
后參與討論
提交評論0/1000
36氪
36氪

下一篇

關於騰訊收購 Nexon 傳聞,我的一點看法果騰訊真的收購 Nexon,可能是出於以下三個目的。

2025-06-13

36 氪 APP讓一部分人先看到未來
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业