ChatGPT 化身生活操作系統:奧特曼預告下一代頂級 AI
OpenAI 計劃發佈一個非常強大的開源模型。
它能夠讓人們在本地運行極其強大的模型,重新認識“本地部署”的可能性。
在三藩市 AI 初創學校對話中,奧特曼宣佈了以上消息。 這場對話由 Y Combinator 的首席執行官 Garry Tan 主持。
期間,他們還討論了 OpenAI 的發展過程、未來方向、ChatGPT 的起源和 AI 硬體的構建。
奧特曼談到,o3 模型上周的運行成本是本周的 5 倍,價格下降趨勢還在繼續,且 API 的成本將會持續大幅下降,開源模型將會非常棒。 Chatgpt 的記憶功能不僅僅是一個小硬體,而是 AI 伴侶一般的存在。
未來,GPT-5 以及多種推理模型將往集成模型方向發展,並與 AI 智慧終端以及機器人連接,成為人們的生活操作系統。
他還說到, 如果用戶註冊最高級別的 ChatGPT 訂閱,將會給他們免費贈送一個機器人 。
在不改變原意的基礎上,在此做了以下整理。
GPT 推理模型的未來
Tan:最新的 o3 型號最讓您感到驚訝的是什麼,目前有哪些新興行為或用例讓您印象深刻?
奧特曼 :我認為我們正處在一個非常有趣的時代。 雖然目前我們還沒有看到達到新的創新水準的推理模型產品,但是這個世界的模型能力已經進入了一種新的領域,我們仍然有大量全新的事物需要去構建。
我們很快就會推出一個令你們驚訝的開源模型。 我認為它會比你希望的要好得多,你將能在本地運行非常強大的模型。 同時,API 的成本將會持續大幅下降,開源模型將會非常棒。
Tan:對我來說,記憶甚至變成了一種與瞭解我的人對話的感覺,這很有趣。
奧特曼 :是的,記憶是我們今年推出的我最喜歡的功能。
我認為這指向了我們希望產品的方向。 那就是你將擁有一個實體,它可以瞭解你,連接到你所有的東西,並主動説明你。
這不會像你發送一條消息然後它又回復你一條消息那樣。 它會一直運行,會查看你的東西,會知道何時向你發送消息,會知道何時為你做某事。
你會擁有特殊的新設備,它會集成到你使用的每項服務中,並且伴隨你一生。
當這個系統在後台持續運行並不斷向你推送內容時,這個交互區域會變得更加豐富。 而當我們推出首款新設備時,這裡還會新增更多功能或內容。
但我認為它的關鍵不在於那塊小硬體,這個東西已經發展到可以在後台運行並感覺像是一種人工智慧伴侶的程度。
Tan:我想我們看到 LMS 與真實數據集成的強大功能,我聽說 MCP 即將登陸 OpenAI。 實際的整合有什麼令人驚訝的地方? 你知道,在 YC 我們實際上內部擁有代理基礎設施並且我們一直在使用它。
奧特曼:人們無疑開始使用 ChatGPT 作為操作系統,將他們的整個生活都融入其中。
整合盡可能多的數據源,以及始終伴隨你的設備,例如新型網路瀏覽器,與所有數據源的連接、記憶體以及持續運行的模型,如果你把所有這些放在一起,它會是一個非常強大的地方。
Tan:您認為它未來會出現在雲端,還是會出現在我們的桌面上,或者兩者兼而有之?
奧特曼 :會是所有這些的混合。 人們肯定會為某些事情運行本地模型,如果我們可以將一半的聊天工作負載推送到本地設備上,沒有人會比我們更高興。 至於雲端部分 ,我認為我們很快就會運行世界上最大最貴的基礎設施。 Tan:在雲端運行,計算難度之大令你感到驚訝嗎? 奧特曼 : 我們很擅長從零開始。 就像兩年半前我們還沒有 ChatGPT.com 一樣, 現在已經發展成為世界第 5 大網站。
GPT-5 和多模態超級模型的願景
Tan:o3、o4mini 推理模型與像 4o 這樣的多模型並行發展,這兩個線程彙聚在一起時會發生什麼 ? GPT-5 及以後的願景是什麼?
奧特曼:我們無法通過 GPT-5 實現所有目標,但我們最終確實想要一個集成模型,它可以在需要時進行推理,並在需要時生成實時視頻。
如果你問一個問題,你可以想像它會非常努力地思考,做一些研究,編寫一堆代碼,就像一個全新的應用程式供你使用。 我認為這像一種真正的新型計算機介面,AI 在某種程度上已經做到了這一點,但是當我們得到一個真正完整的多模態模型時,比如完美的視頻、完美的編碼及一切深度推理,感覺會非常強大。
Tan:這似乎是向具體化邁出的一步。 你知道擁有視覺、語言和推理能力的機器人是我們想要的機器人的飛躍。
奧特曼 :我們的策略是先解決這個問題,然後確保我們可以將其連接到機器人上。
但機器人的時代很快就要到來了,我想如果你註冊最高級別的 ChatGPT 訂閱時,我們會向你免費贈送一個機器人。
Tan:在現實世界擁有做實際工作的機器人,這是多麼瘋狂的未來。
奧特曼 :我覺得我們離目標已經不遠了。 雖然機器人的機械工程非常複雜,AI 的認知能力也同樣具有挑戰性,但整體來看,我們正逐步掌握這些關鍵問題。
我認為幾年後機器人就能做一些非常有用的事情,但製造十億個機器人仍需要一段時間,我也不知道需要多少機器人能夠完成自動化供應鏈,它們是否能運行整個供應鏈,比如驅動採礦設備、驅動集裝箱輪船等。
Tan:談到三級 AGI,AI agent,Greg Brockman 說最近是 agent 之年。 有了操作員代碼解釋器這樣的工具,你認為哪些類型的工作流程將會消失或者出現,但我們現在還沒有做好準備。
奧特曼 :長期以來,ChatGPT 像是 Google 的高級搜索版本,仍像是替代品。
但是現在你可以真正將一項任務交給 codeex 進行深入研究。 它能夠反饋相關建議,這就像一個初級員工可以在短時間做某項工作。
我認為使用當前的 o3 就能做到,更不用說我們下一個模型,你可以有很多這樣的體驗。
Tan:你如何看待人機交互和介面的未來? 這些介面存在哪些局限性促使你這樣做?
奧特曼 :就像今天的語音介面一樣,我認為它有點糟糕,因為效果不太好。
如果你能對電腦說:“這正是今天我想要完成的事,如果我被耽擱了或有任何變化,我相信你會在不打擾我的情況下,去做所有事。 ”
除非它是一個超級棒的人類助手,不然介面就會消失。 希望我們能向人們展示一種不同的電腦使用方式。
AI for Science:Sam 的個人賭注
Tan:展望未來十到二十年的時間里,您個人最興奮的是什麼? 現在人們應該構建什麼來實現這樣的未來? 奧特曼 :這是一個難以想像的超級智慧世界,我期待看到它的發展,而不是讓它成為一個模糊的答案。 我認為 AI 應用到科學是我個人最興奮的。
我相信世界上所有長期可持續的經濟增長,就像所有能改善人們生活的事情一樣,基本上都在於發現新的科學,並擁有相當完善的治理機構,以便這些科學能夠得到發展並與世界共用。
如果我們能夠大幅度提升 AI 在科學探索中的速度,我相信能夠為每個人帶來提升和奇跡。
Open AI 發展:人才吸引與競爭力
Tan:你是世界上最擅長聚集最聰明的人之一嗎? 你在招聘方面學到的最艱難的教訓是什麼?
奧特曼 :招聘真正聰明,有動力高效能團隊合作的人,能讓你成功 90%, 而人們在招聘過程中對其他事情的關注程度總是讓我感到驚訝。
招聘一個能夠保持良好的業績記錄,好奇心強、積極融入工作並與公司願景保持一致的人,效果會很好。
Tan:保持良好的業績記錄是指那種在頂級機構擔任了二十年管理職位、擁有頂級聲譽的人? 奧特曼 :在創業初期,我不推薦招聘這樣的人。 坦白說 YC 創業初期招聘過這樣富有管理經驗的人,但效果並不理想。
我們還是選擇招聘年輕有活力能完成任務的人,而不是那些有著極其輝煌履歷的人 。 我會問,你做過印象最深刻的一次事情是什麼。
Tan:擔任 Open AI 的 CEO,總的來說,最難的教訓是什麼?
奧特曼 :我們必須同時做很多事情,而且有很多大公司以各種方式向我們發起挑戰。 我們必須花費更多精力去處理這些問題,而且我們需要從一種重大決策方式切換到完全不相關但同樣重要的決策方式去應對和處理。
Tan:對於很多想要創建 B2B、SAS 的軟體工程師來說,如何在當下去完成一個複雜麻煩的事情?
奧特曼 :現在是科技史上最佳的創業時機。 成功之處在於,初創公司比其他大公司更容易反覆運算,且成本更低。 大公司有很多優勢,但它們的反覆運算速度非常慢。 但是,便宜的東西也很容易被取代,所以有很多角度去看待這個問題。
我建議這樣看待它們:每個人都會面臨同樣的挑戰和機遇,但是當行業周期變化如此之大,初創公司幾乎總是贏家,我們可能從未見過如此巨大的變化。
從這個方向出發採取行動,我認為你會處於非常有利的狀態,或許你可以邀請我談談,比如隨著時間的推移,你可以建立哪些防禦性領域,我認為這是一個內在問題(內部問題)。
Tan:你會對學生時代的自己說些什麼。
奧特曼 :我希望有人能教我長期堅持信念和韌性,很多人在一次失敗后就放棄了,學習如何堅持下去,我認為這真的很重要。
培養對自己直覺的信任,並隨著時間推移不斷完善你的決策和直覺,從而增強這種信任。 好的部分真的比你想像的要好得多,而困難的部分,難以用任何你能理解的方式表達出來。 你必須堅持下去。
還有一件事
結果好巧不巧,沒過幾天他就公開發起投票,o3-mini 水準的模型將在哪一年能在手機上運行?
截至完稿前,投票網友中,超過40%的人認為此模型2025年便可運行。
好好好,就在等著了(Doge)。
參考連結:
https://www.youtube.com/watch?v=V979Wd1gmTU
https://x.com/WesRothMoney/status/1937148640575009176
本文來自微信公眾號 “量子位”,作者:時令 奕然 ,36 氪經授權發佈。