這是用戶在 2025-7-1 20:53 為 https://36kr.com/p/3352908436796289 保存的雙語快照頁面,由 沉浸式翻譯 提供雙語支持。了解如何保存?

一天 15k 星,代碼生成碾壓 Claude,連 Cursor 都慌了? 谷歌 Gemini CLI 殺瘋了

AI 前線·2025 年 06 月 26 日 18:41
今天,谷歌正式發佈了 Gemini CLI ,這是其 AI 助手在終端環境下的一個版本。

今天,谷歌正式發佈了 Gemini CLI ,這是其 AI 助手在終端環境下的一個版本。 這款工具的亮點在於其非常慷慨的免費使用配額:它支援每分鐘 60 次、每天 1,000 次的模型調用。

免費配額「開掛」, 逼瘋 Claude?

繼 2 月的 Claude Code 和 4 月的 OpenAI Codex CLI 之後,谷歌也在 6 月推出了 Gemini CLI。 至此,三大 AI 實驗室都已發佈了各自的「終端智慧體」工具——這類 CLI 工具可以讀取、修改檔,並在終端中代表使用者執行命令。

估計不少人原本以為這類終端工具會一直是一個小眾方向,但現在看來這是低估了它的潛力——不少開發者每月在 Claude Code 上的花費高達數百美元 甚至是數千美元,說明這個「小眾市場」其實比預想中大得多、也重要得多。

相對 Claude Code,谷歌在價格方面可謂「豪橫」:

使用個人 Google 帳號登錄,即可免費獲得 Gemini Code Assist 許可。 這將解鎖 Gemini 2.5 Pro 模型和百萬 token 上下文視窗。 在此次預覽期間,谷歌提供業界最寬鬆的調用配額:每分鐘最多 60 次、每天最多 1000 次請求,全部免費。

目前來看,社區對 Gemini CLI 的關注重點集中在其超大免費配額上。 評論者直言:「太誇張了,這會給 Anthropic 帶來巨大壓力。 “”確實如此——如果這些調用限制是真的而且免費,那終於有真正的競爭了。”

與 Claude Code 不同,Gemini CLI 和 OpenAI Codex CLI 一樣是開源的(使用 Apache 2.0 許可)。 並且 Gemini CLI 在不到一天的時間里,獲得了 15.1k 星。

Gemini CLI 提供的功能包括代碼編寫、問題調試、專案管理、文檔查詢以及代碼解釋。 它還連接了 MCP(模型上下文協定)伺服器,具備 Agentic AI 能力。

CLI 工具的優勢在於,它可以與任何編輯器或 IDE 搭配使用,而不局限於特定外掛程式支援的工具; 同時還支援多實例併發運行。 部分開發者也認為,命令行交互效率更高。

Gemini CLI 支援 Mac、Linux(包括 ChromeOS)和 Windows 平臺。 與 Claude Code 或 Codex 不同的是,Windows 上為原生實現,無需依賴 Windows 子系統(WSL)。 開發者可以通過在專案根目錄添加一個名為 gemini.md 的文本檔來自定義上下文和參數。 谷歌高級工程師 Tayor Mullen 表示,當 CLI 檢測到“值得長期保存的細節”時,也會自動將其寫入該檔。

因為整體開源,所以我們還可以看到它的 system prompt。

一如既往,這份系統提示詞不僅定義了工具行為,也是一份非常精鍊準確的使用文檔。 比如它對代碼註釋的原則是:

註釋: 請謹慎添加註釋,重點說明「為什麼」要這麼做,尤其是處理複雜邏輯時,而不是解釋“做了什麼”。 只有在確實能提升可讀性或用戶明確要求時,才添加高價值註釋。 請勿修改與你更改無關的註釋,也絕不要通過註釋與使用者交流或說明你的更改

系統預設使用的技術棧也頗有參考價值。

如果用戶沒有指定技術偏好,默認建議如下:

Web 前端: React(JavaScript/TypeScript)+ Bootstrap CSS,結合 Material Design 設計規範;

後端 API: Node.js + Express.js 或 Python + FastAPI;

全棧應用: Next.js(React/Node.js)+ Bootstrap + Material Design,或 Python(Django/Flask)+ React/Vue.js 前端;

命令行工具(CLI): Python 或 Go;

移動 App: Compose Multiplatform(Kotlin)或 Flutter(Dart),用於跨平台開發; 也支援 Jetpack Compose(Android)或 SwiftUI(iOS)原生開發;

3D 遊戲: HTML/CSS/JavaScript + Three.js;

2D 遊戲: HTML/CSS/JavaScript。

勝過專用, Gemini CLI 靠什麼?

Gemini CLI 接入的是谷歌最先進的編碼與推理模型 Gemini 2.5 Pro,具備代碼理解、檔操作、命令執行和動態故障排查等能力,全面提升命令行的使用體驗。 用戶可以通過自然語言編寫代碼、調試問題,並優化工作流程。

不僅如此,Gemini CLI 還能基於 MCP 調用其他谷歌服務,在終端中生成圖像或視頻,實現從編碼到創作的一體化體驗。

在發佈會上展示的一體化演示和背後的技術理念,其實揭示了 Gemini CLI 的關鍵定位——它不僅是一個寫代碼的工具,而是一個連接多模態智慧、打通編碼與創作的“終端智慧體”。 這一理念也體現在背後所依賴的 Gemini 2.5 Pro 模型選擇上。

值得注意的是,Gemini 2.5 Pro 本身並不是為代碼任務特別訓練的“代碼專用模型”,而是一個覆蓋更廣泛能力邊界的通用模型。 那麼,為何谷歌沒有像某些競爭對手那樣,專門為 Gemini CLI 打造一個定製化的代碼模型? 在一場深度訪談中,產品負責人 Connie Fan 和研究負責人 Danny Tarlow 分享了他們的思考。

Connie Fan 表示,雖然特定任務確實可以從專用模型中受益,例如 Cursor 訓練的代碼補全模型“在非常窄的用例里做得非常好”,但她強調,對於大多數現實世界中的開發任務而言,編碼需求往往不局限於代碼本身。

例如她提到的一個經典“vibe check”請求:“幫我做一個泰勒·斯威夫特歌曲排行榜 app”——這就需要模型不僅懂代碼,還要理解上下文、具備常識,甚至有些 UI/UX 審美。 “這些常識背後其實是用戶真實的程式設計需求”,她總結說,“大多數通用任務,並不能從一個純代碼模型中受益。 ”

Danny Tarlow 則進一步指出:“代碼專用模型到底意味著什麼? '代碼'已經不僅僅是代碼本身,它涵蓋了軟體開發過程中的各種環節,涉及多種資訊源,有些專屬於代碼,有些則不是。 如果只強化代碼能力而削弱其他能力,反而會限制模型的表現。 我們更傾向於通用模型上的協同發展,尋求不同能力之間的融合和平衡,打造一個『通才型』模型,這才是更優的發展路徑。 ”

實際上,現在已經有越來越多開發者開始注意到 Gemini 2.5 Pro 在代碼生成和理解方面的顯著提升。

在 Claude 長期佔據主導的討論氛圍中,不少人也開始發出「Gemini 要逆襲了嗎? “、”Google 要翻盤了嗎? “的聲音。 社交媒體上,有使用者分享了一些開發體驗:在一個約 50 萬行代碼規模的專案中,使用 Claude Code 生成的代碼品質“遠遠不如 CLI + Gemini 2.5 Pro”,要達到同等效果,Claude 需要開發者全程盯著。

還有開發者表示,在 Trae 上使用 Gemini 2.5 Pro 程式設計的完成率已經大幅超過 Claude 3.7。 也有開發者表示 Gemini 修復 bug 的速度明顯快於 Claude Code。

一個 3D 渲染的處理問題,讓 Claude Code 修了兩個小時的 bug 還沒解決,結果問 Gemini 2.5 Pro,只用了 5 分鐘就搞定了。 感覺對於那些看起來難度比較高的問題,可以先讓 Gemini 寫好詳細的說明書,然後再讓 Claude Code 按照它來實現,這種組合用法可能會挺不錯的。

這些反饋表明,過去一年,谷歌在代碼能力上的提升已經進入“質變期”。 Gemini 編碼產品負責人 Connie Fan 表示,Gemini 2.5 Pro 之所以能獲得良好口碑,關鍵在於兩個方面的系統性演進:“數據”和“方法論”。

從數據的角度看,“代碼倉庫上下文”變得非常關鍵。 現在模型的目標不再只是做簡單的代碼補全,而是要理解並修改分佈在多個檔、涉及多個模組的大型代碼庫:“模型要能完成那些你如果花一小時坐下來,在熟悉的代碼庫上下文中親自去做的複雜改動。 ”

為了讓模型真正理解這些上下文,谷歌也開始系統性地挖掘內部工程師資源。

其中還包括 Jeff Dean 這樣的一些人,「他們代表了一種」能力新等級」的標準,“Connie 直言,”我們擁有世界上最聰明、最出色、有時也最有主見的十幾萬工程師。 “借助他們在不同語言、技術棧、經驗水準上的反饋,谷歌能夠覆蓋更廣泛的使用場景,提升模型在”專業開發者細膩口味“上的匹配能力。 “我們過去其實並沒有很好地利用這一點,但現在我們開始真正這樣做了,而且效果非常驚人。”

從研究角度看,Gemini 團隊並未將全部籌碼押在「單一大上下文視窗」的方案上,而是探索雙路線:一方面持續擴展上下文長度,另一方面發展具有自主搜索、推理能力的 agentic 程式設計模型,模型以代理的形式與使用者交互,甚至具備一定程度的自主性。

正如研究負責人 Danny Tarlow 所描述:

“如果我們把你(人類開發者)丟進一個大代碼庫里,你會怎麼做? 你會用代碼搜索、看檔結構、點來點去,讀點代碼再搜索其他資訊。 agentic 模型就模仿了這種方式。 ”

更有趣的是,當模型成功處理一個百萬行代碼庫時,使用者會感受到一種“魔法般”的驚喜。 而這正是 Gemini 2.5 Pro 所在意的方向:不僅是模擬人類的工作方式,更是突破人類經驗限制,發展出“非人類”的全新解法。

正因如此,不少開發者開始轉而重視起谷歌在這場 AI 程式設計競賽中的回歸。 Gemini 是否“翻盤”尚未可知,但“趕超”的信號,正在越來越清晰。

參考連結:

https://www.youtube.com/watch?v=jwbG_m-X-gE

本文來自微信公眾號 「AI 前線」(ID:ai-front),作者:Tina,36 氪經授權發佈。

+1
59

好文章,需要你的鼓勵

參與評論
評論千萬條,友善第一條
后參與討論
提交評論0/1000
36氪
36氪

下一篇

誰製造了身價 1.53 億的楊瀚森? 楊瀚森在 NBA 前四年的薪資預計為 2139 萬美元(約為 1.53 億元人民幣)。

2025-06-26

36 氪 APP讓一部分人先看到未來
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业