這是用戶在 2025-7-1 18:50 為 https://www.infoq.cn/article/GrsSGNWzBhp40iQsutgT 保存的雙語快照頁面,由 沉浸式翻譯 提供雙語支持。了解如何保存?
寫點什麼

谷歌推出全新的設備端 GenAI API,將 Gemini Nano 引入 ML Kit

  • 2025-06-05
    北京
  • 本文字數:1165 字

    閱讀完需:約 4 分鐘

大小:453.67K 時長:02:34
谷歌推出全新的设备端GenAI API,将Gemini Nano引入ML Kit

ML Kit 新加入的 GenAI API 使開發者能夠在 Android 應用中使用 Gemini Nano 進行本地推理,支持諸如總結、校對、改寫和圖像描述等功能。


例如,你可以對長達 3000 個英文單詞的文件進行總結,可以讓文本風格更加正式或更加隨性,還可以生成標題、元數據或替代圖像描述。


在本地運行意味著所有數據,包括輸入、推理和輸出,都不會離開本地設備,並且不會產生任何雲端成本。 谷歌表示,GenAI API 的設計注重易於集成和使用,提供了與其他 ML Kit API 類似的高級抽象。


這意味著你可以直接獲得高質量的結果,無需額外進行提示詞工程或針對特定用例進行微調。


這是通過將每個專門的 API 構建為一個元件棧來實現的,以 Gemini Nano 作為共同基礎。 Nano 上面是一個小型的、特定於 API 的 LoRA 適配器模型,用於提高性能,接著是一層定義優化推理參數(如提示詞、溫度、top-K 和批次大小)的層。 最後,評估管道結合了自動化評估器、統計指標和人工評估器,以進一步改進生成的回應。


採用這種方法實現的性能提升通過基準分數來衡量,這些基準分數是為每個 API 定製的,考慮了特定屬性,例如文本總結中的事實一致性。 這些基準表明所有 API 的性能都有了一致的提升,如下圖所示。



ML Kit GenAI API 支援流式和非流式工作流程。 流式工作流特別適合需要較長回應的場景,因為它能夠在不等待整個回應生成完成的情況下逐步輸出內容。


在使用 GenAI API 時,ML Kit 會自動下載 Gemini Nano 和任何所需的特定於 API 的模型。 開發者也可以控制這個過程,並選擇提前下載模型。 假設所有所需的模型都已下載,下面的代碼片段演示了總結 API 的工作流程:


val articleToSummarize = ...
val summarizerOptions = SummarizerOptions.builder(context)    .setInputType(InputType.ARTICLE)    .setOutputType(OutputType.ONE_BULLET)    .setLanguage(Language.ENGLISH)    .build()val summarizer = Summarization.getClient(summarizerOptions)
val summarizationRequest = SummarizationRequest.builder(text).build()summarizer.runInference(summarizationRequest) { newText ->    // Show new text in UI}
複製代碼


為了確保所有所需功能都可在本地使用,開發者可以調用 summarizer.checkFeatureStatus 方法。


借助 AICore ,ML Kit GenAI API 在搭載了優化的聯發科天璣、高通驍龍和谷歌 Tensor 平臺的 Android 設備上可用。 支援的設備包括 Pixel 9 系列、三星 Galaxy 25、小米 15、摩托羅拉 Razr 60 Ultra 等。


對於有意向開始使用 ML Kit GenAI API 的開發者來說,可以將官方的 ML Kit GenAI API 演示應用作為入手點,它演示了所有新功能,還搭配了官方文檔 ,為開發者提供了更深入的指導。


【聲明:本文由 InfoQ 翻譯,未經許可禁止轉載。 】


查看英文原文https://www.infoq.com/news/2025/06/google-mlkit-genai-gemini-nano/

大會推薦:
8 月 22~23 日的 AICon 深圳站 將以 “探索 AI 應用邊界” 為主題,聚焦 Agent、多模態、AI 產品設計等熱門方向,圍繞企業如何通過大模型降低成本、提升經營效率的實際應用案例,邀請來自頭部企業、大廠以及明星創業公司的專家,帶來一線的大模型實踐經驗和前沿洞察。 一起探索 AI 應用的更多可能,發掘 AI 驅動業務增長的新路徑!

2025-06-05 15:006569

評論

發佈
暫無評論

【上汽零束 SOA】雲管端一體化 SOA 軟體平臺系列介紹之六:數字生態篇

SOA 開發者平臺

軟體 SOA 生態 汽車 OTA 的

《鴻蒙理論知識 06》HarmonyOS 概述之應用開發基礎知識

孫叫獸

鴻蒙 HarmonyOS 作系統 鴻蒙系統 引航計劃 領航計劃

模組3-作業

笑看風雨情

Canal Admin 高可用集群使用教程

Se7en

終於完成了私有 NPM 和 PYPI repo 的搭建

吳腦的鍵客

npm 關係皮皮

建立測試自動化策略【譯】

FunTester 測試器

自動化測試 測試框架 測試管理 測試策略 FunTester 測試器

如何將外連接向內連接轉換?

華為雲開發者聯盟

sql 數倉 資料倉庫服務 GaussDB(DWS) 外連接 內連接

MapReduce 示例:減少 Hadoop MapReduce 中的側連接

華為雲開發者聯盟

hadoop mapreduce 排序 側連接 聯接

Opus 從入門到精通(二):編解碼器使用

輕口味

人造人 音視頻 編解碼 9月日更

Apollo 配置中心詳細教程

牧小農

阿波羅 阿波羅

【上汽零束 SOA】雲管端一體化 SOA 軟體平臺系列介紹之五:服務實現篇

SOA 開發者

軟體 SOA

數字貨幣錢包開發,imtoken 錢包系統搭建

13530558032

netty 系列之:在 netty 中處理 CORS

程式那些事

爪哇島 程式那些事 回應式系統

簡單聊聊汽車 OTA 給 OEM 和 Tire1 帶來的變化

SOA 開發者

程式師 職業成長 汽車

3年才能駕馭新技術,不如試試這個低代碼魔方

華為雲開發者聯盟

低代碼 開發 華為雲應用魔方 應用程式 魔方

百度智慧輸入,會是企業降本增效的「新生產力」嗎?

ToB 行業頭條

百度 企業服務 百度輸入法

【上汽零束 SOA】雲管端一體化 SOA 軟體平臺系列介紹之五:服務實現篇

SOA 開發者平臺

軟體 車聯網 物聯網 汽車

Vue 進階(幺幺玖):element-ui table 元件適應性問題(橫向滾動條)

沒有靈丹妙藥

Vue 的 9月日更

Python——靜態方法與類方法、類的導入

在即

9月日更

計劃會議要開始了,產品負責人卻沒來...

華為雲開發者聯盟

Scrum (爭霸)採購訂單 開發團隊 計劃會議 短跑

數據中心建設很複雜,但選擇卻能很簡單:華為數據中心的多維創新

架構實戰課程 模組三作業

弗蘭克

穿越時空,跟我一起探索雲棲數位谷(2021雲棲大會免費送票)

阿裡雲 CloudImagine

人工智慧 雲計算 阿裡雲 行業資訊 視頻雲

高可用 | 關於 Xenon 高可用的一些思考

RadonDB

MySQL (MySQL 的 資料庫

分散式系統中協調和複製技術的原理

博文視點 Broadview

NQI 品質基礎設施一站式方案,NQI 一站式線上平臺搭建

13530558032

量化交易 APP 開發,量化交易系統源碼

13530558032

Java 17 正式發佈,Oracle 宣佈從 JDK 17 開始正式免費,Java 邁入新時代

爪哇島 程式設計 源碼 架構

谷歌推出全新的设备端GenAI API,将Gemini Nano引入ML Kit_AI&大模型_Sergio De Simone_InfoQ精选文章