谷歌发布AI Edge Gallery，手机离线也能玩转AI

快速阅读: 谷歌发布Google AI Edge Gallery应用，集成Gemma系列端侧模型，支持图像识别、音频对话和文字交互，全离线运行保障隐私，已在Google Play上架，提供直观操作界面和多功能模块。

近年来，随着人工智能技术的迅速发展，端侧AI（On-Device AI）因高效、隐私保护和离线运行的特点而受到广泛关注。近日，谷歌在其官方Google Play商店上架了备受期待的Google AI Edge Gallery应用，为用户带来了一款集成了Gemma系列端侧模型的强大AI体验工具。此应用不仅支持图像识别、音频对话和文字交互，还以全离线运行和隐私保护为核心亮点，为开发者和普通用户提供了一个探索AI潜力的绝佳平台。以下是AIbase整理的最新资讯，带您全面了解这款革命性应用。

Google AI Edge Gallery：端侧AI的创新尝试

Google AI Edge Gallery是一款实验性应用，旨在让用户在Android设备上直接运行AI模型，无需依赖云端或网络连接。据公开信息，该应用支持谷歌自主研发的Gemma系列模型，包括Gemma3和Gemma3n等轻量级多模态语言模型。这些模型专为移动设备优化，能够处理文本、图像和音频等多种模态任务。无论是开发者测试模型性能，还是普通用户体验AI的强大功能，这款应用都提供了直观的操作界面和丰富的功能模块。

目前，该应用已在Google Play商店上线，用户可通过搜索“Google AI Edge Gallery”直接下载安装。对于无法访问Google Play的用户，谷歌还在GitHub上提供了APK安装包，iOS版本也在不久后推出。

核心功能：多模态AI触手可及

Google AI Edge Gallery凭借其多样化的功能吸引了广泛关注，以下是其主要亮点：

– **全离线运行**：所有AI处理均在设备本地完成，无需网络连接，确保了数据隐私和快速响应。用户可以在无Wi-Fi或移动数据的环境中使用AI功能，极大地提升了便捷性。

– **图像识别（Ask Image）**：用户可以上传图片或直接拍摄照片，向AI提问相关内容。例如，识别物体、描述场景或解答与图像相关的问题，适用于学习、旅行或日常探索。

– **音频对话（Audio Scribe）**：支持音频转录和翻译，用户可上传或录制音频，AI会将其转换为文本或翻译成其他语言，适合会议记录或多语言沟通。

– **文字交互（AI Chat & Prompt Lab）**：提供多轮对话功能，类似ChatGPT的交互体验，同时支持单轮任务如文本摘要、代码生成和内容改写，满足多样化需求。

– **模型灵活切换**：用户可从Hugging Face等平台下载不同AI模型，并在应用内切换以比较性能，开发者还能测试自有LiteRT模型。

此外，应用还提供实时性能数据，如首次令牌生成时间（TTFT）和解码速度，帮助用户直观了解模型效率。

Gemma模型：端侧AI的强大引擎

Google AI Edge Gallery的核心在于其集成的Gemma系列模型。Gemma3n作为谷歌最新推出的轻量化多模态模型，采用了创新的Matryoshka Transformer（MatFormer）设计，能够根据设备性能动态调整模型层级，从而在节省电量和内存的同时保持高效的推理能力。据了解，Gemma3n支持高达4000个token的对话上下文，并能处理140多种语言，展示了卓越的多模态处理能力。

与传统的云端AI相比，Gemma模型的本地运行不仅提升了响应速度，还避免了数据上传云端的隐私风险。这使得Google AI Edge Gallery在隐私敏感场景（如医疗、教育）中具有显著优势。

安装与使用：简单上手，开发者友好

安装Google AI Edge Gallery的过程相对简单，用户只需在Google Play商店搜索应用名称即可下载。对于需要手动安装的用户，可通过GitHub获取最新APK文件，但需启用“未知来源”安装权限。安装完成后，用户需从应用内目录下载Gemma3n4B模型包（约1.5GB），部分模型可能需要Hugging Face账户和许可协议。

应用界面设计直观，分为“Ask Image”、“Prompt Lab”和“AI Chat”三大模块，用户可根据需求选择相应功能。开发者可以通过调整推理参数（如CPU/GPU后端、温度设置）优化模型性能，充分满足个性化需求。

端侧AI的未来：隐私与效率并重

Google AI Edge Gallery的上架标志着谷歌在端侧AI领域的又一重要布局。通过开源（Apache 2.0许可证）和离线运行的设计，谷歌不仅降低了AI技术门槛，还推动了去中心化AI的发展。专家指出，这款应用可能对依赖云服务的AI生态产生一定冲击，同时为开发者提供了更多的创新空间。

对于普通用户而言，Google AI Edge Gallery提供了一个无需编程即可体验前沿AI的机会。从识别旅行中的地标到实时转录会议内容，这款应用让AI技术真正“装进”了用户的口袋。

(以上内容均由Ai生成)