本地部署 Gemma4 E4B 实战指南:从旧模型迁移到统一多模态AI
本地部署 Gemma4 E4B 实战指南:从旧模型迁移到统一多模态AI 迁移背景 2026年4月,我们将本地部署的多个小模型(gemma3:1b、qwen3.5:4b、moondream、Whisper)统一迁移到 Google 的 Gemma4 E4B(4B Effective),实现了单一模型处理图片识别、视频分析和语音识别任务。 环境要求 操作系统: Ubuntu 22.04+ (ARM64 或 x86_64) 内存: 推荐 16GB RAM(模型运行时占用约 10-11GB) 磁盘: 10GB 可用空间(模型文件 9.6GB) 软件: Ollama 0.20.0+ 迁移步骤 1. 升级 Ollama 到 0.20+ 1# 检查当前版本 2ollama --version 3 4# 升级到最新版本 5curl -fsSL https://ollama.com/install.sh | sh 6 7# 重启服务 8systemctl restart ollama # 或 service ollama restart 2. 卸载旧模型 1ollama rm moondream:latest 2ollama rm gemma3:1b 3ollama rm qwen3.5:4b 4 5# 卸载 Whisper(如果通过 pip 安装) 6pip uninstall -y faster-whisper 3. 拉取 Gemma4 E4B 1ollama pull gemma4:e4b 首次拉取需要下载 9.6GB 模型文件,耗时取决于网络速度。 ...