谷歌开源轻量级函数调用模型,边缘设备本地部署不再难

robot
摘要生成中

【币界】最近谷歌发布了个有意思的东西——FunctionGemma。说白了就是把Gemma 3 270M这个轻量模型专门调教成了函数调用模型,主要瞄准本地和离线场景。

亮点还是挺多的。首先统一了聊天和工具执行,不用来回折腾。其次支持定制微调,官方数据显示Mobile Actions的准确率从58%直接飙到85%,这个提升幅度不错。再加上它个子小,能跑在NVIDIA Jetson Nano、手机这类边缘设备上,还特别优化了JSON和多语言输入。

生态这块也比较完善。Hugging Face、Kaggle都能下载,微调工具有Transformers、Unsloth、Keras、NeMo可选,部署方案包括LiteRT-LM、vLLM、MLX、Llama.cpp、Ollama、Vertex AI、LM Studio等一整套。还上线了Edge Gallery展示各种用例,配套数据集和Colab代码。对想搭本地AI代理的开发者来说,这套组合拳还是有吸引力的。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)