当前位置: 首页 > news >正文

卧槽,26M参数跑函数调用!Gemini被蒸馏成马蜂窝袖珍模型

昨天刷到一个项目给我整沉默了——Needle,一个26M参数的模型,专门干函数调用(function call)这件事。

说人话:就是你问它「北京今天天气怎么样」,它能老老实实给你生成一个get_weather(location="北京")的调用,而不是在那儿废话连篇写一大段文字描述。

这项目是从Gemini 3.1蒸馏来的,权重完全开源,HuggingFace上直接下载。Mac上能跑,生产环境能跑到1200 tokens/s的解码速度。


快速上手

安装贼简单:

git clone https://github.com/cactus-compute/needle.git
cd needle && source ./setup
needle playground

直接起一个Web UI,测试你自己的工具集,权重自动下载。

Python调用更直接:

from needle import SimpleAttentionNetwork, load_checkpoint, generate, get_tokenizerparams, config = load_checkpoint("checkpoints/needle.pkl")
model = SimpleAttentionNetwork(config)
tokenizer = get_tokenizer()result = generate(model, params, tokenizer,query="What's the weather in San Francisco?",tools='[{"name":"get_weather","parameters":{"location":"string"}}]',stream=False,
)
print(result)
# [{"name":"get_weather","arguments":{"location":"San Francisco"}}]

就问你怕不怕,26M,CPU都能跑。


这玩意儿到底什么原理

核心是一个叫Simple Attention Network的结构,8层Decoder + 12层Encoder,专门做跨注意力融合。

等等,12层Encoder是什么鬼?传统LLM用的是纯Decoder,Needle加了个Encoder来处理工具调用的结构化信息——说白了就是把函数签名当文档丢给Encoder,让模型学会「看到这种输入格式就对应那种工具」。

预训练用了16块TPU v6e跑了200B token,27小时。然后用20亿token的函数调用数据做微调,45分钟搞定。


能用吗?值不值得跑?

适合场景:

  • 手机/手表/眼镜这种端侧AI助手
  • 需要快速响应的工具调用场景
  • 边缘设备上跑function call

局限性:

  • 纯函数调用单项任务,不适合通用对话
  • 26M参数能做的事情有限,复杂推理别指望它
  • 小模型本身比较娇气,数据分布偏移了性能掉得很快

泼冷水时间

3个月后这项目最大的问题:工具一多就傻眼

现在它用的是单工具调用测的,toy case跑得漂亮。但现实里一个Agent可能要调度十几个工具,工具之间还有依赖关系和返回值传递——这种场景下26M够不够用真不好说。

另外,Gemini被蒸馏的过程中「灵魂」丢了多少也存疑。函数调用只是表面,真正的理解能力、推理链、上下文窗口才是价值所在。

最后,生态问题——这种极小模型的生命力取决于社区能跑多少场景,如果主要还是极客玩具,三个月后star数不跌才怪。


一句话评价: 方向对了,但路还长。端侧AI函数调用这个坑有人来填是好事,别指望它能替代Claude/GPT的Agent能力,先当成树莓派跑AI的玩具比较合适。

👉 项目地址:https://github.com/cactus-compute/needle
🤗 模型权重:https://huggingface.co/Cactus-Compute/needle

http://www.jsqmd.com/news/811872/

相关文章:

  • 2026东莞专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月东莞最新深度调研方案) - 防水百科
  • 前端开发中常用的 Shell 脚本命令有哪些?
  • 2026淮安专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月淮安最新深度调研方案) - 防水百科
  • 2026年新疆包车旅游选哪家?人数配置、服务体验与性价比全解析 - 科技焦点
  • 2026湖州专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月湖州最新深度调研方案) - 防水百科
  • 2026.5.13
  • 2026扬州专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月扬州最新深度调研方案) - 防水百科
  • 2026绍兴专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月绍兴最新深度调研方案) - 防水百科
  • 2025-2026年全球储能消防解决方案公司推荐:五家数据中心场景避免灭火残留痛点口碑好的评测注意事项 - 品牌推荐
  • 2026宿迁专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月宿迁最新深度调研方案) - 防水百科
  • 2026年性价比高的新疆包车旅游团:车队配置、服务标准与价格体系全解析 - 科技焦点
  • 2026南通专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月南通最新深度调研方案) - 防水百科
  • 2026丽水专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月丽水最新深度调研方案) - 防水百科
  • 2026嘉兴专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月嘉兴最新深度调研方案) - 防水百科
  • 2026宁波专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月宁波最新深度调研方案) - 防水百科
  • 广州企业破产重组全领域专业律师推荐,蒋阳兵律师团队真实案例可验证 - TOP10品牌推荐榜单
  • Vue 2 升级到 Vue 3 后渲染性能提升明显吗?
  • C++学习(26_05_13)
  • 高端装备首选!广东犸力压力传感器排名替代进口 - 品牌速递
  • 2026扭矩传感器行业品质革新,广东犸力扭矩传感器以专业实力,成为行业推荐之选 - 品牌速递
  • 中国制造实力!广东犸力压力传感器排名替代进口 - 品牌速递
  • 2026年高端港澳台西藏旅游推荐:热门旅行社对比测评 - 科技焦点
  • 2026气压传感器十大品牌揭晓,广东犸力凭稳定性能,跻身行业前列 - 品牌速递
  • 260513 -「再度降临的灾难」
  • STM32理论 —— SD卡、FatFS 文件管理系统
  • LeetCode HOT100 - 不同路径
  • 2026 南京 GEO 优化公司选型:先验自身优化,合规优先,理性定价 - 小艾信息发布
  • 2026微型压力传感器厂家推荐,广东犸力作为靠谱品牌,稳居行业头部行列 - 品牌速递
  • 2026年成都口碑好的家教机构汇总:像川师大家教网这样的老牌平台是怎么做的? - 教育快讯速递
  • RC 滤波截止频率与滤波原理详解