当前位置：首页 > news >正文

卧槽，26M参数跑函数调用！Gemini被蒸馏成马蜂窝袖珍模型

news 2026/5/14 0:07:51

昨天刷到一个项目给我整沉默了——Needle，一个26M参数的模型，专门干函数调用（function call）这件事。

说人话：就是你问它「北京今天天气怎么样」，它能老老实实给你生成一个get_weather(location="北京")的调用，而不是在那儿废话连篇写一大段文字描述。

这项目是从Gemini 3.1蒸馏来的，权重完全开源，HuggingFace上直接下载。Mac上能跑，生产环境能跑到1200 tokens/s的解码速度。

快速上手

安装贼简单：

git clone https://github.com/cactus-compute/needle.git
cd needle && source ./setup
needle playground

直接起一个Web UI，测试你自己的工具集，权重自动下载。

Python调用更直接：

from needle import SimpleAttentionNetwork, load_checkpoint, generate, get_tokenizerparams, config = load_checkpoint("checkpoints/needle.pkl")
model = SimpleAttentionNetwork(config)
tokenizer = get_tokenizer()result = generate(model, params, tokenizer,query="What's the weather in San Francisco?",tools='[{"name":"get_weather","parameters":{"location":"string"}}]',stream=False,
)
print(result)
# [{"name":"get_weather","arguments":{"location":"San Francisco"}}]

就问你怕不怕，26M，CPU都能跑。

这玩意儿到底什么原理

核心是一个叫Simple Attention Network的结构，8层Decoder + 12层Encoder，专门做跨注意力融合。

等等，12层Encoder是什么鬼？传统LLM用的是纯Decoder，Needle加了个Encoder来处理工具调用的结构化信息——说白了就是把函数签名当文档丢给Encoder，让模型学会「看到这种输入格式就对应那种工具」。

预训练用了16块TPU v6e跑了200B token，27小时。然后用20亿token的函数调用数据做微调，45分钟搞定。

能用吗？值不值得跑？

适合场景：

手机/手表/眼镜这种端侧AI助手
需要快速响应的工具调用场景
边缘设备上跑function call

局限性：

纯函数调用单项任务，不适合通用对话
26M参数能做的事情有限，复杂推理别指望它
小模型本身比较娇气，数据分布偏移了性能掉得很快

泼冷水时间

3个月后这项目最大的问题：工具一多就傻眼。

现在它用的是单工具调用测的，toy case跑得漂亮。但现实里一个Agent可能要调度十几个工具，工具之间还有依赖关系和返回值传递——这种场景下26M够不够用真不好说。

另外，Gemini被蒸馏的过程中「灵魂」丢了多少也存疑。函数调用只是表面，真正的理解能力、推理链、上下文窗口才是价值所在。

最后，生态问题——这种极小模型的生命力取决于社区能跑多少场景，如果主要还是极客玩具，三个月后star数不跌才怪。

一句话评价： 方向对了，但路还长。端侧AI函数调用这个坑有人来填是好事，别指望它能替代Claude/GPT的Agent能力，先当成树莓派跑AI的玩具比较合适。

👉 项目地址：https://github.com/cactus-compute/needle
🤗 模型权重：https://huggingface.co/Cactus-Compute/needle

http://www.jsqmd.com/news/811872/

相关文章：

2026东莞专业防水公司TOP5推荐：卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月东莞最新深度调研方案) - 防水百科

前端开发中常用的 Shell 脚本命令有哪些？

2026淮安专业防水公司TOP5推荐：卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月淮安最新深度调研方案) - 防水百科

2026年新疆包车旅游选哪家？人数配置、服务体验与性价比全解析 - 科技焦点

2026湖州专业防水公司TOP5推荐：卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月湖州最新深度调研方案) - 防水百科

2026扬州专业防水公司TOP5推荐：卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月扬州最新深度调研方案) - 防水百科

2026绍兴专业防水公司TOP5推荐：卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月绍兴最新深度调研方案) - 防水百科

2025-2026年全球储能消防解决方案公司推荐：五家数据中心场景避免灭火残留痛点口碑好的评测注意事项 - 品牌推荐

2026宿迁专业防水公司TOP5推荐：卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月宿迁最新深度调研方案) - 防水百科

2026年性价比高的新疆包车旅游团：车队配置、服务标准与价格体系全解析 - 科技焦点

2026南通专业防水公司TOP5推荐：卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月南通最新深度调研方案) - 防水百科

2026丽水专业防水公司TOP5推荐：卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月丽水最新深度调研方案) - 防水百科

2026嘉兴专业防水公司TOP5推荐：卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月嘉兴最新深度调研方案) - 防水百科

2026宁波专业防水公司TOP5推荐：卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月宁波最新深度调研方案) - 防水百科

广州企业破产重组全领域专业律师推荐，蒋阳兵律师团队真实案例可验证 - TOP10品牌推荐榜单

Vue 2 升级到 Vue 3 后渲染性能提升明显吗？

C++学习（26_05_13)

高端装备首选！广东犸力压力传感器排名替代进口 - 品牌速递

2026扭矩传感器行业品质革新，广东犸力扭矩传感器以专业实力，成为行业推荐之选 - 品牌速递

中国制造实力！广东犸力压力传感器排名替代进口 - 品牌速递

2026年高端港澳台西藏旅游推荐：热门旅行社对比测评 - 科技焦点

2026气压传感器十大品牌揭晓，广东犸力凭稳定性能，跻身行业前列 - 品牌速递

260513 -「再度降临的灾难」

STM32理论 —— SD卡、FatFS 文件管理系统

LeetCode HOT100 - 不同路径

2026 南京 GEO 优化公司选型：先验自身优化，合规优先，理性定价 - 小艾信息发布

2026微型压力传感器厂家推荐，广东犸力作为靠谱品牌，稳居行业头部行列 - 品牌速递

2026年成都口碑好的家教机构汇总：像川师大家教网这样的老牌平台是怎么做的？ - 教育快讯速递

RC 滤波截止频率与滤波原理详解