当前位置: 首页 > news >正文

025、TOSA(Tensor Operator Set Architecture)标准介绍

TOSA(Tensor Operator Set Architecture)标准介绍

上周帮团队排查一个跨框架模型部署的bug,现象很诡异:同一个ONNX模型,用ONNX Runtime跑推理结果正确,转成TFLite后在某个嵌入式设备上输出全乱码。折腾了两天,最后定位到是量化后的卷积算子在不同后端的行为不一致——有的后端把bias加在量化前,有的加在量化后,有的干脆把bias类型当int32处理,有的当float32。这种“一个算子,各自表述”的混乱,正是TOSA想要终结的。

为什么需要TOSA

MLIR生态里,你可能会遇到Linalg、StableHLO、MHLO、TOSA这些方言。它们都在做同一件事:把上层框架(PyTorch、TensorFlow、JAX)的算子表示,降级到硬件后端能理解的形式。但问题在于,每个方言都有自己的“脾气”。

Linalg擅长表达线性代数操作,但对量化、形状推断的支持比较弱。StableHLO是HLO的稳定版本,主要服务JAX和TensorFlow,但它的语义偏向XLA编译器,对嵌入式场景的量化约束不够细。MHLO是StableHLO的前身,现在基本被取代了。

TOSA的定位很明确:它是为跨框架、跨硬件的算子集标准化而生的。ARM、Google、Qualcomm、Intel这些公司一起搞的,目标就是让一个模型在CPU、GPU、NPU、DSP上跑出相同的结果。注意,是“相同的结果”,不是“差不多的结果”。

TOSA的核心设

http://www.jsqmd.com/news/1036405/

相关文章:

  • 中国电子学会图形化2025.09月Scratche二级考级题
  • 20.代码敲不队——船舶智能问答系统测试计划
  • OpenAI 收入增长至 130.7 亿美元,高额支出下距盈利仍有长路要走
  • 全功能施工项目管理甘特图 Demo:任务依赖箭头、当前日期标线、周末高亮、分组项目可视化
  • QT Creator静态编译配置实战:从原理到一键部署
  • 让 Codex 桌面版流畅调用国内大模型:codex-cn-bridge 实战配置指南
  • 计算机视觉资源总索引
  • 从PowerPC 601浮点指令集看现代处理器浮点运算原理与优化
  • 珠海本地室内装修设计行业研读|本土装企评析之江南创艺装饰实力解读 - 百航
  • 零门槛免封号!还不会用Claude Code?从0到1的 Claude Code 保姆教程
  • 2026双金属温度计产品定制采购指南:代表性品牌解析与选型参考 - 速递信息
  • 2026年6月技术好的机械设备回收实力厂家推荐,机械设备回收/剪板机回收/数控车床回收,机械设备回收厂商哪家好 - 品牌推荐师
  • STM32WLE5实战指南:从零构建LoRaWAN终端节点
  • WSL与Windows文件传输全攻略:从基础操作到自动化同步
  • 天津包包回收门店排名|禹竞名奢汇领跑,LV香奈儿闲置箱包变现优选 - 名奢变现站
  • 免费大模型平台真相:聚合代理架构与平滑迁移指南
  • 2026 长沙急用钱想变现黄金?3 种渠道到账速度与安全性对比 - 逸程
  • 2026保姆级教程:录音实时转文字软件推荐,电脑手机免费在线工具手把手操作 - 办公小帮手
  • 从零到一:HC32F072搭载FreeRTOS的实战移植与性能调优指南
  • DeepSeek V4为何反向助推英伟达:CUDA生态深度绑定解析
  • 实时通信深度剖析:SSE与WebSocket核心差异、适用场景及Spring Boot实战落地
  • 从数据到决策:时序InSAR技术如何精准刻画城市地表沉降的生命周期
  • 不同期刊配图规范差异科普,灵活调整图表的实操经验 - 品牌2026
  • 嵌入式开发中链接器命令文件(LCF)实现ROM到RAM数据拷贝详解
  • 2026西浦计划外2+2自主申请弊端与靠谱机构规避风险指南 - 品牌2026
  • Microchip 24AA32AF与24LC32AF EEPROM选型与I2C通信实战指南
  • 2026重庆主城九区黄金回收实测 结算透明极速转账商家盘点 - 名奢变现站
  • 终极NCM文件解密指南:3分钟学会网易云音乐加密文件转换
  • 2026年度ETPU鞋材与宠物用具新材料制造企业综合实力推荐榜 - 速递信息
  • 当“舌尖上的技艺”遇上“数字孪生”,中式烹调实训室开发未来实训新模式