当前位置: 首页 > news >正文

AI 给出的答案,你敢直接用吗?芯片研发需要一套新的评估标准

做芯片的人对"质量"这个词不陌生。

代码覆盖率、时序余量……这些指标跑了几十年,大家都知道怎么看,怎么判断一个版本能不能往下走。

但现在流程里多了一个新角色——大模型的输出。问题来了:这个输出,用什么来量?


传统的软件质量评估体系,建立在一个前提上:输出是确定的。

同样的输入,同样的代码,跑出来的结果是一样的。所以可以写测试用例,可以做回归,可以用覆盖率衡量测试的充分程度。这套逻辑非常扎实,几十年没有本质变化。

大模型打破了这个前提。同样的问题,问两次,答案可能不一样。

http://www.jsqmd.com/news/516646/

相关文章:

  • 手把手教你用51单片机实现数码管加减计数器(含仿真效果)
  • 分期乐礼品卡回收变现攻略:快速换现金的实用技巧 - 团团收购物卡回收
  • 文墨共鸣实战落地:从需求分析、模型选型、UI设计到上线运维全链路
  • HY-Motion 1.0参数怎么调?采样步数、动作时长设置全解析
  • 2024年还用Windows XP?VMware17虚拟化实战:从系统封装到快照管理
  • 深入Linux固件仓库:手把手教你为Intel AX211和Ultra 7新硬件手动下载并安装缺失的iwlwifi驱动
  • 一眼看穿idea潜力!创智×复旦提出RL新范式,让大模型拥有科研品味
  • 别再瞎调了!用正点原子PID上位机给直流有刷电机调参,保姆级避坑指南
  • 告别格式混乱:3分钟掌握html-to-docx实现HTML到Word的完美转换
  • 别再手动推导了!用MATLAB CVX快速搞定机器学习中的正则化回归与SVM模型
  • OpenClaw跨平台方案:Qwen3-32B在mac与Windows执行对比
  • 基于Ubuntu 24.04与Zabbix 7.0构建云服务器监控体系
  • 仅0.04B!哈工深首创同层混合架构STILL,极低成本线性化LLM
  • Ollama+granite-4.0-h-350m:开源轻量模型在学生编程作业辅导中的应用
  • 从入门到精通:MATLAB GUI界面开发核心要点与避坑指南
  • 三步搞定网易云音乐下载:为什么你需要这个命令行神器?
  • DeepSeek-R1-Distill-Qwen-7B数学推理能力实测:AIME竞赛题解题分析
  • IEEE33节点配电网Simulink模型 附带有详细节点数据以及文献出处来源,MATLAB
  • 从零开始:cv_resnet18_ocr-detection OCR模型环境搭建与测试
  • 如何在Windows下查看本机的IP地址
  • LeetCode 3643.子矩阵垂直翻转算法解析
  • 别再只聊天了!OpenClaw(养龙虾)让AI自己工作,附部署教程!
  • MySQL GTID深度解析:gtid_executed与gtid_purged的核心机制与应用场景
  • 2026年四大系列减速机专业定制厂哪家好,鑫钺传动值得选吗 - mypinpai
  • 嵌入式C语言宏定义工程规范与实战
  • ST-LINK升级失败?手把手教你用STM32 ST-LINK Utility搞定固件更新(附常见问题排查)
  • VMware群集搭建必看:如何用iSCSI共享存储实现EXSI主机互通?
  • 从零搭建一个AI摄像头:我用RK3576的6TOPS NPU跑通了YOLOv5s全流程(附模型转换与性能实测)
  • Ubuntu22.04下DPDK环境搭建全攻略:从源码编译到HelloWorld测试
  • lychee-rerank-mm在软件测试中的应用:自动化用例优先级排序