当前位置: 首页 > news >正文

[开源项目] SmartSafe-大模型安全测评备案系统

SmartSafe(智安)

📖 项目简介

SmartSafe(智安)是一套面向大语言模型(LLM)的安全评测系统助力快速完成大模型备案。系统参考tc260-003《生成式人工智能服务安全基本要求》等国家标准,提供测试用例库、模型接入、评测任务执行与结果分析等能力,帮助团队将”模型安全”沉淀为可测、可追踪、可对比的指标与流程,一键生成符合监管要求的安全评测报告
github地址:https://github.com/xyh4ck/SmartSafe
数据集:可以star⭐项目,私聊领取

🎯 核心价值

  • 合规备案:对标国家标准,输出符合监管要求的评测报告,助力大模型快速通过备案
  • 全面评测:覆盖语料安全、生成内容安全、拒答测试等多维度安全评测能力
  • 开箱即用:内置丰富测试用例库,支持自定义扩展,快速构建评测体系

✨ 核心功能

🔬 评测任务管理

模块路径:module_evaltask

功能说明
任务创建三步向导创建任务,选择模型 + 按全部/维度/分类筛选用例,自动批量组装评测输入
异步执行Celery 异步执行评测,支持并发限流、失败重试与任务幂等保护
进度追踪提供任务进度、用例明细、阶段日志查询(支持轮询与 ETag 缓存)
结果分析内置规则分析与 deepteam 评估,输出风险分数、风险等级、风险原因与 Token 用量
汇总报告自动生成任务汇总结果:等级分布、通过率、指标均值与 Top 风险样本

📚 测试用例库管理

模块路径:module_evaluation

功能说明
关键词题库支持关键词增删改查、同类唯一性校验、风险等级与匹配类型配置、Excel 导入导出
生成内容题库支持测试用例 CRUD,按维度/分类/状态分页检索,自动校验维度分类一致性与重复
候选题审核支持候选题自动生成(应拒答/不应拒答)、批量审核、审核后发布至正式题库
风险分类支持风险维度与分类管理、启用状态控制、维度-分类树查询、模板导入导出

🤖 模型接入管理

模块路径:module_model

功能说明
模型配置模型注册与配置管理(provider/type/api_base 等)
密钥管理API Key 加密存储与解密调用,评测执行阶段按模型配置自动注入
连通测试在线验证模型可调用性
状态管理模型可用状态批量开关、版本维护

📸 系统截图

评测任务管理




测试用例管理




模型接入管理

🗺️ 未来开发计划

🔐 大模型漏洞库

构建专属大模型漏洞库,实现漏洞收集、分类、更新、匹配、扫描的全流程管理,联动现有评测用例库,提升评测精准度,支持漏洞自动扫描与风险预警,形成漏洞治理闭环。

🔌 Skills 安全扫描

覆盖大模型技能(插件/应用)的全生命周期安全,重点打造 Skills 安全扫描核心能力,实现技能注册审核、运行时监控、恶意行为识别、安全评级的全流程扫描管控,联动评测流程完善安全闭环。

📡 MCP 安全扫描

聚焦大模型通信协议(MCP)安全,重点构建 MCP 安全扫描能力,实现协议适配、加密校验、身份认证、数据传输检测、异常行为拦截的全流程扫描防护,保障模型通信全链路安全。

http://www.jsqmd.com/news/532130/

相关文章:

  • Duix.Avatar完整教程:免费开源AI数字人克隆神器如何快速上手
  • 用matla做的本科毕设:从仿真到部署的实战全流程解析
  • 最短路问题webApp实验室:双标号法的可视化与AI智能分析
  • Linux Nethogs实战:从进程级流量监控到自动化分析
  • 快速上手Stable Diffusion v1.5 Archive:镜像免配置,一键生成创意图像
  • 2025进阶版Subfinder实战手册:从入门到精通的系统化被动子域名枚举指南
  • 4个维度实现企业办公自动化:基于WeChatFerry的零代码部署指南
  • 2026年大件加工供应商找哪家,大型CNC加工/精密零件加工/数控立车加工/机加工/焊接加工,大件加工企业找哪家 - 品牌推荐师
  • 免费AI模型SLANeXt_wired_safetensors强力指南
  • 大数据专业毕业设计案例实战:从数据采集到可视化分析的完整链路构建
  • 昇腾910B多卡环境下hccl-test性能调优实战
  • 别再乱调temperature了!用Hugging Face Transformers实战,5分钟搞懂大模型参数组合的坑
  • MMCV安装配置完全指南:从问题诊断到性能优化的系统方法
  • Wan2.2-I2V-A14B效果集锦:城市风光与自然景观的动态化演绎
  • 我只是想让AI记住更多,结果它直接卡住了
  • 保姆级教程:使用Docker一键部署LiuJuan20260223Zimage国风美学模型
  • hadoop+spark+hive薪资预测 招聘推荐系统 招聘可视化大屏 招聘数据可视化分析系统 招聘数据 求职就业数据可视化 Flask框架 Echarts可视化
  • 3步搞定B站字幕提取:BiliBiliCCSubtitle的全流程高效解决方案
  • 【ADRC/Simulink实战】跟踪微分器TD:从理论到抗噪性能的仿真剖析
  • OpenClaw多端同步:Qwen3-VL:30B任务跨设备执行
  • Blinker-ESP-IDF:嵌入式物联网开发框架的技术实践与演进
  • 小米手环心率监测完整指南:构建实时健康数据采集系统
  • 《Ionic Range:深度解析其功能与应用场景》
  • 从 Researcher 到 Reporter:拆解 DeerFlow 多智能体深度调研全流程
  • 电赛备赛别慌!这份用Multisim仿真好的集成运放电路库,直接拿来就能用
  • 用Python模拟神经元放电:Izhikevich模型实战教程(附BrainPy代码)
  • Python开发者工具链高效集成指南:10分钟上手Codex智能开发助手
  • 5步搞定水面垃圾检测系统:从数据标注到PyQt5界面开发全流程
  • MindSpore实战经验:从PyTorch迁移到昇腾NPU的性能优化全记录
  • Storyboarder - 影视动画创作的高效视觉叙事利器