data-brief:基于AI与规则引擎的数据分析报告自动化生成系统
1. 项目概述:从“数据展示”到“决策驱动”的范式转变
在数据分析这个行当里干了十几年,我见过太多“精美但无用”的报告。它们通常有着漂亮的配色、规整的图表,以及一堆诸如“Q3数据呈现上升趋势,值得关注”的正确废话。决策者看完点点头,然后继续按照自己原有的认知和直觉做决定——报告成了流程中的一个装饰品,而非改变行动的催化剂。这正是我接触到>阶段 注意:红队测试(第8阶段)对用户是透明的,它发生在报告生成之后、最终交付之前。如果洞察被大量驳倒,系统可能会回溯到更早的阶段重新分析,以确保交付物的质量。 这是>git clone https://github.com/carrielabs/data-brief.git \ ~/.claude/skills/data-brief 注意: 方法B:手动下载与放置 即使没有 Python 环境,data-brief 的核心工作流依然可以运行,Claude 模型会尝试直接解析数据文件。但对于大型或复杂的 Excel 文件,使用 Python 脚本预处理会更可靠、更快速。 安装完成后,在 Claude Code 中与 Claude 对话,即可触发>加载文件 核心任务与产出 1. 需求摄入 无 明确报告受众(技术团队/业务负责人/高管)和业务背景。 2. 数据剖析 无 运行 profile_data.py,理解数据结构、分布、缺失值,生成数据概览。3. 模式狩猎 PATTERN_HUNT.md执行7方向反直觉扫描,寻找数据中的异常模式。 4. 洞察提炼与净化 INSIGHT_RULES.md,ANTI_AI.md对候选洞察执行6项测试;应用禁用词表和句式黑名单,净化语言。 5. 报告结构设计 REPORT_TEMPLATES.md基于洞察和受众,规划报告的叙事结构和章节布局。 6. 反幻觉验证 无 交叉核对洞察与原始数据,确保所有陈述均有据可查。 7. 报告生成 THEMES.md,CHART_LIBRARY.md根据选定主题和图表规则,生成最终的、自包含的 HTML 文件。 8. 红队测试 (内部) 无 模型自我反驳,攻击并淘汰脆弱的洞察。 9. 交付 无 输出最终的 HTML 报告文件。 3. 核心机制深度解析:如何保证洞察质量?
3.1 六重质量门禁:每一条洞察的“生存试炼”
~/.claude/skills/是 macOS/Linux 上的标准路径。在 Windows 上,路径通常是C:\Users\<你的用户名>\.claude\skills\。请确保目录存在。https://github.com/carrielabs/data-brief),点击Code->Download ZIP,将项目下载到本地并解压。># 检查Python版本,需要3.8+ python3 --version # 安装必要的库,如处理Excel文件所需的openpyxl pip install openpyxl pandas numpy4.2 触发分析与报告生成
