SKILL·94F816

review-data-analysis

Name: review-data-analysis
Author: pjt222

pjt222

업데이트됨 1 month ago

12 조회

기타data

정보

이 스킬은 데이터 품질 평가, 가설 검증, 모델 검증, 데이터 누수 탐지를 포함하여 데이터 분석의 품질, 정확성, 재현성을 검토합니다. 개발자가 동료의 작업을 출판 전에 감사하거나, ML 파이프라인을 배포 전에 검증하거나, 규제 검토를 수행하기 위해 설계되었습니다. 이 도구는 분석 코드와 출력물을 필요로 하며, 선택적으로 원본 데이터와 프로토콜을 받아 포괄적인 검증을 수행합니다.

빠른 설치

Claude Code

문서

数据分析评审

评估数据分析流水线的正确性、健壮性和可重复性。

适用场景

在发表前审查同事的分析笔记本或脚本
在生产部署前验证机器学习流水线
为监管或业务决策审计分析报告
评估分析是否支持其所述结论
在受监管环境中进行第二分析师复核

输入

必填：分析代码（脚本、笔记本或流水线定义）
必填：分析输出（结果、表格、图表、模型指标）
可选：原始数据或数据字典
可选：分析计划或协议（预先注册或临时的）
可选：目标受众和决策背景

步骤

第 1 步：评估数据质量

在评估分析之前，先审查输入数据：

## 数据质量评估

### 完整性
- [ ] 缺失数据已量化（按列和按行的缺失百分比）
- [ ] 缺失数据机制已考虑（MCAR、MAR、MNAR）
- [ ] 插补方法适当（如使用）或完整案例分析有理据支持

### 一致性
- [ ] 数据类型符合预期（日期是日期，数字是数字）
- [ ] 值域合理（无负年龄，历史数据中无未来日期）
- [ ] 分类变量具有预期水平（无拼写错误，编码一致）
- [ ] 记录间单位一致

### 唯一性
- [ ] 重复记录已识别并处理
- [ ] 预期位置的主键是唯一的
- [ ] 连接操作产生预期行数（无扇出或丢失）

### 时效性
- [ ] 数据时效性适合分析问题
- [ ] 时间覆盖范围与研究期间相匹配
- [ ] 时间序列数据中无前瞻偏倚

### 溯源
- [ ] 数据来源已记录
- [ ] 提取日期/版本已记录
- [ ] 来源与分析输入之间的任何转换已记录

预期结果： 数据质量问题已记录，并说明其对结果的潜在影响。

失败处理： 若数据不可访问以供审查，则从代码中评估质量（应用了哪些检查和转换）。

第 2 步：检验假设

对所用的每种统计方法或模型：

方法	关键假设	检验方式
线性回归	线性性、独立性、残差正态性、方差齐性	残差图、Q-Q 图、Durbin-Watson、Breusch-Pagan
逻辑回归	独立性、无多重共线性、线性 logit	VIF、Box-Tidwell、残差诊断
t 检验	独立性、正态性（或大 n）、方差相等	Shapiro-Wilk、Levene 检验、目视检查
方差分析	独立性、正态性、方差齐性	各组 Shapiro-Wilk、Levene 检验
卡方检验	独立性、期望频率 ≥ 5	期望频率表
随机森林	足够的训练数据、特征相关性	OOB 误差、特征重要性、学习曲线
神经网络	足够数据、适当架构、无数据泄漏	验证曲线、过拟合检查

## 假设检验结果
| 分析步骤 | 方法 | 假设 | 已检验？ | 结果 |
|---------|------|------|---------|------|
| 主模型 | 线性回归 | 残差正态性 | 是 | Q-Q 图显示轻微偏差——n>100 时可接受 |
| 主模型 | 线性回归 | 方差齐性 | 否 | 未检验——建议添加 Breusch-Pagan 检验 |

预期结果： 每种统计方法的假设均已明确检验或得到承认。

失败处理： 若假设被违反，检查作者是否已处理（稳健方法、变换、敏感性分析）。

第 3 步：检测数据泄漏

数据泄漏发生在训练集外的信息影响模型时，导致过于乐观的性能：

常见泄漏模式：

目标泄漏：直接编码目标变量的特征（如使用"treatment_outcome"预测"treatment_success"）
时间泄漏：使用未来信息预测过去（使用预测时不可用的数据计算的特征）
训练测试污染：在数据分割之前对完整数据集拟合预处理（缩放、插补、特征选择）
群组泄漏：相关观测（同一患者、同一设备）分散在训练集和测试集中
特征工程泄漏：跨整个数据集而非仅在训练折叠内计算的聚合值

## 泄漏评估
| 检查项 | 状态 | 证据 |
|-------|------|------|
| 目标泄漏 | 清除 | 无从目标派生的特征 |
| 时间泄漏 | 关注 | 特征 X 使用 30 天前向平均值 |
| 训练测试污染 | 清除 | StandardScaler 仅在训练集上拟合 |
| 群组泄漏 | 关注 | 患者 ID 未用于分层分割 |

预期结果： 所有常见泄漏模式均已检查，状态为清除/关注。

失败处理： 若发现泄漏，通过重新运行去除泄漏特征来估计影响（如可能），或标记供分析师调查。

第 4 步：验证模型性能

对于预测模型：

问题对应的适当指标（不仅仅是准确率——考虑精确率、召回率、F1、AUC、RMSE、MAE）
交叉验证或留出策略已描述且适当
训练集与测试/验证集性能已比较（过拟合检查）
提供了基准比较（朴素模型、随机机会、先前方法）
性能指标的置信区间或标准误差
在相关子群体上评估了性能（公平性、边缘案例）

对于推断/解释模型：

报告了模型拟合统计量（R²、AIC、BIC、偏差）
系数解释正确（方向、量级、显著性）
多重共线性已评估（VIF < 5–10）
已识别有影响的观测值（Cook 距离、杠杆值）
如测试了多个规格，进行了模型比较

预期结果： 模型验证适合用例（预测 vs 推断）。

失败处理： 若测试集性能与训练性能可疑地接近，标记潜在泄漏。

第 5 步：评估可重复性

## 可重复性清单
| 项目 | 状态 | 备注 |
|------|------|------|
| 代码无错误运行 | [是/否] | 在 [环境描述] 上测试 |
| 随机种子已设置 | [是/否] | [文件] 第 [N] 行 |
| 依赖项已记录 | [是/否] | requirements.txt / renv.lock 存在 |
| 数据加载可重复 | [是/否] | 路径是 [相对/绝对/URL] |
| 结果与报告值匹配 | [是/否] | 已验证：表 1 ✓，图 2 ✗（轻微差异） |
| 环境已记录 | [是/否] | 已指定 Python 3.11 / R 4.5.0 |

预期结果： 通过重新运行分析验证了可重复性（若数据不可用则从代码评估）。

失败处理： 若结果无法精确重现，确定差异是否在浮点数容差范围内或表明存在问题。

第 6 步：撰写评审报告

## 数据分析评审

### 整体评估
[1-2 句：分析是否可靠？是否支持结论？]

### 数据质量
[数据质量发现摘要，对结果的影响]

### 方法论问题
1. **[标题]**：[描述，在代码/报告中的位置，建议]
2. ...

### 优点
1. [做得好的地方]
2. ...

### 可重复性
[等级评估：金/银/铜/不透明，附理由]

### 建议
- [ ] [分析师的具体行动项目]

预期结果： 评审提供了可操作的反馈，并有对代码位置的具体引用。

失败处理： 若时间有限，优先处理数据质量和泄漏检查，而非风格问题。

验证清单

数据质量已从完整性、一致性、唯一性、时效性、溯源方面评估
每种所用方法的统计假设均已检验
数据泄漏已系统性地评估
模型性能已用适当指标和基准验证
可重复性已评估（代码运行，结果匹配）
反馈具体，引用了代码行或报告章节
语气具有建设性和合作精神

常见问题

只审查代码：分析计划和结论与实现同样重要。
忽视数据质量：在劣质数据上运行复杂模型会产生自信但错误的答案。
将复杂性等同于正确性：95% 准确率的随机森林可能存在数据泄漏；简单 t 检验可能是正确方法。
不运行代码：尽可能执行代码以验证可重复性。阅读代码是不够的。
见树不见林：不要因代码风格问题而忽略根本性的分析错误。

GitHub 저장소

pjt222/agent-almanac

경로: i18n/zh-CN/skills/review-data-analysis

agentsagentskillsai-assisted-developmentclaude-codeskillsteams

FAQ

Frequently asked questions

What is the review-data-analysis skill?

review-data-analysis is a Claude Skill by pjt222. Skills package instructions and resources that Claude loads on demand, so Claude can perform review-data-analysis-related tasks without extra prompting.

How do I install review-data-analysis?

Use the install commands on this page: add review-data-analysis to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does review-data-analysis belong to?

review-data-analysis is in the Other category, tagged data.

Is review-data-analysis free to use?

Yes. review-data-analysis is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

연관 스킬

llamaguard

기타

LlamaGuard는 폭력 및 혐오 발언 등 6가지 안전 범주에서 LLM 입력과 출력을 조정하기 위한 Meta의 70-80억 파라미터 모델입니다. 94-95% 정확도를 제공하며 vLLM, Hugging Face 또는 Amazon SageMaker를 사용해 배포할 수 있습니다. 이 기술을 사용하여 AI 애플리케이션에 콘텐츠 필터링 및 안전 가드레일을 손쉽게 통합하세요.

스킬 보기

cost-optimization

기타

이 Claude Skill은 리소스 적정화, 태깅 전략, 지출 분석을 통해 개발자들이 클라우드 비용을 최적화할 수 있도록 지원합니다. AWS, Azure, GCP에서 클라우드 비용을 절감하고 비용 거버넌스를 구현하기 위한 프레임워크를 제공합니다. 인프라 비용을 분석하거나, 리소스를 적정화하거나, 예산 제약을 충족해야 할 때 사용하세요.

스킬 보기

sports-betting-analyzer

기타

이 Claude Skill은 스프레드, 오버/언더, 프로프 베트를 포함한 스포츠 베팅 시장을 분석합니다. 역사적 추이와 상황별 통계를 검토하여 가치 베트를 발견하고, 교육적 목적으로 실행 가능한 권장 사항이 담긴 구조화된 마크다운 결과를 제공합니다. 개발자는 이 기능을 스포츠 베팅 분석 도구에 활용할 수 있으며, 단순히 엔터테인먼트/교육 목적으로만 설계되었음을 유의해야 합니다.

스킬 보기

quantizing-models-bitsandbytes

기타

이 스킬은 bitsandbytes를 사용하여 LLM을 8비트 또는 4비트 정밀도로 양자화하며, 최소한의 정확도 손실로 50-75%의 메모리 감소를 달성합니다. 제한된 GPU 메모리에서 더 큰 모델을 실행하거나 추론을 가속화하는 데 이상적이며, INT8, NF4, FP4와 같은 형식을 지원합니다. 이 스킬은 HuggingFace Transformers와 통합되어 QLoRA 학습 및 8비트 옵티마이저를 가능하게 합니다.

스킬 보기

review-data-analysis

정보

빠른 설치

Claude Code

문서

数据分析评审

适用场景

输入

步骤

第 1 步：评估数据质量

第 2 步：检验假设

第 3 步：检测数据泄漏

常见泄漏模式：

第 4 步：验证模型性能

对于预测模型：

对于推断/解释模型：

第 5 步：评估可重复性

第 6 步：撰写评审报告

验证清单

常见问题

相关技能

GitHub 저장소

Frequently asked questions

What is the review-data-analysis skill?

How do I install review-data-analysis?

What category does review-data-analysis belong to?

Is review-data-analysis free to use?

연관 스킬