review-research
Über
Diese Claude Skill führt strukturierte Peer-Reviews von Forschungsdokumenten durch und bewertet Methodik, statistische Validität, Reproduzierbarkeit und Verzerrungen. Sie ist für die Begutachtung von Artikeln, Preprints, Forschungsanträgen und Protokollen konzipiert, um konstruktives Feedback zur wissenschaftlichen Strenge zu geben. Entwickler können sie nutzen, um automatisierte Forschungsqualitätsbewertung in ihre Anwendungen zu integrieren.
Schnellinstallation
Claude Code
Empfohlennpx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/review-researchKopieren Sie diesen Befehl und fügen Sie ihn in Claude Code ein, um diese Fähigkeit zu installieren
Dokumentation
name: review-research description: > 研究手法、実験デザイン、論文品質のピアレビューを実施する。手法評価、統計的妥当性、 再現可能性の評価、バイアスの特定、建設的なフィードバックを網羅する。 論文・プレプリント・内部研究レポートのレビュー、研究提案や研究プロトコルの評価、 主張の根拠となる証拠の質の評価、または論文の章・節のレビューに使用する。 locale: ja source_locale: en source_commit: 6f65f316 translator: claude-opus-4-6 translation_date: 2026-03-16 license: MIT allowed-tools: Read Grep Glob WebFetch metadata: author: Philipp Thoss version: "1.0" domain: review complexity: advanced language: natural tags: peer-review, methodology, research, reproducibility, bias, manuscript
Review Research
研究成果の構造化ピアレビューを実施し、手法、統計的選択、再現可能性、科学的厳密さを評価する。
使用タイミング
- 論文、プレプリント、内部研究レポートのレビュー
- 研究提案や研究プロトコルの評価
- 主張や推奨事項の根拠となる証拠の質の評価
- データ収集前に同僚の研究デザインへフィードバックを提供する場合
- 論文の章や博士論文の節をレビューする場合
入力
- 必須: 研究文書(論文、レポート、提案書、またはプロトコル)
- 必須: 分野・学問領域のコンテキスト(手法標準に影響する)
- 任意: ジャーナルや会議のガイドライン(出版向けレビューの場合)
- 任意: 補足資料(データ、コード、付録)
- 任意: 過去のレビューコメント(改訂版をレビューする場合)
手順
ステップ1: 第一読み — 範囲と構造
文書全体を一度読み、以下を把握する:
- 研究課題: 明確かつ具体的に述べられているか?
- 貢献の主張: 何が新規または斬新か?
- 全体構造: 期待されるフォーマット(IMRaDまたは会議固有の形式)に従っているか?
- 範囲の適合性: 対象の読者・会議に適切な内容か?
## First Pass Assessment
- **Research question**: [Clear / Vague / Missing]
- **Novelty claim**: [Stated and supported / Overstated / Unclear]
- **Structure**: [Complete / Missing sections: ___]
- **Scope fit**: [Appropriate / Marginal / Not appropriate]
- **Recommendation after first pass**: [Continue review / Major concerns to flag early]
期待結果: 論文の主張と貢献について明確に理解できている。 失敗時: 全文を読んでも研究課題が不明確な場合は、これを重大な懸念点として記録し、レビューを続行する。
ステップ2: 手法の評価
研究デザインをその分野の標準に照らして評価する:
量的研究
- 研究課題に適した研究デザイン(実験的、準実験的、観察的、調査)
- サンプルサイズの根拠(検出力分析または実践的な根拠)
- サンプリング方法の説明と適切さ(無作為、層別、便宜的)
- 変数の明確な定義(独立変数、従属変数、制御変数、交絡変数)
- 測定機器の妥当性と信頼性の報告
- 記述から再現可能なデータ収集手順
- 倫理的考慮事項への対処(IRB/倫理審査委員会の承認、同意)
質的研究
- 明示的な方法論(グラウンデッドセオリー、現象学、ケーススタディ、民族誌)
- 参加者の選定基準と飽和について議論されているか
- データ収集方法の説明(インタビュー、観察、文書)
- 研究者のポジショナリティが認識されているか
- 信頼性確保の戦略が報告されているか(トライアンギュレーション、メンバーチェッキング、監査証跡)
- 倫理的考慮事項への対処
混合研究法
- 混合デザインの根拠が説明されているか
- 統合戦略の説明(収束型、説明的逐次型、探索的逐次型)
- 量的・質的コンポーネントの両方がそれぞれの標準を満たしているか
期待結果: 各項目に対する具体的な所見を添えて手法チェックリストが完成している。 失敗時: 重要な手法情報が欠落している場合は、推測せず重大な懸念点として記録する。
ステップ3: 統計的・分析的選択の評価
- データの種類と研究課題に適した統計手法
- 統計検定の前提条件の確認と報告(正規性、等分散性、独立性)
- p値と並んで効果量が報告されているか
- 適切な箇所に信頼区間が提供されているか
- 必要な場合に多重比較の補正が適用されているか(Bonferroni、FDRなど)
- 欠損データの処理方法の説明と適切さ
- 主要な前提に対する感度分析が実施されているか
- 分析と一致した結果の解釈(所見の誇大解釈がないか)
統計的な危険信号:
- p値ハッキングの指標(多数の比較、選択的報告、「境界的有意」)
- 不適切な検定(正規性のないデータへのt検定の無理な適用、順序データへのパラメトリック検定)
- 統計的有意性と実際的有意性の混同
- 効果量の報告なし
- 事後仮説を事前仮説として提示
期待結果: 具体的な懸念点を文書化して統計的選択が評価されている。 失敗時: 特定の手法に専門知識がない場合はその旨を認め、専門家レビュアーを推奨する。
ステップ4: 再現可能性の評価
- データの利用可能性の記述(オープンデータ、リポジトリリンク、要請により利用可能)
- 分析コードの利用可能性の記述
- ソフトウェアのバージョンと実行環境の文書化
- 乱数シードまたは再現性メカニズムの説明
- 主要なパラメータとハイパーパラメータの報告
- 計算環境の説明(ハードウェア、OS、依存関係)
再現可能性のティア:
| ティア | 説明 | 証拠 |
|---|---|---|
| Gold | 完全に再現可能 | オープンデータ + オープンコード + コンテナ化された環境 |
| Silver | 実質的に再現可能 | データ利用可能、分析が詳細に説明されている |
| Bronze | 再現可能性あり | 手法が説明されているがデータ/コードの共有なし |
| Opaque | 再現不可 | 手法の詳細が不十分または独自データ |
期待結果: 根拠を添えて再現可能性ティアが割り当てられている。 失敗時: データを共有できない場合(プライバシー、独自情報)、合成データまたは詳細な疑似コードが許容可能な代替手段となる。それが提供されているか記録する。
ステップ5: 潜在的なバイアスの特定
- 選択バイアス: 参加者はターゲット集団を代表しているか?
- 測定バイアス: 測定プロセスが結果を系統的に歪めた可能性はあるか?
- 報告バイアス: 非有意のものを含むすべてのアウトカムが報告されているか?
- 確証バイアス: 著者は仮説を支持する証拠のみを探したか?
- 生存者バイアス: 脱落者、除外データ、失敗した実験は考慮されているか?
- 資金バイアス: 資金源が開示されており、所見に影響する可能性はあるか?
- 出版バイアス: これは全体像か、それとも否定的結果が欠けている可能性はあるか?
期待結果: 論文からの具体例を挙げて潜在的バイアスが特定されている。 失敗時: 利用可能な情報からバイアスを評価できない場合は、著者がこれを明示的に対処することを推奨する。
ステップ6: レビューの執筆
建設的な構造でレビューを執筆する:
## Summary
[2-3 sentences summarizing the paper's contribution and your overall assessment]
## Major Concerns
[Issues that must be addressed before the work can be considered sound]
1. **[Concern title]**: [Specific description with reference to section/page/figure]
- *Suggestion*: [How the authors might address this]
2. ...
## Minor Concerns
[Issues that improve quality but are not fundamental]
1. **[Concern title]**: [Specific description]
- *Suggestion*: [Recommended change]
## Questions for the Authors
[Clarifications needed to complete the evaluation]
1. ...
## Positive Observations
[Specific strengths worth acknowledging]
1. ...
## Recommendation
[Accept / Minor revision / Major revision / Reject]
[Brief rationale for the recommendation]
期待結果: レビューが具体的、建設的であり、論文内の正確な箇所を参照している。 失敗時: レビューが長くなりすぎる場合は、重大な懸念点を優先し、軽微な問題はサマリーリストに記載する。
バリデーション
- すべての重大な懸念点が特定のセクション、図、または主張を参照している
- フィードバックが建設的である — 問題には提案が添えられている
- 懸念点と並んで良い点が認められている
- 統計的評価が使用された分析手法と一致している
- 再現可能性が明示的に評価されている
- 推奨事項が提起した懸念点の重大度と一致している
- トーンが専門的、敬意を持った、同僚的なものである
よくある落とし穴
- 曖昧な批判: 「手法が弱い」は役に立たない。何が弱く、なぜ弱いのかを具体的に述べること。
- 別の研究を要求する: 実施された研究をレビューすること。自分がやりたかった研究ではなく。
- 範囲の無視: 会議論文はジャーナル論文と異なる期待水準を持つ。
- 人身攻撃: 研究をレビューするのであり、著者をレビューするのではない。著者のアイデンティティに言及しないこと。
- 完璧主義: 完璧な研究は存在しない。結論を変える懸念点に集中すること。
関連スキル
review-data-analysis— データ品質とモデル検証に深く焦点を当てたレビューformat-apa-report— 研究レポートのAPA書式標準generate-statistical-tables— 出版対応の統計テーブルvalidate-statistical-output— 統計出力の検証
GitHub Repository
Verwandte Skills
llamaguard
AndereLlamaGuard ist Metas 7-8B-Parameter-Modell zur Moderation von LLM-Eingaben und -Ausgaben in sechs Sicherheitskategorien wie Gewalt und Hassrede. Es bietet eine Genauigkeit von 94-95 % und kann mit vLLM, Hugging Face oder Amazon SageMaker eingesetzt werden. Nutzen Sie diese Skill, um Inhaltsfilterung und Sicherheitsguardrails einfach in Ihre KI-Anwendungen zu integrieren.
cost-optimization
AndereDiese Claude Skill unterstützt Entwickler bei der Optimierung von Cloud-Kosten durch Ressourcen-Dimensionierung, Tagging-Strategien und Ausgabenanalysen. Sie bietet einen Rahmen zur Senkung von Cloud-Ausgaben und zur Implementierung von Kosten-Governance für AWS, Azure und GCP. Nutzen Sie sie, wenn Sie Infrastrukturkosten analysieren, Ressourcen richtig dimensionieren oder Budgetvorgaben einhalten müssen.
quantizing-models-bitsandbytes
AndereDiese Fähigkeit quantisiert LLMs auf 8-Bit- oder 4-Bit-Präzision mittels bitsandbytes und erreicht dabei eine Speicherreduzierung von 50–75 % bei minimalem Genauigkeitsverlust. Sie ist ideal für den Betrieb größerer Modelle mit begrenztem GPU-Speicher oder zur Beschleunigung von Inferenzvorgängen und unterstützt Formate wie INT8, NF4 und FP4. Die Fähigkeit integriert sich in HuggingFace Transformers und ermöglicht QLoRA-Training sowie 8-Bit-Optimierer.
dispatching-parallel-agents
AndereDiese Claude-Fähigkeit verteilt mehrere Agenten, um drei oder mehr unabhängige Probleme gleichzeitig zu untersuchen und zu beheben. Sie ist für Szenarien konzipiert, die unabhängige Fehler umfassen, die ohne gemeinsamen Zustand oder Abhängigkeiten gelöst werden können. Die Kernfähigkeit ist die parallele Problemlösung, bei der pro unabhängigem Problembereich ein Agent zugewiesen wird, um die Effizienz zu maximieren.
