スキル一覧に戻る

perform-sweep

mattnigh
更新日 5 days ago
10 閲覧
22
1
22
GitHubで表示
テストaitestingdesign

について

perform-sweepスキルは、開発者がGRPOトレーニング実験のためのアブレーションスイープを設計、実行、監視することを可能にします。このスキルは、設定、検証、ステータス追跡コマンドを通じて、体系的なハイパーパラメータテストと仮説比較のための完全なワークフローを提供します。統合された実験分析ツールを介して、制御された実験を実行し結果を分析するために、このスキルをご利用ください。

クイックインストール

Claude Code

推奨
メイン
npx skills add mattnigh/skills_collection -a claude-code
プラグインコマンド代替
/plugin add https://github.com/mattnigh/skills_collection
Git クローン代替
git clone https://github.com/mattnigh/skills_collection.git ~/.claude/skills/perform-sweep

このコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします

GitHub リポジトリ

mattnigh/skills_collection
パス: collection/bglick13__diplomacy-v2__claude__skills__perform-sweep__SKILL.md
0

関連スキル

evaluating-llms-harness

テスト

このClaudeスキルは、lm-evaluation-harnessを実行し、MMLUやGSM8Kなど60以上の標準化学術タスクでLLMをベンチマークします。開発者がモデルの品質を比較し、トレーニングの進捗を追跡し、学術的な結果を報告するために設計されています。このツールはHuggingFaceやvLLMモデルを含む様々なバックエンドをサポートしています。

スキルを見る

cloudflare-cron-triggers

テスト

このスキルは、cron式を使用してWorkersをスケジュールするためのCloudflare Cron Triggersの実装に関する包括的な知識を提供します。定期的なタスクの設定、メンテナンスジョブ、自動化されたワークフローの構築を網羅し、無効なcron式やタイムゾーン問題といった一般的な課題への対処法も含みます。開発者はこれを使用して、スケジュールされたハンドラーの設定、cronトリガーのテスト、WorkflowsやGreen Computeとの連携を構成できます。

スキルを見る

webapp-testing

テスト

このClaude Skillは、Playwrightベースのツールキットを提供し、Pythonスクリプトを通じてローカルWebアプリケーションのテストを可能にします。フロントエンドの検証、UIデバッグ、スクリーンショット撮影、ログ表示を実現し、サーバーライフサイクルを管理します。ブラウザ自動化タスクにご利用いただけますが、コンテキストの汚染を避けるため、スクリプトのソースコードを読むのではなく直接実行してください。

スキルを見る

finishing-a-development-branch

テスト

このスキルは、開発者がテストの合格を確認し、構造化された統合オプションを提示することで、完成した作業を仕上げることを支援します。実装が完了した後のマージ、PR作成、ブランチの整理といったワークフローを案内します。コードが準備できてテスト済みの際に使用し、開発プロセスを体系的に完了させましょう。

スキルを見る