SKILL·20CF6F

determinism

Name: determinism
Author: majiayu000

majiayu000

更新日 2 months ago

16 閲覧

テストai

について

決定論スキルは、主観的なLLM判断を実行可能なコード検証に置き換えることで、再現可能な結果を保証します。SHA256ハッシュ検証によるバージョン管理されたプロンプトを提供し、明確な合格/不合格の結果のためにブーリアン終了コードを使用します。一貫した決定論的なエージェント動作が要求される重要な検証タスクに、このスキルをご利用ください。

クイックインストール

Claude Code

推奨

メイン

npx skills add majiayu000/claude-skill-registry -a claude-code

プラグインコマンド代替

/plugin add https://github.com/majiayu000/claude-skill-registry

Git クローン代替

git clone https://github.com/majiayu000/claude-skill-registry.git ~/.claude/skills/determinism

このコマンドをClaude Codeにコピー＆ペーストしてスキルをインストールします

GitHub リポジトリ

majiayu000/claude-skill-registry

パス: skills/data/determinism

FAQ

Frequently asked questions

What is the determinism skill?

determinism is a Claude Skill by majiayu000. Skills package instructions and resources that Claude loads on demand, so Claude can perform determinism-related tasks without extra prompting.

How do I install determinism?

Use the install commands on this page: add determinism to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does determinism belong to?

determinism is in the Testing category, tagged ai.

Is determinism free to use?

Yes. determinism is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

関連スキル

evaluating-llms-harness

テスト

このClaudeスキルは、lm-evaluation-harnessを実行し、MMLUやGSM8Kなど60以上の標準化学術タスクでLLMをベンチマークします。開発者がモデルの品質を比較し、トレーニングの進捗を追跡し、学術的な結果を報告するために設計されています。このツールはHuggingFaceやvLLMモデルを含む様々なバックエンドをサポートしています。

スキルを見る

cloudflare-cron-triggers

テスト

このスキルは、cron式を使用してWorkersをスケジュールするためのCloudflare Cron Triggersの実装に関する包括的な知識を提供します。定期的なタスクの設定、メンテナンスジョブ、自動化されたワークフローの構築を網羅し、無効なcron式やタイムゾーン問題といった一般的な課題への対処法も含みます。開発者はこれを使用して、スケジュールされたハンドラーの設定、cronトリガーのテスト、WorkflowsやGreen Computeとの連携を構成できます。

スキルを見る

webapp-testing

テスト

このClaude Skillは、Playwrightベースのツールキットを提供し、Pythonスクリプトを通じてローカルWebアプリケーションのテストを可能にします。フロントエンドの検証、UIデバッグ、スクリーンショット撮影、ログ表示を実現し、サーバーライフサイクルを管理します。ブラウザ自動化タスクにご利用いただけますが、コンテキストの汚染を避けるため、スクリプトのソースコードを読むのではなく直接実行してください。

スキルを見る

finishing-a-development-branch

テスト

このスキルは、開発者がテストの合格を確認し、構造化された統合オプションを提示することで、完成した作業を仕上げることを支援します。実装が完了した後のマージ、PR作成、ブランチの整理といったワークフローを案内します。コードが準備できてテスト済みの際に使用し、開発プロセスを体系的に完了させましょう。

スキルを見る