SKILL·399CDA

exploration-strategies

Name: exploration-strategies
Author: mattnigh

mattnigh

更新日 1 month ago

12 閲覧

その他general

について

このスキルは、スパースな報酬や大規模な状態空間に直面する強化学習エージェントの探索戦略を開発者が実装し、トラブルシューティングすることを支援します。ε-greedy、UCB、そしてRNDのような好奇心駆動型アプローチによる内発的動機づけといった主要な手法を網羅しています。エージェントが局所最適解に陥っている場合や、適切な探索技術を選択・調整する必要がある場合にご利用ください。

クイックインストール

Claude Code

推奨

メイン

npx skills add mattnigh/skills_collection -a claude-code

プラグインコマンド代替

/plugin add https://github.com/mattnigh/skills_collection

Git クローン代替

git clone https://github.com/mattnigh/skills_collection.git ~/.claude/skills/exploration-strategies

このコマンドをClaude Codeにコピー＆ペーストしてスキルをインストールします

GitHub リポジトリ

mattnigh/skills_collection

パス: collection/tachyon-beep__hamlet__claude__skills__yzmir-deep-rl__skills__exploration-strategies__SKILL.md

FAQ

Frequently asked questions

What is the exploration-strategies skill?

exploration-strategies is a Claude Skill by mattnigh. Skills package instructions and resources that Claude loads on demand, so Claude can perform exploration-strategies-related tasks without extra prompting.

How do I install exploration-strategies?

Use the install commands on this page: add exploration-strategies to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does exploration-strategies belong to?

exploration-strategies is in the Other category, tagged general.

Is exploration-strategies free to use?

Yes. exploration-strategies is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

関連スキル

llamaguard

その他

LlamaGuardは、暴力やヘイトスピーチなど6つの安全性カテゴリーにおいて、LLMの入力と出力をモデレートするMetaの70-80億パラメータモデルです。94〜95%の精度を提供し、vLLM、Hugging Face、Amazon SageMakerを使用してデプロイ可能です。このスキルを使用して、AIアプリケーションにコンテンツフィルタリングと安全策を簡単に統合できます。

スキルを見る

cost-optimization

その他

このClaudeスキルは、リソースの適正サイジング、タグ付け戦略、支出分析を通じて、開発者がクラウドコストを最適化することを支援します。AWS、Azure、GCPにわたるクラウド支出の削減とコストガバナンスの実施のためのフレームワークを提供します。インフラコストの分析、リソースの適正サイジング、または予算制約への対応が必要な際にご利用ください。

スキルを見る

sports-betting-analyzer

その他

このClaudeスキルは、スポーツベッティング市場（スプレッド、オーバー/アンダー、プロップベットなど）を分析し、過去の傾向や状況統計を検証することでバリューベットを特定します。教育目的のための実践的な提案を構造化されたマークダウン形式で出力します。開発者はスポーツベッティング分析ツールとして本機能を活用できますが、娯楽および教育目的に限定されている点に留意してください。

スキルを見る

quantizing-models-bitsandbytes

その他

このスキルは、bitsandbytesを使用してLLMを8ビットまたは4ビット精度に量子化し、精度の低下を最小限に抑えつつ50〜75％のメモリ削減を実現します。限られたGPUメモリでより大規模なモデルを実行したり、推論を高速化するのに理想的で、INT8、NF4、FP4などのフォーマットをサポートしています。HuggingFace Transformersと統合され、QLoRAトレーニングや8ビットオプティマイザーを可能にします。

スキルを見る