SKILL·1BF24A

actor-critic-methods

Name: actor-critic-methods
Author: majiayu000

majiayu000

Обновлено 2 months ago

28 просмотров

Другоеgeneral

О программе

Этот навык предоставляет рекомендации по реализации и устранению неполадок для продвинутых актор-критических алгоритмов обучения с подкреплением (A2C, A3C, SAC, TD3), предназначенных для задач непрерывного управления. Он помогает разработчикам выбирать подходящий алгоритм, настраивать ключевые гиперпараметры, такие как коэффициент энтропии в SAC, и решать типичные проблемы обучения, включая нестабильность или расходимость критика. Используйте его при реализации или отладке этих методов для сред с непрерывными пространствами действий.

Быстрая установка

Claude Code

Рекомендуется

Основной

npx skills add majiayu000/claude-skill-registry -a claude-code

Команда плагинаАльтернативный

/plugin add https://github.com/majiayu000/claude-skill-registry

Git клонированиеАльтернативный

git clone https://github.com/majiayu000/claude-skill-registry.git ~/.claude/skills/actor-critic-methods

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

GitHub репозиторий

majiayu000/claude-skill-registry

Путь: skills/data/actor-critic-methods

FAQ

Frequently asked questions

What is the actor-critic-methods skill?

actor-critic-methods is a Claude Skill by majiayu000. Skills package instructions and resources that Claude loads on demand, so Claude can perform actor-critic-methods-related tasks without extra prompting.

How do I install actor-critic-methods?

Use the install commands on this page: add actor-critic-methods to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does actor-critic-methods belong to?

actor-critic-methods is in the Other category, tagged general.

Is actor-critic-methods free to use?

Yes. actor-critic-methods is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

Похожие навыки

llamaguard

Другое

LlamaGuard — это модель от Meta с 7–8 миллиардами параметров для модерации входных и выходных данных больших языковых моделей по шести категориям безопасности, таким как насилие и разжигание ненависти. Она обеспечивает точность 94–95% и может быть развернута с помощью vLLM, Hugging Face или Amazon SageMaker. Используйте этот навык, чтобы легко интегрировать фильтрацию контента и защитные механизмы в ваши ИИ-приложения.

Просмотреть навык

cost-optimization

Другое

Этот навык Claude помогает разработчикам оптимизировать облачные расходы за счет правильного подбора ресурсов, стратегий тегирования и анализа затрат. Он предоставляет framework для сокращения облачных расходов и внедрения управления затратами в AWS, Azure и GCP. Используйте его, когда вам нужно проанализировать расходы на инфраструктуру, оптимизировать ресурсы или уложиться в бюджетные ограничения.

Просмотреть навык

sports-betting-analyzer

Другое

Этот навык Клода анализирует рынки спортивных ставок, включая форы, тоталы и ставки на игроков, изучая исторические тенденции и ситуационную статистику для выявления валуйных ставок. Он предоставляет структурированный вывод в формате markdown с практическими рекомендациями в образовательных целях. Разработчикам следует использовать его для инструментов анализа спортивных ставок, учитывая, что он предназначен исключительно для развлечения и обучения.

Просмотреть навык

quantizing-models-bitsandbytes

Другое

Этот навык выполняет квантизацию LLM до 8-битной или 4-битной точности с использованием библиотеки bitsandbytes, обеспечивая сокращение использования памяти на 50-75% при минимальной потере точности. Он идеально подходит для запуска больших моделей при ограниченной памяти GPU или для ускорения вывода, поддерживая форматы INT8, NF4 и FP4. Навык интегрируется с HuggingFace Transformers и позволяет использовать обучение QLoRA и 8-битные оптимизаторы.

Просмотреть навык