MCP HubMCP Hub
Вернуться к навыкам

Model Hyperparameter Tuning

aj-geddes
Обновлено 28 days ago
89 просмотров
74
9
74
Посмотреть на GitHub
Другоеautomation

О программе

Этот навык позволяет проводить систематическую оптимизацию гиперпараметров с использованием методов полного перебора, случайного поиска и байесовской оптимизации с помощью таких фреймворков, как Optuna. Используйте его для максимизации производительности модели, находя наилучшие конфигурации параметров для сложных моделей, таких как нейронные сети или ансамбли. Он помогает разработчикам улучшать обобщающую способность моделей и эффективно исследовать большие пространства параметров.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add aj-geddes/useful-ai-prompts -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/aj-geddes/useful-ai-prompts
Git клонированиеАльтернативный
git clone https://github.com/aj-geddes/useful-ai-prompts.git ~/.claude/skills/Model Hyperparameter Tuning

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

GitHub репозиторий

aj-geddes/useful-ai-prompts
Путь: skills/model-hyperparameter-tuning
0

Похожие навыки

llamaguard

Другое

LlamaGuard — это модель от Meta с 7–8 миллиардами параметров для модерации входных и выходных данных больших языковых моделей по шести категориям безопасности, таким как насилие и разжигание ненависти. Она обеспечивает точность 94–95% и может быть развернута с помощью vLLM, Hugging Face или Amazon SageMaker. Используйте этот навык, чтобы легко интегрировать фильтрацию контента и защитные механизмы в ваши ИИ-приложения.

Просмотреть навык

cost-optimization

Другое

Этот навык Claude помогает разработчикам оптимизировать облачные расходы за счет правильного подбора ресурсов, стратегий тегирования и анализа затрат. Он предоставляет framework для сокращения облачных расходов и внедрения управления затратами в AWS, Azure и GCP. Используйте его, когда вам нужно проанализировать расходы на инфраструктуру, оптимизировать ресурсы или уложиться в бюджетные ограничения.

Просмотреть навык

quantizing-models-bitsandbytes

Другое

Этот навык выполняет квантизацию LLM до 8-битной или 4-битной точности с использованием библиотеки bitsandbytes, обеспечивая сокращение использования памяти на 50-75% при минимальной потере точности. Он идеально подходит для запуска больших моделей при ограниченной памяти GPU или для ускорения вывода, поддерживая форматы INT8, NF4 и FP4. Навык интегрируется с HuggingFace Transformers и позволяет использовать обучение QLoRA и 8-битные оптимизаторы.

Просмотреть навык

dispatching-parallel-agents

Другое

Этот навык Claude распределяет нескольких агентов для исследования и устранения трёх и более независимых проблем параллельно. Он предназначен для сценариев с несвязанными сбоями, которые можно устранить без общего состояния или зависимостей. Ключевая возможность — параллельное решение проблем, где за каждую независимую предметную область назначается отдельный агент для максимальной эффективности.

Просмотреть навык