MCP HubMCP Hub
Вернуться к навыкам

model-routing

frankxai
Обновлено 2 days ago
2
2
Посмотреть на GitHub
Другоеai

О программе

Навык маршрутизации моделей автоматически выбирает оптимальную модель Claude (Haiku, Sonnet или Opus) на основе анализа сложности задачи, чтобы сбалансировать скорость, стоимость и возможности. Он направляет простые задачи в Haiku для эффективности, использует Sonnet для сбалансированных рабочих нагрузок и резервирует Opus для сложного стратегического анализа. Это предоставляет разработчикам интеллектуальную оптимизацию затрат при сохранении соответствующей производительности модели для каждой задачи.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add frankxai/agentic-creator-os -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/frankxai/agentic-creator-os
Git клонированиеАльтернативный
git clone https://github.com/frankxai/agentic-creator-os.git ~/.claude/skills/model-routing

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

GitHub репозиторий

frankxai/agentic-creator-os
Путь: .claude/skills/model-routing
0
agentic-skillsai-agentsautonomous-codingclaude-codeclaude-code-pluginscontext-engineering

Похожие навыки

llamaguard

Другое

LlamaGuard — это модель от Meta с 7–8 миллиардами параметров для модерации входных и выходных данных больших языковых моделей по шести категориям безопасности, таким как насилие и разжигание ненависти. Она обеспечивает точность 94–95% и может быть развернута с помощью vLLM, Hugging Face или Amazon SageMaker. Используйте этот навык, чтобы легко интегрировать фильтрацию контента и защитные механизмы в ваши ИИ-приложения.

Просмотреть навык

cost-optimization

Другое

Этот навык Claude помогает разработчикам оптимизировать облачные расходы за счет правильного подбора ресурсов, стратегий тегирования и анализа затрат. Он предоставляет framework для сокращения облачных расходов и внедрения управления затратами в AWS, Azure и GCP. Используйте его, когда вам нужно проанализировать расходы на инфраструктуру, оптимизировать ресурсы или уложиться в бюджетные ограничения.

Просмотреть навык

quantizing-models-bitsandbytes

Другое

Этот навык выполняет квантизацию LLM до 8-битной или 4-битной точности с использованием библиотеки bitsandbytes, обеспечивая сокращение использования памяти на 50-75% при минимальной потере точности. Он идеально подходит для запуска больших моделей при ограниченной памяти GPU или для ускорения вывода, поддерживая форматы INT8, NF4 и FP4. Навык интегрируется с HuggingFace Transformers и позволяет использовать обучение QLoRA и 8-битные оптимизаторы.

Просмотреть навык

dispatching-parallel-agents

Другое

Этот навык Claude распределяет нескольких агентов для исследования и устранения трёх и более независимых проблем параллельно. Он предназначен для сценариев с несвязанными сбоями, которые можно устранить без общего состояния или зависимостей. Ключевая возможность — параллельное решение проблем, где за каждую независимую предметную область назначается отдельный агент для максимальной эффективности.

Просмотреть навык