SKILL·3C8C6E

torchserve

Name: torchserve
Author: cuba6112

cuba6112

Mis à jour 1 month ago

10 vues

Développementapi

À propos

TorchServe est un moteur de production pour la mise en service de modèles PyTorch, qui empaquette les modèles dans des fichiers MAR et les sert via des API REST/gRPC. Il est idéal lorsque vous avez besoin d'une logique de prétraitement et d'inférence personnalisée via des gestionnaires Python et d'une mise à l'échelle automatique des workers multi-GPU. Utilisez-le pour gérer le traitement par lots des requêtes, l'équilibrage de charge et la gestion de multiples versions de modèles en déploiement.

Installation rapide

Claude Code

Recommandé

Principal

npx skills add cuba6112/skillfactory -a claude-code

Commande PluginAlternatif

/plugin add https://github.com/cuba6112/skillfactory

Git CloneAlternatif

git clone https://github.com/cuba6112/skillfactory.git ~/.claude/skills/torchserve

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Dépôt GitHub

cuba6112/skillfactory

Chemin: skills/torchserve

FAQ

Frequently asked questions

What is the torchserve skill?

torchserve is a Claude Skill by cuba6112. Skills package instructions and resources that Claude loads on demand, so Claude can perform torchserve-related tasks without extra prompting.

How do I install torchserve?

Use the install commands on this page: add torchserve to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does torchserve belong to?

torchserve is in the Development category, tagged api.

Is torchserve free to use?

Yes. torchserve is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

Compétences associées

qmd

Développement

qmd est un outil CLI de recherche et d'indexation locale qui permet aux développeurs d'indexer et de rechercher dans des fichiers locaux en utilisant une recherche hybride combinant BM25, des embeddings vectoriels et du reranking. Il prend en charge à la fois une utilisation en ligne de commande et un mode MCP (Model Context Protocol) pour l'intégration avec Claude. L'outil utilise Ollama pour les embeddings et stocke les index localement, ce qui le rend idéal pour rechercher dans de la documentation ou des bases de code directement depuis le terminal.

Voir la compétence

subagent-driven-development

Développement

Cette compétence exécute des plans de mise en œuvre en déployant un nouveau sous-agent pour chaque tâche indépendante, avec une revue de code entre les tâches. Elle permet une itération rapide tout en maintenant des contrôles de qualité grâce à ce processus de revue. Utilisez-la lorsque vous travaillez sur des tâches principalement indépendantes au sein d'une même session pour assurer une progression continue avec des vérifications de qualité intégrées.

Voir la compétence

mcporter

Développement

La compétence mcporter permet aux développeurs de gérer et d'appeler des serveurs Model Context Protocol (MCP) directement depuis Claude. Elle fournit des commandes pour lister les serveurs disponibles, appeler leurs outils avec des arguments, et gérer l'authentification ainsi que le cycle de vie du démon. Utilisez cette compétence pour intégrer et tester les fonctionnalités des serveurs MCP dans votre flux de travail de développement.

Voir la compétence

adk-deployment-specialist

Développement

Cette compétence déploie et orchestre des agents Vertex AI ADK en utilisant le protocole A2A, gérant la découverte d'AgentCard, la soumission de tâches, et prenant en charge des outils tels que le bac à sable d'exécution de code et la banque de mémoire. Elle permet de construire des systèmes multi-agents avec des modèles d'orchestration séquentiels, parallèles ou en boucle en Python, Java ou Go. Utilisez-la lorsqu'on vous demande de déployer des agents ADK ou d'orchestrer des flux de travail d'agents sur Google Cloud.

Voir la compétence