MCP HubMCP Hub
Volver a habilidades

blip-2-vision-language

davila7
Actualizado 27 days ago
533 vistas
18,478
1,685
18,478
Ver en GitHub
DiseñoMultimodalVision-LanguageImage CaptioningVQAZero-Shot

Acerca de

BLIP-2 es un marco de trabajo de visión y lenguaje que conecta un codificador de imágenes congelado con un modelo de lenguaje grande para tareas multimodales. Úsalo para generar descripciones de imágenes en modo zero-shot, responder preguntas visuales o recuperar información imagen-texto sin ajuste específico por tarea. Es ideal para desarrolladores que necesitan añadir comprensión visual de vanguardia a aplicaciones basadas en LLM.

Instalación rápida

Claude Code

Recomendado
Principal
npx skills add davila7/claude-code-templates -a claude-code
Comando PluginAlternativo
/plugin add https://github.com/davila7/claude-code-templates
Git CloneAlternativo
git clone https://github.com/davila7/claude-code-templates.git ~/.claude/skills/blip-2-vision-language

Copia y pega este comando en Claude Code para instalar esta habilidad

Repositorio GitHub

davila7/claude-code-templates
Ruta: cli-tool/components/skills/ai-research/multimodal-blip-2
0
anthropicanthropic-claudeclaudeclaude-code

Habilidades relacionadas

executing-plans

Diseño

Utilice la habilidad executing-plans cuando tenga un plan de implementación completo para ejecutar en lotes controlados con puntos de revisión. Esta habilidad carga y revisa críticamente el plan, luego ejecuta tareas en pequeños lotes (por defecto 3 tareas) mientras reporta el progreso entre cada lote para la revisión del arquitecto. Esto asegura una implementación sistemática con puntos de control de calidad integrados.

Ver habilidad

requesting-code-review

Diseño

Esta habilidad despacha un subagente revisor de código para analizar los cambios en el código frente a los requisitos antes de proceder. Debe usarse después de completar tareas, implementar funciones principales o antes de fusionar con la rama principal. La revisión ayuda a detectar problemas de forma temprana al comparar la implementación actual con el plan original.

Ver habilidad

connect-mcp-server

Diseño

Esta habilidad proporciona una guía integral para que los desarrolladores conecten servidores MCP a Claude Code mediante transportes HTTP, stdio o SSE. Cubre la instalación, configuración, autenticación y seguridad para integrar servicios externos como GitHub, Notion y APIs personalizadas. Úsala al configurar integraciones MCP, al configurar herramientas externas o al trabajar con el Protocolo de Contexto del Modelo de Claude.

Ver habilidad

web-cli-teleport

Diseño

Esta habilidad ayuda a los desarrolladores a elegir entre las interfaces web y CLI de Claude Code mediante el análisis de tareas, y luego permite la teletransportación fluida de sesiones entre estos entornos. Optimiza el flujo de trabajo gestionando el estado y el contexto de la sesión al cambiar entre web, CLI o móvil. Úsala para proyectos complejos que requieren diferentes herramientas en varias etapas.

Ver habilidad