llava

zechenzhangAGI

更新日 28 days ago

259 閲覧

デザインdesign

について

LLaVAはオープンソースのビジョン言語モデルであり、視覚的質問応答とマルチターン画像チャットを通じて対話型画像分析を実現します。CLIPの画像エンコーディングとVicunaなどの言語モデルを組み合わせることで、ビジョン言語チャットボットや画像理解タスクをサポートします。開発者は、画像入力機能を備えた対話型AIを必要とするアプリケーション構築にこれを活用すべきです。

クイックインストール

Claude Code

推奨

メイン

npx skills add zechenzhangAGI/AI-research-SKILLs -a claude-code

プラグインコマンド代替

/plugin add https://github.com/zechenzhangAGI/AI-research-SKILLs

Git クローン代替

git clone https://github.com/zechenzhangAGI/AI-research-SKILLs.git ~/.claude/skills/llava

このコマンドをClaude Codeにコピー＆ペーストしてスキルをインストールします

GitHub リポジトリ

zechenzhangAGI/AI-research-SKILLs

パス: 18-multimodal/llava

aiai-researchclaudeclaude-codeclaude-skillscodex

関連スキル

executing-plans

デザイン

executing-plansスキルは、完全な実装計画があり、それを管理されたバッチでレビューチェックポイントを設けながら実行する場合に使用します。このスキルは計画を読み込んで批判的にレビューした後、小さなバッチ（デフォルトは3タスク）でタスクを実行し、各バッチの間に進捗状況を報告してアーキテクトのレビューを受けます。これにより、品質管理チェックポイントが組み込まれた体系的な実装が保証されます。

スキルを見る

requesting-code-review

デザイン

このスキルは、コードレビュアーサブエージェントを起動し、処理を進める前に要件に対してコード変更を分析します。タスク完了後、主要な機能の実装後、またはmainブランチへのマージ前などに使用すべきです。このレビューは、現在の実装と元の計画を比較することで、問題を早期に発見するのに役立ちます。

スキルを見る

connect-mcp-server

デザイン

このスキルは、開発者がHTTP、stdio、またはSSEトランスポートを使用してMCPサーバーをClaude Codeに接続するための包括的なガイドを提供します。GitHub、Notion、カスタムAPIなどの外部サービスを統合するためのインストール、設定、認証、セキュリティについて解説しています。MCP統合のセットアップ、外部ツールの設定、またはClaudeのModel Context Protocolを扱う際にご利用ください。

スキルを見る

web-cli-teleport

デザイン

このスキルは、タスク分析に基づいて開発者がClaude Code WebとCLIインターフェースの選択を支援し、これらの環境間でのシームレスなセッションテレポーテーションを可能にします。Web、CLI、モバイル環境を切り替える際のセッション状態とコンテキストを管理することで、ワークフローを最適化します。様々な段階で異なるツールを必要とする複雑なプロジェクトにご活用ください。

スキルを見る