SKILL·91F9F0

tensorrt-llm

Name: tensorrt-llm
Author: zechenzhangAGI

zechenzhangAGI

更新日 2 months ago

265 閲覧

その他ai

について

TensorRT-LLMは、NVIDIA GPU上で大規模言語モデル(LLM)の推論を最大スループットと最低レイテンシに向けて最適化するNVIDIA製ライブラリです。量子化やマルチGPUスケーリングなどの機能をサポートし、PyTorch比10～100倍高速な性能が求められるプロダクション環境での導入に最適です。NVIDIAハードウェア上で最高のパフォーマンスが必要な場合にご利用ください。よりシンプルな設定の場合はvLLMを、CPUまたはApple Siliconの場合はllama.cppなどの代替手段を選択することをお勧めします。

クイックインストール

Claude Code

推奨

メイン

npx skills add zechenzhangAGI/AI-research-SKILLs -a claude-code

プラグインコマンド代替

/plugin add https://github.com/zechenzhangAGI/AI-research-SKILLs

Git クローン代替

git clone https://github.com/zechenzhangAGI/AI-research-SKILLs.git ~/.claude/skills/tensorrt-llm

このコマンドをClaude Codeにコピー＆ペーストしてスキルをインストールします

GitHub リポジトリ

zechenzhangAGI/AI-research-SKILLs

パス: 12-inference-serving/tensorrt-llm

aiai-researchclaudeclaude-codeclaude-skillscodex

FAQ

Frequently asked questions

What is the tensorrt-llm skill?

tensorrt-llm is a Claude Skill by zechenzhangAGI. Skills package instructions and resources that Claude loads on demand, so Claude can perform tensorrt-llm-related tasks without extra prompting.

How do I install tensorrt-llm?

Use the install commands on this page: add tensorrt-llm to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does tensorrt-llm belong to?

tensorrt-llm is in the Other category, tagged ai.

Is tensorrt-llm free to use?

Yes. tensorrt-llm is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

関連スキル

llamaguard

その他

LlamaGuardは、暴力やヘイトスピーチなど6つの安全性カテゴリーにおいて、LLMの入力と出力をモデレートするMetaの70-80億パラメータモデルです。94〜95%の精度を提供し、vLLM、Hugging Face、Amazon SageMakerを使用してデプロイ可能です。このスキルを使用して、AIアプリケーションにコンテンツフィルタリングと安全策を簡単に統合できます。

スキルを見る

cost-optimization

その他

このClaudeスキルは、リソースの適正サイジング、タグ付け戦略、支出分析を通じて、開発者がクラウドコストを最適化することを支援します。AWS、Azure、GCPにわたるクラウド支出の削減とコストガバナンスの実施のためのフレームワークを提供します。インフラコストの分析、リソースの適正サイジング、または予算制約への対応が必要な際にご利用ください。

スキルを見る

sports-betting-analyzer

その他

このClaudeスキルは、スポーツベッティング市場（スプレッド、オーバー/アンダー、プロップベットなど）を分析し、過去の傾向や状況統計を検証することでバリューベットを特定します。教育目的のための実践的な提案を構造化されたマークダウン形式で出力します。開発者はスポーツベッティング分析ツールとして本機能を活用できますが、娯楽および教育目的に限定されている点に留意してください。

スキルを見る

quantizing-models-bitsandbytes

その他

このスキルは、bitsandbytesを使用してLLMを8ビットまたは4ビット精度に量子化し、精度の低下を最小限に抑えつつ50〜75％のメモリ削減を実現します。限られたGPUメモリでより大規模なモデルを実行したり、推論を高速化するのに理想的で、INT8、NF4、FP4などのフォーマットをサポートしています。HuggingFace Transformersと統合され、QLoRAトレーニングや8ビットオプティマイザーを可能にします。

スキルを見る