SKILL·19C44D

gguf-quantization

Name: gguf-quantization
Author: davila7

davila7

Aktualisiert 2 months ago

568 Ansichten

18,478

1,685

18,478

Auf GitHub ansehen

DesignGGUFQuantizationllama.cppCPU InferenceApple SiliconModel CompressionOptimization

Über

Diese Fähigkeit ermöglicht GGUF-Quantisierung für effiziente Modellbereitstellung auf Consumer-Hardware wie CPUs und Apple Silicon. Sie bietet flexible 2-8 Bit Quantisierungsoptionen ohne GPU-Beschleunigung. Nutzen Sie sie, wenn Sie Modelle für lokale Inferenz-Tools oder ressourcenbeschränkte Umgebungen optimieren.

Schnellinstallation

Claude Code

GitHub Repository

davila7/claude-code-templates

Pfad: cli-tool/components/skills/ai-research/optimization-gguf

anthropicanthropic-claudeclaudeclaude-code

FAQ

Frequently asked questions

What is the gguf-quantization skill?

gguf-quantization is a Claude Skill by davila7. Skills package instructions and resources that Claude loads on demand, so Claude can perform gguf-quantization-related tasks without extra prompting.

How do I install gguf-quantization?

Use the install commands on this page: add gguf-quantization to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does gguf-quantization belong to?

gguf-quantization is in the Design category, tagged GGUF, Quantization, llama.cpp, CPU Inference, Apple Silicon and Model Compression.

Is gguf-quantization free to use?

Yes. gguf-quantization is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

Verwandte Skills

executing-plans

Design

Verwenden Sie die Fähigkeit "executing-plans", wenn Sie einen vollständigen Implementierungsplan zur Ausführung in kontrollierten Batches mit Überprüfungspunkten vorliegen haben. Sie lädt den Plan und überprüft ihn kritisch, führt dann Aufgaben in kleinen Batches (standardmäßig 3 Aufgaben) aus und meldet den Fortschritt zwischen jedem Batch zur Überprüfung durch den Architekten. Dies gewährleistet eine systematische Implementierung mit integrierten Qualitätskontrollpunkten.

Skill ansehen

requesting-code-review

Design

Diese Fähigkeit sendet einen Unteragenten für Code-Review, um Codeänderungen anhand der Anforderungen zu analysieren, bevor fortgefahren wird. Sie sollte nach dem Abschließen von Aufgaben, der Implementierung größerer Funktionen oder vor dem Zusammenführen in den Hauptzweig verwendet werden. Die Überprüfung hilft dabei, Probleme frühzeitig zu erkennen, indem die aktuelle Implementierung mit dem ursprünglichen Plan verglichen wird.

Skill ansehen

connect-mcp-server

Design

Diese Fähigkeit bietet Entwicklern eine umfassende Anleitung, um MCP-Server über HTTP-, stdio- oder SSE-Transports mit Claude Code zu verbinden. Sie behandelt Installation, Konfiguration, Authentifizierung und Sicherheit für die Integration externer Dienste wie GitHub, Notion und benutzerdefinierter APIs. Nutzen Sie sie beim Einrichten von MCP-Integrationen, bei der Konfiguration externer Tools oder bei der Arbeit mit Claude's Model Context Protocol.

Skill ansehen

web-cli-teleport

Design

Diese Fähigkeit unterstützt Entwickler bei der Wahl zwischen Claude Code Web- und CLI-Schnittstellen basierend auf Aufgabenanalysen und ermöglicht nahtloses Session-Teleporting zwischen diesen Umgebungen. Sie optimiert den Workflow, indem sie den Sitzungsstatus und Kontext beim Wechsel zwischen Web, CLI oder Mobilgeräten verwaltet. Nutzen Sie sie für komplexe Projekte, die in verschiedenen Phasen unterschiedliche Werkzeuge erfordern.

Skill ansehen