MCP HubMCP Hub
Retour aux compétences

plagiarism-checker

bitwize-music-studio
Mis à jour 2 days ago
1 vues
209
37
209
Voir sur GitHub
Autreai

À propos

Cette compétence analyse les paroles de chansons pour détecter d'éventuels plagiats en extrayant les phrases distinctives et en les vérifiant par rapport aux résultats de recherche web et aux connaissances des LLM. Elle génère un rapport de risque structuré pour identifier les emprunts involontaires avant la publication. Les développeurs doivent l'utiliser comme un outil de contrôle qualité lors de la préparation de musique pour la publication.

Installation rapide

Claude Code

Recommandé
Principal
npx skills add bitwize-music-studio/claude-ai-music-skills -a claude-code
Commande PluginAlternatif
/plugin add https://github.com/bitwize-music-studio/claude-ai-music-skills
Git CloneAlternatif
git clone https://github.com/bitwize-music-studio/claude-ai-music-skills.git ~/.claude/skills/plagiarism-checker

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Documentation

Your Task

Target: $ARGUMENTS

  1. Get lyrics for the specified track(s)
  2. Extract distinctive phrases using MCP tool
  3. Web search top phrases for matches against known songs
  4. Use LLM knowledge to independently flag similarities
  5. Generate structured risk report

Plagiarism Checker

You scan lyrics for phrases that may unintentionally echo existing songs. This is a quality check, not a legal tool — it catches borrowing early so the writer can revise before release.


Workflow

Step 1: Get Lyrics

  • Use extract_section(album_slug, track_slug, "streaming") to get streaming lyrics (preferred — no phonetic spellings that confuse web searches)
  • If streaming lyrics empty, fall back to extract_section(album_slug, track_slug, "lyrics") for Suno lyrics
  • If raw text was provided instead of album/track reference, use that directly

Step 2: Extract Distinctive Phrases

Call extract_distinctive_phrases(text, max_phrases=15, include_raw_lines=False) MCP tool. This returns:

  • Distinctive 4-7 word n-grams ranked by section priority (top 15)
  • Pre-formatted search suggestions with quoted phrases + "lyrics"
  • Common cliches already filtered out

Step 3: Web Search

  • Search the top 10-15 search_suggestions returned by the tool using WebSearch
  • For short lyrics (<100 words), limit to 5-8 searches
  • Look for results that reference specific songs by title/artist
  • Skip results that are:
    • Lyrics aggregator sites listing hundreds of matches (too generic)
    • Dictionary/reference pages
    • The user's own published work

Step 4: Deep Compare

For any search result that names a specific song:

  1. WebFetch the lyrics page
  2. Compare the matching section against the user's lyrics
  3. Check if the match is:
    • Exact consecutive words (5+) — HIGH risk
    • Partial overlap (4 words) — MEDIUM risk
    • Thematic similarity only — LOW risk

Step 5: LLM Knowledge Check

Independently scan ALL lines of the lyrics (not just extracted phrases) using your training knowledge:

  • Flag any line that closely resembles a well-known song lyric
  • Include the suspected source song and artist
  • Note whether the similarity is in words, melody hook phrasing, or concept

Step 6: Generate Report


Risk Levels

LevelCriteriaAction
HIGH5+ consecutive matching words from a known song, especially chorus/hookRewrite the line immediately
MEDIUM4-word match from known song, or structural similarity flagged by LLMReview and consider rewording
LOWCommon phrasing overlap, likely coincidenceNote for awareness, no action needed

Output Format

PLAGIARISM CHECK REPORT
Album: [Album Name]
Track: [Track Title]
Date: [Scan Date]

PHRASES SEARCHED: [N]
WEB MATCHES FOUND: [N]
LLM FLAGS: [N]

FINDINGS:
------------------------------------------------------------------------

[HIGH] Line 12 (Chorus): "burning shadows fall tonight across the wire"
  Match: "Shadows Fall Tonight" by [Artist] — 5 consecutive words match chorus
  Source: [URL]
  Recommendation: Rewrite this line to avoid direct overlap

[MEDIUM] Line 24 (Verse 2): "walking through the ruins of the empire"
  Similarity: Resembles "Empire" by [Artist] — similar phrasing in bridge
  Source: LLM knowledge
  Recommendation: Consider rewording if concerned

[LOW] Line 8 (Verse 1): "the city sleeps beneath the stars"
  Note: Generic night imagery, appears in many songs
  Recommendation: No action needed

------------------------------------------------------------------------

SUMMARY:
  HIGH risk findings: 1
  MEDIUM risk findings: 1
  LOW risk findings: 1

VERDICT: NEEDS REVIEW
  1 high-risk match requires attention before release.

COMMON PHRASES FILTERED: [N] (not searched — too generic to flag)

Verdicts

VerdictCriteria
CLEARNo HIGH or MEDIUM findings
NEEDS REVIEWAny MEDIUM findings, or 1 HIGH finding
REWRITE REQUIRED2+ HIGH findings

Important Notes

  • This is not a legal tool. It catches likely borrowing, not copyright infringement. Only a lawyer can determine infringement.
  • Streaming lyrics preferred. Suno lyrics contain phonetic respellings (e.g., "Seh-KYOOR-ih-tee" for "security") that will produce garbage web search results.
  • Common cliches are pre-filtered. The MCP tool removes ~75 ubiquitous phrases ("break my heart", "falling in love", etc.) before returning results. These are too common to flag.
  • Web searches may fail. If WebSearch is unavailable or rate-limited, proceed with LLM knowledge check only and note the limitation in the report.
  • Not a pre-generation gate. This check is too slow (web searches) and too unreliable (search availability) to block generation. Run it before release, not before Suno.

Running for Full Album

When given an album slug without a specific track:

  1. List all tracks via list_tracks(album_slug)
  2. Run the check for each track with status "In Progress", "Generated", or "Final"
  3. Skip tracks with status "Not Started" or "Sources Pending"
  4. Aggregate findings into a single album-level report with per-track sections

Example Invocations

/plagiarism-checker dark-tide
/plagiarism-checker dark-tide 03-the-wire

Dépôt GitHub

bitwize-music-studio/claude-ai-music-skills
Chemin: skills/plagiarism-checker
0
ai-musicai-music-toolsaudio-masteringclaudeclaude-codeclaude-code-plugin

Compétences associées

llamaguard

Autre

LlamaGuard est le modèle de Meta, doté de 7 à 8 milliards de paramètres, conçu pour modérer les entrées et sorties des LLM selon six catégories de sécurité comme la violence et les discours haineux. Il offre une précision de 94 à 95 % et peut être déployé avec vLLM, Hugging Face ou Amazon SageMaker. Utilisez cette compétence pour intégrer facilement le filtrage de contenu et des garde-fous de sécurité dans vos applications d'IA.

Voir la compétence

cost-optimization

Autre

Cette compétence de Claude aide les développeurs à optimiser les coûts du cloud grâce au redimensionnement des ressources, aux stratégies d'étiquetage et à l'analyse des dépenses. Elle fournit un cadre pour réduire les dépenses cloud et mettre en œuvre une gouvernance des coûts sur AWS, Azure et GCP. Utilisez-la lorsque vous devez analyser les coûts d'infrastructure, redimensionner les ressources ou respecter des contraintes budgétaires.

Voir la compétence

quantizing-models-bitsandbytes

Autre

Cette compétence quantifie les LLMs en précision 8 bits ou 4 bits à l'aide de bitsandbytes, permettant une réduction de 50 à 75 % de la mémoire utilisée avec une perte de précision minime. Elle est idéale pour exécuter des modèles plus volumineux sur une mémoire GPU limitée ou pour accélérer l'inférence, prenant en charge des formats comme INT8, NF4 et FP4. La compétence s'intègre à HuggingFace Transformers et permet l'entraînement QLoRA ainsi que l'utilisation d'optimiseurs en 8 bits.

Voir la compétence

dispatching-parallel-agents

Autre

Cette compétence Claude déploie plusieurs agents pour enquêter et résoudre simultanément 3 problèmes indépendants ou plus. Elle est conçue pour des scénarios impliquant des défaillances non liées qui peuvent être résolues sans état partagé ni dépendances. La capacité fondamentale est la résolution de problèmes en parallèle, en assignant un agent par domaine problématique indépendant afin de maximiser l'efficacité.

Voir la compétence