video-translation
정보
이 스킬은 소스를 다운로드하고, 자막을 추출하며, 텍스트를 번역하고, TTS로 새로운 오디오를 생성한 후 원본 오디오 트랙을 대체하는 방식으로 동영상을 번역 및 더빙합니다. 사용자가 언어 변경을 요청할 때 YouTube 동영상을 현지화하는 것과 같은 사용 사례를 위해 설계되었습니다. 주요 기능으로는 동영상 다운로드 처리, 자막 처리, 원본 동영상을 보존하면서 오디오 합성 등이 포함됩니다.
빠른 설치
Claude Code
추천npx skills add NoizAI/skills -a claude-code/plugin add https://github.com/NoizAI/skillsgit clone https://github.com/NoizAI/skills.git ~/.claude/skills/video-translationClaude Code에서 이 명령을 복사하여 붙여넣어 스킬을 설치하세요
문서
Video Translation
Translate a video's speech into another language, using TTS to generate the dubbed audio and replacing the original audio track.
Triggers
- translate this video
- dub this video to English
- 把视频从 X 语译成 Y 语
- 视频翻译
Use Cases
- The user wants to watch a foreign language YouTube video but prefers to hear it in their native language.
- The user provides a video link and explicitly requests changing the audio language.
Workflow
When the user asks to translate a video:
-
Download Video & Subtitles: Use the
youtube-downloaderskill to download the video and its subtitles as SRT. Make sure you specify the source language to fetch the correct subtitle.python path/to/youtube-downloader/scripts/download_video.py "VIDEO_URL" --subtitles --sub-lang <source_lang_code> -o /tmp/video-translation -
Translate Subtitles: Read the downloaded
.srtfile. Translate its contents sentence by sentence into the target language using the following fixed prompt. Keep the exact same SRT index and timestamp format!Translation Prompt:
Translate the following subtitle text from <Source Language> to <Target Language>. Provide ONLY the translated text. Do not explain, do not add notes, do not add index numbers. The translation must be colloquial, natural-sounding, and suitable for video dubbing.
Save the translated text into a new file
translated.srt. -
Generate Dubbed Audio: Use the
ttsskill to render the timeline-accurate audio from the translated SRT. The Noiz backend automatically aligns the duration of each sentence to the original video's subtitle timestamps.To ensure the cloned voice matches the original speaker's exact tone and emotion for each sentence, pass the original video file to
--ref-audio-track. The TTS engine will automatically slice the original audio at each subtitle's exact timestamp and use it as the reference for that specific segment.Create a basic
voice_map.json:{ "default": { "target_lang": "<target_lang_code>" } }Render the timeline-accurate audio:
bash skills/tts/scripts/tts.sh render --srt translated.srt --voice-map voice_map.json --backend noiz --auto-emotion --ref-audio-track original_video.mp4 -o dubbed.wav -
Replace Audio in Video: Use the
replace_audio.shscript to merge the original video with the new dubbed audio. To keep the original video's non-speech audio background outside of translated segments, pass the--srtfile.bash skills/video-translation/scripts/replace_audio.sh --video original_video.mp4 --audio dubbed.wav --output final_video.mp4 --srt translated.srt -
Present the Result: Return the
final_video.mp4file path to the user.
Inputs
- Required inputs:
VIDEO_URL: The URL of the video to translate.target_language: The language to translate the audio to.
- Optional inputs:
source_language: The language of the original video (if not auto-detected or specified).reference_audio: Specific audio file/URL to use for voice cloning instead of the dynamic original video track.
Outputs
- Success: Path to the final video file with replaced audio.
- Failure: Clear error message specifying whether download, TTS, or audio replacement failed.
Requirements
- Dependencies (other skills)
- youtube-downloader (crazynomad/skills) — SKILL.md
Install: clone or copy theskills/youtube-downloaderdirectory from crazynomad/skills into yourskills/folder so thatskills/youtube-downloader/scripts/download_video.pyis available. - tts (NoizAI/skills) — SKILL.md
If not already in this repo: clone or copy theskills/ttsdirectory from NoizAI/skills into yourskills/folder. Ensureskills/tts/scripts/tts.shand related scripts are present.
- youtube-downloader (crazynomad/skills) — SKILL.md
NOIZ_API_KEYconfigured for the Noiz backend. If it is not set, first guide the user to get an API key fromhttps://developers.noiz.ai/api-keys. After the user provides the key, ask whether they want to persist it; if they agree, either write/updateNOIZ_API_KEY=...in the project's.envfile or runbash skills/tts/scripts/tts.sh config --set-api-key YOUR_KEYto store it.ffmpeginstalled.
Limitations
- The source video must have subtitles (or auto-generated subtitles) available on the platform for the source language.
- Very long videos may take a significant amount of time to translate and dub.
GitHub 저장소
연관 스킬
llamaguard
기타LlamaGuard는 폭력 및 혐오 발언 등 6가지 안전 범주에서 LLM 입력과 출력을 조정하기 위한 Meta의 70-80억 파라미터 모델입니다. 94-95% 정확도를 제공하며 vLLM, Hugging Face 또는 Amazon SageMaker를 사용해 배포할 수 있습니다. 이 기술을 사용하여 AI 애플리케이션에 콘텐츠 필터링 및 안전 가드레일을 손쉽게 통합하세요.
cost-optimization
기타이 Claude Skill은 리소스 적정화, 태깅 전략, 지출 분석을 통해 개발자들이 클라우드 비용을 최적화할 수 있도록 지원합니다. AWS, Azure, GCP에서 클라우드 비용을 절감하고 비용 거버넌스를 구현하기 위한 프레임워크를 제공합니다. 인프라 비용을 분석하거나, 리소스를 적정화하거나, 예산 제약을 충족해야 할 때 사용하세요.
quantizing-models-bitsandbytes
기타이 스킬은 bitsandbytes를 사용하여 LLM을 8비트 또는 4비트 정밀도로 양자화하며, 최소한의 정확도 손실로 50-75%의 메모리 감소를 달성합니다. 제한된 GPU 메모리에서 더 큰 모델을 실행하거나 추론을 가속화하는 데 이상적이며, INT8, NF4, FP4와 같은 형식을 지원합니다. 이 스킬은 HuggingFace Transformers와 통합되어 QLoRA 학습 및 8비트 옵티마이저를 가능하게 합니다.
dispatching-parallel-agents
기타이 Claude Skill은 3개 이상의 독립적인 문제를 동시에 조사하고 해결하기 위해 다중 에이전트를 배치합니다. 공유 상태나 의존성 없이 해결 가능한 무관련 장애 시나리오에 맞게 설계되었습니다. 핵심 기능은 병렬 문제 해결로, 각 독립 문제 영역마다 하나의 에이전트를 할당하여 효율성을 극대화합니다.
