MCP HubMCP Hub
스킬 목록으로 돌아가기

chunking-strategy

majiayu000
업데이트됨 7 days ago
10 조회
58
9
58
GitHub에서 보기
기타ragchunkingvector-searchembeddingsdocument-processing

정보

이 스킬은 RAG 시스템과 벡터 데이터베이스를 위한 최적의 문서 청킹 전략을 구현하여, 대용량 문서를 임베딩과 검색을 위해 의미론적으로 의미 있는 세그먼트로 분할합니다. 검색 성능을 향상시키고 문맥을 보존하기 위해 검색 증강 생성 시스템이나 처리 파이프라인을 구축할 때 사용됩니다. 주요 기능으로는 문서 분할을 위한 프레임워크 제공과 효율적인 검색을 위한 청킹 최적화가 포함됩니다.

빠른 설치

Claude Code

추천
기본
npx skills add majiayu000/claude-skill-registry -a claude-code
플러그인 명령대체
/plugin add https://github.com/majiayu000/claude-skill-registry
Git 클론대체
git clone https://github.com/majiayu000/claude-skill-registry.git ~/.claude/skills/chunking-strategy

Claude Code에서 이 명령을 복사하여 붙여넣어 스킬을 설치하세요

GitHub 저장소

majiayu000/claude-skill-registry
경로: skills/data/chunking-strategy
0

연관 스킬

chunking-strategy

기타

이 스킬은 RAG 시스템과 벡터 데이터베이스를 위한 최적의 문서 청킹 전략을 구현하여 대용량 문서를 의미론적으로 유의미한 세그먼트로 분할합니다. 검색 파이프라인 구축이나 임베딩 및 검색을 위한 문서 처리 시 활용됩니다. 주요 기능으로는 효율적인 검색을 위한 문맥 보존과 문서 처리 최적화를 위한 프레임워크 제공이 포함됩니다.

스킬 보기

when-managing-token-budget-use-token-budget-advisor

메타

이 스킬은 작업 복잡성을 분석하고 한도 내에서 실행 계획과 함께 청킹 전략을 생성하여 토큰 예산을 사전에 관리합니다. 대규모 작업 전, 예산 한도에 근접했을 때, 또는 토큰 소진 오류 발생 후에 사용하도록 설계되었습니다. 주요 기능으로는 사용량 평가, 작업 우선순위 지정, 다중 에이전트 간 자원 할당 최적화 등이 포함됩니다.

스킬 보기

when-managing-token-budget-use-token-budget-advisor

메타

이 기술은 작업 복잡성을 분석하고 한도 내에서 실행할 수 있도록 청킹 전략과 실행 계획을 생성하여 Claude의 토큰 예산을 능동적으로 관리합니다. 대규모 작업 전이나 예산 제약에 근접했을 때 토큰 소진을 방지하기 위해 개발자가 사용할 수 있도록 설계되었습니다. 이 도구는 사용량을 평가하고 작업 우선순위를 정하며, 다단계 프로젝트나 다중 에이전트 조정을 위한 최적화된 계획을 수립합니다.

스킬 보기

docling

기타

Docling은 PDF, DOCX 및 기타 문서 형식을 고급 레이아웃 이해 기능으로 파싱하는 Python 라이브러리입니다. 이 라이브러리는 문서를 통일된 구조화된 표현으로 변환하여 RAG 파이프라인과 AI 워크플로에 이상적입니다. LangChain, LlamaIndex 또는 MCP 서버와의 통합을 위해 문서에서 깔끔한 텍스트와 레이아웃 데이터를 추출해야 할 때 사용하세요.

스킬 보기