MCP HubMCP Hub
스킬 목록으로 돌아가기

basic-obedience

pjt222
업데이트됨 2 days ago
5 조회
17
2
17
GitHub에서 보기
기타general

정보

이 스킬은 긍정적 강화와 마커 트레이닝을 사용하여 기본적인 개 훈련 명령을 교육하는 구조화된 프로토콜을 제공합니다. 핵심 명령, 타이밍, 보상 시스템, 그리고 일반적인 조련사 오류 해결 방법을 다룹니다. 강아지, 성견, 또는 기초 기술 구축이 필요한 구조 동물을 위한 애플리케이션에 개 훈련 로직을 구현할 때 사용하세요.

빠른 설치

Claude Code

추천
기본
npx skills add pjt222/agent-almanac -a claude-code
플러그인 명령대체
/plugin add https://github.com/pjt222/agent-almanac
Git 클론대체
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/basic-obedience

Claude Code에서 이 명령을 복사하여 붙여넣어 스킬을 설치하세요

문서

基础服从训练

使用正向强化和标记训练教授基础指令(坐下、等待、过来、随行、趴下)。

适用场景

  • 新幼犬(8+ 周龄)准备进行基础训练
  • 成年犬缺乏可靠的基本指令
  • 救助或转让的犬只需要学习家庭的指令词汇
  • 进阶到更复杂的行为或脱绳训练之前
  • 现有指令已退化需要重新建立时

输入

  • 必需:一只犬(任何品种,8+ 周龄)
  • 必需:高价值零食(小块、软质、可快速食用)
  • 可选:响片或口头标记词(例如"好")
  • 可选:1.8 米牵绳和平扣项圈或胸背带
  • 可选:干扰最小的安静训练空间(初始阶段)

步骤

第 1 步:建立标记

标记桥接了期望行为和奖励之间的间隔。

Marker Training Protocol:
1. Choose your marker: clicker (precise) or verbal "yes" (always available)
2. Charge the marker (10-15 reps):
   - Mark (click or "yes") then immediately deliver a treat
   - No behavior required — just marker → treat, marker → treat
   - Dog should begin orienting toward you at the sound of the marker
3. Test: mark when the dog is looking away. Does the dog turn toward
   you expecting a treat? If yes, the marker is charged.

Timing Rule:
The marker must occur WITHIN 1 second of the desired behavior.
Late marking teaches the wrong behavior.
Mark → then reach for the treat (not the reverse).

预期结果: 犬只在听到标记时可靠地转向处理者,期待奖励。

失败处理: 如果犬只在 20 次重复后仍不响应标记,零食价值太低。换用更高价值的奖励(奶酪、鸡肉、肝脏)。如果犬只太分心而不吃东西,环境刺激太强——移到更安静的空间。

第 2 步:教授五个基础指令

每次训练课专注一个指令直到可靠,然后开始混合练习。

Command Protocols:

SIT:
1. Hold treat above dog's nose, slowly arc backward over the head
2. As the dog's head follows up, the rear naturally lowers
3. The instant the rear touches the ground → mark and treat
4. Add the verbal cue "sit" AFTER the dog is offering the behavior reliably
   (cue comes before behavior only once the dog understands the behavior)

DOWN:
1. From a sit, hold treat at the dog's nose then lower slowly to the ground
2. Draw the treat slightly forward along the ground
3. As elbows touch the ground → mark and treat
4. If the dog stands instead, reset and try with less forward movement

STAY:
1. Ask for a sit or down
2. Open palm toward the dog, say "stay"
3. Wait 1 second → mark and treat while the dog is still in position
4. Gradually increase duration: 2s, 5s, 10s, 30s, 1 min
5. Add distance: one step back, then two, then five
6. Add distraction: only after duration and distance are solid
   (the "three Ds": Duration, Distance, Distraction — increase one at a time)

COME (recall):
1. Start on a long line (15-30 ft) in a low-distraction environment
2. Let the dog wander, then call name + "come" in an upbeat tone
3. If the dog turns toward you → mark → reward generously when the dog arrives
4. NEVER call "come" for something unpleasant (bath, crate, leaving the park)
5. Recall is the most important safety command — make it the most rewarding

HEEL:
1. Dog on your left side, treat in left hand at your hip
2. Take one step, if the dog moves with you → mark and treat
3. Gradually increase to two steps, five steps, ten steps
4. Mark and treat for maintaining position (head roughly at your knee)
5. If the dog pulls ahead, stop walking. Resume when the leash is loose.

预期结果: 在低干扰环境中,每个指令都能以零食作为动力可靠执行。

失败处理: 如果一个指令在 3 次课程后没有进步,将其分解为更小的步骤。犬只可能需要一个中间行为(例如对于"趴下",在要求完全肘部着地之前先奖励低头动作)。

第 3 步:组织训练课程

Session Guidelines:
+--------------------+------------------------------------------+
| Parameter          | Guideline                                |
+--------------------+------------------------------------------+
| Duration           | 5-10 minutes (puppies: 3-5 minutes)      |
| Frequency          | 2-3 sessions per day                     |
| End on success     | Always end after a successful rep, not   |
|                    | after a failure                          |
| Reward rate        | Initially: every correct rep             |
|                    | Later: intermittent (variable schedule)  |
| Energy management  | High-energy dog? Exercise BEFORE training|
|                    | Low-energy dog? Train when most alert    |
| Session structure  | Warm-up (easy known command) → new       |
|                    | material → cool-down (easy command)      |
+--------------------+------------------------------------------+

The 80/20 Rule:
- 80% of reps should succeed (dog is getting it right)
- If success rate drops below 80%, the criteria is too high — go easier
- 20% challenge keeps the dog engaged without frustrating

预期结果: 简短、成功的训练课程,让犬只意犹未尽。

失败处理: 如果犬只脱离参与(嗅地、四处张望、趴下),训练课程太长、太难或奖励不够有吸引力。结束课程并重新评估。

第 4 步:指令抗干扰训练

在安静环境中可靠后,系统地增加干扰。

Distraction Ladder (work through sequentially):
1. Quiet room, no distractions (starting point)
2. Room with a family member present
3. Backyard or garden
4. Front yard with street noise
5. Quiet park or trail
6. Busy park with other dogs at a distance
7. Busy park with other dogs nearby
8. Novel environments (pet store, cafe patio)

At each new level:
- Expect performance to decrease — this is normal
- Increase reward rate back to every correct rep
- Do not add more distraction until the current level is reliable
- If the dog fails 3 reps in a row, you moved up too fast — go back one level

预期结果: 指令在逐渐增加干扰的环境中可靠执行。

失败处理: 如果特定干扰(其他犬、松鼠)持续破坏训练,该干扰需要单独的反条件化训练(见 behavioral-modification)。

验证清单

  • 标记已充值且犬只可靠响应
  • 所有五个指令在低干扰环境中都能执行
  • 训练课程为 5-10 分钟,在成功时结束
  • 每个指令的成功率在 80% 或以上
  • 指令正在通过干扰阶梯进行泛化
  • 处理者的时机(标记在 1 秒内)保持一致

常见问题

  • 重复指令:说"坐,坐,坐!"教会犬只第一个"坐"是可选的。说一次然后等待
  • 给食太迟:零食应在标记后 2-3 秒内给出。迟给零食会破坏关联
  • 永远使用引导:用零食做手势引导应在 10-20 次重复内逐渐消除。否则犬只只在看到食物时才响应
  • 惩罚失败的召回:叫"过来"然后斥责犬只(因为太慢、因为嘴里叼着东西)会永久性地毒化召回指令
  • 训练时间过长:疲劳的犬只什么也学不会。在领先时退出
  • 不一致的指令:所有家庭成员必须对每个指令使用相同的词语和手势

相关技能

  • behavioral-modification — 用于解决干扰基础服从训练的不良行为

GitHub 저장소

pjt222/agent-almanac
경로: i18n/zh-CN/skills/basic-obedience
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

연관 스킬

llamaguard

기타

LlamaGuard는 폭력 및 혐오 발언 등 6가지 안전 범주에서 LLM 입력과 출력을 조정하기 위한 Meta의 70-80억 파라미터 모델입니다. 94-95% 정확도를 제공하며 vLLM, Hugging Face 또는 Amazon SageMaker를 사용해 배포할 수 있습니다. 이 기술을 사용하여 AI 애플리케이션에 콘텐츠 필터링 및 안전 가드레일을 손쉽게 통합하세요.

스킬 보기

cost-optimization

기타

이 Claude Skill은 리소스 적정화, 태깅 전략, 지출 분석을 통해 개발자들이 클라우드 비용을 최적화할 수 있도록 지원합니다. AWS, Azure, GCP에서 클라우드 비용을 절감하고 비용 거버넌스를 구현하기 위한 프레임워크를 제공합니다. 인프라 비용을 분석하거나, 리소스를 적정화하거나, 예산 제약을 충족해야 할 때 사용하세요.

스킬 보기

quantizing-models-bitsandbytes

기타

이 스킬은 bitsandbytes를 사용하여 LLM을 8비트 또는 4비트 정밀도로 양자화하며, 최소한의 정확도 손실로 50-75%의 메모리 감소를 달성합니다. 제한된 GPU 메모리에서 더 큰 모델을 실행하거나 추론을 가속화하는 데 이상적이며, INT8, NF4, FP4와 같은 형식을 지원합니다. 이 스킬은 HuggingFace Transformers와 통합되어 QLoRA 학습 및 8비트 옵티마이저를 가능하게 합니다.

스킬 보기

dispatching-parallel-agents

기타

이 Claude Skill은 3개 이상의 독립적인 문제를 동시에 조사하고 해결하기 위해 다중 에이전트를 배치합니다. 공유 상태나 의존성 없이 해결 가능한 무관련 장애 시나리오에 맞게 설계되었습니다. 핵심 기능은 병렬 문제 해결로, 각 독립 문제 영역마다 하나의 에이전트를 할당하여 효율성을 극대화합니다.

스킬 보기