https://github.com/cookyman74/my_harness
AI로 작업하다 보면 "혼자 다 하는 AI"보다 "역할 나눠서 협업하는 AI 팀"이 결과가 훨씬 좋다는 걸 느끼게 되는데요. 그걸 자동으로 만들어주는 오픈소스를 만들어 봤습니다.
한 줄로 요약하면, Claude Code에서 "XXX 하네스 구성해줘"라고 말하면, 내 프로젝트에 맞는 AI 에이전트 팀을 알아서 짜주는 도구예요. (영어로는 "build a harness for this project")
예시 프롬프트
-
/my-harness 카드 게임을 만들고 싶어
-
/my-harness 주식투자 프로그램을 만들고 싶어.
-
/my-harness XXX라는 주제의 유튭 컨텐츠를 기획하고 싶어.
- /my-harness @{기획서} 상기 기획서의 문서를 기반으로 react 기반의 앱을 만들고 싶어.
뭐가 좋냐면
보통 AI한테 복잡한 일을 시키면 하나가 처음부터 끝까지 다 하려다 품질이 떨어지잖아요. Harness는 그 일을 쪼개서
-
누가(분석가·작성자·검수자 같은 역할) 맡을지
-
어떻게(작업 절차와 도구) 할지
를 자동으로 설계해줍니다. 일종의 "AI 팀을 만들어주는 공장" 이라고 생각하면 편해요.
게다가 작업물을 자기들끼리 한 번 검수하고, 외부 AI(Codex/Gemini)로 한 번 더 교차 검증하는 이중 품질 체크까지 들어가 있어서 결과물 신뢰도가 높습니다.
제가 만들어 써보고 있지만,, 꽤 괜찮습니다.
이런 데 써볼 수 있어요 (README에 바로 복붙할 수 있는 예시 프롬프트가 많습니다)
-
딥 리서치 (여러 각도에서 조사 → 교차검증 → 리포트)
-
웹사이트 풀스택 개발 (디자인→프론트→백엔드→QA)
-
웹툰/유튜브 콘텐츠 기획
-
코드 리뷰 & 리팩토링
-
기술 문서 자동 생성 등
같이 쓰면 좋은 플러그인 들
-
context-mode
-
caveman
-
graphify
참고
-
라이선스는 Apache 2.0 (자유롭게 사용 가능)
-
Claude Code가 메인이고, Codex 런타임도 함께 지원해요
ps:
관종이라 별좀 눌러주세요 ㅋ
webcopilot 이라는 크롬 확장앱도 만들어서 배포하고 있습니다.
저는 그냥 바이브 코딩할때 검증 에이전트, 개발 담당 에이전트, UX 담당 에이전트를 그냥 말로 요청해서 작업해달라고 하는데 막상 이게 정말 효과적으로 작동 되는지는 알길이 없어서요.
이런 오픈 소스를 사용하면 확실히 차이가 있을까요?
초보적인 질문은 아니고 핵심적인 질문이네요 ㅎㅎ
일단 보통 님이 하시는 방식처럼 단순히 클로드에게 말로 "검증/개발/UX 에이전트"라고 요청해도 작동은 합니다. 다만 한 AI가 1인 다역을 하는 거라 자기가 쓴 걸 자기가 검증하게 되고(같은 맹점), 세션이 끝나면 그 역할 정의도 휘발돼요.
하지만 이런 하네스 오픈소스는 그 부분들에 대해 개발자들이 쌓아온 노하우 — 역할을 파일로 고정해 일관되게 재사용하고, 검증은 독립된 다른 엔진에 맡기는 식 — 으로 미리 짜놓은 겁니다. 그래서 매번 직접 설계 안 해도 믿고 써볼 만하실 껍니다.
물론 짧고 단발성 작업이면 지금처럼 말로 하셔도 충분하고요. 반복·품질·검증이 중요해질수록 차이가 커집니다.
클로드 코드에서 위의 요청에 "로컬 에이전트" 라는 단어를 언급하시면 하위 로컬 에이전트를 새로 spawn하기 때문에 사실상 1인 다역은 아닙니다. claude code 의 workflow가 그런식으로 동작합니다.
물론 claude만 쓰는게 아니라 gemini / openai 같은 완전히 다른 provider를 교차 사용하는게 더 넓은 시각을 확보할 수 있다는 점에서 좋은 면이 있습니다.
깃허브 주소주시면 그다음 액션은 뭔가요 ㅎㅎㅎ
일단 리눅스 환경에서만 가동되기 때문에
윈도우의 경우 WSL이 필수 입니다.
만약 설치환경이 준비되셨다면
git clone https://github.com/cookyman74/my_harness.git
클론 받으시고
클로드코드 사용하시면..
1. 마켓설치
/plugin marketplace add cookyman74/my_harness
2. 플러그인 설치
/plugin install myharness@myharness-marketplace
3. 리로드 하시거나 클로드를 재실행해주세요.
/reload-plugins
이렇게 하면 플러그인이 설치하신후 /myharness 명령어로 사용하시면 됩니다.
만약 클로드코드가 아니라 코덱스 사용하시면
해당 디렉토리에 install.sh를 실행시켜 주신후 다시 코덱스를 재실행한 후에
$myharness 명령어로 사용하시면 됩니다.
그냥 클로드코드 채팅창 여시고 한줄만 말하시면 됩니다. 다음은 클로드가 또 알려줄겁니다.
https://github.com/cookyman74/my_harness 이거 설치해줘
감사합니다..
확인해보니 Claude Code v2.1.178부터 TeamCreate(와 TeamDelete)가 실제로 제거됐고, 이제 Agent 도구로 팀원을 바로 생성하는 방식으로 바뀌었네요;;
제보 감사드리며, 바로 수정 들어갑니다. ㅎㅎ
제가 볼때 가장 큰 장점은 fan-out을 병렬로 처리한다는 점입니다. 그래서 속도나 컨텍스트 관리차원에서 유리한 것 같습니다.
그리고... 반복적인 작업을 정형화했기 때문에 작업이 편하다와 이를 루프화할 수 있다는 장점으로 보여집니다.
ulw가 뭔지 잘 모르겠습니다. ㅜㅜ
비슷한 컨셉인거 같아서 여쭤봣어요 ㅎ
요구사항에 대한 플랜을 작성하고, 플랜에 맞게 각 에이전트에게 분배하며 병렬로 일도 시키고 해주는 친구가 있더라구요
https://github.com/ultraworkers/claw-code
요 친구인데 프로젝트에 도움이 되시길 바라며 링크 남겨봅니다 ㅎ
아....뭔지 알고 있습니다.
근데 기본 컨셉이 완전히 다르고 저 프로젝트가 훨씬 큰 프로젝트이긴 합니다.
오픈클로 코드 같은 종류이고 제가 공유드린것은 클로드코드나 코덱스 기반에서 스킬과 에이전트만 워크플로우를 재정의한 정도라고 보시면 될것 같습니다. (어떻게 보면 프롬프트 통합빌드 같은거죠 ㅎㅎ)
업데이트 방법을 다시 공유드립니다.
## 클로드
클로드에선 다음과 같이 플러그인을 다시 설치해주시고 (업데이트)
/plugin marketplace update myharness-marketplace → /plugin update myharness → /reload-plugins.
끝나면
/myharness:myharness update
으로 스킬과 에이전트를 업데이트해서 사용해주세요 :)
## 코덱스
1. 레포 최신화 (원격 변경분 받기) : git pull
2. 세션은 종료하고 새 세션 시작
3. $myharness update
일단 클로드 코드가 실행되는 환경이면 됩니다.