전 젬마는 클로드 코드에 worker로 호출해서 간단하지만 토큰이 많이 드는 작업들을 대행시킵니다. 주로 인터넷 글 검색, 요약, 유튜브 영상 요약, 깃헙 레포 요약 등 입니다. 원래 e4b 버전 쓰다가 이번에 12b 모델 나왔길래 바꿨는데.. 속도는 조금 느려진 대신 정확도가 꽤 많이 올라서 바꿔 끼웠습니다.
꼼발남자
IP 211.♡.47.55
06-11
2026-06-11 01:17:00
·
@뚱뚱고도비만님 혹시 worker호출은 어떻게 하는지 알수 있을까요? 아직 잘 몰라서 토큰 아끼는데 활용해보고 싶습니다.
@꼼발남자님 댓글로 과정을 다 설명하기엔 너무 길고 복잡하구요.. 가장 간단하게는 클로드 코드한테 해달라고 하면 됩니다.
혹시 궁금하실까봐 원리는.. 기본적으로 클로드 코드는 서브에이전트를 호출 할 때 타사 모델을 사용하는걸 금지 해놓았습니다. 그래서 gemma 4 같은 타사 모델을 서브에이전트로 직접 호출 할 수 없기 때문에.. 클로드 코드가 서브에이전트를 하나 호출하고.. 해당 서브에이전트가 worker를 다시 호출해서 작업을 위임하는 형태로 구현이 가능 합니다. 단, 이렇게 하면 단점은 올라마 같은데서 쓰시는것처럼 gemma4에게 직접 뭔가를 물어보거나 시키거나 하는건 안되고.. 클로드 코드에게 이런 저런 작업을 할껀데 gemma에게 위임해.. 같은 명시적인 지시가 있어야 합니다. 매번 이렇게 하기가 귀찮으니, 특정 작업들 중 gemma가 해도 충분한 작업 몇가지는 정해서.. claude.md에 규칙으로 박아주면 해당 작업들은 클로드에게 그냥 해줘~ 라고 해도 gemma에게 위임 합니다. 간혹 gemma 에게 위임하도록 정해놓은 작업이지만, 그 내용을 직접 분석해야 할 경우 클로드가 알아서 위임하지 않고 직접 수행하기도 하기 때문에 더 편한부분도 있습니다.
클로드코드에게 gemma4 12B 모델을 백그라운드에 mlx 서버에 상주 시키고 worker로 호출해서 사용하도록 해줘. 라고 하시면.. 지가 알아서 방법 찾아서 이렇게 할까요? 저렇게 할까요? 물어 보면서 셋팅해 줄 겁니다.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB
업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
주로 인터넷 글 검색, 요약, 유튜브 영상 요약, 깃헙 레포 요약 등 입니다.
원래 e4b 버전 쓰다가 이번에 12b 모델 나왔길래 바꿨는데..
속도는 조금 느려진 대신 정확도가 꽤 많이 올라서 바꿔 끼웠습니다.
가장 간단하게는 클로드 코드한테 해달라고 하면 됩니다.
혹시 궁금하실까봐 원리는..
기본적으로 클로드 코드는 서브에이전트를 호출 할 때 타사 모델을 사용하는걸 금지 해놓았습니다.
그래서 gemma 4 같은 타사 모델을 서브에이전트로 직접 호출 할 수 없기 때문에..
클로드 코드가 서브에이전트를 하나 호출하고.. 해당 서브에이전트가 worker를 다시 호출해서 작업을 위임하는 형태로 구현이 가능 합니다.
단, 이렇게 하면 단점은 올라마 같은데서 쓰시는것처럼 gemma4에게 직접 뭔가를 물어보거나 시키거나 하는건 안되고..
클로드 코드에게 이런 저런 작업을 할껀데 gemma에게 위임해.. 같은 명시적인 지시가 있어야 합니다.
매번 이렇게 하기가 귀찮으니, 특정 작업들 중 gemma가 해도 충분한 작업 몇가지는 정해서..
claude.md에 규칙으로 박아주면 해당 작업들은 클로드에게 그냥 해줘~ 라고 해도 gemma에게 위임 합니다.
간혹 gemma 에게 위임하도록 정해놓은 작업이지만, 그 내용을 직접 분석해야 할 경우 클로드가 알아서 위임하지 않고 직접 수행하기도 하기 때문에 더 편한부분도 있습니다.
클로드코드에게 gemma4 12B 모델을 백그라운드에 mlx 서버에 상주 시키고 worker로 호출해서 사용하도록 해줘. 라고 하시면.. 지가 알아서 방법 찾아서 이렇게 할까요? 저렇게 할까요? 물어 보면서 셋팅해 줄 겁니다.