Qwen3.5 122b q6, Qwen3 Coder Next q8 상황에 맞쳐 쓰다가..
Qwen3.6 35B-A3B 무손실 돌리고
Cline 에 규칙, 워크플로우, 스킬 세팅다시 맞추고
싱크옵션을 아예삭제하니 호환문제없이 추론메세지 잘 나오고..
코드도 거의 버그없이 잘 만들어주네요.
기존에 아무생각 없이 작성된 2만줄 넘는 dart 파일을..
기능별로 파일분리하려고 Qwen3.5 122b, Qwen3 Coder Next 로 시도했다가 결국 롤백했는데..
이번에 성공했습니다~
llama.cpp 평균 출력 속도는 30 tok/s 정도 나오고, 풀컨텍스트 쓰고있어요.
eugr vLLM 으로 평균속도는 40 tok/s 정도 나오네요.. +_+
자동 컨텍스트 압축은 끄고..
회사에서 혼자 쓰는데 속도도 만족스럽네요.. ^^
맥북프로 M5, 32GB 메모리인데 Qeen 3.6 모델 추천 부탁 드립니다 +_+
32G 라면 최대 Qwen3.6-35B-A3B Q4 정도 일듯 싶네요.
문제없이 돌릴려면 Qwen3 14B~8B 급 모델을 추천해요.