Qwen3.6 35B-A3B BF16 엄청 괜찮네요 : 클리앙

Qwen3.5 122b q6, Qwen3 Coder Next q8 상황에 맞쳐 쓰다가..
Qwen3.6 35B-A3B 무손실 돌리고
Cline 에 규칙, 워크플로우, 스킬 세팅다시 맞추고

싱크옵션을 아예삭제하니 호환문제없이 추론메세지 잘 나오고..

코드도 거의 버그없이 잘 만들어주네요.

기존에 아무생각 없이 작성된 2만줄 넘는 dart 파일을..

기능별로 파일분리하려고 Qwen3.5 122b, Qwen3 Coder Next 로 시도했다가 결국 롤백했는데..
이번에 성공했습니다~

llama.cpp 평균 출력 속도는 30 tok/s 정도 나오고, 풀컨텍스트 쓰고있어요.

eugr vLLM 으로 평균속도는 40 tok/s 정도 나오네요.. +_+

자동 컨텍스트 압축은 끄고..

회사에서 혼자 쓰는데 속도도 만족스럽네요.. ^^

AI당