지난주 목요일 저녁, 김선태 유튜브를 보다가 댓글이 엄청 많이 달렸더라구요
댓글이 5만개가 넘게 달렸더라구요...
기업들, 공공기관이 압다투어 댓글들을 보면서
"이거 어지간한 박람회보다 나은데?" 란 생각에
선태 박람회를 기획하게 되었습니다. ㅎ
https://seontae-expo.uslab.ai/

5만개의 댓글을 분석해서, 2천여개를 부스로 만들었습니다.
금,토,일 3일간 작업을 했고, 3일간의 제작기 올립니다.
----------------------------------------
목요일 밤 11시였습니다.
유튜브를 보고 있었는데, 김선태 유튜브 댓글에 “박람회 같다” 라는 말이 보이더라구요.
그 댓글을 보는 순간,
“그러면 진짜 박람회를 만들어보면 어떨까?” 이 생각이 바로 들었습니다.
그래서 그냥…
바로 작업을 시작했습니다.
gemini와 ChatGPT를 돌려가며 기획을 했고, 디스코드의 오픈클로를 깨웠습니다.
1. 유튜브 댓글 수집
가장 먼저 유튜브 댓글 수집이 관건이었는데요
바이브코딩 2년전에 입문했을때 유튜브 댓글 수집을 했었는데 1300개 이상 막혀있어서 못했었던 기억이 났거든요
직접 스크롤해도 65페이지를 넘으면 더이상 스크롤이 안됐던거로 알고 있었습니다.
그 사이에 업데이트가 된건지, 이님 제가 실력이 없어선지 몰라도 찾아보니 구글클라우드 플랫폼 API에
Youtube Data Pack V3 API가 있더라구요. 일일 10,000번 호출인데 (전 이게 댓글 1만개 한계인줄 알았는데)
1회 호출당 100개 이상씩 수집이 가능해서, 계산상 댓글을 100만개까지 수집가능하더라구요.
(그외 채널 메타라던지 각종 횟수 포함이라 계산은 좀 복잡한걸로.. )
그래서 ChatGPT로 수집과 관련된 md 문서를 만들었고, 오픈클로에 던져봤습니다.

2분만에 세팅이 끝났습니다.
GCP 구글클라우드 플랫폼에 들어가서 API키값을 받아와서 설정해주고
(해보신 분들을 아시겠지만 GCP 세팅이 더 오래걸립니다 ㅎ.. 20분 걸렸네요..)
키는 오픈클로가 연동된 맥미니 원격으로 들어가서 그 폴더에 .env.local 파일로 넣었습니다.

바로 5만개 댓글을 다 읽어왔다네요..?
이 당시 댓글이 49,000개 정도 달렸는데 1차 상위댓글이 32,735개였습니다.
대댓글이 17,000개 정도였던거죠.
그리고 대댓글까지 순조롭게 수집이 됐습니다.

아이디어 구상부터 댓글수집 구현까지 2시간만에 와서 새벽에 도파민이 쫙 퍼지더군요
2. 프로토 타입 완성
웹사이트는 시스템은 Supabase + Vercel 조합으로 구성했고, Cursor AI로 작업했습니다.
새벽 2시까지 댓글 검토를 했고 3시간 정도 작업해서 새벽 5시쯤 프로토타입이 완성됐습니다.
3. 홍보관 분류작업 (오픈클로 + gemini-2.0-flash)
기본적인 구현은 됐는데
문제는 이걸 박람회처럼 보이기 위해서는 댓글을 분류해야 했습니다.
기업관 | 공공기관 | 크리에이터 (연예인, 유명인)
으로 구조를 잡았고, 이대로 분류는 쉬웠는데,
일반인들이 구인,구직을 하고 있는것도 재밌어 보였습니다.
그래서 이걸 분류해 내야 하는것이 관건이었습니다.

이런 댓글을 인재관으로 분류하고 싶었거든요..
이걸 gpt, gemini를 열심히 돌려 인재관 분류 규칙을 만들어서
오픈클로에 돌렸고, gemini-2.0-flash api를 이용했습니다.

이걸 병렬로 했어야 했는데, 별생각이 돌렸고
4시간이 걸렸네요..

문제는 정확도가 30%도 안되서 못쓸 수준이었습니다....
4. Cursor AI에서 분류 작업 (Codex-5.3)
목표는 금요일 저녁 6시쯤 사이트 오픈이었는데,
일을 하면서 일과중에 프로젝트를 손보기는 한계가 있더라구요..
그래서 아쉽지만 주말에 마무리 하기로 하고 분류를 어떻게 하면 잘 할 수 있을지 검토를 했습니다.
그리고, 오픈클로는 반복작업 워커로 돌리느게 낫겠단 생각에
커서 ai로 직접 조절을 시작했습니다.
- gemini-2.0-flash의 한계
싼 모델로 댓글의 의미를 분석해서 이게 진짜 기관, 기업, 그리고 인재관 댓글인지 그냥 댓글인지 분류는 한계가 있더라구요..

선태 박람회 기간 3일간 7천원 정도 썼습니다.
그렇다고 해서 gemini-3.0으로 올리면 지금보다 4-5배의 요금이 나올거고
gpt-5.3과 같은 최신 고급 모델을 쓰면 10-20만원은 그냥 나오겠더라구요.
그래서 어떻게 하지.. 하다가 커서 AI에 익스텐션으로 오픈ai의 Codex-5.3 모델을 Auth 인증으로 연동이 됐습니다.
이렇게 하면 추가과금없이 월구독료 안에서 사용할 수 있습니다(오픈클로도 코덱스 연동 사용중)
저도 ChatGPT Pro 모델을 쓰고 있어서 Auth 인증으로 연동을 했습니다.
코덱스 보고 직접 읽어서 분류해달라고 하니 해주더군요..

csv로 분류한걸 보니
꽤 완성도 높았습니다. 80% 정도?
그래서 이걸로 분류작업을 주말 내내 했습니다.
5. AI 시대의 서비스 개발
일단 이런 사이트를 2-3일만에 개발자도 아닌 제가 만든다는게 놀라운 일이죠.
오픈클로에 딸깍 하고 그냥 만들어주는.. 수준은 아직은 어렵죠 (이만큼 되는것만 해도 크지만..)
그리고 사이트를 만들고, 최적화 하고 트래픽에 대비하고 각종기능을 붙이는건 세심한 설계와 개발이 필요하죠.
물론 현업수준의 사이트는 아니지만 이정도로 만드는데에도 엄청난 디테일들을 필요로 합니다...
결국 인간의 개입이 필요하죠.
김선태유튜브가 금요일 밤에 2번째 영상을 올렸고, 2번째 영상도 댓글이 3만개가 넘게 달렸습니다.
이것도 사이트에 추가를 했는데, 이제 일반 댓글들도 기관명 아이디를 만들면서 참여하기 시작합니다...;
이걸 걸러네는건 AI가 잡아내기는 너무 어렵죠.
결국 인간의 개입을 얼마나 편하고 빠르게 분류할수있는지에 대한 시스템을 만들어야 하는 단계로 넘어갔습니다.
작업간에 만든 md 문서가 80개였습니다.
ChatGPT로 아이디어 초안을 만들고 그걸 커서ai에 던져서 검토 -> 다시 Gpt 검토 -> 커서 검토 를 계속 돌려서
ChatGPT에서 Go 사인이 떨어지면 구현하는 방식으로 작업했습니다.
ChatGPT는 5.4 thinking을 기본으로 쓰다가 명세서가 필요할땐 gpt-5.4-pro로 돌렸습니다.

6. 결론
주말을 불태워 만들었는데, 생각만 하던걸 뚝딱...(은 아니지만) 그래도 빠르게 만들수 있는 시대로 왔습니다.
너무 즐겁네요 ㅎ
분류 성능은 80%인데, 85%까지는 올릴수있지만 아직은 90% 이상은 인간의 몫인거 같습니다.
긴글 읽어주셔서 감사합니다.
선태 박람회 : https://seontae-expo.uslab.ai/
트래픽에 최적화라 사이트에는 피드백을 남길수있는 곳이 없습니다.
아직 부족하지만, 계속해서 개선해 나가겠습니다.
선태 박람회는 유튜브 댓글 문화를 소개하는 비상업적 팬 프로젝트로
모든 댓글은 출처 기반 인용이며, 원문은 유튜브에서 확인할 수 있습니다.
YouTube 및 관련 상표는 해당 권리자의 자산입니다.
여기서 피드백 주시거나 contact@uslab.ai로 피드백 주시면 반영하겠습니다.
감사합니다.
덕분에 재밌는 댓글 구경 잘하고 아침부터 빵 터졌네요.
오픈클로와 바이브 코딩을 이정도로 하시다니 대단합니다!
다만 이걸 만드신 분이 개발자가 아니라는 말이 좀 무섭습니다. 이정도면 개발자 아닌가요 -0-;;;
너무나 놀랍네요
멋진 서비스 입니다
요즘 연간 할인도 많이 하고 있고요
그리고 글쓰기나 분석 자체는 gpt가 좋습니다
하나만 쓰면 gemini
두개쓰면 gpt입니다
그리고 바이브코딩의 경우는
Cursor AI를 추천합니다
20$ auto 모드
저는 강의와 컨설팅을 하고 있어서..
300-400만원 정도 월에 쓰고 있어요 ㅎ