스팸 차단 AI를 아이폰 안에서 동작하게 만들어보자 (feat. Core ML) : 클리앙

안녕하세요,

한국어 LLM 연구하는 Beomi입니다.

이전에 쓴 3개 글을 통해서(출시 글은 홍보성 게시글이라고 삭제되었더라구요..ㅡㅜ) 많은 분들께 온라인 AI 스팸 차단기능이 들어간 앱을 소개해드렸는데요.

아무래도 애플유저들(저를 포함한)이 개인정보를 보다 소중히 여긴다는 점을 공감하고 있기 때문에,

휴대폰 내에서만 동작하는 온디바이스 AI에 대한 요청이 많았습니다.

Apple은 생각보다 온디바이스 AI에 진심인 회사인데요. 2017년도부터 "Core ML"이라는 이름으로 머신러닝 Accelerate를 할 수 있는 프레임워크를 제공해왔습니다.

스크린샷 2024-06-17 오후 10.23.46.png

온디바이스에서 동작하는 AI의 경우는 사실 모바일 칩셋의 성능도 성능이지만 배터리 문제가 큰 편인데요.

단순히 CPU 혹은 GPU 가속을 Metal API를 통해 사용하는것과는 다른 방식을 사용합니다.

스크린샷 2024-06-17 오후 10.25.30.png

Metal API의 경우는 Graphics 즉 아이폰 칩셋 내의 GPU에 Low-level로 접속해서 최고의 성능을 이끌어내는 것을 목표로 하는데요.

실제 최근 앱스토어에 간간히 올라오는 온디바이스 Stable Diffusion(그림그리는 앱) 혹은 최근의 언어모델 7B급의 모델을 구겨넣는 경우는 배터리를 엄청 사용한다 하더라도 일단 '돌아간다'에 의의를 두고 있기 때문에 보통의 경우 상시 동작하는 AI를 가정하지 않습니다.

또한, 사용자에게 최대한의 성능을 제공해줘야하니 당연히 발열도 엄청나구요.

hero-image.fill.size_1200x675.jpg

위 스크린샷에서 "모델을 Core ML로 변환"이라는 부분이 있는데요.

딥러닝 개발/연구 할 때 가장 많이 쓰는 프레임워크가 PyTorch라는 프레임워크입니다.

하지만 해당 코드는 파이썬으로 작성되어있고, 그 뒷단에는 C++로 구성된 CUDA기반의 커널들이 존재합니다.

따라서 해당 코드를 곧바로 아이폰에서 사용하는건 굉장히 까다로운 것도 있지만 배터리 등 모바일 기기의 효율성 측면을 고려하지 않는다는 문제가 있습니다.

이때 애플은 ONNX에 기반한 CoreML 자체 프레임워크를 내세워서 '이거 쓰면 우리가 알아서 기기 상태에 따라 전기량이나 성능이나 그런거 조절해줄게'라고 하는 접근법을 사용합니다.

근데 문제는 이렇게 해서 접근 난도가 꽤나 높았다는 거구요(...)

그러던 중에 자연어처리 연구 분야가 Hugging Face 하나로 천하통일이 됩니다.

그리고 나서는 Exporters( https://github.com/huggingface/exporters )라는 형태로, Hugging Face Transformers라는 라이브러리에 기반한 모델 중 일부 모델을 Core ML로 손쉽게 변환해주는 킷이 나오게 됩니다.

스크린샷 2024-06-17 오후 11.12.32.png

사실 이 Exporters 이전에도 Core ML Tools( https://apple.github.io/coremltools/docs-guides/ ) 라는 Apple의 공식 변환 툴이 있었지만, 모델의 아키텍처를 하나하나 만들어줘야한다는 치명적인 단점이 있었습니다. -> 그래서 아무도 안썼어요...

스크린샷 2024-06-17 오후 11.13.41.png