문외한이지만 이거저거 줏어들은 결과 저런 모델들 (GPT, LLAMA, CLAUDE)는 사실 무슨 언어인가가 중요한게 아니고 그 언어로 얼마나 많은 train이 가능한가가 중요한거라 언어는 큰 문제가 아니다....라고 전 이해했는데 맞나요?
챠우챠우챠우
IP 116.♡.103.194
03-16
2023-03-16 20:52:50
·
@와싸다님 특정 언어로 만들어진 데이터의 양이 중요하다라는 표현을 하신 것 같은데, 그런 측면이 있습니다. 그런데 그것도 옛말입니다. 요새는 창발현상이라고 해서 언어를 뛰어넘는 학습도 가능한 것으로 관측되고 있습니다. 이를 테면 번역에 대한 데이터가 굉장히 작았음에도 불구하고(성능을 낼 수 없을 정도로) 번역이 된다던가, 영어에서만 학습한 지식이 한국어에도 적용된다던가 하는 현상들이 나타나고 있거든요.
삭제 되었습니다.
챠우챠우챠우
IP 39.♡.28.167
03-16
2023-03-16 23:38:51
·
@콩심었어님 여전히 주류는 양적으로 훈련하는 경향이 있습니다만, 일부는 적은 데이터와 파라미터로도 비슷한 성능을 내는 모델을 훈련하고도 있습니다. 두가지가 동시에 간다고 보시면 됩니다. 대형모델은 주로 한계 성능을 내는데 주목하고 이후에는 보다 가성비 좋은, 효율적인 모델이 나오는 식입니다.
MeltCz
IP 61.♡.147.218
03-17
2023-03-17 11:10:56
·
한국기업들이 따라갈수 있을까요? 첨단산업 우수한 인력들이 많아야 할텐데.. 미국이 우수한 인재 다 빨아들이는 블랙홀 같은 나라고..
@MeltCz님 올해 들어 국가별 기술적 차이가 무의미한 기술이 나오고 있습니다. chatGPT나 GPT시리즈만 있는 게 아닙니다. 일반인도 사용할 수 있을 정도라는 거죠. Chain of Hindsight Aligns Language Models with Feedback 이런 제목의 논문인데, 관심있으시면 구글에 검색하시면 논문이 나옵니다. 수식이 필요없는 페이퍼라 구글 검색기로도 편하게 읽을 수 있습니다.(물론 NLP에 대한 사전 지식은 좀 필요합니다..)
SpaceDust
IP 104.♡.68.33
02-09
2024-02-09 15:45:50
·
@MeltCz님 불가능하다고 생각합니다. 이미 DeepL 품질이 파파고에 비해 월등히 좋더라고요.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB
업로드 가능 확장자 jpg,gif,png,jpeg
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
그런데 그것도 옛말입니다. 요새는 창발현상이라고 해서 언어를 뛰어넘는 학습도 가능한 것으로 관측되고 있습니다. 이를 테면 번역에 대한 데이터가 굉장히 작았음에도 불구하고(성능을 낼 수 없을 정도로) 번역이 된다던가, 영어에서만 학습한 지식이 한국어에도 적용된다던가 하는 현상들이 나타나고 있거든요.
미국이 우수한 인재 다 빨아들이는 블랙홀 같은 나라고..
불가능하다고 생각합니다. 이미 DeepL 품질이 파파고에 비해 월등히 좋더라고요.