Chat GPT는 어떻게 말을 배웠을까
예전에 일반적인 기계를 교육하는 방식은 정답에 맞는 알고리즘을 가르쳐주는 것이었다고 한다. 예를 들어, 문장은 주어 + 동사 + 목적어로 구성되고 주어는 “나, 너, 우리” 등이 있으며, 동사와 목적어의 특징을 가진 단어는 이런 것들이 있다고 알려주면 기계가 적용하는 식이었다.
GPT는 말을 할 수 있는 인공지능을 말하며, 그 개념 자체는 구글이 만들었다. Chat GPT는 예전의 인공지능과 학습 방식이 다르다. 흔히 아는 이 데이터는 어떤 데이터라고 정의해주는 데이터 라벨링을 사용하지 않았다. 대신에 방대한 양의 정보를 일단 AI에 넣고, 너 알아서 패턴을 찾아보라고 하는 식이다. 그리고 그렇게 배워서 대답하는 값이 변화가 없을 때까지 학습을 시킨다
그 이후에는 교사학습을 시킨다. 교사학습은 문제와 정답을 알려주는 학습이다. 정밀 교정 작업이라고 할 수 있고, 이 과정이 끝나면 처음 받는 질문에도 답을 할 수 있다. 이 교사학습에 따라 인공지능의 특성이 결정되는 것 같다. 음악과 관련된 문제와 정답을 배우면 음악을 생성할 수 있는 인공지능이 되는 식이다.
Chat GPT로 돈을 버는 방법
이렇게 정밀 교정(Fine tuning) 작업을 통해 각 인공지능 특징을 갖게 되면 새로운 비즈니스에 적용할 수 있다. 당장 Chat GPT 구독서비스를 이용하는데 달에 20달러가 필요하지만, 기능은 질문에 답하는 기능뿐이다. 이 인공지능에 추가로 학습을 시키면, 활동할 수 있는 영역이 음악 생성, 영상 생성, 의료 부문, 등등으로 전문화되고 확대될 수 있다.
관련 AI 시장은 소프트웨어, 하드웨어 모두 크게 성장할 것으로 기대된다. 2018년에 AI 소프트웨어 시장을 전망한 자료는 연평균 27% 시장 성장을 예상했었다. 최근에 나온 다른 곳의 자료를 확인해보니 2030년까지 연평균 37%의 속도로 시장이 성장할 것으로 기대하고 있다. 더불어 AI 하드웨어(가속기) 시장도 함께 성장할 것으로 예상된다.
GPT의 문제점이 있다면
실시간 최신 정보를 반영하지 못한다. GPT를 교육시키는데 2년 정도의 시간이 걸렸다고 한다. 데이터를 집어넣고 패턴을 만드는데 1년 그리고 정답을 말하도록 교정하는데 6개월인가 1년인가가 추가로 소요됐다. 그래서 미국 대통령이 누구냐는 질문에 아직도 트럼프라고 대답하는 웃긴 상황도 벌어진다.
다른 문제점은 만드는 비용이 비싸다는 점이다. 이번 Chat GPT의 기반이 되는 GPT3를 만드는데 비용도 50억이 들었다고 하고, Chat GPT는 1000억원이 들었다고 한다. GPT3의 다음 버전인 GPT4를 만드는데 들어갈 비용은 500~1000억으로 추정되고 있다. Chat GPT에 들어간 GPU만해도 2000개 ~ 1만개가 상용된 것으로 추정되는데, 다음 버전에는 얼마나 더 들어갈까
또 다른 문제점으로 신뢰성이 대두되고 있다. 처음에 구글이 자체 대화형 인공지능 바드(Bard)를 출시하면서 사용한 광고 영상에서 그 내용이 아예 엉터리라는 점 때문에 주가가 폭락을 했었다. 문제는 애당초 논리적으로 배운 것이 아니기 때문에 어디서 틀린 것인지 모른다는 점이다. 그 이후에 Open AI의 Chat GPT도 오답을 냈는데, 이 부분은 크게 기사화되지는 않았다.
인공지능에 경쟁력을 가진 기업과 국가는
앞서 이야기한 단점들을 보완하고 인공지능을 발전시킬 수 있는 국가는 글로벌에 미국과 중국뿐이라고 한다. AI 분야의 개발자의 경우 미국과 우리나라 임금 차이는 20배 수준이며, 미국의 전체 개발자 5%의 인구가 우리나라 전체 개발자보다 많다고 한다. 중국은 임금은 부족하더라도 미국에서 배우고 돌아온 충성심 높은 인민 개발자들이 많다.
게다가 인공지능을 학습시키기 위한 데이터도 많이 확보하고 있어야 한다. 그 조건에 충족하는 곳은 미국과 중국이다. 특히, 구글이 위기라고 하는데 인공지능 관련 기술은 구글이 압도적이다. 구글이 미루다가 성급히 바드(Bard)를 출시하는 이유는 기술력 부족이 아니라, 기존에 자신이 1위이던 검색광고 시장을 오히려 자신이 밀어내는 효과가 생길까봐 망설였던 것 같다.
한국의 기업들은 어떻게 살아남을 수 있을까
한국의 기업들은 데이터도 인프라도 부족한다. 아무리 네이버가 한국에서 잘 나가는 기업이지만, 카카오나 다른 기업들과 합쳐도 구글이 인공지능 투자규모를 따라오지 못한다. 한국 기업들이 노릴 수 있는 것은 틈새 시장이다. 한국어는 글로벌 입장에서는 틈새 시장이다. 네이버가 상반기 GPT를 서비스할 예정이라고 한다. 현재는 다른 GPT에서 발생한 신뢰성 문제를 제고하는 단계라고 한다.
AI 개발에는 GPU가 많이 필요하다. 다량의 데이터를 빠르게 한번에 계산해야 한다. 인공지능 수준이 높아질수록 처리해야 되는 데이터도 많아지고, 필요한 GPU도 많이 필요하다. GPU의 일처리를 도화주는 것이 메모리인데, SK하이닉스는 이 인공지능 분야에 활용되는 메모리가 크게 발전할 것으로 보고 있다
Chat GPT는 어떻게 말을 배웠나
Chat GPT에 대해 공부하던 중, 솔트룩스 이경일 대표님이 기초부터 심화까지 잘 정리해주신 영상을 참고해서 요약했습니다. 이것만 봐도 기초는 이해가 될 것 같습니다.
'정보와 지식' 카테고리의 다른 글
금융위기의 산물, FDIC(연방예금보험공사)와 도드 프랭크 법 (0) | 2023.03.25 |
---|---|
카카오뱅크 주택담보대출, 잔금일에 챙겨야 할 몇 가지 (0) | 2023.03.16 |
일본 엔화와 우리나라 부동산의 관계, 임형록 교수님 (0) | 2023.03.04 |
확률에 대한 이야기, 월가아재의 제2라운드 투자 수업 (0) | 2023.02.26 |
바뀐 특례보금자리론에 대한 정리 (0) | 2023.02.15 |
댓글