요즘 핫한 Chat GPT 파헤치기

Chat GPT가 뭘까?

작년 12월 초, 미국의 OpenAI가 대화형 인공지능 챗봇 'Chat GPT'를 선보였습니다. 이 AI는 자연스러운 대화가 가능하며 출시 후 일주일 만에 100만 명 이상의 사용자를 확보했습니다. 전문가들은 이 AI가 기존의 검색 중심 시장에 혁신을 가져올 것으로 예측하고 있습니다. Chat GPT는 OpenAI의 대규모 인공지능 모델 'GPT-3.5'를 기반으로 하며, GPT(Generative Pre-trained Transformer)는 주어진 텍스트를 바탕으로 다음 텍스트를 예측하여 글을 생성하는 모델입니다.

다른 챗봇과 뭐가 다를까?

그렇다면, 다른 챗봇과 뭐가 다르길래 이렇게 Chat GPT에 사람들이 주목하는 걸까요?

1) 대화의 맥락을 정확하게 파악할 수 있음

우선 Chat GPT는 대화 전후로 맥락 파악이 정확히 가능하다고 합니다. 다른 챗봇의 경우 일단 대화가 끝나면 백지 상태로 돌아갑니다. 다들 많이 경험해보셨겠지만, 우리가 경험한 챗봇은 지금 내가 한 질문에 대한 대답만 내놓을 뿐, 이전에 했던 대화와 흐름이 이어지지는 못했죠. 이는 이전 대화를 기억하거나 학습하는 기능이 없기 때문입니다.

하지만 Chat GPT는 다릅니다. Chat GPT는 사용자와 했던 이전 대화에서 말한 내용을 기억해뒀다가 전후 맥락과 후속 질문에 대한 답을 할 때 사용할 수 있습니다. 이렇게 정확한 맥락 파악이 가능한 이유는 이전 대화까지 기억이 가능하도록 프로그래밍 되어 있기 때문이라고 하네요.

그래서 사람과 대화하듯 자연스러운 대화를 이어나갈 수 있는 것이죠!

2) 잘못된 것을 지적할 수 있음

또 다른 특징은 사용자가 잘못된 질문을 할 경우, Chat GPT가 이의를 제기하기도 한다는 겁니다!

일반적인 검색 기능의 경우 해당 내용을 찾을 수 없다고 나오거나 일부 키워드에 맞는 답변을 내놓는데, Chat GPT는 다릅니다. 예를 들어 “2022년 한일 월드컵에서 가장 인기 있는 축구 선수가 누구지?”라고 물으면 “한일 월드컵는 2002년이고, 2022년 월드컵 개최국은 카타르 입니다”라고 전제 자체에 이의를 제기함으로써 오류를 피한다고 하는데 정말 똘똘하네요😯

또 신기한 것은 사용자가 묻는 질문에 틀린 답을 할 경우, 사용자가 이를 Chat GPT에 지적하면 즉시 인정합니다. 데이터와 알고리즘을 통해 Chat GPT는 대화 내용을 학습하며, 이를 통해 이전의 오류를 반복하지 않도록 개선됩니다. 이는 지속적인 학습을 통해 AI가 계속 성장한다는 것을 의미합니다.

3. 어떻게 이러한 것이 가능할까요?

Chat GPT가 이런 능력을 갖게 된 이유는 오픈AI가 사용한 알고리즘 학습법이 기존 AI 챗봇과 차별화되기 때문입니다. 오픈AI는 Chat GPT의 개발에 실수 기반의 반복적인 '강화 학습'을 적용했다고 블로그에서 설명했습니다. 머신러닝의 한 종류인 강화 학습은 AI가 반복적으로 시행착오를 겪어가며 최적의 방법을 학습하는 기법입니다. 이는 지속적으로 인간의 지시를 받아가며 상황에 맞게 최상의 결과물을 창출하는 방식으로 진행됩니다.

이러한 학습은 강아지가 환경과 훈련사를 포함한 상황에서 학습하는 과정과 유사합니다. 훈련사는 강아지에게 명령이나 신호를 보내고, 강아지는 이를 관찰합니다. 강아지는 반응으로 행동을 하고, 이 행동이 원하는 것과 가까울 때 훈련사는 간식이나 장난감과 같은 보상을 주게 됩니다. 초기에는 강아지가 관측값과 행동, 보상을 연결하기 위해 여러 무작위 행동을 시도할 것입니다.

강아지 관점에서 최상의 시나리오는 모든 신호에 올바르게 반응하여 최대한 많은 간식을 받는 것입니다. 이것이 강화 학습 훈련의 목표인데요, 강아지의 정책을 조정하여 보상을 최대화하는 행동을 배우는 것입니다. 훈련이 끝나면 강아지는 자체적으로 정한 정책을 사용해 훈련사의 명령을 관찰하고 적절히 반응할 수 있게 됩니다.

Chat GPT도 이와 같이 인간 AI트레이너가 챗봇과 나눈 대화 기반의 데이터로 훈련해서 만들어졌지만, 현재는 이용자들과 대화하면서 실시간으로 데이터를 학습할 수 있습니다.

이용자들과 대화하고 피드백을 통해서 강화되는것이죠. 그래서 실수를 바로잡고, 지속적으로 최적의 답을 내놓도록 훈련돼서 잘못된 질문에 대한 이의를 제기할 수 있는 것입니다.

Chat GPT, 어떻게 활용할 수 있을까요?

사용자는 정보를 얻기 위해 기본적인 질문을 할 수 있습니다. 구글 검색은 다른 사람이 작성한 정보를 조합해 얻는 반면, Chat GPT는 마치 선생님이 설명하는 것처럼 답변을 제공합니다. 하지만 아직 놀라기는 이릅니다.

소프트웨어 개발 분야에서는 버그를 설명하고 수정하는 데에도 Chat GPT가 사용됩니다. 이는 디버깅 도구로서 큰 잠재력을 가졌다고 알려져 있죠. 게다가 버그를 찾는 것을 넘어 개발자들에게 코드 작성 방법까지 알려주기도 합니다. 또한 스토리텔링 기능으로 소설, 시, 대본 등의 창작물을 생성하는 것도 가능합니다. 얼마 전 국내에선 영화 '데드풀'의 주인공으로 유명한 라이언 레이놀즈가 자신이 대표로 있는 '민트모바일'의 공식 광고를 Chat GPT를 통해 제작하였는데요, 완벽한 정보 전달과 농담을 겸비해 사람들을 놀라게 했다고 하죠.

이처럼 교육이나 언어 학습, 코딩, 계산, 챗봇 등의 분야에서는 이미 Chat GPT를 기반으로 하는 사업화가 꾸준히 진행되고 있습니다.

Chat GPT, 한계는 무엇일까요?

Chat GPT는 무한한 만능이 아닙니다. 초기 버전인 GPT-1은 1억1700만 개의 매개변수를 갖고 있었고, GPT-2는 15억 개, 현재의 GPT-3는 1천750억 개의 매개변수를 사용합니다. 이런 증가는 성능 향상으로 이어질 수 있지만, 데이터 의존적인 약 인공지능의 한계를 완전히 극복하기는 어려울 것입니다.

또한 정치적 변수나 윤리적 문제에 대한 동작적인 처리에는 여전히 한계가 있으며, 종종 사실과 다른 내용을 그럴듯하게 언급하기도 합니다. 이런 점 때문에 전문적인 정보를 세세하게 설명하려 하지만 틀린 정보가 섞여 있을 수 있습니다. 전문적인 내용을 검색 기반으로 세세하게 설명하려고는 하나, 더러 틀린 내용이 섞여있기도 합니다. 틀린 내용을 너무 그럴싸하게 얘기해서 오히려 더 무섭기도 하다고 하는 반응도 있습니다. 또한 텍스트라는 한계를 벗어나기 힘든 점도 넘어야 할 산입니다.

출처)

1. AI타임(https://www.aitimes.com/news/articleView.html?idxno=148732)

2. BrandBrief(https://www.brandbrief.co.kr/news/articleView.html?idxno=5736)

3. 주간조선(http://weekly.chosun.com/news/articleView.html?idxno=23943)4. IT World
(https://www.itworld.co.kr/news/273763)5. MathWorks

(https://kr.mathworks.com/discovery/reinforcement-learning.html)

6. 모두의 연구소

(https://modulabs.co.kr/blog/chatgpt/)

7. 네이버 칼럼

(https://contents.premium.naver.com/3mit/wony/contents/230108112903807vr)

8. (https://jiho-ml.com/weekly-nlp-53/)

writer 최정현/ editor 최정현