22년 11월 Open AI에서 공개된 대화형 인공지능 서비스 챗 GPT (Chat GPT)는 뛰어난 성능으로 많은 관심과 주목을 받았습니다. GPT와 관련된 정보가 티비와 신문, 그 밖의 다양한 매체에서 쏟아져 나왔으며, 관련 주식들 또한 크게 주목받았습니다. 하여 대화형 인공지능 서비스 챗 GPT란 무엇인지, 그리고 그 기능과 활용, 향후 발전과 한계 등에 대한 정보를 알아보았습니다.
인공지능 관련 글에서 자주 보이는 단어들
- 매개변수(파라미터)
AI가 사용자의 의도를 이해하기 위해 필요한 데이터를 말합니다. 언어모델이 학습 중에 신경망에서 조정되는 값으로, 매개변수의 수가 많을수록 인공지능이 더 좋은 성능을 가졌다고 할 수 있습니다. - 언어모델
네이버에서 검색을 하면 '단어 시퀀스에 대해 확률을 할당하는 모델'이라고 나와있습니다.
좀 더 풀어쓰면 '특정 단어의 뒤에 어떤 단어가 나오는 게 좋을지 통계적, 확률적으로 예측하는 모델'이라는 뜻입니다. 이때 사용된 데이터가 많을수록, 그리고 정확할수록 보다 정확한 답변을 해줄 수 있는 것입니다.
챗지피티 (챗 GPT)란
챗 GPT는 2015년 12월 샘 알트만에 의해서 설립된 Open AI에서 만든 대화형 인공지능 서비스로서,
Open AI에서 만든 언어모델인 지피티 3.5와 지피티 4.0을 기반으로 하고 있습니다.
(챗은 채팅을 뜻하는 말이고, GPT는 Generative Pre-trained Transformer의 약자입니다. 직역하면 '사전 훈련된 생성 변환기'라는 뜻으로
'답변을 생성하는 미리 학습된 신경망 모델'이라는 의미라고 할 수 있습니다.)
사실 '대화형 인공지능'이라 불리는 서비스는 다양하게 존재했고 또 주변에서 쉽게 이용할 수 있었습니다. 가장 흔한 챗봇이라 불리는 서비스가 있었으며, 스마트폰에서 이용할 수 있는 빅스비나 시리 또한 대화형 인공지능 서비스의 한 종류입니다.
챗GPT도 이런 프로그램과 유사한 대화형 인공지능 프로그램입니다.
이렇게 흔한 프로그램임에도 챗지피티가 더 많은 관심과 주목을 받은 이유는 타 서비스들이 따라올 수 없을 정도의 정확도와 세밀함 그리고 보다 인간에 가까운 문장을 생성할 수 있기 때문입니다.
Open Al의 언어모델 지피티 간략 소개
챗지피티는 언어모델 지피티 3.5와 4.0을 기반으로 한 서비스이기 때문에 그 성능이나 특징 또한 지피티 3.5와 4.0와 같다고 할 수 있습니다.
지피티는 2018년 공개된 1.0 버전부터 3.5 버전을 거쳐 최근의 4.0 버전까지 공개되었습니다.
- GPT1.0
간단한 대화만 가능. - GPT2.0
15억 개 정도의 매개변수를 가져 1.0보다 향상된 성능을 보여주지만, 그럼에도 정확도가 매우 떨어져 실사용에는 어려움이 있었습니다. 스마트폰에 탑재된 시리, 빅스비가 챗지피티 2.0 정도의 인공지능입니다. - GPT3.0
20년 6월 11일 공개. 매개변수가 1750억 개가 되어 2.0보다 우수한 성능을 보임. - GPT3.5
이 버전은 기존의 3.0 버전을 미세조정시킨 언어모델로 챗GPT에 탑재된 언어모델이 3.5 버전. - GPT4.0 - 23년 3월 14일 공개된 가장 최신버전의 모델. 유로서비스인 ChatGPT Plus 가입자만 이용가능.
(3000~6000억 개의 파라미터를 가졌다는 의견부터, 1조 개 또는 100조 개의 매개변수를 사용할 것이다라는 의견도 존재합니다. 하지만 실제로 OpenAI 측에서 해당 정보를 공개한 적은 없습니다.)
GPT 3.5와 GPT 4의 차이점과 능력
위와 같은 여러 버전 중에서도 챗지피티에 사용된 버전은 무료로 사용가능한 3.5와 유료 서비스인 4.0입니다.
현재 이용 가능한 이 두 개 버전의 지피티가 어떤 능력을 가지고 있으며, 서로 어떤 차이가 있는지 알아보겠습니다.
1. 단어의 기억 능력 (처리 능력)
- GPT 4.0은 GPT 3.5 보다 8배 정도 향상된 기억력을 가지고 있습니다. 3.5 버전이 3000개 정도의 단어를 기억한다고 한다면 4.0은 대략 25,000개의 단어를 기억할 수 있습니다.
2. 대화 내용을 기억할 수 있는 능력에서도 기존 3.5 버전은 4쪽 정도만을 기억할 수 있었지만, 4.0은 50쪽 가까운 분량을 기억할 수 있게 되었습니다.
3. GPT3.5와는 달리 GPT4.0은 멀티모달(Multi Modal) 방식의 모델입니다.
- 멀티모달이란 하나의 인공지능이 이미지나 글, 음성 등 여러 종류의 데이터를 동시에 다룰 수 있는 능력을 말합니다.
- GPT4의 경우 사진을 인식하고 해석할 수 있습니다.
- 예를 들어, GPT4에게 아래 사진을 보여주며 '끈을 끊으면 어떤 일이 벌어질까?'라고 질문을 한다면 '풍선이 날아가버려'라고 답을 한다고 합니다.
4. GPT3.5는 미국 변호사 시험에서 하위 10%의 낮은 성적을 보였지만, GPT4.0은 상위 10%의 성적을 보여주었습니다.
또한 미국의 대학 입학시험인 SAT의 읽기와 수학시험에서 상위 10%에 해당하는 능력을 보여주었습니다.
5. GPT4는 더 큰 모델크기를 가졌기 때문에 3.5에 비해 더 높은 처리능력을 필요로 하고 이에 따라 답변을 하는데 더 많은 시간과 데이터를 사용하게 되었습니다.
결론적으로 그리 복잡하지 않은 간소한 질문이나 답변이 필요한 경우에는 GPT3.5를 사용해도 충분하지만 좀 더 자세하고 최신의 정보와 답변을 원한다면 GPT 4.0을 추천합니다.
사진 - 챗 GPT에 물어본 GPT3.5와 4.0의 차이점
챗 지피티 4.0의 활용
1. Microsoft 365 Copilot
지난 23년 3월 17일 마이크로소프트는 GPT4.0을 탑재한 인공지능 도우미 Microsoft 365 Copilot를 공개했습니다.
Microsoft 365 Copilot을 이용하여 문서나 파워포인트 등의 생성을 도와주는 프로그램입니다.
- 워드를 분석해서 문장을 수정하거나, 파워포인트를 자동으로 생성하는 것이 가능해지며, 파워포인트의 내용이나 사진 위치나 크기 등을 자동으로 변경해주기도 합니다.
- 앞으로 업데이트를 통해 음성인식 능력이 추가된다면 말로 명령을 내리는 것만으로 파워포인트를 만들 수 있게 될지도 모릅니다.
- 또한 사용자의 윈드라이브에서 자동으로 적합한 사진을 찾아내 적용하는 능력을 갖추기도 했습니다.
2. 스픽의 AI 튜터
AI튜터는 AI가 상황, 맥락, 분위기를 파악해 실제 원어민 같은 대화를 구사하며 자유자재로 프리토킹이 가능한 서비스입니다.
- GPT4.0을 기반으로 개발된 프로그램이며, 인공지능이 사용자의 수준을 평가하고, 어색한 표현이나 잘못된 문법을 정확하게 수정해주기도 합니다.
3. GitHub Copilot X
코드제안이나, 개발자가 입력한 코드와 오류 메세지를 인식하고 단위 테스트 생성 및 버그에 대한 제안된 수정 사항 등을 제공합니다.
향후 발전방향
한계와 문제점
- 환상 (환각).
환상은 AI가 사실과 다른 정보나 존재하지 않는 정보를 마치 사실인 것처럼 답변하는 문제를 말합니다.
GPT가 알지 못하는 질문, 제대로 학습하지 않은 정보에 대한 질문이 주어졌을 때 주로 발생합니다. 최근 GPT4로 넘어오면서 40% 정도 오류를 줄였다고는 하지만 완전한 해결을 이루지 못하고 있습니다.
따라서 간단한 질문을 하는 것은 큰 문제가 되지 않지만, 의료 정보와 같이 중요한 일과 관계된 질문을 할 때는 100% 믿기보다는 오류의 가능성을 늘 포함하는 것이 좋을 것 같습니다. - 실시간 데이터 학습 불가.
- 논리에 취약.
챗 지피티가 인공지능이라 불리고 있지만,
질문에 대해 의미를 파악하고 스스로 생각하여 답변을 내놓는 것은 아닙니다. 그저 확률을 계산하여 가장 높은 확률을 가진 답변을 내놓는 것뿐입니다.
그렇기 때문에 논리적인 답을 필요로 하는 질문(수학 계산과 같은)에 대해서는 약한 모습을 보여줍니다. - 기억력의 한계.
지피티 3.5의 경우 3000개의 단어를 초과하면 챗지피티는 이전의 대화를 기억하지 못한다고 한다. 대화가 길어질수록 대화의 일관성이 떨어지게 되는 것이다. - 정보 유출.
chatGPT에 입력되는 정보는 개발사인 OpenAI 측에서 확인이 가능하며, AI학습에 이용될 수 있습니다.
최근 chatGPT가 가진 뛰어난 능력을 활용하기 위해 업무에 이용하는 일이 많습니다. 이때 유출되어서는 안되는 중요한 정보, 데이터를 chatGPT에 입력하게 되면 이러한 중요 정보들이 외부로 유출될 수 있습니다. - 편향성 문제.
데이터를 학습하는 프로그램이기 때문에 정보에 대한 편향성 문제가 항상 존재합니다.
최대한 객관적 정보를 학습한다 하여도 결국에는 인간이 만든 정보를 학습하는 프로그램입니다.
따라서 데이터의 편향, 언어의 편향 등 논란의 여지가 있는 질문에 대해서 완전히 중립적일 수 없습니다.
마치며
chatGPT가 여러면에서 놀라움을 주기도 했지만 한편으로는 우리가 생각하고 꿈꾸었던 인공지능에 비하면 아직 가야 할 길이 멀었다는 생각을 지울 수 없었습니다.
하지만 인공지능은 우리가 꿈꾸던 그런 모습은 아닐지라도 이미 다양한 곳에서 다양하게 활용되고 있습니다.
머지않아 더욱더 발전할 챗지피티와 그밖의 다른 인공지능들이 어떤 식으로 우리의 삶에 스며들지 상상해 보며,
이상으로 인공지능 서비스 챗GPT의 간략한 정보와 기능, 활용, 한계에 대한 포스팅을 마치겠습니다.