ChatGPT가 난리였다. "였다"라고 쓴 이유는, IT 바닥의 속도감이라는 게 지난주보다 이번 주에 이슈가 적으면 "난리다"라고 말하기 좀 어색해지기 때문이다. 비IT적 관점에서 본다면 지금도 난리다. GPT가 없앨 직업에 대한 칼럼이나, GPT 시대의 자녀교육에 대한 콘텐츠들이 끊임없이 나오고 있으니 말이다.
월 신규 사용자 수 100만을 달성할 때까지 걸린 시간. 틱톡도 9개월 걸린 일을 ChatGPT는 단 2개월 만에 해냈다.
한편, IT기술의 발달에 힘입어 하루가 멀다하고 새로운 기술이 등장한다. 우리네 문과생들은 이제 슬슬 따라가기가 버겁다. 기계학습, 인공지능에 이어 GPT는 도대체 뭐란 말인가. 묻는 말에 대답하는 건 시리와 빅스비가 이미 하던 것들 아닌가. 이세돌 알파고 대국이 엊그제 같은데... 머리가 지끈거린다.
그래서 준비했다. 문과생도 이해하기 쉬운 GPT 이야기. 먼저 비슷비슷해 보이는 기계학습, 인공지능, GPT 개념이 서로 어떻게 다른지 살펴보자. 이어서 이제는 과거 사례가 된 구글 검색, VR 같은 사례와 비교해 보자. 한 번만 이해하면 생각보다 GPT는 어렵지 않다. 이번 기회에 제대로 함 드가보자.
기반기술 ML
GPT를 풀어쓰면 Generative Pre-trained Transformer. 세 단어(Generative, Pre-trained, Transformer)는 기술적인 맥락에서 사용되다 보니 사전을 찾아봐도 GPT라는 용어의 뜻을 직관적으로 이해하기 어렵다. Generative는 "생성하는"이라는 뜻인데, 기존 AI가 생성하는 것과 뭐가 다른지 저 단어만으로는 이해하기 어렵다.
순서대로 보면, 기계학습(머신러닝, Machine Learning, 줄여서 ML) 기술이 자리 잡으면서 AI(인공지능, Artificial Intelligence)가 우리네 삶에 파고들었고, 최근 들어 GPT라는 형태의 AI가 등장했다고 할 수 있다. 좀 더 친숙한 용어로 예를 들면, 반도체 기술이 자리 잡으면서 컴퓨터가 우리네 삶에 파고들었고, 최근에는 양자컴퓨터까지 등장한 것과 비슷한 맥락으로 이해하면 되겠다. 다시 말해, ML이 기반 기술, AI가 포괄적 개념, GPT는 하위 종류다.
프로그래밍할 때, 일반적으로 사람은 의도를 가지고 논리 체계를 개발한다. 그래서 대부분의 프로그램은 순서도로 나타낼 수 있고, 프로그램 개발자가 아닌 다람 사람도 그 순서도를 보면서 내용을 이해할 수 있다. 하지만 ML 기술은 많은 변수로 구성된 일정한 틀을 만들어 놓고, 스스로 적합한 변수들을 찾게 만든다.
예를 들어, 'A 곱하기 B'를 일반적인 프로그래밍으로 접근한다면 'A에 A를 더하는데, 그 횟수를 B번 만큼 반복'한다고 설명할 수 있을 것이다. 이 말을 ML 방식으로 접근하면, 많은 변수로 가득한 어떤 틀을 짜놓고, 구구단표를 던져준다. 그러면 컴퓨터가 그 틀 안에서 변수를 이리저리 바꿔가면서 구구단표와 똑같은 결과가 나오는 변수를 찾아낸다.
이 '틀'을 보통 '모델'이라고 부르고, 구구단표를 '데이터', 변수를 찾는 과정을 '학습' 또는 '훈련'이라고 부른다. 재밌는 점은, 똑같은 틀(모델)에 구구단표 대신 나눗셈표를 던져준다면 그 모델은 나눗셈을 학습하여 변수를 찾아낸다는 점이다. 즉, 곱셈이든 나눗셈이든 모델의 모습은 동일하고 컴퓨터 스스로 찾아낸 변수들의 조합만이 다른 것이다. 그래서 내용을 다른 사람이 본다 해도 모델이 이 변수들로 어떤 결과를 만들어 낼지 이해하기 어렵다. 일반적인 프로그래밍은 그 내용을 이해할 수 있다는 것과 대비되는 점이다.
이런 측면에서, ML이 기존의 기술과 다른 점을 문과적으로 표현하자면 "이게 되는데 왜 되는지는 나도 몰라!!"라고 할 수 있다. 특히나 어려운 모델 유형으로 만든 ML 기술을 보통 딥러닝(Deep Learning)이라고 부르는데, 요즘 ML은 대부분 딥러닝 모델을 이용하므로 일단 그냥 ML로 통칭하자.
이렇게, 어떤 틀(모델)을 정해놓고 스스로 데이터를 통해 방법을 찾아내는 방법론을 ML이라고 할 수 있겠다. 기존의 일반적인 프로그래밍은 의도한 결과만 만들어 낼 수 있지만, ML은 이게 될까 안될까 확신할 수 없는 상황에서도 좋은 결과를 만들어 내곤 한다.
ML 기술을 이용하면 순서도로는 표현하기 어려운 아주 복잡하고 유기적인 처리를 컴퓨터가 해낼 수 있다. 또한 많은 경우, 같은 결과를 만드는 데에 있어 일반적인 프로그램에 비해 훨씬 적은 자원을 사용한다. 그 예로, 사람 얼굴 윤곽을 뒷배경과 구분하는 기술은 일반적인 프로그래밍으로도 구현할 수 있지만, ML을 통해 훨씬 효율적으로 좋은 성능을 낼 수 있다.
포괄적 개념 AI
'인공지능'이라는 말은 사실 수십 년전부터 쓰여왔다. '지능'이라는 말을 어떻게 정의하느냐에 따라 사실 에어콘 자동 온도조절 기능도 인공지능이라고 우기면 우길 수 있을 테니 말이다. 요즘 AI 개념은 대체로 최근 'ML 기술이 적용된 모델을 사용한 기능'을 일컫는다.
90년대에는 "기온이 25도가 넘으면 풍량을 최대로 한다"는 단순한 기능만으로도 인공지능이라 했지만, 2023년에 그런 짓을 했다가는 시장의 놀림감이 된다. 사전적으로 지능이라는 말 자체가 지적인 능력을 의미하므로, 통상적으로 지각-인지-학습-추론에 따른 행위를 컴퓨터가 스스로 할 수 있는 경우 인공지능이라 부른다. 각각의 인공지능이 어떤 ML 모델을 바탕으로 구성되어 있는지, 그리고 어떤 데이터들을 바탕으로 학습했는지에 따라 기능이나 성능 수준이 갈린다.
AI 개념이 점차 대중화되면서 기술로써의 AI 이외에도, 제품으로써의 AI, 마케팅 키워드로써의 AI가 각각 조금씩 다른 의미를 지니게 되었다. 제품으로써는 "이 AI는 뭘 할 수 있나?", 나아가 "인건비보다 싸게 먹힐 수 있나?"가 주 관심사가 된다. 그래서 뭘 할 수 있고, 얼마나 수행하는지, 그리고 얼마나 비싼지가 중요해진다.
마케팅 키워드로써의 AI는 그간의 다양한 SF영화들의 영향으로 "진짜 사람 같다"는 느낌이 드는 모든 것에 쓰인다. 사람을 사람답게 만드는 것이 물리적 외양, 언어, 창작 능력 등이라고 할 때, 3D모델링으로 만든 캐릭터에 AI라는 말을 붙이기도 하고, 자연어를 처리하는 모델이나 서비스에 AI라는 말을 많이 붙인다. 음악, 그림, 사진 등을 만들어 내는 AI들도 많은 관심을 받고 있다.
이제 오늘의 주인공 GPT가 등장한다. 바로 "만들어 내는 AI"가 GPT의 영역이다.
뭔가를 만들어 내는 AI 모델, GPT
GPT서비스 개발 기업 오픈에이아이
뭔가를 만들어내는 부분은 GPT의 G(Generative)와 상통한다. P의 Pre-trained는 이미 훈련되었다는 뜻으로, 기술적, 산업적으로 많은 의미를 담고 있지만 일단은 넘어가자. T의 Transformer는 앞서 말한 틀, 그러니까 모델의 형태를 말하는 것으로 다른 모델과 Transformer 모델의 차이에 대해서도 기술적인 얘기이니 그냥 넘어가겠다. 어디서 아는척할 만한 포인트만 언급하자면, Transformer라 불리는 형태의 모델은 구글에서 처음 고안했다. 구글이 고안한 모델이 현재 구글 사업을 위협하는 요인이 되었다는 아이러니한 소식들을 찾아볼 수 있을 것이다. 참고로, Transformer는 특정 모델명이므로 다른 모델을 사용하는 AI의 경우 생성형 인공지능(Generative AI)이라고 통칭할 수 있다.
인공지능이라 불리는 기능은 대체로 지각-인지-학습-추론을 모두 수행한다. 예를 들어, 사람의 얼굴을 인식하는 AI는 수많은 이미지를 통해 사람의 얼굴과 그 외의 요소를 구분하는 변수들을 학습한 상태에서, 카메라에 들어오는 정보들을 지각하고 이를 해석하여(인지), 어디까지가 얼굴이고 어디까지가 배경인지 어디가 눈/코/입인지를 추론한다. 좋은 모델일수록 적은 연산량으로 더욱 정확하게 추론한다.
생성형 AI는 '추론'의 대상이 글, 이미지, 음악과 같은 경우에 해당한다. 이는 상당히 철학적인 포인트인데, 사람이 만들어 내는 것 중에서 이를 제외하면 대체로 물리적인 실체를 갖기 때문에 '지능'이 생산한다고 보기 어렵다. 이렇게 질문해 보자.
"로봇이 커피를 내리면 음료를 "생성"하는 거니까 생성형 AI 아닌가?"
맞는 말 같기도 하지만 상당히 어색한 논리다. 물리적으로 커피를 만드는 건 커피 가루와 물에 관련된 도구들이며 사람이 이를 제어하는 시스템이다. 바리스타는 분명 경험과 감, 지식을 이용하지만 최종적으로 손과 팔을 이용한다. 그렇다 보니 바리스타의 '지능'이 개입하는 부분은 커피를 내리는 구체적 시점보다는, 그에 앞서 레시피를 만들고 도구와 재료의 상태를 관리하는 이전 시점에 더 많이 적용된다.
이런 식으로, 물리적 결과물을 만들어 내는 것에 관련된 AI를 생성형 AI로 분류하는 것은 어색하다. (이런 말이 있는지 모르겠지만) 오히려 제어형 AI라는 표현이 더 어울릴 것 같다.
그렇다면 AI가 직접 생성할 수 있는 비물리적 결과물. 뭐가 있을까?
문학, 학술논문 등은 결국 언어를 통해 표현되므로 ‘글’로 통칭할 수 있다. 프로그래밍 언어까지도 대체로 기호와 알파벳과 숫자로 표현하니 '글'의 범주에 둘 수 있다. 그 외 물리적 실체가 없는 것들은 시각적으로나 청각적으로 받아들여지되 '글'이 아니므로 그림과 소리, 즉 미술과 음악의 영역이 되고, 나아가 영상의 영역이 될 것이다. 결국 글, 그림, 소리를 생성할 수 있는 AI가 바로 생성형 AI인 셈이다.
특이점이 온 것만 같은 느낌
OpenAI사의 ChatGPT는 최초의 생성형 AI가 아니다. 앞서 말했듯 Transformer 모델은 구글이 먼저 만들었다. 그러면 왜 ChatGPT가 그렇게 유독 난리였을까?
천재 중의 천재 존 폰 노이만, 미래학자 레이 커즈와일 등이 언급한 '특이점'이라는 개념은 특히 인공지능 분야에 있어서 수십 년간 많은 이들의 기대의 대상이면서 동시에 우려의 대상이었다. 그 사전적 정의는 "인공지능 및 기타 기술이 매우 발전하여 인류가 극적이고 돌이킬 수 없는 변화를 겪는 순간"을 의미한다.
어떤 시점을 특이점으로 볼 것이냐에 대한 수많은 논의가 있었다. 그중 통상적으로 받아들여지는 기준은 인공지능이 스스로를 개선해 나갈 수 있는 수준에 이르러 폭발적으로 발전할 수 있는 시점이다.
야구 게임과 비교해 보자. 야구 연습장에서 공을 던져주는 기계는 나 같은 몸치보다 공을 훨씬 잘 던진다. 하지만 그 기계는 타자 역할을 할 수는 없으므로 야구 게임을 한다면 득점을 할 수 없다. 결국 게임이 성립되지 않는다. 만약 어떤 회사가 만든 야구 로봇이 간단한 투구와 배팅, 수비를 할 수 있다고 생각해 보자. 그러면 게임이 성립되긴 할 것이다. 하지만 이들이 5세 수준의 운동능력과 지능 수준을 갖고 있다면, 성인 야구팀에게는 무조건 패배할 것이다.
또 다른 가정, 이 회사가 기술을 발전시켜 게임을 하면 할수록 운동능력과 지능 수준이 향상되게 만들었다고 치자. 게임을 할수록 전략도 좋아지고 에러율도 줄어들고 타율도, 제구력도 좋아진다. 그렇다면 이 로봇이 성인 야구팀을 이기는 것은 시간문제다.
이렇게 '시간 문제'가 되는 순간이 바로 특이점이다. 컴퓨터나 로봇은 단순하게 무한 반복하여 훈련할 수 있고, 그만큼 발달 속도가 높아질 것이기 때문이다. 마치 알파고가 자기들끼리 가상의 바둑을 무한히 두어 실력이 급속히 늘어난 것처럼 말이다. 특이점이 아직 오지 않았다면, 아무리 시간이 주어져도 기계가 인간을 앞지를 수 있으리란 기대는 할 수 없다. 반대로 시간이 주어지고 언젠가 인간을 앞지를 수 있으리라 기대할 수 있다면, 결국 그 시간은 계속 단축되어 기계가 인간을 앞지르게 된다. 그 구분점이 바로 특이점이라 불리는 기준이 된다.
ChatGPT가 난리였던 이유는, 마치 그 '시간 문제'인 단계에 거의 이른 것 같다는 느낌을 주기 때문이다. ChatGPT가 만들어 낸 글들은 폭넓은 범위에 있어 어지간한 인간의 수준에 크게 떨어지지 않고, 때때로 웬만한 전문가 못지않은 수준의 결과물을 내기도 한다. 기존 심심이나 Siri, 빅스비와 크게 다르다. Siri나 빅스비 같은 음성비서 서비스를 쓰다 보면 어느새 말을 못 알아듣거나 했던 얘기를 또 하는 과정에서 답답함을 느끼지만, ChatGPT는 비교하기 어려운 수준의 매끄럽고 세련된 말로 대답한다.
나아가, ChatGPT는 인간의 언어뿐만 아니라 프로그래밍 언어도 구사한다. 그래서 사람들은 이런 생각을 하게 된다.
"이 정도 수준의 지능이 프로그래밍을 직접 한다면, AI가 직접 AI를 개선하는 단계가 오는 것도 시간문제다."
"그렇다면 바로, 이 순간이 특이점이 아닐까?"
맞을 수도, 틀릴 수도 있다. 우리가 전혀 몰랐던 새로운 요인이 "아쉽게도 이번에는 특이점이 아니었다"는 판정을 내릴지도 모른다. 반대로 이미 지금, 이 시각 어느 한편에서는 AI가 스스로를 개선하는 코드를 직접 만들어 내는 중일지도 모른다. 우린 준비해야 할까? 아님 설레발 치지 말라고 코웃음 한번 치고 그냥 평소처럼 착실히 살면 되는 걸까?
정답은 모르지만, 과거의 사례로부터 배울 게 있는지 훑어보며 마무리해 보자.
"GPT는 거짓말쟁이다?": 구글 검색엔진 사례
2023 구글 연례 개발자 회의에서 연설 중인 구글 CEO 순다르 피차이
출처 - <구글 제공>
1998년, 구글 검색엔진이 만들어졌다. 기존 디렉터리형 검색포털에 비해 웹 크롤링(웹 문서를 자동으로 긁어오는 것)과 검색 알고리즘의 강화로 기술적인 승부를 걸어 시장의 뜨거운 반응을 얻었다. 물론 주요 수익원인 광고 사업이 천재적이었지만, 분명 시장에서 사용자에게 첫 반응을 얻은 건 검색엔진의 성능이었다.
기존 야후와 같은 검색포털들은 대중이 방대한 웹 문서 중 필요한 정보에 접근하는 과정을 도와주고, 콘텐츠나 제품의 소비로 이어지게 하는 데에 중점을 두었다. 하지만 구글은 아주 복잡한 검색어를 통해 가장 관련성이 높은 문서를 찾아갈 수 있게 하는 데에 중점을 두었다. 그냥 빌보드 차트에 요새 어떤 노래가 인기 있나 하는 수준의 간단한 정보를 찾는 것은 야후가 더 편했지만, 대학생들이 18세기 문학에 대한 과제를 쓸 때는 야후에서 절대 찾을 수 없는 문서를 구글에서 찾아낼 수 있었다.
한국에서는 네이버가 "그런 목적이라면 사람들끼리 묻고 답해봐"라는 태도로 지식검색기능을 만들면서 전혀 다른 역사로 이어졌지만, 미국을 비롯한 영어권 국가들은 구글 검색엔진의 강력한 성능에 힘입어 순식간에 구글 중심의 생태계가 만들어졌다. 그러다 보니 구글 검색엔진에 대한 문제 제기가 이어졌다.
'검증되지 않은 웹 문서'를 결과로 내다보니 잘못된 정보들이 확대 재생산되었다. 비윤리적, 폭력적, 불법적인 문서에 너무 쉽게 접근할 수 있게 되었다는 문제의식도 있었다. 또 학생들이 과제를 구글 검색 결과로 대체하면서 학교에서 이를 막기 위해 골머리를 앓기도 했고, 너무 쉽게 저작권이 침해되는 것도 문제가 됐다. 아마 2000년대 초반을 겪었던 사람들은 기억할 것이다. 이러한 문제로 "나는 인터넷을 하지 않는다. 책을 본다" 하는 사람도 꽤 많았다. 한국 시장에서도 지식검색이나 블로그에 부정확한 정보가 범람하여 이슈가 됐었고 이 때문에 국내 검색포털을 쓰지 않는 사람들도 많았다.
지금도 ChatGPT가 사실과 다른 대답이나 엉뚱한 대답을 하는 경우를 놓고, "아직 GPT 기술은 갈 길이 멀다"라고 말하는 경우가 많다. 갈 길이 멀다는 건 일면 맞는 말이다. 하지만 과연, 20년 전 검증되지 않은 웹 문서들로 인해 구글 검색이, 네이버 포털이 갈 길이 멀었다고 할 수 있을지 생각해 볼 필요가 있다.
지금도 대부분의 검색엔진에서 어떤 내용을 검색하면 출처나 진위를 알 수 없는 정보들이 무수히 쏟아져나온다. 심지어 공식적인 언론사에서도 가짜뉴스를 내거는 상황이니 말이다. 하지만 우리는 여전히 구글과 네이버를 쓴다. 내가 클릭하는 검색 결과가 사실일 확률이 그리 높지 않다는 걸 알면서도 수시로 접속한다.
정확도의 높고 낮음보다 편의성이 중요한 서비스이기 때문이다. 맞춤법이 궁금하면 국립국어원 홈페이지에 가고, 부동산 시세가 궁금하면 국토교통부 실거래가 공개시스템에 가면 되지만, 우리는 대체로 포털사이트에서 그냥 다 찾아본다. 더 편하기 때문에.
포털에서 찾는 것 보다 GPT가 편해지는 시점이, 시장의 판도를 바꾸는 시점이 될 것이다. GPT가 난리였던 이유는, 이미 어느 정도 어떤 부분에서는 검색보다 편해서이다.
"그래서 뭘 할 건데?": VR의 사례
출처 - <TNW>
VR 기술은 혜성처럼 등장해서 운석처럼 추락해 버렸다. 그 압도적인 입체감과 몰입감은 2015~2016년도에 IT업계를 뜨겁게 달궜다. 하지만 지금 VR은 번화가에서 처량하게 색바랜 간판 속을 장식하거나, 주책맞은 40대 남성의 방 한쪽에 처박혀 있다. 팔머 러키와 존 카멕이 설립한 오큘러스는 당시 페이스북(현, 메타)에 20억 불로 인수합병되었다. 그러나 지금은 천덕꾸러기가 되었다.
그렇게 뜨거웠던 기술이 순식간에 추락한 데에는 수많은 이유가 있겠지만, 종합적으로 표현할 때 "그래서 그걸로 뭘 할 건데?"라는 질문에 대한 대답이 빈약했다는 것에 있다. 열기가 쭉 빠진 지금, VR은 안전과 관련된 훈련이나 어떤 행사장의 체험 부스 외에, 일부 게임이나 성인 콘텐츠에 사용되는 정도이다. 2016년만 해도 이걸로 그림도 그리고 영화도 보고 여러 군데 다 쓰일 거 같았지만, 이유야 어쨌든 결과적으로 그러지 못했다.
GPT가 맞닥뜨린 상황도 비슷하다. 생성형 AI가 지금 '할 수 있을 것으로 보이는' 영역 중, 과연 실질적으로는 어디까지 쓰일 수 있을까. 의사 시험에 합격했다고는 하지만 의약품의 처방이 가능할까. 회계사 시험에 떨어졌다고는 하지만 합격한다면 회계사를 고용하는 대신 ChatGPT에 과금하면 될까?
OpenAI의 ChatGPT가 난리를 치자, 여타 거대 IT기업들이 우후죽순 생성형 AI를 발표하고 있다. 그리고 저마다 "우린 이런 걸 할 수 있다!!"고 내건다. 일면 2016년도 VR 업계와 비슷한 느낌이 들기도 한다.
ChatGPT가 주목받고 각 IT사들이 발 벗고 나선 지 이제 1~2개월 남짓 지난 상태이기 때문에 속단하긴 이르지만, 이렇게 "우린 이것도 돼요, 쟤넨 저거 안 돼요"하는 모습들을 보고 있자면, 2016년도 VR 시장에서 느꼈던 위화감이 데자뷰처럼 느껴진다. 그 위화감은 소위 '공급자 중심의 마인드'에서 기인한다. 일반인 입장에서야 6DoF든 3DoF든, inside-out 방식이든 outside-in 방식이든 알바 아니고 그냥 이걸로 뭘 할 수 있느냐가 중요한데, 당시 VR 시장은 소비시장 규모가 큰 게임 분야에 일찌감치 타겟팅해버린 채 기술 우위에 천착했다.
생성형 AI 시장도 비슷한 숙제를 앞둔 시점이다. 뭘 할 수 있냐는 질문에 대한 명쾌한 대답을 내릴 수 있느냐에 따라 또 하나의 일장춘몽이 될 수도, 진짜 특이점의 시작이 될 수도 있을 것이다. 다분히 업계 사람들의 숙제이긴 하지만, 여기서 소비자인 우리가 할 수 있는 건 계속 해서 물어보는 것이다. "그래서 뭘 할 수 있냐?"는 여론이 지속 형성되어야, VR 시절처럼 일찌감치 헛다리를 짚고 삽질하는 상황을 미연에 방지할 수 있다. 더 가치 있는 일을 하는 방향으로 발전해야 VR의 전철을 밟지 않을 것이다.
GPT의 앞날: 춘심애비의 관점을 담아
어느덧 IT 밥을 먹은 지 20년이 다 되어간다. 나름 VR 업계도 기웃거려 보고 ML 모델로 연구개발도 해보면서 관련 기술들을 지속 깔짝거려 본 바, ChatGPT의 열풍에 힘입어 재빨리 유료 결제를 해놓고 이런저런 테스트를 하고 있다. 한 달에 20불을 결제한 대가로 현재 사용하고 있는 여러 가지 기능 중 지극히 실무적인 부분이 있다면, 자료조사와 영문 이메일 작성이다.
자료조사의 경우, 구글링으로 직접 내용을 찾아보고 머릿속에서 정리한 후 요약하는 것에 비해, GPT를 사용하는 것이 시간상 3~4배 정도 절약되는 느낌이다. 자료 퀄리티도 마찬가지. 종종 예상치 못한 헛소리를 할 경우가 있기 때문에 조사 결과를 내가 한 번 더 검토하는 시간을 감안하더라도, 온전히 구글링만 사용하던 것에 비해 훨씬 유용하다.
영문 이메일의 경우에는 좀 더 유용하다. 애초에 내가 업무적으로 쓰는 영문 이메일의 수준이 그리 높지 않으나, 이메일을 받는 사람에게 짧은 영어 실력을 들키지 않으려는 욕심 때문에 영어 문법이나 표현을 다듬는 데에 긴긴 시간이 걸렸다. ChatGPT는 (당연하게도) 영어를 나보다 잘하기 때문에 (그러 고보면 한국어도 나보다 잘하는 것 같지만) 의도만 잘 담으면 정말 매끄러운 이메일을 작성해 준다.
<컨트롤 C+컨트롤 V>를 한 뒤, 내가 습관적으로 사용하는 몇몇 단어로 수정해서 보내면 최소한 10분은 걸리던 과정을 2분 이내로 단축할 수 있다. 이렇게 자료조사와 이메일 작성만 해도 한 달에 2시간 이상은 단축되고, 이 정도면 20불 정도를 지출하는 데에 그렇게 아깝다는 생각은 들지 않는다. 다만 여기서 두 가지 문제가 있다.
첫 번째는 가격. 현재 월 20불은 OpenAI 측에서 남겨 먹을 생각 없이 최소한으로 잡은 가격일 가능성이 높다. 유튜브에도 결국 광고가 붙고 유료 상품이 생기듯, OpenAI도 결국 가격이 오르거나 광고가 붙을 것이다. 과연 미래의 가격도 지금처럼 합리적일 것인가. 섣불리 광고를 붙이거나 가격을 올려서 망한 수많은 사례들을 피해 납득할 수 있는 수준을 유지해 낼 것인가가 관건이다.
둘째, 진짜 특이점을 만들어 낼 수 있는가 하는 점이다. 현재 IT 덕후들 사이에서는 이 GPT를 활용한 여러 가지 실험들이 활발히 진행 중이고, 그중에 Auto-GPT라는 프로젝트는 전 세계 덕후들의 이목을 사로잡고 있다. 이 기능은 GPT를 이용해 단순히 질문에 답을 하는 게 아니라, 스스로 구글링을 하고, 자료를 모아서 저장한 후, 저장한 자료들을 다시 이해해서 다음 질문을 연쇄적으로 만든다. 그 과정을 통해 더욱 깊이 있고 범위가 넓은 업무를 수행할 수 있도록 하는 실험적인 모델이다.
출처 - 영화 <아이언맨>
이 모델이 작동하는 모습을 보고 있으면 진짜 아이언맨의 자비스가 눈앞에서 돌아가는 것 같은 느낌을 받는다. 하지만 테스트 도중 문제가 쉽게 발견된다. GPT가 헛소리하는 구간으로 접어들게 되면, 꼬리에 꼬리를 물고 헛소리가 헛소리를 낳는 악순환에 빠진다는 것이다. 내가 해본 간단한 테스트 과정 중 하나였던 "뉴진스 멤버들의 프로필을 정리해"라는 과제에 대해 Auto-GPT는 "한국의 9인조 여성그룹으로, 멤버는 하니, 혜인, 지니, 제인, 다니엘, 지수, 하나, 지은, 제니 이다"라는 이상한 답변이 튀어나오면서 존재하지 않는 멤버들의 생년월일, 별명, 맡은 역할 등을 제 맘대로 만들어 내기에 이르렀다.
GPT가 프로그래밍 언어를 직접 구사하여 코드를 짤 수도 있지만, GPT가 짠 코드를 그냥 그대로 실행해서 오류 없이 작동하게 하려면, 대체로 내가 바탕을 짜놓고 일부분만 맡겨야 했다. 전체를 다 짜게 하는 경우는 아직 성공적으로 실행된 적이 없다.
위 두 가지 포인트를 종합하여 질문을 단순화하면,
"특이점을 만들어 낼 수 있을 정도로 기능이 자리잡히면서, 충분히 저렴한 가격에 형성될 수 있을 것이냐?"
는 것이다. 나의 전망은 "그렇다"이다.
VR은 다분히 '소비재'의 성격이 강한 제품이었다. 성능이나 활용도가 충분히 자리 잡지 못했기 때문에 결과적으로 '사치재'에 전락하게 되었다. 사람들은 VR을 구매할 때 비슷한 가격으로 구매할 수 있는 콘솔 게임기나 모니터와 비교하게 되었고, 대체로 그런 것들을 이미 보유한 사람 중 경제적 여유가 되는 사람들이 추가로 구매하는 기기의 포지션이 됐다. 이런 사치재는 실질적 성능뿐 아니라 아주 디테일한 경험이나 뉘앙스, 감성적 브랜딩도 영향을 끼친다.
천안삼거리 휴게소에 설치된 솜사탕 제조 로봇
출처 - <충청신문>
생성형 AI는 소비자들이 직접 사용하기보다는, 기업들이 사용하는 '생산도구'에 가깝다. "콜라냐, 사이다냐?"라는 고민이 소비재의 영역이라면, 생산도구의 영역은 "매점을 만들 것이냐, 자판기를 둘 것이냐?"의 고민과 비슷하다. 이 영역은 소비재에 비해 훨씬 이성적이다. 덧셈과 뺄샘을 해보면서 더 이득이 많은 선택을 하게 된다. 최근 들어 많은 쇼핑몰이 솜사탕을 만드는 로봇을 들이기 시작했다. 복합적인 이유가 있겠지만, 가장 직접적인 이유는 이제 로봇 임대료가 솜사탕 만드는 사람 한 명 인건비보다 적어졌기 때문이다.
이제야 말하자면 GPT의 P는 Pre-trained 이미 훈련된 모델이라는 의미로, 한 버전이 그대로 완성된 상태에서 작동한다. 그 외에 많은 AI 모델은 강화학습이라는 과정을 통해 지속적으로 변화한다. 이미 완성된 상태로 찍어내는 제품이, 향후 계속 변화할 수 있는 제품에 비해 원가적으로나 유지보수비용적인 차원에서 저렴할 가능성이 높다는 점은 상식적인 선에서 예상할 수 있다. GPT 유형의 모델들은 가격적으로 꽤 유리한 입장인 셈이다.
생성형 AI의 수준은 이미 사람과 구분하기 어렵고, 시장의 뜨거운 반응을 얻고 있으니, 지금도 실시간으로 수많은 데이터가 생성되고 있을 것이다. OpenAI가 치고 나간 사이 구글이나 다른 IT 대기업이 한걸음 뒤처진 것으로 보이겠지만, 수년 내에 또 다른 인수합병이 일어날 것이고, 이미 거대한 데이터를 보유한 대기업들이 어느 한순간 선두를 역전하거나 위협하는 일은 언제든지 벌어질 수 있다.
그러한 가운데, 어지간한 사람 한 명의 인건비를 대체할 수 있는 생성형 AI 제품 출시는 시간문제가 될 것이다. 앞서 말했듯, IT 바닥에서 "시간 문제"가 되는 순간, 그 일은 반드시 벌어진다. 정말 특이점의 시대가 온 것인지, 조심스러운 마음으로 지켜보고자 한다.
https://www.ddanzi.com/ddanziNews/772799995
Gpt는 기존의 검색, 수집에 편집까지 갖춘 프로그램임. 한때 Ai분야에서 퍼지(애매한)이론에 광분하다가 불가능하다고 선언한 뒤 이 이론을 폐기함. 퍼지이론은 진짜 인간과 똑같은 사고체계를 추구했던 이론임.