스타트업 가이드

스타트업 가이드

당신은 몇 %에 속하나요?


경제학자 제러미 리프킨은 “인류 역사는 0.1%의 창의적인 인간과 0.9%의 통찰력을 가진 인간이 만든 결과물이다”라고 했습니다. 그리고 나머지 99%를 ‘잉여인간’일 뿐이라고도 했습니다. 이 얘기는 ‘시골의사 박경철’의 강연으로도 많이 알려져 있습니다. 


이곳에 오직 0.1%의 CEO만을 위해 0.9%의 통찰력을 가진 변리사들이 준비한 칼럼을 모아두었습니다. 성장과 성공을 위한 올바른 방향을 안내합니다.

[AI타임스] OpenAI의 인공지능 모델 라인업 현황과 미래 전망

이 글은 김성현 대표 변리사가 AI타임스에 기고한 글입니다.




오픈AI(OpenAI)가 배포한 인공지능 모델 중 가장 유명한 것은 챗GPT(ChatGPT)이다. 지난 글에서는 챗GPT를 소개하면서, 챗GPT의 학습 데이터, 학습에 사용한 모델, 학습 환경 등을 토대로 챗GPT가 특허로 보호받을 수 있는지 함께 검토해 보았다. 그러나 오픈AI의 인공지능 모델 라인업을 보면 더 많고 다양하다. 국내에서는 아직 많은 관심을 받지 못하고 있지만, 해외에서는 뛰어난 성능으로 주목받고 있는 모델들을 소개하고 싶다. 필자의 직업은 일종의 기술 작가(Technical Writer)인 변리사이다. 조금 어려운 내용도 있지만 가능한 쉽게 풀이하여 독자들에게 전달해 보겠다. 그리고 가능하다면 OpenAI가 준비하는 미래도 함께 전망해 보겠다.


챗GPT는 대형 언어 모델인 GPT-3로부터 시작되었다. GPT-3를 이용하면 작문, 요약, 질의응답, 분류, 번역 등을 자동으로 할 수 있다. GPT-3는 인간이 쓴 글을 무서울 정도로 실제에 가깝게 모방할 수 있다. 인간이 직접 쓴 글처럼 복잡한 문장을 만들어 낼 수도 있다. 그 때문에 인간이 쓴 글인지 GPT-3가 쓴 글인지 쉽게 구분하기 어렵다. 그래서 인공지능이 작성한 글을 식별해 내는 GPT제로(GPTZero)라는 앱이 출시되어 인기를 누리고 있다. GPT-3가 이해하는 언어에는 프로그래밍 언어도 포함된다. 2021년부터 인간을 대신해 코딩을 하고 있다.


GPT-3는 상업용 글쓰기인 카피라이팅에도 효과적이다. 비개발자 유저라면 제일 관심 분야일 듯하다. 실제로 AB 테스트를 이용하여 인간과 GPT-3 간의 카피라이팅 대결이 이루어졌다. 결과는 더 높은 전환율을 기록한 GPT-3의 승리였다. GPT-3에 대해서 각광하는 이유도 이것 때문이다. GPT-3는 시간, 창의성, 생산성을 도와주는 도구가 될 수 있기 때문이다. 아이디어나 영감이 부족하더라도 누구나 글을 쓸 수 있다. 그것도 고작 몇 초 만에 말이다. 구독료는 인건비에 비하면 얼마되지 않는다.


GPT 모델은 사실 하나가 아니다. 여러 모델이 모여 가문(family)을 이루고 있다. 기본 모델로는 Davinci, Curie, Babbage, Ada가 있다. 나열한 순으로 성능이 우수하고 비싸다. Ada가 가장 저렴하지만 가장 빠르기도 하다. 텍스트 구문 분석, 간단한 분류, 키워드 추출 등의 태스크에 적합하다. Codex라고 하는 모델도 있다. 이 모델은 앞서 말한 코딩을 대신해 주는 모델이다. 수십억 줄의 GitHub 코드를 학습했고, 특히 Python에 가장 능숙하다고 소개하고 있다.


GPT-3는 GPT 시리즈의 3세대 모델이다. GPT-3의 이전 모델인 GPT-2는 15억 개의 파라미터를 가지고 있었는데, GPT-3의 경우 그 수가 1,750억 개다. 인간으로 치면 뇌의 용량과 지능이 100배 커진 것이다. 인공지능의 '파라미터'는 인간의 뇌의 '시냅스'라는 것과 대비된다. 시냅스는 뇌에서 신호를 전달하는 통로 역할을 한다. 인간의 시냅스는 약 100조 개라고 알려져 있는데, GPT 시리즈의 최종 목표도 버금가는 개수의 파라미터일 것이다.


GPT-3의 카피라이팅 (사진= 오픈AI)


달리(DALL-E)를 '이미지 생성기'라는 딱딱한 명칭보다는 '인공지능 아티스트'라는 이름으로 소개하고 싶다. 달리의 이름은 '월-E(애니메이션)'와 '살바도르 달리(화가)'에서 따왔다. 달리는 그림을 그리고, 아웃페인팅과 인페이팅을 하고, 이미지를 변형하기까지 한다.


달리에게 그림을 그리게 하기 위해서는 텍스트로 명령하면 된다. 달리가 학습한 수많은 사진들 중에서 입력한 단어로 분류되어 있는 사진을 단순히 찾아주는 것 아니냐고 의심할 수 있겠다. 그러면 생성형 AI라는 이름을 달리에게 붙였을 리 있겠나. '살바도르 달리'는 초현실주의 화가이다. 그의 화풍을 물려받은 달리는 '아보카도 모양의 안락의자'나 '말을 타고 달을 달리는 우주 비행사'와 같은 이미지도 척척 그려낸다. 정해진 규칙에 따라 명령어를 입력할 필요도 없다. 달리는 우리가 일상에서 사용하는 자연어를 이해하기 때문이다.


아웃페인팅과 인페이팅 실력은 정말 놀랍다. 아웃페인팅은 원본 이미지의 바깥 부분 배경을 그려내는 것을 말하고, 인페이팅은 원본 이미지의 일부를 지워낸 뒤 특정 객체로 덮씌워 그려내는 것을 말한다. 아래 좌측 이미지를 보면, 달리는 원작의 어두운 배경을 벽으로 만들고 존재하지 않았던 몸과 팔을 자연스럽게 만들어냈다. 우측 이미지에서도 달리는 원작에 없었던 플라밍고 튜브를 그려냈다. 빛과 그림자까지 고려하여 티가 나지 않는다.


달리는 입력 받은 이미지를 자유롭게 변형할 수도 있다. 독자들은 한 번쯤 '진주 귀고리를 한 소녀'를 마주한 적이 있을 것이다. 원작은 네덜란드 화가인 요하네스 페르메이르가 그린 것이다. 그러나 우리가 본 작품은 고개가 오른쪽을 바라보고 있거나, 터번의 모양이나 색상이 바뀌었거나, 진주가 더 커졌거나, 귀고리가 다른 것으로 바뀐 것들이었다.


다음 세대 달리는 어떻게 변화할까? 지금까지의 달리가 텍스트를 이미지로 만드는 기술(Text-to-Image)이었다면, 다음은 아마도 텍스트를 비디오로 만드는 기술(Text-to-Video)이 되지 않을까 싶다. 그것이 영상 중심의 콘텐츠 소비 트렌드에 맞다. 그렇게 되면 화가가 아니라 감독을 대신할 수 있게 될 것이다. 아직 음성이나 배경음악이 입혀진 상태는 아니기 때문에 결과물은 무성영화 같은 형태가 될 듯하다.


달리가 그린 작품 (사진= 오픈AI)


위스퍼(Whisper)는 오디오 전문 인공지능이다. 오픈AI는 위스퍼를 '자동 음성 인식(Automatic Speech Recognition, ASR) 시스템'이라고 소개하고 있다. 위스퍼는 음성을 인식하고, 전사와 번역을 할 수 있다. 전사(transcription)한다는 것은 음성을 문자로 옮기는 것을 말한다. 위스퍼는 영어 외 다른 언어도 전사할 수 있다. 이를 위해서 위스퍼는 680,000시간의 다중언어(multilingual) 음성 데이터를 학습했다.


오픈AI의 위스퍼 연구 소개 페이지를 보면, 흥미롭게도 비영어(Non-English) 전사의 예로 K-Pop 한국어 전사를 제시하고 있다. 사용된 음악은 가수 윤하의 '오르트 구름'이다. 위스퍼는 한국어를 인식하고 전사와 동시에 번역을 수행해서 결과물로 'While darkness was my everything I ran so hard that I ran out of breath ...'을 출력해낸다. 위스퍼의 핵심 개발자 중 한국인이 있기 때문이다. 그 덕분인지 위스퍼는 한국어 데이터도 상당 시간을 학습했다.


그 이름답게 악센트가 특이하거나 배경 소음에도 강해 작은 소리도 인식해낼 수 있다. 음성 인식 시스템이라고 하면, 단어 하나 혹은 음절 하나 단위로 인식하는 것이라고 생각하기 쉽다. 그래서인지 내비게이션을 이용할 때 우리는 음절 하나하나를 또박또박 발음하고 있지 않나. 그러나 GPT-3와 형제인 위스퍼는 다르다. 위스퍼는 문맥을 이해하기 때문에 오디오의 다음 단어를 예측하는 방식으로 정확도를 높이고 있다. 이 같은 특성 때문에 위스퍼는 오히려 음성에는 없던 엉뚱한 텍스트를 내놓기도 한다. 점진적으로 개선되리라 기대해 본다.


위스퍼가 전사한 음성 (사진= 오픈AI)


잠시만요!


'문의하기'를 누르시기 전에 충분히 비교해보셨나요?
홈페이지를 둘러보면서 30분만 더 고민해보세요.
그리고 신중하게 결정해주세요. 

위포커스 특허법률사무소


06150 서울특별시 강남구 선릉로91길 14, 201호 (역삼동)

© WeFocus Patent Law Firm. All rights reserved