이 글은 김성현 대표 변리사가 AI타임스에 기고한 글입니다.
인공지능 자체가 인프라가 되어가고 있다. 이제 누구든지 어디서나 언제든지 원하는 대로 오픈소스나 API를 통해서 인공지능을 도입하고 사용할 수 있다. 인공지능의 역할이 특정 기능에 국한되던 짧은 과거를 지나 인공지능 일상화 시대가 다가오고 있다. 인공지능이 점차 공공재 또는 공공자원의 성격을 띠어가고 있다. 인공지능을 이용한 제품 또는 서비스를 공급하는 기업들은 이제 인공지능 적용만으로는 차별화하기 어렵게 되었다. 설령 차별화에 성공한다고 하더라도 특허와 같은 억제 수단이 없는 한 경쟁사의 빠른 복제, 표절, 모방을 막아내는 것은 불가능하다. 인공지능 기술 특허의 성공 여부 비즈니스의 성패를 좌우하게 될 것이다.
특허를 받는 데 있어 가장 큰 걸림돌은 진보성이다. '진보성'은 특허를 받고자 하는 발명(이하 출원발명)과 선행기술 간의 차이점을 평가하는 것이다. 평가 결과 그 차이점의 수준이 통상의 창작 범위를 벗어나는 경우에 한하여 특허를 주게 된다. '통상의 창작 범위'라는 것은 선행기술에 보탠 아이디어의 수준이 미미한 경우라고 설명할 수 있겠다. 인공지능 기술에 대한 특허청의 진보성 판단 절차는 다음과 같다.
가장 먼저 출원발명과 선행기술의 과제 해결 원리가 동일한지를 판단한다. 쉽게 설명하면 '문제 인식과 해결 방식이 근본적으로 동일한지'를 판단한다. 출원발명과 선행기술이 동일한 문제 인식에서 출발했고, 문제를 해결하기 위한 특유의 아이디어나 기술 구성에 있어서도 차이가 없는 가운데, 단순히 '인공지능을 이용하는 것'만이 유일한 차이점이라면 특허를 받는데 실패할 것이다.
예를 들어, 기술 구성을 전반적으로 동일하게 둔 채 룰베이스 시스템을 머신러닝 시스템으로 대체하는 경우는 대부분 특허를 받을 수 없다. 사람이 수행하는 업무를 인공지능 기술을 이용하여 단순히 시스템화한 경우에도 진보성을 부정한다. 이런 상황은 대체로 다음의 원인에 의해서 발생한다. '인공지능을 이용해 보자'라는 콘셉트 수준의 아이디어만 도출하고 멈춘 경우 또는 나름의 기술적 특징들이 있었지만 이를 특허 명세서에 담아내는데 실패하는 경우이다. 후자라면 대리인에게도 책임이 있다.
과제 해결 원리에 차이가 없는 것으로 판단하였다면, 다음 단계로 학습 모델이 동일한지를 살펴본다. 모델이 같은 것인지 다른 것인지 만을 살펴보는 것은 아니고, 공지의 학습 모델(예: CNN, RNN, GAN, Transformer 등)을 적용한 것인지도 함께 살펴본다. 여기서 선행기술과 신경망이 구조적으로 달라 효과의 차이를 보인다면 진보성을 긍정한다. 그러나 글로벌 빅테크나 국내 주요 AI 기업을 제외한 대부분의 기업은 이 기준을 적용받기 어려워 보인다.
마지막 판단 과정은 학습 데이터를 살핀다. 학습 모델이 동일하거나 공지의 학습 모델을 적용한 것이더라도, 출원발명과 선행기술의 학습 데이터가 동일한지 한 번 더 판단한다. 학습 데이터의 차이에 따라 모델의 성능이 개선되거나, 학습 데이터의 용량 또는 학습 시간 등을 감소시키는 효과가 만들어진다면 진보성을 인정받을 수 있다.
학습 데이터에 일부 차이가 있지만, 선행기술을 비롯하여 종래의 사례에 비추어 봤을 때에 일반적인 수준의 기술자가 손쉽게 선택할 수 있는 경우라면 진보성은 부정당한다.
이와 관련하여 특허청의 심사실무가이드는 보수적이다. 선행기술 1에서 (인공지능 기술을 사용하지 않고) 룰베이스 방식으로 동일한 데이터를 분석하도록 하고 있고, 선행기술 2에서 동일한 기술 분야에서 (비록 학습 데이터에 차이는 있지만) 어떤 데이터를 학습 데이터로 하여 인공지능 모델을 학습시키는 것을 설명하고 있다면, 선행기술 1과 선행기술 2의 결합으로 대부분 진보성을 부정할 수 있다는 입장이다. 이 같은 방침에 따르면, 종래의 룰베이스 방식에서 사용했던 데이터를 동일하게 학습 데이터로 한다면 특허는 불가능해진다. 우리는 새로운 학습 데이터를 찾는 데 더 많은 노력을 기울여야 한다.
한편, 학습 과정의 주요한 절차는 아니지만, (학습 모델과 학습 데이터가 모두 동일하더라도) 전처리에 있어서 차이가 있다면 진보성을 손쉽게 인정받을 수 있다. 단 전처리에 의해서 학습모델의 수렴이나 추론 시간 등을 단축시키는 효과를 기대할 수 있는 경우에 한한다. 학습 모델과 학습 데이터가 모두 동일하지만 출력 데이터의 활용에 있어서 차이가 있는 경우에도 마찬가지이다.
결론적으로 인공지능 기술 특허를 실패하지 않으려면, 과제해결원리부터 다르게 하는 것이 가장 좋다. 이를 위해서는 룰베이스 사고를 버리고, 전혀 새로운 차원에서 문제 인식과 해결책을 고민하는 것이 필요하다. 그렇다면 특허청에 제시한 학습 모델이나 학습 데이터가 동일한 상황은 대개 피할 수 있을 것이다.
그렇지 않다면, 즉 아이디어 차원에서 유사한 선행기술이 있다면, 학습 데이터의 정의, 종류, 학습 모델의 종류 및 학습 구조 등 학습 수단을 구체적으로 그리고 상세하게 기재하여야 하여야 한다. 종래에 이 같은 학습 데이터를 채택하는 데에 어떤 어려움이 있었는지, 그리고 학습 모델을 이것으로 변경하면서 그 전후 과정에 어떤 처리 과정이 추가되었는지, 학습 알고리즘을 수정하면서 어떤 성능 개선 효과가 있는지 등을 최대한 자세히 설명하여야 한다. 그래야만 선행기술 대비하여 뾰족한 부분을 보여주고 특허청 심사관의 고개를 끄덕이게 만들 수 있다.
이 글은 김성현 대표 변리사가 AI타임스에 기고한 글입니다.
인공지능 자체가 인프라가 되어가고 있다. 이제 누구든지 어디서나 언제든지 원하는 대로 오픈소스나 API를 통해서 인공지능을 도입하고 사용할 수 있다. 인공지능의 역할이 특정 기능에 국한되던 짧은 과거를 지나 인공지능 일상화 시대가 다가오고 있다. 인공지능이 점차 공공재 또는 공공자원의 성격을 띠어가고 있다. 인공지능을 이용한 제품 또는 서비스를 공급하는 기업들은 이제 인공지능 적용만으로는 차별화하기 어렵게 되었다. 설령 차별화에 성공한다고 하더라도 특허와 같은 억제 수단이 없는 한 경쟁사의 빠른 복제, 표절, 모방을 막아내는 것은 불가능하다. 인공지능 기술 특허의 성공 여부 비즈니스의 성패를 좌우하게 될 것이다.
특허를 받는 데 있어 가장 큰 걸림돌은 진보성이다. '진보성'은 특허를 받고자 하는 발명(이하 출원발명)과 선행기술 간의 차이점을 평가하는 것이다. 평가 결과 그 차이점의 수준이 통상의 창작 범위를 벗어나는 경우에 한하여 특허를 주게 된다. '통상의 창작 범위'라는 것은 선행기술에 보탠 아이디어의 수준이 미미한 경우라고 설명할 수 있겠다. 인공지능 기술에 대한 특허청의 진보성 판단 절차는 다음과 같다.
가장 먼저 출원발명과 선행기술의 과제 해결 원리가 동일한지를 판단한다. 쉽게 설명하면 '문제 인식과 해결 방식이 근본적으로 동일한지'를 판단한다. 출원발명과 선행기술이 동일한 문제 인식에서 출발했고, 문제를 해결하기 위한 특유의 아이디어나 기술 구성에 있어서도 차이가 없는 가운데, 단순히 '인공지능을 이용하는 것'만이 유일한 차이점이라면 특허를 받는데 실패할 것이다.
예를 들어, 기술 구성을 전반적으로 동일하게 둔 채 룰베이스 시스템을 머신러닝 시스템으로 대체하는 경우는 대부분 특허를 받을 수 없다. 사람이 수행하는 업무를 인공지능 기술을 이용하여 단순히 시스템화한 경우에도 진보성을 부정한다. 이런 상황은 대체로 다음의 원인에 의해서 발생한다. '인공지능을 이용해 보자'라는 콘셉트 수준의 아이디어만 도출하고 멈춘 경우 또는 나름의 기술적 특징들이 있었지만 이를 특허 명세서에 담아내는데 실패하는 경우이다. 후자라면 대리인에게도 책임이 있다.
과제 해결 원리에 차이가 없는 것으로 판단하였다면, 다음 단계로 학습 모델이 동일한지를 살펴본다. 모델이 같은 것인지 다른 것인지 만을 살펴보는 것은 아니고, 공지의 학습 모델(예: CNN, RNN, GAN, Transformer 등)을 적용한 것인지도 함께 살펴본다. 여기서 선행기술과 신경망이 구조적으로 달라 효과의 차이를 보인다면 진보성을 긍정한다. 그러나 글로벌 빅테크나 국내 주요 AI 기업을 제외한 대부분의 기업은 이 기준을 적용받기 어려워 보인다.
마지막 판단 과정은 학습 데이터를 살핀다. 학습 모델이 동일하거나 공지의 학습 모델을 적용한 것이더라도, 출원발명과 선행기술의 학습 데이터가 동일한지 한 번 더 판단한다. 학습 데이터의 차이에 따라 모델의 성능이 개선되거나, 학습 데이터의 용량 또는 학습 시간 등을 감소시키는 효과가 만들어진다면 진보성을 인정받을 수 있다.
학습 데이터에 일부 차이가 있지만, 선행기술을 비롯하여 종래의 사례에 비추어 봤을 때에 일반적인 수준의 기술자가 손쉽게 선택할 수 있는 경우라면 진보성은 부정당한다.
이와 관련하여 특허청의 심사실무가이드는 보수적이다. 선행기술 1에서 (인공지능 기술을 사용하지 않고) 룰베이스 방식으로 동일한 데이터를 분석하도록 하고 있고, 선행기술 2에서 동일한 기술 분야에서 (비록 학습 데이터에 차이는 있지만) 어떤 데이터를 학습 데이터로 하여 인공지능 모델을 학습시키는 것을 설명하고 있다면, 선행기술 1과 선행기술 2의 결합으로 대부분 진보성을 부정할 수 있다는 입장이다. 이 같은 방침에 따르면, 종래의 룰베이스 방식에서 사용했던 데이터를 동일하게 학습 데이터로 한다면 특허는 불가능해진다. 우리는 새로운 학습 데이터를 찾는 데 더 많은 노력을 기울여야 한다.
한편, 학습 과정의 주요한 절차는 아니지만, (학습 모델과 학습 데이터가 모두 동일하더라도) 전처리에 있어서 차이가 있다면 진보성을 손쉽게 인정받을 수 있다. 단 전처리에 의해서 학습모델의 수렴이나 추론 시간 등을 단축시키는 효과를 기대할 수 있는 경우에 한한다. 학습 모델과 학습 데이터가 모두 동일하지만 출력 데이터의 활용에 있어서 차이가 있는 경우에도 마찬가지이다.
결론적으로 인공지능 기술 특허를 실패하지 않으려면, 과제해결원리부터 다르게 하는 것이 가장 좋다. 이를 위해서는 룰베이스 사고를 버리고, 전혀 새로운 차원에서 문제 인식과 해결책을 고민하는 것이 필요하다. 그렇다면 특허청에 제시한 학습 모델이나 학습 데이터가 동일한 상황은 대개 피할 수 있을 것이다.
그렇지 않다면, 즉 아이디어 차원에서 유사한 선행기술이 있다면, 학습 데이터의 정의, 종류, 학습 모델의 종류 및 학습 구조 등 학습 수단을 구체적으로 그리고 상세하게 기재하여야 하여야 한다. 종래에 이 같은 학습 데이터를 채택하는 데에 어떤 어려움이 있었는지, 그리고 학습 모델을 이것으로 변경하면서 그 전후 과정에 어떤 처리 과정이 추가되었는지, 학습 알고리즘을 수정하면서 어떤 성능 개선 효과가 있는지 등을 최대한 자세히 설명하여야 한다. 그래야만 선행기술 대비하여 뾰족한 부분을 보여주고 특허청 심사관의 고개를 끄덕이게 만들 수 있다.