간단한 예로 포유류와 조류를 구분하는 AI를 학습하는 과정을 상상해보자. 포유류의 예제로는 코끼리, 조류의 예제로는 독수리가 주어졌다. AI는 이 예제들로부터 포유류와 조류를 구분하기 위한 규칙을 스스로 학습해야 한다. 그런데, 코끼리를 포유류로, 독수리를 조류로 구분할 수 있는 기준은 코의 길이, 다리의 수, 부리의 유무, 깃털의 유무, 비행능력 등 여러가지가 있다. 이들 중 어떤 규칙을 적용해도 코끼리와 독수리에 대하여는 정확한 답을 얻을 수 있다. AI가 운좋게 일반적 지식인 부리나 깃털의 유무에 의한 규칙을 학습한다면 다른 동물이 입력되어도 정답을 출력할 것이다. 그러나, 다리의 수나 비행능력에 의한 규칙을 학습한다면 실제 상황에서는 인간을 조류로, 닭을 포유류로 오인식할 것이다. 하나를 배워 열을 깨우치듯 AI가 제한된 학습 데이터로부터 일반적인 규칙을 정확히 찾아내면 이상적이겠으나, AI의 입장에서는 위에서 열거한 기준들 중 어느 것이 일반적인 규칙인지를 알기 어렵다. 따라서 AI가 일반적인 지식을 배울 가능성과 학습 데이터에만 국한된 잘못된 지식을 배울 가능성이 공존하는데, 특히 작업이 복잡하고 학습 데이터가 적을수록 잘못된 규칙을 학습할 가능성이 증가한다.
또한, AI의 오류를 완전히 막을 수는 없어도 오류의 가능성을 줄일 수는 있다. 가장 근본적인 방법은 다양하고 풍부한 학습 데이터를 확보하는 것이다. 학습 데이터가 다양할수록 잘못된 지식의 문제점이 노출되기 쉬우므로 AI가 일반적인 지식을 선택할 가능성이 증가한다. 또한, 적절한 가정을 적용하면 AI가 좀 더 일반적인 지식을 배우도록 유도할 수 있다. 널리 사용되는 가정 중 하나는 단순성의 가정이다. AI가 학습 데이터를 설명할 수 있는 지식 중 단순한 지식을 더 선호하도록 만들면 ‘오캄의 면도날(Occam’s Razor)’의 원리에 따라 일반적인 지식을 학습할 가능성이 높아진다. 최근에는 AI의 취약점을 발견해 보완하는 기술도 많이 개발되었다. 대표적인 방법은 입력 정보에 약간의 변형을 가하더라도 동일한 결과를 출력하도록 학습함으로써 AI의 일관성을 강화하는 것이다.
AI는 완전하지 않다. 그러나, AI의 불완전성을 잘 이해하고 적절히 활용할 경우 매우 유익한 도구가 될 수 있다. AI의 잠재력이 막대한 가장 중요한 이유는 불완전한 AI를 효과적으로 활용할 수 있는 창의성과 지혜가 인간에게 있기 때문이다.
김인중 한동대 교수
관련뉴스