블로그

INSIGHT

인공지능 어디까지 왔나? : 인공지능 기술 수준 정의

2024.08.01.

인공지능 기술 수준 정의

 

 

지난 5월 13일, 오픈AI가 GPT-4o를 공개했습니다. GPT-4o에서는 텍스트 뿐만 아니라 다양한 매체 (사진, 파일 등)를 처리할 수 있다는 점에서 사용자의 편의성이 크게 높아졌는데요. 휴대폰에 앱으로 설치하면, 카메라를 통해 사람의 표정을 읽을 수 있을 뿐 아니라, 실제 사람과 대화하는 것과 같은 빠른 응답 속도를 보여, 큰 주목을 받았습니다.

 

이처럼 빠르게 발전하는 인공지능 기술 수준을 전문가들은 어떻게 평가하고 있을까요? 구글 딥마인드 소속 연구원들이 발간한 논문을 기반으로 현재 인공지능 기술의 수준을 짚어보고자 합니다.

 

그 전에, 논문에서는 ‘AGI’ (Artificial General Intelligence)라는 표현을 사용하고 있는데요. 들어가기 전, AGI는 어떤 의미를 포함하고 있는지 먼저 살펴보겠습니다.

 

 

 

AGI (Artificial General Intelligence) 

AGI는 한국어로 범용인공지능 등으로 종종 번역되며, 인간 수준의 일의 범위와 수행역량을 보이는 인공지능을 가리키는 말로 활용됩니다. 초기의 인공지능 연구가 인간과 같은 지적 역량을 가진 시스템을 구축하는 것을 목표로 했다는 점에서, 이는 인공지능 연구의 지향점이라고 볼 수 있습니다. 

그러나, 정확히 어떤 요인으로 AGI를 정의할 수 있는지에 대해서는 아직도 의견이 분분한데요. 인공지능 관련 기술이 그 어느 때보다도 많은 관심 속에 빠르게 발전하는 시대에서, AGI를 정의하는 것은 현재의 기술 역량을 평가하고 미래의 기술 발전 로드맵을 그려보는 바탕이 될 수 있을 것입니다.

 

 

 

AGI를 정의하는 6가지 원칙

이에 구글 딥마인드에서는 다음과 같이 AGI를 정의합니다. 인공지능을 정의하고자 했던 선행 연구를 기반으로, 다음의 6가지 원칙들을 제안했는데요:

 

1. 과정(Process) 아닌 기능(Capabilities)에 집중
인공지능 연구는 인간과 같이 사고하는 기계를 개발하기 위해 시작되었지만, 대부분의 인공지능 연구에서는 ‘인공지능이 인간과 같은 사고과정을 거치는지’가 아닌 인공지능이 만들어내는 결과물을 가지고 그 역량을 평가하고 있습니다. 다만, 필자는 기계적 사고에 대한 연구가 진행됨에 따라 ‘과정’(process)에 기반을 둔 인공지능의 정의가 가능해질 수도 있을 것으로 보았습니다.

 

2. 일반성(Generality)과 퍼포먼스(Performances)
‘Generality’는 한국어로는 ‘일반성’으로 번역되는데요. 이는, ‘AI시스템의 역량의 폭’을 말합니다. 즉, AI시스템이 얼마나 넓은 범위의 업무를 목표하는 수준만큼 완성할 수 있는지를 의미합니다. 반면, 퍼포먼스(Performance, 성능)란 ‘AI시스템의 역량의 깊이’를 말하는데요. 동일한 업무가 주어졌을 때 인간이 보일 수 있는 역량과 비교하여 이를 구분해볼 수 있습니다. 

 

3. 인지(Cognitive task) 및 메타인지(Metacognitive task)
인공지능은 인지적 역량을 갖추고 있어야 합니다. 이 때 인지적 역량은, 반대로 말하면, 물리적이지 않은 업무를 처리할 수 있는 역량입니다. 일부에서는 기계적으로 구성된 신체의 유무가 인공지능의 업무 달성에 꼭 필요할 수 있기 때문에 중요하다고 주장하는데요. 본 연구에서는 최근의 로봇학 연구의 발전에도 불구하고, AI 시스템을 위한 물리적 역량을 부여하기에는 기술적인 어려움이 있기 때문에 이를 배제하였습니다.
대신, ‘새로운 일을 배우거나, 인간에게 확인받거나 도움을 요청할 때를 아는’ 메타인지 역량을 인지적 역량과 함께 중요한 전제 조건으로 정의합니다.

 

4. 잠재력 (Potential)
인공지능은 요구되는 업무를 기대되는 수준만큼 수행할 수 있다는 가능성이 충분히 증명되어야 합니다. 

 

5. 생태학적 타당성 (Ecological validity)
인공지능이 수행하는 업무는 인간이 가치 있게 평가할 수 있는 업무여야 합니다. 이 때의 가치는 단지 경제적인 것뿐만 아니라, 사회적, 예술적 가치 등을 포함합니다.

 

6. 단일 엔드포인트가 아닌 AGI로의 여정
본 연구에 앞서 2021년 국제자동차기술자협회(SAE International)에서는 자율주행 기술의 발전 단계를 구분하는 논문이 발표한 바 있는데요. 이와 같이 기술의 수준을 정의하는 것은 기술이 나아가야할 방향을 논의하고 병행되어야 할 정책 방안을 고민하는데 바탕이 된다는 점에서 의의를 둘 수 있습니다.

 

 

 

AGI의 수준 정의

앞서 살펴본 AI의 일반성과 퍼포먼스를 두개의 축으로 활용하여, 논문에서는 다음과 같은 표를 제시하고 있습니다. 
이때 퍼포먼스는 2가지 수준으로 구분하였는데요. ‘업무의 범위가 명확하게 정해져 있거나 정의되어 있는’ 경우에 대해 ‘좁다’는 의미의 ‘Narrow’라고 명명했으며, ‘새로운 스킬을 습득하는 것과 같이 메타인지를 활용하는 넓은 범위의 비물리적인 업무’에 대해서는 ‘General’이라고 정의했습니다.

 

 

 Level of AGI

[표1] Level of AGI (번역, 디자인: 웅진)

 

논문에서는 총 12개의 카테고리로 인공지능을 구분합니다. 이 중 아직 현재의 기술력에서 도달하지 못한 영역은 총 4개 단계로, 모두 범용인공지능(AGI)에 해당합니다. 

이 중 특정 범위의 일에서 인간을 능가한다고 평가받은 ‘Superhuman Narrow AI’로는 단백질 구조를 예측하는 “AlphaFold”와 체스 엔진 “AlphaZero”, “StockFish”가 있습니다.

한 편 범용인공지능(AGI)로는 이제 겨우 ‘Emerging AGI’에 도달했다고 평가했는데요. 2023년 공개된 OpenAI의 GPT-4 모델 또한 아직은 1단계 수준에 머물러 있다고 보았습니다.

 

 

 

AGI의 위험

논문에서는 범용인공지능(AGI)과 관련된 논의에서 대두되는 AI 위험성에 대해서도 함께 다루고 있습니다.

 

지난 포스트에서도 AI 안전성(AI Safety)에 대해 다룬 바 있는데요.

 

[ AI 안정성에 대해 알아보기 ]

 

본 논문에서는 AGI의 수준에 따라서 발생가능한 위험이 달라진다는 점을 명확히 했습니다. 간단히 생각해보자면, 인공지능의 성능이 좋지 않다면, 업무를 제대로 처리하지 못하거나 인간의 개입과정에서 발생하는 오류가 목표 달성을 저해할 수 있습니다. 반대로, 인공지능의 성능이 좋을수록 오류가 발생할 확률은 줄어들겠지만, 인간 윤리에 어긋나는 결과로 의도치 않게 도달할 수 있다는 위험이 있습니다. 

이와 같이, AI의 역량 자체는 AI 위험에 대한 전제 조건을 제공하지만 AI (AGI)에 아무것도 주어지지 않는다면 AI는 작동할 수 없습니다. 즉, AI의 역량과 별개로 AI가 작동하는 상황적 속성(예: 인터페이스, 업무, 시나리오, 최종사용자)이 위험의 발생과 또 다시 긴밀한 관계를 맺고 있다는 것이죠.

이에 논문에서는 아래와 같은 6가지 자율성 수준으로 인간-AI 상호 작용 패러다임을 정의하고, 이를 AGI 레벨과 교차하여 그 위험성과 양상을 설명합니다.

 

 

 자율성 수준과 AGI 역량에 따른 위험
[표2] 자율성 수준과 AGI 역량에 따른 위험 (일부발췌, 번역, 디자인: 웅진)

 

이상으로 인공지능의 기술 수준을 정의하고, 인공지능의 자율성과 역량에 따라 구분되는 발생가능한 위험까지 정리해 보았습니다. 이러한 ‘정의’를 통용하기 위해서는 더 많은 논의가 필요할 것으로 보입니다. 실제로 OpenAI는 지난 7월 11일, 블룸버그(Bloomberg)의 보도를 통해 AGI로 가는 AI 수준을 5단계로 나누어 제시하였으며, 그 내용이 위에서 다뤄진 정의와는 상이함을 확인할 수 있습니다. 

 

 

OpenAI Imagines Our AI Future
[표3] OpenAI Imagines Our AI Future (내용출처: Bloomberg, 디자인: 웅진)

 

그러나 이와 같이 기술 발전 방향을 정의하는 과정이 결국 기술 발전의 로드맵을 그리고 병행되어야 할 사회적인 환경 마련을 시작하는 계기가 될 수 있을 것으로 보입니다.

 

 

 

Reference
Morris, M. R., Sohl-Dickstein, J., Fiedel, N., Warkentin, T., Dafoe, A., Faust, A., ... & Legg, S. Position: Levels of AGI for Operationalizing Progress on the Path to AGI. In Forty-first International Conference on Machine Learning. 

Will Douglas Heaven, “Google DeepMind wants to define what counts as artificial general intelligence”, MIT Technology Review (2023.11.16)
https://www.technologyreview.com/2023/11/16/1083498/google-deepmind-what-is-artificial-general-intelligence-agi/ 

 

 

목록보기