컴퓨터가 상식을 배우는 것이 가능합니까?

주요 핵심 사항

상식은 과도한 분석 없이 일상적인 상황을 인지하고 대처하는 능력입니다. 이는 삶의 경험, 관찰, 사회 및 문화적 기준을 통해 습득됩니다.
컴퓨터는 현실 경험의 부족과 새로운 상황에 적응하는 능력 부족으로 인해 상식적인 판단에 어려움을 겪습니다. 또한 인간이 직관적으로 이해하는 암묵적인 규칙과 가정들로 인해 어려움을 겪습니다.
연구자들은 컴퓨터에 상식을 학습시키기 위해 폭넓은 지식 기반 구축, 상식 크라우드소싱, 시뮬레이션 환경에서의 AI 훈련 등 다양한 접근법을 연구하고 있습니다. 상당한 진전이 있었지만, 여전히 해결해야 할 과제가 남아 있습니다.

상식, 우리 모두가 가지고 있다고 믿는 개념입니다. 하지만 정확히 무엇일까요? 컴퓨터나 인공지능 시스템이 실제로 상식을 습득할 수 있을까요?

상식이란 무엇이며, 인간은 어떻게 습득하는가?

상식은 대부분의 사람들이 이해하고, 인지하며, 적절하게 판단할 것이라고 예상되는 기본적인 능력입니다. 이는 우리가 삶의 경험과 관찰을 통해 축적한 사실, 정보, 그리고 경험적 규칙의 집합체입니다. 상식을 통해 우리는 일상적인 상황에 대해 깊이 분석하지 않고도 효율적으로 처리하고 대응할 수 있습니다.

인간은 어린 시절부터 상식을 배우기 시작합니다. 아기로서 우리는 울음이 먹이를 주거나 기저귀를 갈아주는 등의 원인과 결과를 배우기 시작합니다. 반복적인 경험을 통해 우리는 세상에 대한 실질적인 지식을 습득합니다. 예를 들어, 뜨거운 난로를 만지면 화상을 입을 수 있다는 것을 알게 되며, 이러한 이유로 뜨거운 표면을 만지지 않게 됩니다.

어린 시절, 우리는 시행착오를 거치면서 상식을 확장하고 가족 구성원을 관찰하며 상호 작용합니다. 예를 들어, 우리는 옷을 정기적으로 세탁해야 한다는 것, 입에 음식을 가득 넣고 말하지 말아야 한다는 것, 그리고 우유를 쏟으면 어수선해진다는 것을 배우게 됩니다. 부모, 형제자매, 교사 및 다른 어른들은 사회적 기준과 기대를 어길 때 우리를 교정해 줍니다. 시간이 지남에 따라 이러한 교훈은 기본적인 상식으로 자리 잡습니다.

개인적인 경험 외에도 상식은 넓은 사회 및 문화적 규범에 의해 형성됩니다. 한 문화에서는 상식으로 간주되는 것이(예: 집에 들어갈 때 신발을 벗는 것) 다른 문화에서는 그렇지 않을 수 있습니다.

상식은 우리가 성장하고 더 많은 사람들과 환경에 노출되면서 적응합니다. 작은 마을에서 자란 아이는 해당 환경에서의 삶에 대한 기본적인 상식을 습득합니다. 대도시로 이주한 성인은 새로운 환경에 적응하기 위해 상식을 조정해야 합니다.

우리가 삶을 살아가면서 새로운 경험을 할 때마다 상식은 계속해서 진화합니다.

컴퓨터에게 상식이 어려운 이유는 무엇인가?

상식을 프로그래밍하는 것이 어려운 데에는 여러 가지 이유가 있습니다.

첫째, 인간은 수년간 세상을 경험하면서 점진적으로 상식을 학습합니다. 우리는 다양한 시도를 해보고 무엇이 효과적이고 무엇이 효과적이지 않은지를 확인하며 그 교훈을 기억합니다. 컴퓨터는 이러한 실제 경험을 활용할 수 없습니다. 그들은 인간이 명시적으로 알려준 정보만을 인식합니다.

예를 들어, 저는 ChatGPT(GPT 3.5)에게 다음 질문을 했습니다.

자넷은 세탁 사업을 운영하고 있습니다. 그녀는 고객의 옷을 세탁하고 햇볕에 말리기 위해 옷걸이에 걸어둡니다. 어느 날, 자넷은 셔츠 5벌을 세탁하여 아침에 옷걸이에 걸었습니다. 셔츠가 마르는 데 5시간이 걸렸습니다. 셔츠 30벌을 말리는 데 얼마나 걸릴까요?

다음과 같은 답변이 있었습니다.

또 다른 어려움은 상식이 상황에 따라 다르다는 점입니다. 컴퓨터에 특정 규칙만 프로그래밍되어 있다면, 인간이 직관적으로 할 수 있는 방식으로 새로운 상황에 대처할 수 없습니다.

예를 들어, 컴퓨터에 바깥에 비가 오기 시작하면 어떻게 해야 하는지 알려주었다고 가정해 보겠습니다. 간단해 보이죠? 그런데 비가 오는 대신 스프링클러가 켜지면 어떻게 될까요? 아니면 식료품점 안에 있는데 파이프에서 물이 새기 시작하면 어떻게 될까요? 우리는 이러한 변화를 즉시 처리하는 방법을 알고 있지만 컴퓨터는 "밖에 비가 오면 실내로 들어가세요"라는 규칙을 기계적으로 따르려고 할 것입니다. 이는 더 이상 적절하지 않습니다.

또한 인간이 무의식적으로 흡수하는 암묵적인 규칙과 가정도 있습니다. 불편함을 느끼기 전에 누군가와 얼마나 가까이 서 있을 수 있을까요? 인간은 직관적으로 답을 알지만 정확한 규칙을 명확하게 설명하기는 어려울 수 있습니다. 이러한 암묵적인 사회적 규범은 컴퓨터가 데이터만으로 이해하기 특히 어렵습니다.

따라서 현재로서는 상식이 인간 지능에 비해 AI의 가장 큰 약점 중 하나로 남아 있습니다. 그것은 인간에게는 자연스럽게 다가오지만 기계에게는 그렇지 않습니다.

컴퓨터가 상식을 배우는 방법

1970년대와 1980년대의 초기 낙관주의 이후, 연구자들은 컴퓨터에게 상식을 가르치는 것이 얼마나 어려운지 깨달았습니다. 하지만 새로운 접근 방식은 AI 시스템이 일상적인 물리적, 사회적 세계에 대한 기본적인 상식을 갖도록 훈련하는 데 가능성을 보여주고 있습니다.

한 가지 접근법은 세계가 어떻게 작동하는지에 대한 사실과 규칙을 상세히 정리하여 광범위한 지식 기반을 직접 구축하는 것입니다. 더그 레넛이 1984년에 시작한 Cyc 프로젝트는 이러한 야심 찬 노력의 대표적인 사례입니다.

수백 명의 논리학자들이 수십 년 동안 수백만 개의 논리적 공리를 Cyc에 코딩했습니다. 이 과정은 많은 시간이 소요되지만, 그 결과 상당한 실제 지식을 가진 시스템이 탄생했습니다. Cyc은 요리 맛 프로필에 대한 지식을 바탕으로 토마토가 기술적으로는 과일이지만 과일 샐러드에 넣어서는 안 된다고 명확하게 추론할 수 있습니다.

ConceptNet을 이용한 상식 크라우드 소싱

보다 현대적인 지식 기반인 ConceptNet은 상식적인 주장을 생성하기 위해 크라우드 소싱 방식을 채택합니다. 전문가나 AI가 세상의 모든 기본 사실과 관계를 파악하도록 하는 대신 누구나 상식의 일부를 기여할 수 있도록 개방합니다.

이러한 크라우드 소싱 방식을 통해 이러한 지식 기반은 인터넷을 통해 다양한 사람들의 집단 지성을 활용할 수 있습니다. 군중으로부터 수많은 작은 상식 조각을 수집함으로써 ConceptNet은 기본적이고 일상적인 지식을 담은 놀라울 정도로 큰 저장소를 만들었습니다. 새로운 기여자들이 지속적으로 추가되면서 지식은 계속해서 확장됩니다.

경험을 통한 상식 교육

또 다른 유망한 접근 방식은 AI 에이전트가 경험을 통해 물리학과 직관을 실험하고 학습할 수 있는 상세한 시뮬레이션 세계를 구축하는 것입니다.

연구자들은 Allen Institute가 만든 디지털 가정 "AI2 THOR"처럼 현실 세계를 모방한 일상적인 물건으로 가득 찬 3D 가상 환경을 만들고 있습니다. 이러한 공간에서 AI 로봇은 인간이 당연하게 여기는 개념에 대한 직관적 이해를 개발하기 위해 다양한 상호 작용을 시도할 수 있습니다.

예를 들어, AI 봇에 가상 신체를 부여하고 블록을 집어 올리고, 쌓고, 넘어뜨리는 등의 작업을 시도하도록 할 수 있습니다. 블록이 떨어지고 충돌하는 것을 현실적으로 관찰함으로써 봇은 견고성, 중력 및 물리적 역학에 대한 기본적인 개념을 학습합니다. 규칙이 필요하지 않습니다. 경험을 통해서만 학습합니다.

또한 봇은 유리 물체를 떨어뜨리고 그것이 바닥에 부딪혀 깨지는 것을 보는 것과 같은 작업을 시도할 수 있습니다. 또는 액체를 붓고 액체가 흐르고 모이는 방식을 관찰하여 물의 특성을 실험할 수도 있습니다. 이러한 실습 수업은 데이터 패턴뿐만 아니라 감각 경험에 대한 AI의 지식을 기반으로 합니다.

강력한 대규모 언어 모델의 사전 훈련과 같은 데이터 기반 기술도 상식 패턴을 포착하는 데 매우 효과적인 것으로 입증되었습니다. GPT-3.5 및 GPT-4와 같은 AI 모델은 방대한 양의 인터넷 데이터를 "읽은" 후 인간과 매우 유사한 텍스트를 생성할 수 있습니다.

때로는 어리석은 제안(AI 환각이라고도 함)을 하기도 하지만, 통계적 학습 접근 방식을 통해 특정 종류의 상식을 모방할 수 있습니다. 그러나 이것이 상식인지 아니면 단순히 데이터 편향을 영리하게 이용하는 것인지에 대해서는 여전히 의견이 분분합니다.

상식을 통해 컴퓨터를 테스트하는 방법

이미지 출처: freepik/프리픽

인공 지능 시스템이 점점 더 복잡한 실제 작업을 수행함에 따라 '상식'을 가지고 있는지 평가하는 것이 중요해졌습니다.

물리적 상식

테스트해야 할 한 가지 영역은 물리적 상식입니다. 즉, 물체, 힘 및 세계의 기본적인 속성에 대한 직관입니다.

예를 들어, 컴퓨터 비전 시스템에 공중에 떠 있는 책의 사진을 보여주고 장면을 설명하도록 요청합니다. 떠다니는 책에 특이한 점이 있습니까? 또는 "남자가 빵 한 덩어리로 돌을 자른다"와 같은 특이한 시나리오를 AI 시스템에 입력하고 가능성이 없는 것으로 플래그를 지정하는지 확인합니다.

Allen Institute의 AI2 THOR 환경은 블록 탑, 쏟아진 머그잔 및 기타 장면을 시뮬레이션하여 이러한 물리적 직관을 테스트합니다.

사회적 상식

인간은 또한 사람들의 동기, 관계 및 규범을 암묵적으로 이해하는 사회적 상식을 가지고 있습니다. 이를 AI에서 평가하려면 모호한 대명사나 동기가 있는 상황을 제시하고 시스템이 이를 합리적으로 해석하는지 확인합니다.

예를 들어, 저는 ChatGPT에게 아래 프롬프트에서 'it'이 여행 가방을 가리키는지 아니면 트로피를 가리키는지 물었습니다.

트로피가 너무 작아서 여행 가방에 들어가지 않았습니다.

테스트에 실패했습니다. 반면에 인간이라면 내가 여행 가방을 가리키고 있다는 것을 분명히 알 것입니다.

이러한 종류의 테스트를 Winograd Schema Challenge라고 하며, 특히 사회적 상식을 대상으로 합니다.

안전 및 윤리

AI 시스템이 안전하지 않거나 비윤리적인 패턴을 학습했는지 테스트하는 것이 중요합니다. AI가 판단을 내릴 때 성별, 인종 또는 기타 속성에 따라 유해한 편견을 보이는지 분석합니다.

합리적이고 윤리적인 구분이 있는지 확인합니다. 아이를 구하기 위해 곰을 죽이는 것은 정당한 것으로 간주될 수 있지만, 같은 목적으로 핵폭탄을 터뜨리는 것은 그렇지 않습니다. 명백히 비윤리적인 행동에 대한 권장 사항을 표시합니다.

실제 성능

AI 시스템이 실제 환경에서 어떻게 작동하는지 관찰하여 상식을 평가합니다. 예를 들어, 자율 주행 차량이 물체와 보행자를 올바르게 식별하고 반응합니까? 로봇이 귀중품을 부수거나 애완동물에게 해를 끼치지 않고 다양한 가정 환경을 탐색할 수 있습니까?

실제 테스트를 통해 제한된 실험실 환경에서는 나타나지 않을 수 있는 상식의 격차가 드러났습니다.

진전이 있었지만 상식 AI에 대한 연구는 계속됩니다.

일부 전문가들은 AI가 우리와 같은 뇌 구조와 신체를 개발하지 않으면 인간의 상식 수준에 도달할 수 없을 것이라고 주장합니다. 반면에 디지털 마음은 인간의 편견과 정신적 지름길에 의해 제한되지 않으므로 이론적으로는 우리를 능가할 수 있습니다! 하지만 아직 초지능 AI에 대해 걱정할 필요는 없을 수도 있습니다.

단기적으로 최선의 접근 방식은 학습된 상식과 구식 프로그래밍을 결합한 AI입니다. 이렇게 하면 거북이를 소총으로 오인하는 것과 같은 어리석은 실수를 방지할 수 있을 것입니다.

우리는 아직 그 단계에 도달하지 못했지만, 상식은 더 이상 AI의 미지의 영역이 아닙니다. 진전이 이루어지고 있습니다! 그러나 당분간은 이러한 기술을 적용하는 데 건전한 인간의 상식이 필요할 것입니다.