Alexa, Siri 및 Google은 사용자가 말하는 단어를 이해하지 못합니다.

Alexa, Google Assistant 및 Siri와 같은 음성 비서는 지난 몇 년 동안 많은 발전을 이루었습니다. 그러나 그들의 모든 개선에도 불구하고 한 가지 제약이 있습니다. 그들은 당신을 이해하지 못합니다. 그들은 특정 음성 명령에 너무 많이 의존합니다.

음성 인식은 마술에 불과합니다.

음성 비서는 당신을 이해하지 못합니다. 어쨌든. Google Home 또는 Amazon Echo에 말할 때 기본적으로 단어를 텍스트 문자열로 변환한 다음 예상 명령과 비교합니다. 정확히 일치하는 항목을 찾으면 일련의 지침을 따릅니다. 그렇지 않으면 가지고 있는 정보를 기반으로 수행할 작업의 대안을 찾고 작동하지 않으면 “죄송하지만 잘 모르겠습니다. .” 당신이 그것을 이해한다고 생각하도록 속이는 것은 속임수 마술에 지나지 않습니다.

상황에 맞는 단서를 사용하여 최상의 추측을 할 수 없으며 유사한 주제에 대한 이해를 바탕으로 결정을 내릴 수도 없습니다. 음성 도우미를 사용하는 것도 어렵지 않습니다. Alexa에게 “당신은 NSA에서 일하십니까?”라고 물을 수 있습니다. “당신은 비밀리에 NSA의 일원입니까?” (적어도 이 글을 쓰는 시점에서는) “나는 그것을 모른다”라는 응답을 받게 됩니다.

말을 진정으로 이해하는 인간은 이렇게 일하지 않습니다. 당신이 인간에게 “하늘에 있는 그 클라베인은 무엇입니까? 아치형으로 빨강, 주황, 노랑, 파랑 등 줄무늬가 가득한 것.” klarvain이 지어낸 말임에도 불구하고, 귀하가 질문한 사람은 귀하가 무지개를 설명하고 있는 맥락에서 이해할 수 있을 것입니다.

당신은 인간이 말을 아이디어로 전환하고 있다고 주장할 수 있지만, 인간은 지식과 이해를 적용하여 답을 결론을 내릴 수 있습니다. NSA에서 비밀리에 일하는 사람에게 물어보면 대답이 거짓말일지라도 예 또는 아니오로 대답할 것입니다. 인간은 그런 질문에 “나는 그것을 모른다”고 말하지 않을 것입니다. 인간이 거짓말을 할 수 있다는 것은 진정한 이해와 함께 오는 것입니다.

회사에서 여전히 암호를 일반 텍스트로 저장하는 이유는 무엇입니까?

음성 비서는 프로그래밍을 넘어갈 수 없습니다.

음성 도우미는 궁극적으로 프로그래밍된 예상 매개변수로 제한되며, 이 매개변수를 벗어나면 프로세스가 중단됩니다. 그 사실은 언제 타사 장치가 작동하는지 보여줍니다. 일반적으로 이들과 상호 작용하는 명령은 “선택적 인수를 명령하도록 장치 제조업체에 지시”에 해당하는 매우 다루기 어렵습니다. 정확한 예는 다음과 같습니다. “Whirlpool에 건조기를 일시 중지하라고 말하십시오.” 더 기억하기 힘든 예를 들어, 제네바 알렉사 스킬 일부 GE 오븐을 제어합니다. 기술 사용자는 “GE에”가 아니라 “제네바에”를 기억하고 나머지 명령을 기억해야 합니다. 그리고 오븐을 350도까지 예열하도록 요청할 수는 있지만 온도를 50도 더 높이라는 요청은 따라할 수 없습니다. 그러나 인간은 이러한 요청을 따를 수 있습니다.

Amazon과 Google은 이러한 장애물을 극복하기 위해 매우 열심히 노력했으며 이를 보여줍니다. 스마트 락을 제어하기 위해 위의 순서를 따라야 했던 곳에서 이제는 “앞문을 잠그십시오”라고 말할 수 있습니다. Alexa는 “개 농담을 말해봐”라고 혼동하곤 했지만 오늘 요청하면 작동할 것입니다. 그들은 당신이 사용하는 명령에 변형을 추가했지만 궁극적으로 당신은 여전히 말할 올바른 명령을 알아야 합니다. 올바른 순서로 올바른 구문을 사용해야 합니다.

그리고 그것이 명령줄처럼 들린다고 생각한다면 당신은 틀리지 않습니다.

음성 도우미는 멋진 명령줄입니다.

명령줄은 간단한 작업을 수행하도록 좁게 정의되지만 적절한 구문을 알고 있는 경우에만 가능합니다. 올바른 구문에서 벗어나 dir 대신 dyr을 입력하면 명령 프롬프트에서 오류 메시지를 표시합니다. 명령을 더 쉽게 기억하기 위해 별칭을 사용할 수 있지만 원래 명령이 무엇인지, 어떻게 작동하는지, 별칭을 효율적으로 사용하는 방법을 알아야 합니다. 명령줄의 모든 기능을 배우는 데 시간을 들이지 않으면 많은 것을 얻을 수 없습니다.

음성 도우미도 다르지 않습니다. 명령을 말하거나 질문하는 올바른 방법을 알아야 합니다. 또한 Google 및 Alexa용 그룹을 설정하는 방법, 장치 그룹화가 필수적인 이유 및 스마트 장치의 이름을 지정하는 방법을 알아야 합니다. 이러한 필수 단계를 따르지 않으면 음성 도우미에게 “어떤 연구”를 꺼야 하는지 묻는 질문에만 연구를 끄도록 요청하는 좌절감을 느낄 것입니다.

iOS에서 Google 어시스턴트를 얻는 방법

올바른 구문을 올바른 순서로 사용하더라도 프로세스가 실패할 수 있습니다. 잘못된 응답이 발행되거나 놀라운 결과가 발생합니다. 같은 집에 있는 두 개의 Google Home은 동일한 사용자 계정 정보와 인터넷 연결에 액세스할 수 있더라도 약간 다른 위치의 날씨를 제공할 수 있습니다.

위의 예에서 “30분 타이머 설정” 명령이 제공됩니다. Google Home 허브는 “Hour”라는 이름의 타이머를 만든 다음 타이머가 얼마나 길어야 하는지 묻습니다. 그러나 동일한 명령을 다른 세 번 반복하면 올바르게 작동하여 30분 타이머가 생성되었습니다. “30분 타이머 설정” 명령을 사용하면 보다 일관되게 올바르게 작동합니다.

Google Home 또는 Echo에 대한 말하기가 더 유동적일 수 있지만 내부 음성 비서 및 명령줄은 동일한 방식으로 작동합니다. 새로운 언어를 배울 필요는 없지만 새로운 방언을 배워야 합니다.

음성 비서에 대한 좁은 이해는 성장을 제한할 것입니다

이 중 어느 것도 Google Assistant 및 Alexa와 같은 음성 비서가 충분히 잘 작동하는 것을 방해하지 않습니다(Cortana는 다른 이야기지만). Google 어시스턴트와 Alexa는 온라인에서 질문을 적절하게 검색하지만 당연히 Google이 검색에 더 뛰어나고 측정 변환 및 간단한 수학과 같은 기본 질문에 답할 수 있습니다. 스마트 홈을 올바르게 설정하고 잘 훈련된 사용자가 있으면 대부분의 스마트 홈 명령이 의도한 대로 작동합니다. 그러나 이것은 지적인 이해가 아니라 노력과 노력으로 이루어졌습니다.

타이머와 알람은 단순했습니다. 시간이 지남에 따라 이름 지정이 추가되었으며 타이머에 시간을 추가하는 기능이 추가되었습니다. 그들은 단순한 것에서 더 복잡한 것으로 옮겨갔습니다. 음성 도우미는 더 많은 질문에 답할 수 있으며 매일 새로운 기술과 기능을 제공합니다. 그러나 그것은 배움과 이해에서 오는 자기 성장의 산물이 아닙니다.

그리고 그 어느 것도 알려지지 않은 것에 도달하는 것으로 알려진 것을 사용하는 고유한 기능을 제공하지 않습니다. 작동하는 모든 명령과 질문에는 항상 작동하지 않는 세 가지가 있습니다. 인간과 같은 이해 능력을 부여하는 AI의 혁신이 없다면 음성 비서는 전혀 비서가 아닙니다. 올바른 시나리오에서 유용하지만 이해하도록 프로그래밍된 시나리오로 제한되는 음성 명령줄일 뿐입니다.

사진을 인쇄할 때 사진이 다르게 보이는 이유는 무엇입니까?

다시 말해, 기계는 무언가를 배우고 있지만 이해할 수 없습니다.