일반적으로 이미지에서 텍스트를 추출하기 위해서는 OCR(광학 문자 인식) 소프트웨어를 사용합니다. 하지만 구글 크롬 76 버전부터는 실험적인 기능을 활용하여 별도의 소프트웨어 없이도 이미지 내 텍스트를 추출할 수 있게 되었습니다.
기존의 OCR 방식은 텍스트를 인식하는 데 많은 계산 리소스를 요구합니다. 그러나 하드웨어 제조업체들은 이미 오래전부터 형태 감지 기능을 지원해 왔습니다.
이를 바탕으로 등장한 것이 모양 감지 API입니다. 이 API는 실행 중인 장치의 하드웨어 가속을 활용하며, QR 코드와 같은 바코드 감지, 얼굴 및 텍스트 감지 기능을 제공합니다. 해당 프로젝트에 대한 자세한 내용은 개발자 웹사이트에서 확인할 수 있으며, API 작동 방식에 대한 설명을 제공합니다. 또한 텍스트 감지에 대한 자세한 내용은 웹 인큐베이터 커뮤니티 그룹 웹사이트를 참조하십시오.
이 기능을 사용하려면 크롬에서 실험용 플래그를 활성화해야 합니다. chrome://flags
에서 활성화하는 실험 기능은 아직 개발 중이며, 모든 기기에서 테스트되지 않았으므로 오작동할 수 있습니다. 사용 중 버그가 발생할 가능성이 있으므로 주의해서 플래그를 사용해야 합니다.
본 가이드에서는 윈도우 PC를 기준으로 설명하지만, 모바일 기기를 포함한 다른 플랫폼에서도 동일한 방식으로 작동합니다.
먼저, 크롬을 실행하고 주소창에 chrome://flags
를 입력한 다음 엔터 키를 누릅니다. 이후 검색창에 “실험적 웹 플랫폼”을 입력합니다.
또는 주소창에 chrome://flags/#enable-experimental-web-platform-features
를 붙여넣고 엔터 키를 눌러 해당 플래그로 바로 이동할 수도 있습니다.
“실험적 웹 플랫폼” 플래그 옆에 있는 드롭다운 상자를 클릭한 후 “사용”을 선택합니다.
변경 사항을 적용하려면 크롬을 재시작해야 합니다. 페이지 하단의 파란색 “지금 다시 시작” 버튼을 클릭합니다.
크롬이 다시 시작되면 https://copy-image-text.glitch.me/로 이동하여 텍스트를 추출하려는 이미지를 업로드합니다. “파일 선택”을 클릭합니다.
컴퓨터에서 이미지 파일을 선택한 후 “열기”를 클릭합니다.
사이트에 이미지를 “업로드”하게 되지만, 이 도구는 오프라인에서도 사용할 수 있습니다. 해당 사이트로 이동하는 즉시 모든 리소스가 캐시에 저장됩니다.
파일 업로드 후 “제출”을 클릭합니다.
추출된 텍스트와 함께 페이지가 다시 로드됩니다. 이제 해당 텍스트를 웹 페이지에서 복사하여 텍스트 편집기나 워드 프로세서에 붙여넣을 수 있습니다.
현재 이 기능은 약간의 버그가 있는 것으로 보입니다. 위 이미지에서처럼 문서의 일부만 업로드 및 스캔되는 경우가 있습니다. 그러나 이러한 문제는 조만간 해결될 것으로 예상됩니다.