본문 바로가기
사용기

OCR 이미지에서 글자 추출

by woody.choi 2024. 2. 9.
반응형

OCR 즉, 주어진 이미지에서 글자를 추출하는 방법들에 대하여 알아보도록 하겠습니다. 다음의 사진은 책의 일부분을 촬영한 사진입니다. 해당 이미지를 가지고 여러 OCR 방법으로 글자를 추출하고 결과물을 비교해보겠습니다.

비교할 OCR 방법은 세가지입니다.

  • 아이폰 메모에서 텍스트스캔
  • 윈도우에서 파워토이즈를 이용한 글자추출
  • 구글 렌즈

iPhone 메모앱 텍스트 스캔

아이폰의 메모앱에서 새로운 문서를 생성하고 촬영하고자 하는 책의 페이지 위에서 사진 아이콘을 선택한 후 텍스트 스캔 메뉴를 선택합니다. 글자 추출은 실시간으로 이루어집니다. 세가지 방법중에서는 가장 빠른 속도와 편의성을 갖추고 있습니다.

다음은 추출된 결과물입니다. 잘못 추출된 단어가 두개가 있었습니다.

어 보았다. 그때 얼마 남았었는지 지금은 기억하지 못하지만 그다지 큰돈 은 아니었다. 그러니까 나는 2주일 동안에 왕의 보석만큼이나 엄청난 돈을 버린 것이었다. 그런 사실이었다. 나는 본질적으로 지독한 낭비가였다.

쓰지 않으면 잃어버리기라도 한다. 식당이나 나이트 클럽에서 잔돈을 받 는것을 깜빡 잊는 것이 두 번에 한 번 꼴이다. 그래서 우리 부모들은 펄펄 뛰었다. 그들을 비난할 수는 없다.

그러나 아버지는 꽤 부자이다. 수입이 얼마나 되는지는 잘 모른다. 그런 일에 대해서는 나와 이야기한 적이 없으니까. 그러나 수입이 상당히 많다 는 것쯤은 알고 있다. 아버지는 모 회사의 고문변호사이다. 변호사들이란 마구 긁어들이는 족속이니까 말이다. 아버지가 부자라는 것을 내가 아는 또 하나의 이유는 아버지가 항상 브로드웨이의 쇼에다 투자를 하기 때문 이다. 하긴 늘 실패하고 말지만. 그래서 아버지가 투자하면 어머니는 펄필 한다. 또한 동생 앨리가 죽고 난 다음부터 어머니는 건강이 좋지 못했다.

PowerToy

윈도우에서 사용할 수 있는 방법으로 파워토이즈가 있습니다. 설치는 https://learn.microsoft.com/ko-kr/windows/powertoys/install 문서를 참조합니다. Github에서 다운받아서 설치하거나 윈도우 스토어에서 설치할 수 있습니다.

PowerToys 의 텍스트 추출에서 단축키 및 활성화를 설정할 수 있습니다. 저는 Control + Alt + Shift + T 를 선택하였습니다.

이미지를 화면에 띄우고 설정된 단축키를 실행하면 클립보드로 텍스트가 복사되어집니다. 메모장이나 각종 소프트웨어를 실행하고 붙여넣기를 하면 추출된 글자들을 볼 수 있습니다.

다음은 파워토이즈를 이용한 추출 결과입니다. 다섯곳이 틀렸습니다.

보았다 그때 얼마 남았었는지 지금은 기억하지 못하지만 그다지 큰
은 아니었다. 그러니까 나는 2주일 동안에 왕의 보석만큼이나 엄청난
린 것이었다. 그건 사실이었다. 나는 본질적으로 지독한 낭비가였다.
쓰지 않으면 잃어버리기라도 한다. 식당이나 나이트 클럽에서 잔돈을 받
들것을깜빡 잊는 것이 두 번에 한 번 꼴이다. 그래서 우리 부모들은 펄펄
뛰었다. 그들을 비난할 수는 없다.
그러나 아버지는 꽤 부자이다. 수입이 얼마나 되는지는 잘 모른다. 그런
일에 대해서는 나와 이야기한 적이 없으니까. 그러나 수입이 상당히 많다
는 것쯤은 알고 있다. 아버지는 모 회사의 고문변호사이다. 변호사들이란
마구 긁어들이는 족속이니까 말이다. 아버지가 부자라는 것을 내가 아는
또 하나의 이유는 아버지가 항상 브로드웨이의 쇼에다 투를 하기 때문
이다. 하긴 늘 실패하고 말지만. 그래서 아버지가 투자하면 어머니는 펄펄
뛴다. 또한 동생 앨리가 죽고 난 다음부터 어머니는 건강이 좋지 못했다

구글 렌즈

구글 렌즈 사용은 먼저 구글 홈페이지에서 시작합니다. 구글 홈페이지의 검색창 우측에 사진 아이콘이 있습니다. 이 아이콘을 클릭합니다.

사진 아이콘이 클릭되면 다음과 같이 이미지를 업로드할 수 있는 메뉴가 나타납니다. upload a file를 선택하여 이미지를 업로드합니다.

다음과 같이 이미지가 나타나고 하단부의 텍스트 메뉴를 선택하면 원하는 부분을 선택하여 추출하거나 우측의 모든 텍스트 선택으로 전체 글자들을 추출할 수 있습니다.

다음은 구글 렌즈로 추출된 결과입니다. 틀린 글자가 없습니다. 사용하기에는 좀 번거러울 수 있으나 가장 정확하게 글자들을 추출합니다.

어 보았다. 그때 얼마 남았었는지 지금은 기억하지 못하지만 그다지 큰돈 은 아니었다. 그러니까 나는 2주일 동안에 왕의 보석만큼이나 엄청난 돈을 써버린 것이었다. 그건 사실이었다. 나는 본질적으로 지독한 낭비가였다. 쓰지 않으면 잃어버리기라도 한다. 식당이나 나이트 클럽에서 잔돈을 받 는 것을 깜빡 잊는 것이 두 번에 한 번 꼴이다. 그래서 우리 부모들은 펄펄 뛰었다. 그들을 비난할 수는 없다.
그러나 아버지는 꽤 부자이다. 수입이 얼마나 되는지는 잘 모른다. 그런 일에 대해서는 나와 이야기한 적이 없으니까. 그러나 수입이 상당히 많다 는 것쯤은 알고 있다. 아버지는 모 회사의 고문변호사이다. 변호사들이란 마구 긁어들이는 족속이니까 말이다. 아버지가 부자라는 것을 내가 아는 또 하나의 이유는 아버지가 항상 브로드웨이의 쇼에다 투자를 하기 때문 이다. 하긴 늘 실패하고 말지만. 그래서 아버지가 투자하면 어머니는 펄펄 된다. 또한 동생 앨리가 죽고 난 다음부터 어머니는 건강이 좋지 못했다. 그래서 어머니는 극히 신경질적이다. 내가 다시 퇴학당한 것을 아직 알리 기싫어하는 것도 그 이유 때문이었다.

반응형