AI/글자인식
-
[한글 OCR] 1. 글자 데이터 얻기(글자 생성)AI/글자인식 2022. 8. 25. 23:38
딥러닝을 하기위해 중요한 것은 데이터다. 그런데 데이터를 수집하기 매우 어렵다. 다행히 글자데이터를 생성하는 오픈소스가 있다. 이 오픈소스를 이용해서 글자 데이터를 얻었다. https://github.com/Belval/TextRecognitionDataGenerator GitHub - Belval/TextRecognitionDataGenerator: A synthetic data generator for text recognition A synthetic data generator for text recognition. Contribute to Belval/TextRecognitionDataGenerator development by creating an account on GitHub. github...
-
[한글 OCR] 0. 계획AI/글자인식 2022. 7. 30. 23:50
딥러닝으로 영수증에 있는 글씨를 인식해볼려고 한다. 글자인식은 쉬운 방법으로 tesseract가 있는데 인식오류가 많다는 것을 알았다. 그래서 인식율을 높이기 위해 어떤 기술이 필요한지 조사를 했다. OCR은 크게 두 가지 기술이 있다. 1. 문자 찾기 => 사진에 문자가 있는 영역 표시 2. 문자 식별 => 표시한 영역에 문자 식별 아래 영상에서 관련 정보를 알 수 있다. https://tv.naver.com/v/4578167 글자읽는 AI: 밑바닥부터 외국어 정복까지 NAVER Engineering | 글자읽는 AI: 밑바닥부터 외국어 정복까지 tv.naver.com OCR 계획이다. 1. 글자 데이터 수집 2. 데이터 학습 3. 테스트