전체 글
-
[한글 OCR] 2.2 글자 학습카테고리 없음 2022. 9. 3. 22:00
이전 시간에는 한 글자만 데이터를 만들어서 학습을 진행했는데 이번에는 아래 조합으로 데이터를 만들고 학습하려고 한다. - 길이 - 1. 한 글자 2. 단어 - 조합 - 1. 한글 2. 영어 3. 숫자(숫자 + 특수문자) 4. 한글 + 영어 5. 한글 + 숫자 - 크기 - 1. 소 2. 중 3. 대 한글 단어는 국어국립원에서 데이터를 얻고 중복값을 제거 후 테스트파일로 만들었다. 데이터를 만들 테스트 파일이다. 사용한 명령어다. 한글 한글자 python run.py -c 100000 -fd fonts/ko -dt dicts/ko_one.txt -k 5 -rk -na 2 -f 64 -t 8 --output_dir out/vaild/Ko_one_64/ V python run.py -c 100000 -fd fo..
-
[한글 OCR] 2.1 글자 학습카테고리 없음 2022. 9. 1. 22:53
지난번에 이어서 모델을 학습하려고 한다. 학습하는 방법은 아래 블로그를 참고했다. https://davelogs.tistory.com/94 EasyOCR 사용자 모델 학습하기 (6) - 한글 학습데이터 생성, 학습 및 테스트 이번에는 한글 학습데이터를 생성하고 학습, 검증하는 과정을 진행해 보고자 한다. 이전에 작성한 학습데이터 생성부터 변환, 미세조정(Fine-tune) 학습 등에 대한 내용은 아래 포스트를 참고하기 davelogs.tistory.com 확실히 학습된 모델이라 그런지 처음부터 정확도가 높다. 모델을 테스트 했다. 결과는 학습된 모델보다 인식율이 더 떨어졌다. 문제점을 파악하고 다시 학습시켜야 겠다.
-
[한글 OCR] 2. 글자 학습카테고리 없음 2022. 8. 25. 23:55
네이버에서 오픈소스로 공개된 OCR모델이다. 해당 모델을 이용해서 글자를 학습하려고 한다. https://github.com/clovaai/deep-text-recognition-benchmark GitHub - clovaai/deep-text-recognition-benchmark: Text recognition (optical character recognition) with deep learning methods. Text recognition (optical character recognition) with deep learning methods. - GitHub - clovaai/deep-text-recognition-benchmark: Text recognition (optical charac..
-
[한글 OCR] 1. 글자 데이터 얻기(글자 생성)AI/글자인식 2022. 8. 25. 23:38
딥러닝을 하기위해 중요한 것은 데이터다. 그런데 데이터를 수집하기 매우 어렵다. 다행히 글자데이터를 생성하는 오픈소스가 있다. 이 오픈소스를 이용해서 글자 데이터를 얻었다. https://github.com/Belval/TextRecognitionDataGenerator GitHub - Belval/TextRecognitionDataGenerator: A synthetic data generator for text recognition A synthetic data generator for text recognition. Contribute to Belval/TextRecognitionDataGenerator development by creating an account on GitHub. github...
-
[한글 OCR] 0. 계획AI/글자인식 2022. 7. 30. 23:50
딥러닝으로 영수증에 있는 글씨를 인식해볼려고 한다. 글자인식은 쉬운 방법으로 tesseract가 있는데 인식오류가 많다는 것을 알았다. 그래서 인식율을 높이기 위해 어떤 기술이 필요한지 조사를 했다. OCR은 크게 두 가지 기술이 있다. 1. 문자 찾기 => 사진에 문자가 있는 영역 표시 2. 문자 식별 => 표시한 영역에 문자 식별 아래 영상에서 관련 정보를 알 수 있다. https://tv.naver.com/v/4578167 글자읽는 AI: 밑바닥부터 외국어 정복까지 NAVER Engineering | 글자읽는 AI: 밑바닥부터 외국어 정복까지 tv.naver.com OCR 계획이다. 1. 글자 데이터 수집 2. 데이터 학습 3. 테스트
-
[지렁이 게임] 0. 세팅AI/강화학습 2022. 6. 19. 22:21
https://www.youtube.com/watch?v=C4WH5b-EidU 유튜브에 지렁이 강화학습하는 예제가 있어서 한번 직접 구현하려고 한다. 지렁이 게임 세팅 https://github.com/rajatdiptabiswas/snake-pygame/blob/master/Snake%20Game.py GitHub - rajatdiptabiswas/snake-pygame: A snake game written in Python using the Pygame library :snake: A snake game written in Python using the Pygame library - GitHub - rajatdiptabiswas/snake-pygame: A snake game written in P..
-
[ROS 2] Topic드론/시뮬레이터 2022. 6. 6. 23:11
Topic이란, 노드 사이간 전달하는 메시지(데이터)의 통로이다. Topic의 방향을 보면 메시지(데이터)의 흐름을 파악할 수 있다. ROS 2는 노드 사이에 전달하는 데이터를 메시지라고 한다. 실행중인 Topic 정보 확인 실행중인 topic $ ros2 topic list topic 정보 $ ros2 topic info 토픽이름 message 구성 $ ros2 interface show 메시지타입 참조 : https://puzzling-cashew-c4c.notion.site/ROS-2-Topic-a1bd364220dc4db9beb6d29b79dfdf71 ROS 2 Topic 이번 시간에는 topic이 무엇인지와 topic의 주체가 되는 publisher, subscriber에 대해 배워봅니다. pu..