일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- paddlepaddle
- ppocr
- 우분투22.04
- postbuffer
- ppocrexportmodel
- python데이터시각화
- 도커
- paddleocr한국어
- 우분투
- paddlemultigpu
- matplotlib한글깨짐
- python
- vscodesshkey
- opencv오류
- Docker
- gitrepository
- PyTorch
- 도커이미지
- paddleocrgpu
- paddlepaddlegpu
- paddlepaddleocr
- paddleocr
- addingembedded
- docker container
- paddleocr후기
- python시각화
- dockergpu
- pp-ocr한국어
- gitpostbuffer
- docker사용법
- Today
- Total
목록Project/OCR (3)
D_ontory : 개발스토리
PaddleOCR recognition model 학습을 완료했다.tools/eval.py 로 테스트를 진행해 보았고, gpu를 사용하여 inference 결과도 보고 싶어서 모델을 export_model 을 적용하여 inference 용 모델로 전환하려했다. python3 tools/export_model.py -c /workspace/PaddleOCR/output/rec_ppocr_v3_korean_v4/config.yml -o Global.pretrained_model=./output/rec_ppocr_v3_korean_v4/best_accuracy Global.save_inference_dir=./inference/korean_PP-OCRv3_rec/W0610 10:30:36.766150 179..
OCR 이란?결론부터 말하자면, EasyOCR 과 PaddleOCR 을 비교해본 결과 PaddleOCR 의 인식률이 더 좋았다.그 전에 OCR에 대해 간단하게 설명하자면, OCR은 크게 두가지 모델이 사용된다.1. Text Detection (어디쯤에 글자라는게 있는지 찾음)2. Text Recognition (찾은 영역에 있는글자가 어떤 글자인지 인식함) PaddleOCR 실험 결과 PaddleOCR 은 중국 Baidu PaddlePaddle 에서 개발한 OCR 라이브러리다.성능도 향상시키고, 경량화도 진행하여 CPU 환경에서도 테스트가 수월하게 가능하다.테스트 데이터는 AIHUB에서 제공하는 책표지 데이터셋이다. 추후 학습 데이터로도 사용할 수 있을 것 같다. https://github.com/..
paddleocr 을 사용하여 한국어 ocr finetuning 학습을 진행하려 한다.multi-gpu 사용하여 학습 진행할 예정이었는데, 내가 사용할 gpu는 2,3번 gpu 였다.애초에 docker container 생성할 때도 (nvidia-docker container 사용) 사용 gpu를 2,3으로 제한해두었는데 학습을 진행하려고하니 gpu 관련 오류가 떴다. paddleOCR fine-tuning gpu error ValueError: substring not found 최종적으로는 gpu 오류가 맞았고,해당 컨테이너에서 nvidia-smi 를 통해 gpu 번호를 확인해 보았다. 총 4개의 gpu 중 2,3을 사용 gpu로 가지고왔는데 컨테이너 내에서 nvidia-smi 로 확인해보니 ..