일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- nvidiadocker2설치
- nvidiadocker
- 리눅스도커
- 우분투도커
- ppocrexportmodel
- 우분투
- vscodesshkey
- 리눅스docker
- PyTorch
- 우분투22.04
- Docker
- dockergpu오류
- ppocr한국어
- 도커우분투
- 도커
- docker사용법
- paddlepaddleocr한국어
- dockergpu설치
- 우분투docker재설치
- 도커재설치
- 도커이미지
- python
- 우분투도커재설치
- docker container
- nvidiadocker설치
- linux도커
- paddleocr
- docker재설치
- docker설치오류
- ppocr한국어비교
- Today
- Total
목록Project/OCR (3)
D_ontory : 개발스토리

PaddleOCR recognition model 학습을 완료했다.tools/eval.py 로 테스트를 진행해 보았고, gpu를 사용하여 inference 결과도 보고 싶어서 모델을 export_model 을 적용하여 inference 용 모델로 전환하려했다. python3 tools/export_model.py -c /workspace/PaddleOCR/output/rec_ppocr_v3_korean_v4/config.yml -o Global.pretrained_model=./output/rec_ppocr_v3_korean_v4/best_accuracy Global.save_inference_dir=./inference/korean_PP-OCRv3_rec/W0610 10:30:36.766150 179..

OCR 이란? (Optical Character Recognition)OCR이란 광학 문자 인식 이라고 부르며, 이미지 속 문자를 기계가 해독할 수 있도록 하는 모델이다.OCR Process에 대해 간단하게 설명하자면, OCR은 크게 두가지 모델이 사용된다.1. Text Detection (어디쯤에 글자가 있는지 찾음)2. Text Recognition (찾은 영역 내 글자가 어떤 글자인지 인식함)결론부터 말하자면, EasyOCR 과 PaddleOCR 을 비교해본 결과, 한국어의 경우는 PaddleOCR 의 인식률이 더 좋았다. PaddleOCR 실험 결과PaddleOCR 은 중국 Baidu PaddlePaddle 에서 개발한 OCR 라이브러리다.성능도 향상시키고, 경량화도 진행하여 CPU 환경에서도..

paddleocr 을 사용하여 한국어 ocr finetuning 학습을 진행하려 한다.multi-gpu 사용하여 학습 진행할 예정이었는데, 내가 사용할 gpu는 2,3번 gpu 였다.애초에 docker container 생성할 때도 (nvidia-docker container 사용) 사용 gpu를 2,3으로 제한해두었는데 학습을 진행하려고하니 gpu 관련 오류가 떴다. paddleOCR fine-tuning gpu error ValueError: substring not found 최종적으로는 gpu 오류가 맞았고,해당 컨테이너에서 nvidia-smi 를 통해 gpu 번호를 확인해 보았다. 총 4개의 gpu 중 2,3을 사용 gpu로 가지고왔는데 컨테이너 내에서 nvidia-smi 로 확인해보니 ..