1. 일부 보고서에서 자료를 뽑아야 하는데 PDF이다.
https://da-nika.tistory.com/86
위 사이트에 정리가 잘 되어 있는 것 같고.
2. 보다 세부적으로는
위 영문 사이트가 낫다.
3. camelot이 낫다는 견해에 따라 설치를 위해
https://pypi.org/project/camelot-py/
위 사이트를 참조해서 설치하면 된다.
4. 다만 설치 중 맞이하는 몇 가지 문제는
4-1. Camelot mportError: cannot import name 'PDFTextExtractionNotAllowed' from 'pdfminer.pdfpage'
4-2. RuntimeError: Please make sure that Ghostscript is installed
https://github.com/atlanhq/camelot/issues/282
5. 그렇지만 완전한 형태의 표 추출은 불가능하다....