【Python】PDFのテキストを取得する方法
※過去の記事を再投稿しています
概要
PDFから一括でテキストを取得したいことがあると思います
Pythonのライブラリを使用することで簡単に取得できます
「pdfminer.six」を利用します
sample.pdf
Pythonソースコード
解説
インストールが必要です(pip install pdfminer.six)
pdfminer.high_levelをインポートします
PDFのパスを指定して読み込みます
PDFから取得したテキストを表示します
出力結果になります
所感
PDFのテキストを取得するだけでなく、PDFの画像取得や操作を行うことができます