見出し画像

🛠️Apache PDFBox

https://amzn.to/3SAHVZ4


Apache PDFBox®ライブラリは、PDF文書を扱うためのオープンソースのJavaツールです。このプロジェクトでは、新しいPDF文書の作成、既存の文書の操作、文書からのコンテンツの抽出が可能です。また、Apache PDFBoxには、いくつかのコマンドラインユーティリティも含まれています。Apache PDFBoxは、Apache License v2.0の下で公開されています。

https://pdfbox.apache.org/

Apache PDFBox コミュニティは、Apache PDFBox バージョン 3.0.0 の 3 回目のアルファリリースを発表します。 下記からダウンロード可能です。
https://pdfbox.apache.org/download.html
このリリースの詳細については、完全なリリースノートを参照してください。
移行ガイドでは、PDFBox 2.0.x から来るユーザーに、移行時に見るべきものの概要を説明します。詳細は後ほど。

このガイドでは、Apache PDFBox 3.0 リリースの更新について説明します。提供される情報を使用して、PDFBox 2.x アプリケーションを PDFBox 3.0 にアップグレードします。このリリースの新しい機能、非推奨の機能、サポートされていない機能についての情報を提供します。

Javaバージョン
PDFBox 3.0には最低でもJava 8が必要です。テストは、Java 19まで行われています。

非推奨の API とコンポーネント
PDFBox 2.x の非推奨 API およびコンポーネントはすべて、PDFBox 3.0 で削除されました。

メモリ使用量の削減
インクリメンタルパージング
PDFBoxは現在、最初のメモリフットプリントを減らし、増分的にPDFドキュメントをロードします。これはまた、PDFの特定の部分のみがアクセスされている場合、PDFを消費するために必要なメモリを減らすことができます。PDFの性質上、すべてのページを繰り返し、注釈にアクセスし、PDFに署名するなどの使用は、PDFBox 2.0と同様のメモリ消費につながるオーバータイムのPDFのすべての部分をロードする可能性があることに注意してください。

PDFBoxには、一連のコマンドラインユーティリティが付属しています。これらは標準的なJavaアプリケーションとして利用可能です。
PDFBoxのツールをJavaアプリケーションとして実行するためのクラスパスの設定方法については、「依存関係」のページを参照してください。


いいなと思ったら応援しよう!

あたり帳簿
お願い致します