PDF内のフォント管理とその実装

PDFファイルでは画像、ベクターグラフィックス、テキストを取り扱うことができ、テキストには任意のフォントを適用することが可能です。全てのPDFビューアには、Times、Helvetica、Courier、Symbol、Zapf Dingbatsといった5つの標準フォントファミリが組み込まれており、これらはどの文書にも使用できます。

別のフォントを使用する場合、以下の3つの方法があり、これらはPDF作成ツールで設定されます:

  1. 1. 単にフォント名を指定し、それがユーザーのマシンに存在することを期待する。存在しない場合は、標準フォントに置き換えられます。
  2. 2. フォントをPDFファイルに埋め込む。これはフォントデータをPDFに直接含めることを意味し、どのマシンでも正確なフォント表示が保証されます。ただし、フォントのサイズが大きい場合、PDFファイルのサイズが膨大になる可能性があります。
  3. 3. フォントを埋め込み、サブセット化する。これは使用される文字のみのフォントデータをPDFに含める方法です。例えば、「THE CAT SAT ON THE MAT」という文が含まれるPDFを作成する場合、T、H、E、C、A、S、O、N、Mといった文字のみのフォントデータを埋め込みます。これにより、ファイルサイズを抑えつつ、PDFが期待通りに表示されることを確実にします。

PDF内で使用されるフォントの種類と特徴

PDFファイルでは、いくつかの異なる種類のフォント技術を使用することができます。

Type 1 Type 1フォントは、Adobeによって開発されたベクターベースのフォント形式です。これは、曲線や直線を数学的な式で表現し、どんなサイズにも適応できるようにします。非常に高い印刷品質を提供しますが、現代のPDFファイルでは少し古い形式と見なされることがあります。見た目は比較的「粗い」ものとなることが多く、テキスト値の抽出が難しい場合があります。
Type 3:
Postscript(Type1)
ポストスクリプトプログラムを使って個々の文字を定義するフォントです。Type 1フォントよりも柔軟性がありますが、品質が一貫しないことがあります。Type 3フォントでは、カラー画像やシェーディングパターンもフォントの一部として定義でき、テキスト値の抽出が可能です。
TrueType AppleとMicrosoftによって、特許を持つAdobeのPostscriptに代わるものとして開発されました。ベクターベースで、画面表示と印刷の両方で高品質なテキストを提供します。TrueTypeフォントは、フォント自体とスクリーン用のヒンティング情報を一つのファイルに組み込むことができ、テキスト値の抽出が可能です。Windowsのデフォルトフォントとして広く使われています。
OpenType PostscriptとTrueTypeの長所を統合したフォント技術で、AdobeとMicrosoftが共同で開発したフォント形式です。TrueTypeとType 1の両方の特性を組み合わせており、さらに拡張機能を持っています。これには、広範囲の文字セットサポートや高度なタイポグラフィ機能が含まれます。テキスト値の抽出が可能です。