日本の会計・人事を変える。”もっとやさしく””もっと便利に”企業のバックオフィスを最適化。スーパーストリーム

『紙』のエビデンスを『電子化』する『ドキュメントスキャナー』で何ができる?

 中田 清穂(なかた せいほ)

テレワークを進めていくためには、領収書、請求書や契約書などの「紙」のエビデンスを、PDFファイルなどに電子化することが、非常に重要なポイントになってきます。

日本企業の多くの方々は「紙」文書を電子化するとなると、コピー機にプリンター機能が備わっている、いわゆる「複合機」を使うことを前提とされるでしょう。
しかし、複合機以外にも、「紙」文書を電子化する機器があります。

その一つが、「ドキュメントスキャナー」です。
ドキュメントスキャナーは、「紙」文書を電子化する「専用機」です。

したがって、複合機にはない、特別な機能があります。

いくつかの機能をご紹介します。

(1) 斜行補正機能:
複合機では、原紙が斜めになって読み込まれると、斜めのままの画像で電子化されます。
ドキュメントスキャナーでは、原紙が斜めに読み込まれても、傾きを補正した画像ファイルを作成してくれます。

(2) 両面同時読取機能:
複合機では、両面を読み取る際には、一度片側を読み取った後で、裏返してもう一度読み取ることで両面を読み取ります。
ドキュメントスキャナーでは、表と裏を同時に読み取りますので、それだけスピードが速くなります。

(3) 重送検知機能:
複合機で「紙」文書を電子化する際に、2枚の原紙が読み込まれると、重なって読み込まれたページがスキャンされません。
ドキュメントスキャナーでは、2枚以上の紙が読み込まれかけると、読み込み始める前に停止する機能があります。

(4) 白紙スキップ機能:
複合機で両面読取を行うと、原紙の裏が白紙の場合、白紙のページの画像ファイルも作ってしまいます。
ドキュメントスキャナーでは、原紙の裏が白紙の場合、そのページを飛ばして、白紙ではないページだけの画像ファイルを作ります。

(5) 汚れ削減機能:
ドキュメントスキャナーでは、原紙に汚れがある場合に、文字ではなく汚れであることを検知して、汚れた部分をほとんど見えなくした画像ファイルを作ります。
これにより、OCRでの誤った読取りを防止したり、識字率をあげたりすることができます。

(6) 有彩色除去機能:
ドキュメントスキャナーでは、原紙の背景が白黒ではなく、色がついている場合、色をなくして画像ファイルを作ります。
これにより、OCRでの誤った読取りを防止したり、識字率をあげたりすることができます。

(7) 罫線削除機能:
ドキュメントスキャナーでは、原紙に表などの罫線がある場合、罫線をなくして画像ファイルを作ることができます。
これにより、金額を3桁ごとに区切る縦の罫線があったりすると、OCRで、「罫線」を「1」を間違えて読取ってしまうことがありますが、これを防止することができます。

(8) OCR用フォント変換機能:
ドキュメントスキャナーでは、原紙のフォントがOCRでは不得手なフォントの場合、OCRで読み取られやすいフォントに変えて画像ファイルを作ることができます。

(9) 複数ファイル作成機能:
ドキュメントスキャナーでは、一度の読み取りで、複数の画像ファイルを作ることができます。
OCRの精度を向上させるために、上記のような機能を使うと、原紙を加工した画像ファイルを作ることになります。
もし、電子帳簿保存法のスキャナ保存を行う場合には、原紙を加工した画像ファイルは要件を満たさないために認められません。
これを解決するために、OCRの精度を向上させるための設定で読み取った画像と、原紙そのままの画像の、複数の画像ファイルを作れば良いでしょう。
片やスキャナ保存法対応のエビデンスとしては、原紙を加工せずに作成された画像ファイルにタイムスタンプを押して利用し、片やOCRでテキスト変換する場合には、「罫線削減」や「有彩色除去」などを行った画像ファイルを利用するのです。

いかがでしょうか。

「紙」を電子化する際の心配ごとが、少しでも減るようであればうれしく思います。

関連記事