AIRead v2.3.1 リリース
[AIRead]
◆OCRモデルの改善
・下記OCRモデルの精度・処理速度を改善しました
- 精度向上:活字文字検知モデル(「改善した文字列検知モデルを使用する」で使用)
- 精度向上:手書き数値・電話番号モデル(multi_numberモデル)
- 精度向上:手書きカタカナモデル(katakanaモデル)
- 処理速度向上:手書き文字切り取りモデル(「改善した手書きの文字切取りロジックを使用する」で使用)
◆複数ページ帳票に対して1ファイル出力する機能の追加(座標指定)
・複数ページ帳票の結果を1ファイルにまとめる機能を追加しました(エンタープライズ版は既に対応済み)
<出力エンコード>
- コントロールパネル:基本設定 > 「複数ページの帳票ファイルを1つの帳票として処理する」に
チェックを付ける
- 設定ファイル:FILE_IDENFICATION_TYPE=1を設定(0を設定:1ページ1ファイル出力)
◆出力エンコードの追加
・BOM付UTF-8が選択可能になりました
<出力エンコード>
- コントロールパネル:基本設定 > 「出力文字コード」でUTF-8(BOM付)を選択
- 設定ファイル:OUTPUT_ENCODINGに「UTF-8withBOM」を指定
◆罫線除去で欠けてしまった文字の復元処理機能の追加
・罫線除去で欠けてしまった文字の復元処理機能を追加しました
<出力エンコード>
- コントロールパネル:画像処理 > 「罫線除去で欠けてしまった文字の復元処理を行う」の
チェックで選択
- 設定ファイル:RESTORE_TEXTにtrue:復元処理を行う/false:行わない を指定(デフォルト:false)
・必ず復元できるわけではありません
また、副作用として文字にノイズがつく場合があります
◆出力形式の追加(座標指定)
・SIMPLE_CSV/SIMPLE_SEPARATE_CSV形式をTSV形式にした出力形式を追加しました
<出力形式の指定>
- コントロールパネル:基本設定 > 「出力フォーマット」からSIMPLE_TXT
または SIMPLE_SEPARATE_TXT選択
- 設定ファイル:OUTPUT_FORMAT=SIMPLE_TXT または SIMPLE_SEPARATE_TXTを指定
・SIMPLE_TXT/SIMPLE_SEPARATE_TXT形式はSIMPLE_CSV/SIMPLE_SEPARATE_CSVと同様に
「抽出モードの指定」で「キーワード指定(表検出付き)」を指定した場合のみ指定可能です
◆画像仕分けOCRに全文OCRを追加
・画像仕分けOCRで全文OCRが指定可能となりました
<仕分けOCRで全文OCRを指定>
- option.csv:3列目にWを指定
◆全文OCRでの個別設定機能の追加
・全文OCRで個別設定が設定可能になりました
・詳細はマニュアルをご覧ください
◆優先モデルフォルダ機能の追加
・本機能で指定したフォルダにモデルを配置すると優先して使用します
・優先モデルフォルダに指定されたモデルが存在しない場合、共通のモデルフォルダから使用します
・自前で学習したモデルがある場合に、優先フォルダに配置することで共通フォルダと分けることが可能です
・個別設定と組み合わせることで、帳票ごとに優先モデル/共通モデルの使い分けが可能です
<優先モデルフォルダの指定>
- コントロールパネル:基本設定 > 「優先モデルフォルダ」にフォルダパスを指定
- 設定ファイル:PRIORITY_MODEL_PATHにフォルダパスを指定(デフォルト:指定なし)
◆表示用PDF画像生成機能の追加
・データサイズを減らした表示用のPDFを生成する機能を追加しました
・OCR処理が成功したとき、入力ファイルが複数ページの場合FILE_IDENFICATION_TYPEに関係なく
1ファイル複数ページのPDFを生成します
※仕分け付OCR時はFILE_IDENFICATION_TYPE=0の場合、1ページ1ファイルの表示用画像が生成されます
<表示用画像生成>
- コントロールパネル:基本設定 > 「表示用画像(PDF)を生成する」のチェックで選択
- 設定ファイル:CREATE_DISPLAY_IMAGEにtrue:表示用画像を生成する、false:生成しない
(デフォルト:false)を指定
<表示用画像の出力フォルダ>
- コントロールパネル:基本設定 > 「表示用画像の出力フォルダ」にフォルダパスを指定
- 設定ファイル:DISPLAY_IMAGE_DIRにフォルダパスを指定
(デフォルト:指定なし、CREATE_DISPLAY_IMAGE=trueのとき指定必須)
<表示用画像の品質>
- コントロールパネル:基本設定 > 「表示用画像の品質」で1~100の整数を指定
- 設定ファイル:DISPLAY_IMAGE_QUALITYに1~100の整数(デフォルト:65)
- 備考:PDFに埋め込むJPEG画像の品質に該当する 低いほど画像品質は下がるがデータサイズ
も小さくなる
◆罫線除去の無効化機能の追加
・罫線除去を無効化する機能を追加しました
<罫線除去を無効化>
- コントロールパネル:画像処理 > 「罫線除去を無効化する」のチェックで選択
- 設定ファイル:SKIP_LINE_REMOVEにtrue:罫線除去を無効化する、false:罫線除去を行う
(デフォルト:false)を指定
◆不具合対応
・罫線がない画像で傾き補正が正しく動作しない問題を修正しました
・座標指定の手書き項目で、1文字指定しているのに文字切り取り処理が行われる問題を修正しました
・色抽出/除去処理を行った際にその結果がずれ修正機能に反映されず意図しない結果となる問題を
修正しました
・キーワード抽出時にPROFILE_KWCONFIG_DIRの値の末尾に/がないと出力ファイルが生成されない問題を
修正しました
・キーワード抽出時に複数ページ画像を入力した際に正しくない文字列座標が返される問題を修正しました
・手書き文字切り取りの改善ロジックを使用した場合に稀に手書き処理が終らなくなる問題を修正しました
・表検出OCR時に除去された点線がセルの認識に反映されない問題を修正しました
・補正後画像出力を設定し、なおかつ出力形式がJPEGのとき、
座標指定/全文OCR時にヘッダのImage/Image_jshfilenameの記載にページ番号が正しく記載されない問題を
修正しました
[RuleEditor]
◆クラウド版との分離
・クラウド版と区別がつきやすいように、画面タイトルを下記の形式に変更しました
AIRead Rule Editor [on Premises | on Cloud] [バージョン番号]
・アイコンがオンプレミス版とクラウド版で異なるようにしました
・Windowsスタート画面でオンプレミス版とクラウド版でショートカットが異なるフォルダに配置されるようにしました
◆不具合対応
・特殊な埋め込みフォントを持つPDFを画像登録した際に文字が欠落する問題を修正しました
[FormEditor]
◆UIの改善
・読み取り定義のレコードに設定できる数を0~1000に制限しました
◆クラウド版との分離
・クラウド版と区別がつきやすいように、画面タイトルを下記の形式に変更しました
AIRead Form Editor [on Premises | on Cloud] [バージョン番号]
・アイコンがオンプレミス版とクラウド版で異なるようにしました
・Windowsスタート画面でオンプレミス版とクラウド版でショートカットが異なるフォルダに
配置されるようにしました
◆不具合対応
・読み取り指定の選択モードで、画像の範囲外にドラッグすると青い枠線が消えなくなる問題を修正しました
・固定値の設定でEnterを押したときのフォーカスの移動がおかしい問題を修正しました
・読み取り指定で手書きモデルの「数値・電話番号」を指定した際、文字の区切り線の設定が
できない場合がある問題を修正しました
・読み取り指定でOCR設定時に区切り線の本数が正しく表示されない事がある問題を修正しました
・位置合わせ設定時に個別設定が働かない問題を修正しました
・特殊な埋め込みフォントを持つPDFを画像登録した際に文字が欠落する問題を修正しました
[Control Panel]
◆設定の追加
・新規機能の設定を追加しました
詳しくは[AIRead]の項をご覧ください
◆UX改善
・個別設定時に任意の共通設定ファイルを指定することでデフォルトで表示する各値を指定できるように
なりました
・色抽出・除去の色設定にカラーパレットを適用し、設定しやすくなりました
◆クラウド版との分離
・クラウド版と区別がつきやすいように、画面タイトルを下記の形式に変更しました
AIRead ControlPanel [on Premises | on Cloud] [バージョン番号]
・アイコンがオンプレミス版とクラウド版で異なるようにしました
・Windowsスタート画面でオンプレミス版とクラウド版でショートカットが異なるフォルダに
配置されるようにしました
[AIRead Viewer]
◆UX改善
・結果の一覧画面を追加しました
・複数の結果をまとめて出力できる機能を追加しました
・バージョン番号を画面タイトルに追加しました
・確定済みでない結果もデータ出力可能となりました
◆不具合対応
・キーワード抽出のSUB_KEYWORD_NEARの2行目のデータが、矩形強調範囲に含まれない問題を
修正しました
・座標指定時に、定義した明細の順と表示される順が異なる場合がある問題を修正しました
[インストーラ]
◆クラウド版と分離
・オンプレミス用とオンクラウド用のインストーラを分離しました
◆システム環境変数の登録数の削減
・”PATH”、”CLASS_PATH”、”LD_LIBRARY_PATH”のシステム環境変数への登録を削減しました
⇒削減した各変数は各種OCR実行バッチ、GUI中でAIRead実行時に独自に設定するように修正しています
◆再起動の必須化
・インストール時の再起動を必須にしました