Tegakiアカウントのご用意
※アカウントのご用意については上記サイトよりCogent Labs様へお問い合わせください。
サンプルデータ
添付されている 20180406_tegaki_sample.zip には以下のファイルが入っています。
- sample.jpeg → 手書き入力済みの画像
- sample-jpg.json → Tegaki Editorで作成したjsonファイル
- sample.docx → 手書きテンプレートに利用したWordファイル
- sample.csv → 出力CSVファイルのヘッダー用
以下の処理では1の画像ファイル「sample.jpeg」のみ利用します。その他は必要に応じてご活用いただければと思います。
Tegakiの設定
Tegaki側ではAPIキーの取得と、OCR処理する範囲の指定をする必要があります。トライアルアカウントを取得し、Tegakiにログインして以下の手順で作業を進めます。
APIキーの取得
- 画面左メニューにある「APIキー」をクリックします。
- 「APIキー」は後ほどDataSpider側で利用するのでコピーしておきます。
TEGAKI EDITORの起動
- 画面左側メニューにある「新しいリクエスト」ボタンを選択します。
- 有効なJSON構造を作成するには「TEGAKI EDITOR」の利用がおすすめのようなのでボタンをクリックしてエディタを立ち上げます。
読み取り領域の設定
- sample.jpegを読み込みます。
- 画面左側のコンポーネントを利用し、読み取らせたい範囲を選択します。なお、読み取りの設定方法についてはTegakiのヘルプをご確認ください。
(設定イメージ図) - 読み取り設定が終わったら、画面左下にある「.jsonとして保存」ボタンをクリックし、jsonファイルを取得します。以上でTegaki上の設定は完了となります。
Tegakiアダプタの設定
グローバルリソースの設定
- コントロールパネル → グローバルリソースから「新しいグローバルリソースの作成」を選択し、クラウドカテゴリから「Tegaki」を選択し、先程コピーしておいた「APIキー」を設定します。
スクリプトの作成
- スクリプトを立ち上げ、ツールパレットのTegakiから「文字読み取り」を選択しキャンバスにドラッグします。
- プロパティ設定を行います。
画像ファイル:解析する画像ファイルを指定します。変数による指定も可能です。
テンプレート:Tegakiから取得したJSONファイルを指定します。 - オプション設定を確認します。
デフォルトで両方にチェックがついているので、必要に応じてチェックを外してください。 - 今回はCSVファイルに出力してみようと思います。
ツールパレット「ファイル」カテゴリから「CSVファイル書き込み」をキャンバスにドラッグします。出力されたデータを変換したいので、中間にマッピングアイコンも配置します。ツールパレット「変換」カテゴリの「基本」→「マッピング」をキャンバスにドラッグします。 - CSV書き込みコンポーネントのプロパティ設定をします。
入力データ:「mapping」を指定します。
ファイル:出力先と出力ファイル名を任意に指定します。
※列一覧はサンプル用のCSVファイル「sample.csv」を用意していますので、必要に応じてご利用ください。「ファイルの一行目から列名を読み取り」機能を利用することで列名を設定することが可能です。
エンコード:UTF-8に設定します。
1行目に列名を挿入にチェックを入れることで出力されるファイルに列が作成されます。 - マッピング設定をします。「mapping」をダブルクリックすると設定画面が表示します。
画面左側はTegakiからのレスポンススキーマ、右側はCSVファイルのスキーマになりますので、Tegaki側の「value」からCSV側へ線を引いていきます。
数字は全角で返却されることがあるので、その場合を考慮しツールパレットの「文字列」カテゴリの「日本語」→「全角→半角」を選択して間に配置しています。これで取得された値が半角の値になりCSVへ出力されます。
製品版から新たに「ファイルパス」「リクエストID」「処理ステータス」を取得できるようになりました。後続処理のハンドリングなど、必要に応じた活用が可能です。
必要な値をすべてひくと、設定は完了です。(更新:2018年10月5日)
処理の実行
「テスト実行」ボタンを押して実行してみましょう。実行ログに以下のような値が出力し、CSVファイルが正しく出力されると思います。
スクリプトの実行を開始します。
****** image_analysis処理開始 ******
リソースコンポーネントをプール[Tegaki接続設定])からロードしています。
データ処理コンポーネント(モジュール[tegaki_adapter]:操作[image_analysis])をロードしています。
処理を開始します。
------------------------------
リクエストを開始します。
/data/Tegaki/sample.jpg
RequestId :XXXXXX-XXXX-XXXX-XXXX-XXXXXXX
リクエストを終了しました。
------------------------------
完了を待機しています。
Response ---------------------
Headers:
Date: Mon, 09 Apr 2018 04:17:26 GMT
Content-Type: application/json; charset=utf-8
Transfer-Encoding: chunked
Connection: keep-alive