DataSpider Servista Sedueアダプタのご紹介

Avatar
dstn


皆さんこんにちは。アプレッソの友松です。
今回は、ちょうど本日(2012/12/14)にリリースされたDataSpiderの新しいアダプタ製品、DataSpider Servista Sedueアダプタをご紹介しようと思います。

このSedueアダプタは株式会社Preferred Infrastructure(プリファードインフラストラクチャー 以下PFI)さんが提供されている統合検索プラットフォーム「Sedue(セデュー)」と連携できるアダプタです。

Sedueとは


まず、連携先となるSedueという製品がどのような製品かご説明します。

Sedueはデータの全文検索・レコメンデーションを実現する統合検索プラットフォームです。以下のような特長があります。
・全文検索とレコメンデーションが単一製品で実現できる
・検索結果の絞込み・ソート・ドリルダウンを実現する柔軟な検索処理
・高いパフォーマンス/スケーラビリティ

詳しくはPFIさんの 紹介ページをご覧ください。

すごく乱暴にいってしまうとGoogleやAmazonの検索機能を自分たちで実現できるようなソリューションかと思います。

 

DataSpider Sedueアダプタとは


Sedueは検索対象のデータソースをドキュメントリポジトリに格納しインデックス化することで検索を実現します。そのため検索対象のデータソースを定期的に収集する必要があります。収集はもちろん手動だけではなく自動化も必要ですからその際には収集を自動的に行うプログラム(クローラ)の開発が必要です。

Googleでもクローラを利用してWebサイトからデータソースを収集していますが、Googleが検索対象としているのはWebサイトやPDFなどで数はとてつもなく多いもののデータソースの形式は限られているとおもいます。しかし、社内での検索エンジンを考えてみてください。対象としたいデータソースは様々な形式のものではないでしょうか?テキストファイルやExcelのファイル、もしくはDBに格納されたデータかもしれません。はたまたLotus Notesの中にあるドキュメントかもしれません。

またデータソースによっては単純に収集するだけではなく、必要なものだけを抽出して検索対象にしたり検索結果をわかりやすくするために変換が必要な場合もあるかもしれません。このような状況になってくるとそれぞれシステムやデータソースごとにクローラーを独自に開発する必要が出てきます。

このような個別に独自のインタフェースの開発をしなければいけないようなシーンはDataSpiderの出番ですね!
DataSpiderの豊富なアダプタで様々なデータソースの収集処理をGUIを使って簡単に開発できちゃいますし、データの変換もノンプログラミングで開発可能です。
メンテナンス性もあがって非常に便利です!

このDataSpiderでのSedue連携開発をより効率的に実現できるように新たにリリースしたのが今回のDataSpider Sedueアダプタです。

DataSpider SedueアダプタはDBアダプタと同じようなイメージでSedueへの文書の書き込みがノンプログラミングで開発できます。DataSpiderは元々豊富なアダプタを持っていますので例えばLotus NotesやSalesforceのデータをSedueに書き込むようなことが実現でき、今までSedueの検索対象とすることに手間のかかったシステムも検索対象にすることが可能です。

利用イメージをまとめると以下のような図になります。

001

 

DataSpider Sedueアダプタの設定イメージ


まず接続にはクエリサーバー、アーカイブマネージャーの接続情報が必要です。

DataSpider Sedueアダプタは以下の二つのオペレーションがあります。
・文書書き込み
・文書削除

文書書き込みの設定プロパティは以下のようになっています。

002

書き込みの設定は接続先のグローバルリソースの設定とキーフィールドを指定するだけです。
スキーマは自動的に取得されます。

オプションとして登録した文書をすぐにインデックス化を行い検索対象にするかどうか選択が可能です。
また、大量の文書を書き込みする際にメモリの負荷を軽減できるように文書を分割して書き込むことが可能です。設定は一度に書き込む文書数を指定します。

文書削除の設定プロパティは以下のようになっています。

003

こちらはもはや接続先のグローバルリソースの設定のみです。
Keyのみのスキーマが自動的に取得されますので削除したいドキュメントのIDを渡すことで削除が可能です。

こちらもオプションとして削除した文書をすぐに検索対象外にするかどうか選択が可能です。

 

まとめ


このようにDataSpider SedueアダプタとSedueを組み合わせていただくことで様々な文書を検索できる検索エンジンを比較的容易に導入できるようになり、また担当者が自分たちでメンテナンスすることができるようになります。

DataSpider Sedueアダプタの体験版は弊社よりご提供可能ですのでご要望の方は弊社HPより お問い合わせいただければと思います。

コメント

ログインしてコメントを残してください。

Powered by Zendesk