AzureML×DataSpider共同ハンズオン開催報告

Avatar
dstn


あけましておめでとうございます。

アプレッソ技術部 對馬です。

2016年へのカウントダウンをして盛り上がっていたのはついこの間のような気がしますが、
もう少しで2016年も残り11か月となりますね。早いものです。

今年もdstnを宜しくお願いします。

さて、2016年第1回のブログは、
1月21日に開催された AzureML/DataSpider共同ハンズオンの開催報告です!

どんな内容だったのか、それ以前になぜAzureとDataSpiderなのか、について書かせていただきます。

AzureMLとDataSpiderについて


まず初めに、Microsoft AzureのMachineLearning(機械学習)サービス(以下AzureML)とDataSpiderの関係性についてお話しします。

まずAzureMLは、クラウド上に存在するMachineLearningです。
AzureML

MachineLearningは、IoTやビックデータの活用のために利用されます。

例えば、ビックデータの活用のために、大量のデータの中から必要なものを抽出し、分析を行うとします。

その際に MachineLearningの登場です。

MachineLearningは大量のデータを与えることによって、どんどん学習を行い、どんどん精密なデータ抽出を行うようになります。

その結果、ビックデータも難なく活用することができます。

しかしここで問題が発生します。
それは 『MachineLearningへ送り込む大量のデータはどうするの』問題です。

便利ですが、少量のデータだと素敵サービスのMachineLearningも、あまり学習してくれません。

さて、ここで登場、 データ連携のDataSpider!!

dataspider

DataSpiderによってあらゆるシステム、クラウド、DB…などから、MachineLearningのためのデータを持ってくることができます。
また、DataSpiderではデータのクレンジングもできるので、きれいなデータをMachineLearningは使うことができます。

そしてAzureMLとDataSpiderのタッグでの1番のポイントは、両方とも「 GUIで開発ができる」という点です。

おそらくMachineLearningは開発に難しいイメージがあったり、データ連携もよくわからない…と思ったりする方が多いかと思います。

しかし、どちらも実は 簡単に操作・開発・運用ができるのです!!

…というのを実際に触って学べる、それが今回のハンズオンの目的です。
(少し長くなりました。反省。)

ハンズオン当日


DSC_0919

1月21日Microsoft品川本社で『「Microsoft Azure Machine Learning」と「DataSpider」の共同ハンズオンを開催します!』というイベントを開催しました。
そして寒い中、たくさんの方に足を運んでいただきました。

私はMicrosoft品川本社のエントランスで誘導係をしていたため、外気の冷たさが身に染みる…。
最近は本当に冷え込むので、体調管理はしっかりとしなくてはですね。

1:AzureMLの概要



イベントが始まり、まずはMicrosoftの増渕さんから、AzureのアップデートとAzureMLの概要に関してお話しいただきました。
AzureMLでできること、機械学習ではどういったことをターゲットにするかなど、これからハンズオンが待ち構えているだけに胸が高まるお話でした。


2:AzureMLハンズオン


続きまして、AzureMLのハンズオンです。
ハンズオンはネクストスケープ 上坂さんに担当していただきました。

どんな処理を作成するのだろうとドキドキしていると、
なんと、AzureMLツアーでのハンズオンでした!

IMGP0882

AzureMLツアーとは、AzureMLStudioにアクセスすると出てくるAzureMLの操作を一通りガイドに沿って行える超便利チュートリアル機能です。
しかもガイド通りに処理を進めても、実際にも処理の作成が行われるのです!ダミーではない!
しかもガイドが早かったら、戻ってやり直すこともできる!!!!
素晴らしい!!

▼Azure上でのツアー入り口画面
AzureMLツアー

私はツアー機能に興奮しっぱなしでしたが、あの画面が出るといつも即消していた人間でした…。ごめんなさい。
こんな便利で楽しいものだったとは。皆さんもぜひ、消さずにトライしてみてください!


3:DataSpiderの概要


AzureMLの使い方を一通り体験したところで、さて、これからDataSpiderのお時間です。
アプレッソ 友松さんからDataSpiderとはどんな機能か、説明してもらいました。

IMG_0242

DataSpiderは50種類程度の接続先があるので、もちろんクラウド間連携も行うことができるのが、メリットかなと思うのですが…。
Microsoftさんの会場を借りて開催した Microsoftさんとの共同ハンズオンにてDataSpiderの話をしているときに、「 AWSとの連携が」と話し出す友松さん。さすがです。
でも確かに、クラウド間連携はDataSpiderの魅力の一つです。


4:DataSpiderハンズオン


そして担当が変わり、アプレッソ 森さんがDataSpiderのハンズオンを行いました。

DSC_0921

今回のハンズオンシナリオは、以下の流れです。

AzureMLスクリプト

1.オンプレにあるユーザーデータをBLOBに格納。
2.BLOBに格納されたデータを利用し、AzureMLが実行。
3.AzureML実行完了後、BLOBにOutputされる結果データをDataSpiderで取得。



しかし、いざハンズオン!と意気込んだ直後、事件発生。
一部の受講者環境にデータが格納されていないという未曽有の大事故。

講師の環境にはデータが用意されていたので、スクリーン上ではスクリプトを開発・実行することができましたが、ほとんどの受講者は最後まで辿り着けたかどうか知れず。
また、ドタバタした結果、イベント終了時間もオーバーしてしまうという結果になりました。

受講された皆様には、大変ご迷惑をお掛けしました。
この場を借りてお詫び申し上げます。
大変申し訳ございませんでした。

終わりに


弊社ハンズオンで不手際がありましたが、
AzureMLについては、とっつきやすいイメージを持っていただけたのではないでしょうか。

AzureMLを利用するうちに、いろいろなデータを集めたいですとか、データのクレンジングを行ってからAzureMLに取り込みたい…など要望が出てきた際に、DataSpiderという製品を思い出していただけたらと思います。

また、今回DataSpiderハンズオンで使用したBLOB×AzureML×DataSpiderのスクリプトに関して、
近日 dstnブログで開発手順や設定詳細の記事を投稿予定です!

当日参加されたがハンズオンがついていけなかった方、またハンズオンに参加されなかった方もそちらの記事を参考に、Azure連携を体感してみてください!

コメント

ログインしてコメントを残してください。

Powered by Zendesk