SAS Japan
活用事例からデータ分析のテクニックまで、SAS Japanが解き明かすアナリティクスの全て
予測モデル生成において、従来は、人が考えてデータの中から特徴を抽出する必要がありましたが、ディープラーニングでは、この特徴を自動的に抽出して学習することが可能になっています。 半面、どのように特徴が抽出されているのかに関しては、基本的にはブラックボックスであり、説明責任が求められるような業務要件では、その分析結果を業務に活用することが難しい場合もあります。 しかし、近年ディープラーニングから出てきた結果の根拠=判断根拠を可視化する手法がいくつか考案されてきています。 関連情報サイト: https://qiita.com/icoxfog417/items/8689f943fd1225e24358 https://pair-code.github.io/saliency/ http://blog.brainpad.co.jp/entry/2017/07/10/163000 SAS Viyaでは、各種のディープラーニング(DNN, CNN, RNN)を用いた学習が可能ですが、今回はCNNを用いた画像認識において、判断根拠となり得る情報の出力に関してご紹介します。 この例は、複数のイルカの画像をCNNで学習し、対象の画像(写真)がイルカなのかどうかを判別するものです。 モデルを作成後、以下の画像をモデルに当てはめてスコアリングを実施。 この画像は「イルカ」だと判定されたのですが、その判断根拠の一つとして、以下のように、この画像のどの部分がより重要であると判断されているのかを可視化することが可能になっています。 【レイヤー1のfeature map】 【レイヤー18のfeature map】 SAS Viyaでは、モデルのスコアリング時のオプションとして、指定したレイヤ(層)の特徴マップ(feature map)を画像として指定ライブラリに出力することが可能です。 >> スコアリング用のアクション:”dlScore” の layerOut={出力先ライブラリとテーブル名} オプションと layers={出力対象レイヤ名} オプション >> 上図はライブラリに出力された画像(feature map)を表示したものです。
SAS University Edition や SAS OnDemand for Academics は、教育・研究・学習目的に無償で使えるソフトウェアですが、使い方の学習には教材が必要だという方もおられると思います。もちろん、SASはソフトウェアに関する膨大なドキュメントをご用意していますが、「どこから始めたらいいの?」「英語ではちょっと…」という声もあるでしょう。 SAS Japanでは、SAS入門者の方向けに日本語字幕をつけたチュートリアル・ビデオ群をご用意しています。このビデオは、ほとんどが5~10分の短いもので、SASとは何かから始まり、SAS University Edition や SAS OnDemand for Academics のインターフェイスである SAS Studio の解説、他の環境との差、データへのアクセス、データの操作、グラフの作成、基本的な統計解析、時系列分析の手法をサンプルデータを使いながら説明しています。サンプルデータは、標準でSASに付属しているものや、オンラインドキュメントを参考にして作成するものなどがあり、どなたでも、どんな環境でも学習を開始することができます。 これらの SAS Studio の使用法の解説では、主に「タスク」とよばれる機能を用いた操作を行います。「タスク」は、「棒グラフの描画」や「分散分析」などの機能をプログラミングなしで利用するためのインターフェイスで、データやパラメータをマウス等で指定することで、SASのプログラム・コードが自動生成されます。もちろん、SASの機能を最大限引き出すために、ゼロからプログラムを書くことも可能です。自動生成されたプログラムを参考にしながら、SASプログラミングを学習することにも適しています。 実は、これらの日本語字幕付きのビデオは、SASのチュートリアル・ビデオのごく一部で、SAS Video Portal にはより多くのビデオが用意されています。ここでは、SAS製品の紹介や、操作法・プログラミングのチュートリアルに加え、SASのアナリティクスが実際の活用事例を紹介する Analytics in Action ビデオもご覧になれます。音声は英語のみですが、英語や日本語の字幕を表示できるものもあります。まずはビデオから、SASアナリティクスの世界を覗いてみませんか?
前回、SAS OnDemand for Academics (SODA) の Course 機能を活用することで、授業準備の手間が軽減されることをご紹介しましたが、実は、Cource 登録にはもう一つのメリットがあります。 SODA は、SAS Studioを基本のインターフェイスとしていますが、Course 登録により使用できる製品が増えます。 SAS Enterprise Guide : ポイント&クリック操作によるWindowsアプリケーション SAS Enterprise Miner : GUIによるデータマイニング・ツール SAS Forecast Server : 時系列予測の自動作成ツール これらは、統計の学習よりも、実際のビジネス等の現場で素早く統計手法を適用するためのツールで、基礎を学習した上で、より応用に際して活用できるものです。
統計ソフトを大学等の授業で用いる際に問題となるのが、統一的な環境を用意することの難しさです。受講者全員が同じバージョンのソフトウェアを同じ設定で利用し、同じ場所にあるデータにアクセスするような環境を準備しないと、個々の環境の差異から発生する問題に対処するだけで授業時間が終わってしまうでしょう。 また、統計ソフトを利用した演習講義では、プログラミングが必要になる場面が多いと思います。しかし、少ない授業時間を割いてプログラミングに慣れていない学生にコーディングを教えることは、本来その講義で教えるべき内容を削ってしまいかねません。 ご存知の方も多いと思いますが、SASでは、教育・研究および個人学習目的の利用に限り、無償ソフトウェアを提供しています。ダウンロードしてローカルPCの仮想マシンにセットアップするタイプの SAS University Edition と、クラウド上のアプリとして実行するタイプの SAS OnDemand for Academics がありますが、後者を使うと、上述した統計ソフトを利用した講義における統一環境の準備の問題およびプログラミングの問題を解決することができます。 SAS OnDemand for Academics (以下、SODAと略します) の特徴は以下のとおりです。 クラウド上で実施するソフトウェアなので、インターネット接続さえあれば、PC環境を統一させる必要がありません。 教員はWebページ上で「Course」を作成することができ、学生がその「Course」に登録することで、教員が用意したデータに学生の環境からアクセスすることができます。 ポイント&クリックで操作できるインターフェイスにより、プログラミングせずに統計やデータマイニングの機能を利用することができます。 SODAの利用手順: まずはSODAに登録します。登録の方法は、SlideShareの資料を参考にしてください。(※Analytics Uのページがなければ、SODAのページにアクセスし、上記のスライド4から開始してください。) 教員の方は「Course」を作成してください。こちらのページのInstructorsセクションのドキュメントおよびビデオ「Upload Your Course Data」「Invite Students to Your Course」を参考にしてください。 学生は教員から「Course」に参加するためのリンクを取得し、こちらのページのStudentsセクションを参考にCourseに参加してください。 SODAを利用すれば、無料で環境構築・プログラミング教育のためのコスト・リソースを削減し、統計スキルの教育・学習に集中できます。Let’s teach & learn data science!