SAS Japan

活用事例からデータ分析のテクニックまで、SAS Japanが解き明かすアナリティクスの全て
Data Visualization
SAS Visual Analyticsで地図上にカスタム境界線(領域)を描いて分析

みなさんご存知の通り、SAS Visual AnalyticsはセルフサービスBI&Analyticsツールで、ビジネスユーザー自身で簡単にレポートやダッシュボードを作成することができます。その際、標準で備わっている数多くのチャートオブジェクトを使用することができますが、お客様要件によっては、標準のチャートタイプだけでは表現できないものもあります。それに答えるためにSAS Visual Analytics 8.2(以下VA)には大きく2つの機能が用意されています。 データドリブンコンテンツ 地図上のカスタム境界線描画 1番目の「データドリブンコンテンツ」とは、サードパーティのビジュアライゼーション・ライブラリ(D3.js, C3, Google Chart Toolsなど)と連携することで、チャートタイプやビジュアルのバリエーションを大幅に拡張可能な機能ですが、 今回は、2番目の「地図上のカスタム境界線描画」機能に関してご紹介します。 VAに標準搭載のチャートオブジェクトには地図描画のための「ジオマップ」オブジェクトが含まれています。この機能を活用することで、例えば、地図上で隕石落下地点と被害の度合いを分析(図1.参照)したり、都道府県別の売上や店舗別の顧客数などをビジュアライズし、分析(図2.参照)することができます。 図1.隕石落下地点と被害の度合い分析ダッシュボード 図2.店舗別の売上と利益をバブルのサイズと色で表示 地図描画のタイプとしては、図1の「座標」、図2の「バブル」以外に「領域」を選択可能です。 「座標」とは、地図上の該当ポイントに円形や星形などのアイコンを表示するものです。 そして、「領域」では、基本的に地図上の国の境界線や、その一つ下のレベルである州や都道府県の境界線領域を描画します。例えばアメリカの州や日本の都道府県の領域を指定した値に基づき色分けして表示するものです。(図3.参照) 図3.都道府県ごとの売上分析 さらに、地図上に表示するこの「領域」をカスタムで描画することが可能で、これを「カスタム境界線(領域)」描画機能と呼んでいます。 この機能を活用することで、例えば、特定施設内の人や物の動線を描画したり、家屋ごとのソーラー発電量を実際の地図上に描画することなども可能になります。 その基本的な手順を、アメリカにあるコロラド・コンベンション・センター(以下CCC)内のミーティングフロアにある各種の会議室領域の描画を例に、以下に示します。 図4. VAレポート上に表示された完成版(部屋ごとの面積などを色分けして描画することができます) CCCのフロアレイアウト画像を入手し、市販ツールあるいはオープンソース製品を使用し、Esri shapeファイルを作成 Esri ShapeファイルをVA環境にインポート インポートしたデータに基づきカスタム境界線(領域)をレポート上に描画   1. CCCのフロアレイアウト画像を入手し、市販ツールあるいはオープンソース製品を使用し、Esri Shapeファイルを作成 この例では市販のEsri Desktopツールを使用し、CCCのサイトから入手したフロアレイアウトの画像をEsri地図上に重ね(図5.参照)、部屋の輪郭をなぞって描き(図6.参照)、結果をEsri Shapeファイルとして保存(図7.参照)します。(詳細に関しては、使用するツールのマニュアルを御覧ください。) 図5. Esri地図上のCCCのある地点の上に、CCCのフロアレイアウト画像を重ねる 図6. 部屋の輪郭をなぞって描く(描いた領域ごとにIDを設定しておきます。この例ではRoomID) 図7. 結果をEsri Shapeファイルとして保存 2. Esri ShapeファイルをVA環境にインポート VA環境に実装されているマクロ%SHPIMPRTを使用し、Esri ShapeファイルをSAS Datasetに変換(以降Shapeデータ)し、VA環境(インメモリー)にロードします。 詳細は、以下サポートサイトにあるSAS Viya管理者(Administration)マニュアルを御覧ください。 https://support.sas.com/documentation/onlinedoc/viya/index.html

Machine Learning
ディープラーニングの判断根拠

予測モデル生成において、従来は、人が考えてデータの中から特徴を抽出する必要がありましたが、ディープラーニングでは、この特徴を自動的に抽出して学習することが可能になっています。 半面、どのように特徴が抽出されているのかに関しては、基本的にはブラックボックスであり、説明責任が求められるような業務要件では、その分析結果を業務に活用することが難しい場合もあります。 しかし、近年ディープラーニングから出てきた結果の根拠=判断根拠を可視化する手法がいくつか考案されてきています。 関連情報サイト: https://qiita.com/icoxfog417/items/8689f943fd1225e24358 https://pair-code.github.io/saliency/ http://blog.brainpad.co.jp/entry/2017/07/10/163000 SAS Viyaでは、各種のディープラーニング(DNN, CNN, RNN)を用いた学習が可能ですが、今回はCNNを用いた画像認識において、判断根拠となり得る情報の出力に関してご紹介します。 この例は、複数のイルカの画像をCNNで学習し、対象の画像(写真)がイルカなのかどうかを判別するものです。 モデルを作成後、以下の画像をモデルに当てはめてスコアリングを実施。 この画像は「イルカ」だと判定されたのですが、その判断根拠の一つとして、以下のように、この画像のどの部分がより重要であると判断されているのかを可視化することが可能になっています。 【レイヤー1のfeature map】 【レイヤー18のfeature map】 SAS Viyaでは、モデルのスコアリング時のオプションとして、指定したレイヤ(層)の特徴マップ(feature map)を画像として指定ライブラリに出力することが可能です。 >> スコアリング用のアクション:”dlScore” の layerOut={出力先ライブラリとテーブル名} オプションと layers={出力対象レイヤ名} オプション >> 上図はライブラリに出力された画像(feature map)を表示したものです。

Learn SAS
動画で学ぶSAS ~チュートリアル・ビデオのご紹介~

SAS University Edition や SAS OnDemand for Academics は、教育・研究・学習目的に無償で使えるソフトウェアですが、使い方の学習には教材が必要だという方もおられると思います。もちろん、SASはソフトウェアに関する膨大なドキュメントをご用意していますが、「どこから始めたらいいの?」「英語ではちょっと…」という声もあるでしょう。 SAS Japanでは、SAS入門者の方向けに日本語字幕をつけたチュートリアル・ビデオ群をご用意しています。このビデオは、ほとんどが5~10分の短いもので、SASとは何かから始まり、SAS University Edition や SAS OnDemand for Academics のインターフェイスである SAS Studio の解説、他の環境との差、データへのアクセス、データの操作、グラフの作成、基本的な統計解析、時系列分析の手法をサンプルデータを使いながら説明しています。サンプルデータは、標準でSASに付属しているものや、オンラインドキュメントを参考にして作成するものなどがあり、どなたでも、どんな環境でも学習を開始することができます。 これらの SAS Studio の使用法の解説では、主に「タスク」とよばれる機能を用いた操作を行います。「タスク」は、「棒グラフの描画」や「分散分析」などの機能をプログラミングなしで利用するためのインターフェイスで、データやパラメータをマウス等で指定することで、SASのプログラム・コードが自動生成されます。もちろん、SASの機能を最大限引き出すために、ゼロからプログラムを書くことも可能です。自動生成されたプログラムを参考にしながら、SASプログラミングを学習することにも適しています。 実は、これらの日本語字幕付きのビデオは、SASのチュートリアル・ビデオのごく一部で、SAS Video Portal にはより多くのビデオが用意されています。ここでは、SAS製品の紹介や、操作法・プログラミングのチュートリアルに加え、SASのアナリティクスが実際の活用事例を紹介する Analytics in Action ビデオもご覧になれます。音声は英語のみですが、英語や日本語の字幕を表示できるものもあります。まずはビデオから、SASアナリティクスの世界を覗いてみませんか?

Analytics | Learn SAS | Students & Educators
SAS OnDemand for Academics 授業利用では使用できる製品が追加されます

前回、SAS OnDemand for Academics (SODA) の Course 機能を活用することで、授業準備の手間が軽減されることをご紹介しましたが、実は、Cource 登録にはもう一つのメリットがあります。 SODA は、SAS Studioを基本のインターフェイスとしていますが、Course 登録により使用できる製品が増えます。 SAS Enterprise Guide : ポイント&クリック操作によるWindowsアプリケーション SAS Enterprise Miner : GUIによるデータマイニング・ツール SAS Forecast Server : 時系列予測の自動作成ツール これらは、統計の学習よりも、実際のビジネス等の現場で素早く統計手法を適用するためのツールで、基礎を学習した上で、より応用に際して活用できるものです。

1 41 42 43 44 45 56