SAS Blogs

Japanese

Advanced Analytics | Analytics | SAS Events

Lijun Liu (リュウリクン)September 4, 2019 0

SAS Global Forum 2019 論文紹介シリーズ第3回「オペレーショナル・アナリティクス for Data Scientist」

今回は「オペレーショナル・アナリティクス for Data Scientist」をメインテーマとしてご紹介します。企業で分析業務を行うデータサイエンティストの皆様はご存知の通り、モデルは開発しただけでは意味がありません。そのモデルを業務に実装（デプロイ）してはじめて、ビジネス課題を解決し、価値を創出することができるわけです。SASが長年蓄積してきたナレッジをご覧ください。 1．Using SAS® Viya® to Implement Custom SAS® Analytics in Python: A Cybersecurity Example この論文は、SASの分析機能により支えられているプロダクションレベルのアナリティクスソリューションを開発しようとしているデータサイエンティストを対象としています。本文では、SAS ViyaとCloud Analytics Service（CAS）に基づく、CASの構築基盤とサイバーセキュリティを説明します。そして、SASアナリティクスを本番環境でPythonで実装する方法を説明します。 2．What’s New in FCMP for SAS 9.4 and SAS Viya この論文では、下記いくつかポイントをメインとして議論していきます。まず、SASが提供しているFunctionコンパイラー（FCMP）の新しい特徴を紹介し、それから主にFCMPアクションセットを中心とし、リアルタイムアナリティクススコアリングコンテナ（ASTORE）とPythonのインテグレーションについても説明します。それらの説明により、SASの新しいテクノロジーに対し、更なる理解を頂けることを期待しています。 3．Influencer Marketing Analytics using SAS® Viya® この論文はSAS Viyaを使って、マーケティングアナリティクスを行う事例を紹介します。近来、マーケティングはますますインフルエンサーが大きな役割をしめるようになってきています。それらのインフルエンサーたちはソーシャルメディアのコンテンツ作成者であり、多くのフォロワーを持ち、人々の意見に影響を与え、購入を検討する人々にも影響を与えています。インフルエンサーマーケティングは、より伝統的なマーケティングチャンネルと同じようにコストがかかるため、企業にとって最も効果的なインフルエンサーを選択することは非常に重要です。こういった背景において、この論文では、ソーシャルメディアで本当に影響力をもつ人、そしてその影響程度はなにかについて分析することを目指しています。ケーススタディは、感情面の影響を与えることに焦点を当てています。また、多くのフォロワーを持つインフルエンサーとその色んな投稿とアクティビティを分析します。実施するには、Pythonのライブラリとコードが使用されます。次に、彼らのアクティビティとネットワークを分析して、それらの影響範囲を分析します。これらの分析には、SAS Viyaのテキストおよびネットワーク分析機能が使用されます。データ収集ステップ（Python）はクライアントとしてJupyter Notebookを使用していますが、分析ステップは主にSAS Visual Text Analytics（Model Studio）とSAS Visual Analyticsを使用して行われています。 4．Take

English | Japanese

Advanced Analytics | Analytics

Makoto Unemi (畝見真)September 4, 2019 0

SAS Viya: ビジュアルパイプラインで将来予測（フォーキャスティング）

Enterprise Open Analytics PlatformであるSAS Viyaでは、コーディングスキルを持たないビジネスアナリストやビジネスユーザーでも、Model Studioを使用し、機械学習のモデル、時系列予測のモデル、テキストマイニングのモデルをGUIベースの簡単マウス操作で作成することができるようになっています。モデル生成プロセスをグラフィカルなフロー図として描き、実行するだけです。このフロー図のことを「パイプライン」と呼んでいます。これまで、ビジュアルパイプラインを用いた機械学習のモデル生成は紹介してきましたが、今回は、時系列予測の基本的な手順を紹介します。 Model Studioで時系列予測を実行する基本的な手順は以下の通りです。 ①　プロジェクトの新規作成 ②　学習用の時系列データ内項目へ役割設定 ③　パイプラインの作成と実行 ④　予測結果確認 ⑤　予測値のオーバーライト（必要に応じて） ①　プロジェクトの新規作成 SAS Viyaの統合GUIのホームページのメニューから「モデルの作成」を選択し、表示されるModel Studioの画面から「プロジェクトの新規作成」をクリックします。「プロジェクトの新規作成」画面内で、プロジェクトの名前を入力し、モデルの種類（データマイニングと機械学習 / テキスト分析 / 予測）から「予測」を選択します。使用するパイプライン・テンプレートとして、デフォルトでは、「自動予測」が選択されていますが、必要に応じてテンプレートを変更することができます。今回は、「自動予測」テンプレートを使用してみましょう。学習用の時系列データを選択し、「保存」をクリックします。すると、指定したデータソース内の変数リストが表示されます。 ②　学習用の時系列データ内項目へ役割設定表示された「データ」タブ内で、変数ごとに右側画面内で役割を選択します。・注文日：時間　＜－日付属性データ項目には自動的に“時間”役割が設定されます。・売上：従属　＜－予測対象の項目・原価：独立　＜－予測対象に影響を及ぼす項目・販売地域と製品ライン：BY変数　＜－地域別や製品ライン別で予測結果を見ることができます。「テーブルの表示」アイコンをクリックすると、データの中身を確認できます。ご覧の通り、このデータは年月ごと、販売地域、製品ライン、製品ごとの売上や原価、などの情報を持つ時系列データです。注.　今回使用するデータでは、時系列データとその属性データ（地域、製品ライン、製品）が一つにマージされているデータを使用していますが、時系列データと属性データをそれぞれ別データとして取り込むことも可能です。そうすれば、メモリーにロードするデータ量を削減することができます。 ③　パイプラインの作成と実行役割を設定後、「パイプライン」タブをクリックすると、「自動予測」のパイプラインが表示されます。右側画面には「自動予測」ノードのオプションが表示されています。ご覧の通り、自動予測では、ESM（指数平滑化）とARIMAの２つの手法で予測を実行し、その中から最良のモデルが使用されます。必要に応じて、IDM（間欠需要モデル）とUCM（観測不能成分モデル）を追加することも可能です。左画面内のノードリストから必要な機能をドラッグ操作でパイプラインへ追加することができます。その中にはニューラルネットワークに基づく手法も用意されています。今回は、「ナイーブモデル予測」を加えてみましょう。左側のノードリスト内から「ナイーブモデル予測」をパイプラインの「データ」ノードにドラッグするだけです。それでは、パイプラインの右上の「パイプラインの実行」ボタンをクリックして、このパイプラインを実行しましょう。正常に完了するとすべてのノード上に緑のチェックマークが表示されます。「データ」ノードのメニューから「時系列ビューア」を選択すると、学習データ内容を時系列チャートで確認することができます。役割にBY変数を指定した、販売地域と製品ラインで絞り込んで見ることもできます。以下は、地域：Region2、製品ライン：Line3に絞り込んだチャートです。 ④　予測結果確認