SAS Blogs

Advanced Analytics | Analytics | Artificial Intelligence | Machine Learning

Makoto Unemi (畝見真)February 25, 2019 0

データサイエンティスト（以降、DSと表記）は、お好みのプログラミング言語を使用して、日々モデリングを行っています。昨今は、その中でもオープンソースのプログラミング言語であるPythonやRを使用されている方の割合が多くなってきているようです。その結果として、企業の分析組織やチーム内には複数の異なる言語を活用するDSが混在するケースも見受けられます。（一人で両方の言語を操る方もいます。）「Pythonを操るAさんが作成されたモデルと、Rを操るBさんが作成されたモデル、どちらの精度が高いのかを容易かつビジュアルに比較することができたら…」ということで、今回は、SAS ViyaのModel Studioを使用し、ビジュアルなパイプライン上での異なる言語間モデル精度比較をご紹介します。手順は以下の通りです。 ① プロジェクトの新規作成と学習用のデータソース選択 ② パイプラインの作成と実行 ③ 実行結果（モデル精度）の確認 ① プロジェクトの新規作成と学習用のデータソース選択「SAS Viya: ビジュアルパイプラインで予測モデル生成（基本編）」の「１．プロジェクトの新規作成と学習用のデータソース選択」を参照ください。 ② パイプラインの作成と実行画面上部にある「パイプライン」をクリックします。パイプラインには「データ」ノードのみが表示されています。左端の機能ノードアイコンをクリックすると、パイプラインに追加可能な機能ノードのリストが表示されます。まずは学習データに対する前処理として、欠損値補完を行います。「データマイニングの前処理」内にある「補完」を「データ」ノード上にドラッグすると、「データ」ノードの下に「補完」ノードが追加されます。同様の手順で、「その他」内にある「オープンソースコード」を「補完」ノード上へドラッグすると、「補完」ノードの下に「オープンソースコード」ノードが追加されます。機能ノードごとのオプション設定は、右側画面内で行います。「言語」が「Python」であることを確認し、「開く」をクリックします。開かれた画面内に、比較対象のPythonのコード（ランダムフォレストのモデル）をコピーします。右上の「保存」（フロッピーディスクアイコン）をクリックし、「閉じる」をクリックします。 ※ターゲット変数名や入力変数リスト名など、画面左側の変数名を使用することによって、オープンソースコードノードとその他のノード間でのデータ連携が可能となり、異なる言語のモデル間での精度比較も可能になります。各種規定変数名の詳細に関しては、オンラインマニュアルを参照してください。「オープンソースコード」ノードの右側にある３つのドットが縦に並んでいる（スノーマン）アイコンをクリックし、「名前の変更」を選択し、「Pythonフォレストモデル」に変更します。このようにドラッグ操作でノードを追加する以外に、パイプライン上のメニューからノードを追加することもできます。「補完」ノードのスノーマンアイコンをクリックし、「下に追加」＞「その他」＞「オープンソースコード」の順に選択すると、「補完」ノードの下に「オープンソースコード」ノードが追加されます。以降、同様の手順で比較対象のRのコード（ランダムフォレストのモデル）をコピーし、ノードの名前を変更します。「オープンソースコード」ノードは、データに対する前処理として使用することもできます。デフォルトでは、「オープンソースコード」ノードは、データに対する前処理として認識されているので、これを「教師あり学習」に切り替えます。 PythonとRのモデルノードそれぞれのスノーマンアイコンをクリックし、「移動」＞「教師あり学習」を選択します。すると、「モデルの比較」ノードが追加され、PythonとRのモデルノードと接続されます。パイプラインが完成したので、右上の「パイプラインの実行」アイコンをクリックし、実行します。 ③ 実行結果（モデル精度）の確認処理が正常に完了したら、「モデル比較」ノードのスノーマンアイコンをクリックし、「結果」を選択します。 Rのフォレストモデルの方が精度が高い、チャンピオンモデルであると表示されました。リフトやROC、様々な統計量で、精度を詳細に比較することもできます。以上が、ビジュアルパイプラインでPythonとRのモデル精度を比較する手順です。もちろん、必要に応じて、PythonやRのモデルとSASのモデルの精度を比較することもできます。 ※ビジュアルパイプラインでPythonとRのモデル精度を比較は、SAS Viya特設サイトにある動画でもご覧いただけます。 ※実際にPythonとRのモデル精度比較を試してみたい方は、Githubに公開されているアセットを活用ください。

Japanese

Artificial Intelligence

Makoto Unemi (畝見真)December 10, 2018 0

SAS Viya：RNNでsin波を予測してみた

PythonからSAS Viyaの機能を利用するための基本パッケージであるSWATと、よりハイレベルなPython向けAPIパッケージであるDLPyを使用して、Jupyter NotebookからPythonでSAS Viyaのディープラーニング機能を使用した時系列予測を試してみました。大まかな処理の流れは以下の通りです。１．必要なパッケージ（ライブラリ）のインポート２．Sin波データの生成３．セッションの作成４．RNN向け時系列データセットの作成５．モデル構造の定義６．モデル生成（学習）７．予測１．必要なパッケージ（ライブラリ）のインポート swatやdlpyなど、必要なパッケージをインポートします。 import numpy as np import pandas as pd import matplotlib.pyplot as plt import swat.cas.datamsghandlers as dmh from swat import * import dlpy from dlpy import Sequential from dlpy.layers import * from dlpy.model import Optimizer, AdamSolver, Sequence

Japanese

Analytics | Artificial Intelligence | Machine Learning

Makoto Unemi (畝見真)November 21, 2018 0

SAS Viya：一般物体検出（Object Detection）を試してみた

PythonからSAS Viyaの機能を利用するための基本パッケージであるSWATと、よりハイレベルなPython向けAPIパッケージであるDLPyを使用して、Jupyter NotebookからPythonでSAS Viyaの機能を使用して一般物体検出（Object Detection）を試してみました。今回は、弊社で用意した数枚の画像データを使用して、処理の流れを確認するだけなので、精度に関しては度外視です。大まかな処理の流れは以下の通りです。１．必要なパッケージ（ライブラリ）のインポートとセッションの作成２．一般物体検出向け学習用データの作成３．モデル構造の定義４．モデル生成（学習）５．物体検出（スコアリング）１．必要なパッケージ（ライブラリ）のインポートとセッションの作成 swatやdlpyなど、必要なパッケージをインポートします。 from swat import * import sys sys.path.append(dlpy_path) from dlpy.model import * from dlpy.layers import * from dlpy.applications import * from dlpy.utils import * from dlpy.images import ImageTable from dlpy.splitting import two_way_split from dlpy.blocks import *

Japanese

Blogs

Tag: 機械学習