前回に引き続き、SAS Global Forum 2019で公開された論文をご紹介します。今回は、SASユーザを含め、SAS言語とオープンソース言語の機能を共に活用することで、様々なビジネス課題に対応できるようなコーディング事例をいくつかピックアップします。
1.Deep Learning with SAS® and Python: A Comparative Study
ご存知の通り、SASはディープランニングに関する専門性の高いかつ豊富な機能と製品を提供しています。この論文では、SASとPythonに対し、それぞれ違うデータタイプ(例えば:構造化と非構造化、イメージ、テキスト、シーケンシャルデータ等々)を使ったディープラーニングのモデリングを比較する論文となります。主にSAS環境でのディープランニングフレームワーク、そして、SASとPython言語のディープランニングプログラミングの違いによって、それぞれのメリットとデメリットの紹介となります。
2.Utilization of Python in clinical study by SASPy
Pythonは近年最も使われているプログラミング言語になってきました。そして現在、機械学習とAI領域でもよく使われています。Pythonの一番のアドバンテージはその豊かなライブラリを通じ、多種多様な分析をインプリメントできることです。SASは臨床研究領域で最も強力な分析製品でありながら、さらにPythonを使うことによって、そのレポーティング機能、例えば、データ管理、データ可視化を拡張できます。これもSASプログラマーユーザのキャリアに対し、潜在的なメリットです。その様な背景において、SASPyはその可能性を実現します。SASPyはPythonコードの中でSASのセッションをスタートできるPythonパッケージライブラリとなります。この論文では、基本的なSASPyの使用方法とSASのデータセットを処理するヒントについて紹介しています。そして、Pythonを使って、臨床研究で使えそうなレポーティング機能について検討します。
3.Everything is better with friends: Executing SAS® code in Python scripts with SASPy
SASPyはSASがPythonプログラミング用に開発したモジュールで、SASシステムに代わるインタフェースを提供しています。SASPyを通じて、SASプロシージャはPythonスクリプトと構文で実行することができ、かつ、SASデータセットとそれに相当するPythonデータフレームの間にデータを転送することも可能です。それにより、SASプログラマーはPythonの柔軟性を利用してフロー制御を行うことができ、PythonプログラマーはSAS分析をスクリプトに組み込むこともできます。この論文では、Pythonスクリプト内で通常のSASコードとSASPyの両方を使用した一般的なデータ分析タスクの例を幾つか紹介し、それぞれの重要なトレードオフを強調し、多種プログラミング言語ユーザになれることの価値を強調しています。SAS University Edition用のJupyterLabインタフェースを使用し、それらの例を再現するための説明も含まれています。それらのSASとPythonのインテグレーション例はJupyter Notebookとしてダウンロードできます。
ダウンロード:https://github.com/saspy-bffs/sgf-2019-how
4.Modeling with Deep Recurrent Architectures: A Case Study of Using SAS and Python for Deep Learning
現在、より多くの研究者とアナリストは様々な異なるアナリティクス/AI領域でブレークスルー的な成功をおさめているディープランニングに注目しています。この論文では、単純なリカレントニューラルネットワーク、長期短期記憶(Long-Short Term Memory、通称LSTM)、ゲーテッドリカレントユニット、および新規モデルを含むディープリカレントアーキテクチャを用いて、翌日株価の方向を予測するタスクのためにSASとPythonを組み合わせる事例研究を紹介します。具体的には、各フレームワークの機能を活用するために、SASでデータを前処理し、Pythonでディープモデルを構築します。 プロセス全体からみると、Python環境でSASコードへのアクセスを可能にするSASPyモジュールを使用しているので、1つのフレームワークに統合されています。
次回は、モデルを開発後、そのモデルを業務に実装し、実際に活用して、ビジネス目標の達成など具体的なビジネス価値創出につながるケースをメインテーマにし、「オペレーショナル・アナリティクス for Data Scientist」に関わるSAS Global Forumで公開された事例・ユースケースの論文をご紹介します。ぜひご覧ください。