Advanced Analytics

Move beyond spreadsheets to data mining, forecasting, optimization – and more

Advanced Analytics | Analytics | Machine Learning
SAS Viya: ビジュアルパイプラインで予測モデル生成(基本編)

AIプラットフォームであるSAS Viyaでは、SAS言語のみならず、PythonやR、Java、Luaなどの汎用プログラミング言語からViyaのAI&アナリティクスの機能を使用し、予測モデルを生成することができるようになっています。しかし、昨今、「AI民主化」の流れに沿って、予測モデル生成を必要としているのはデータサイエンティスト(以降:DS)だけではなく、業務部門のビジネスアナリストや一般のビジネスユーザーも必要としています。こうしたコーディングスキルを持たないビジネスユーザー向けに、SAS Viyaでは、GUI上でマウスの簡単操作だけで予測モデル生成を可能としています。 もちろん、DSの中にも、コーディングせずに、もっと簡単に精度の高い予測モデルを生成できる手段があれば活用したいと感じている人達もいます。 SAS Viyaでは、Model Studioを使用し、機械学習のモデル、時系列予測のモデル、テキストマイニングのモデルをGUIベースの簡単マウス操作で作成することができます。モデル生成プロセスをグラフィカルなフロー図として描き、実行するだけです。このフロー図のことを「パイプライン」と呼んでいます。 Model Studioで予測モデルを生成するには、大きく2通りの方法があります。 1つは、マウスの簡単ドラッグ操作でパイプラインを一から作成する方法と、もう一つは、予め用意されているパイプラインのテンプレートを使用する方法です。 まずは、パイプラインを一から作成する際の基本的な手順を紹介します。 プロジェクトの新規作成と学習用のデータソース選択 パイプラインの作成と実行 実行結果(モデル精度)の確認 1.プロジェクトの新規作成と学習用のデータソース選択 SAS Viyaの統合GUIのホームページのメニューから「モデルの作成」を選択すると、 Model Studioの画面が表示されます。 「プロジェクトの新規作成」をクリックします。 「プロジェクトの新規作成」画面内で、プロジェクトの名前を入力し、モデルの種類(データマイニングと機械学習 / テキスト分析 / 予測)を選択し、学習用のデータソースを選択します。今回は、「データマイニングと機械学習」を選び、ローンの審査モデルを作成します。HMEQJというデータソースは、顧客ごとに1行の横持ち形式のデータです。 「保存」をクリックすると、ローン審査モデルプロジェクトが作成され、選択したデータソースの変数リストが表示されます。 予測対象の項目(ターゲット変数)を指定します。変数名:BAD(ラベル名:延滞フラグ)を選択し、右画面内で、役割に「ターゲット」を選択します。 延滞フラグには、過去に延滞の実績があればフラグに“1”が、無ければ“0”が設定されています。 2.パイプラインの作成と実行 予測対象の項目を指定後、画面上部にある「パイプライン」をクリックします。 パイプラインには「データ」ノードのみが表示されています。左端の機能ノードアイコンをクリックすると、 パイプラインに追加可能な機能ノードのリストが表示されます。 今回は、欠損値補完を行った上で、勾配ブースティングとランダムフォレストでモデルを生成してみましょう。まず、データに対する前処理として欠損値補完を行います。 「データマイニングの前処理」内にある「補完」を「データ」ノード上にドラッグすると、 「データ」ノードの下に「補完」ノードが追加されます。 同様の手順で、「教師あり学習」内にある「勾配ブースティング」を「補完」ノード上へドラッグすると、「補完」ノードの下に「勾配ブースティング」ノードが追加されます。(同時に「モデルの比較」ノードが自動的に追加されます) このようにドラッグ操作でノードを追加する以外に、パイプライン上のメニューからノードを追加することもできます。 「補完」ノードの右端にある、3つのドットが縦に並んでいる(スノーマン)アイコンをクリックし、「下に追加」>「教師あり学習」>「フォレスト」の順に選択すると、 「補完」ノードの下に、「フォレスト」ノードが追加されます。 機能ノードごとの詳細なオプションの設定は、右側画面内で行います。 パイプラインが完成したら、パイプラインの実行アイコンをクリックし、実行します。実行中の機能ノードは時計アイコンがクルクル回転し、正常に完了すると緑のチェックマークが表示されます。 3.実行結果(モデル精度)の確認 パイプラインの実行が完了したら、「モデルの比較」ノードのスノーマンアイコンをクリックし、メニュー から「結果」を選択します。 モデルの比較結果が表示されます。今回は勾配ブースティングのモデルの精度の方が高い=チャンピオンであると判定されています。 「アセスメント」タブ内では、リフトやROCの情報などを確認することができます。 以上が、ビジュアルパイプラインで予測モデルを一から生成する際の基本的な手順です。 ※ビジュアルパイプラインによるモデル生成(基本)は、SAS Viya特設サイトの「機械学習」トピック内にある動画でもご覧いただけます。

Advanced Analytics | Analytics
Michael Pawlak 0
How are CSPs using real-time analytics to improve customer experience?

How important is the customer experience in communications today? “Very important” is an understatement. It should be the top area of focus for all communications providers. It’s no secret that when customers are extremely satisfied, they become brand champions for the companies that provide them the products and services they

Advanced Analytics | Artificial Intelligence | Machine Learning
Andreas Becks 0
A reality check on artificial intelligence: Potential, limits and consequences

Gartner expects artificial intelligence (AI) to create 2 million new jobs by 2025. AI and machine learning are already an important part of business processes and business areas in many companies and organisations, making everyday work easier, optimising interactions with customers, reliably predicting the failure of machines or supporting the

Advanced Analytics
Decision Management – What is it and why does it matter?

Whether we talk about improving customer experience, applying chat bots, preventing fraud, realising IoT applications like predictive maintenance, implementing credit scoring or claims management, or just automating internal processes, analytics and eventually AI will have a profound impact on these large and small decisions. Across all industries the discipline of

Advanced Analytics | Analytics | Data Management
Pedro Felipe Cerón 0
Ebook - La analítica avanzada en tiempos de lo extraordinario

La analítica avanzada y sus beneficios crecen exponencialmente con la consolidación de la economía digital y la Cuarta Revolución Industrial, dos componentes sin los cuales el desarrollo de nuestra sociedad y de los negocios como los conocemos no sería posible. Los millones de datos que se producen bajo estas condiciones hace

Advanced Analytics | Analytics | Customer Intelligence | Data Visualization | Machine Learning
Suneel Grover 0
SAS Customer Intelligence 360: Factorization machines, visual analytics, and personalized marketing

In a previous posting, SAS Customer Intelligence 360 was highlighted in the context of delivering relevant product, service, and content recommendations using automated machine learning within digital experiences. Shifting gears, SAS recognizes there are different user segments for our platform. This post will focus on building custom analytical recommendation models

Advanced Analytics | Analytics | Artificial Intelligence
Kimmo Havu 0
Tekoälykokeiluista analytiikan laajamittaiseen hyödyntämiseen

Suomalaisessakin yrityskentässä  pohditaan, miten tekoälyä voidaan hyödyntää kilpailuedun rakentamiseksi. Mahdollisia käyttökohteita tekoälyn hyödyntämiseksi on lähes rajaton määrä. Pörssiyhtiöiden johto on aika hyvin tietoinen mahdollisuuksista, ja yritysten strategiassa tämä aihealue alkaa olla hienosti mukana. Tästä kuulimme yhden esimerkin kesäkuun alussa SAS Business Forumissa Helsingissä, kun Konecranesin Juha Pankakoski avasi yrityksen strategiaa,

Advanced Analytics | Analytics | Artificial Intelligence | Machine Learning
「Pipefitter」の応用 ~CNN(特徴抽出器)+機械学習(分類器)でCNNの欠点を補完

前回は、SASの「Pipefitter」の基本的な使用方法を紹介しました。続く今回は、基本内容を踏まえ、ひとつの応用例を紹介します。 SAS Viyaのディープラーニング手法の一つであるCNNを「特徴抽出器」として、決定木、勾配ブースティングなどを「分類器」として使用することで、データ数が多くないと精度が出ないCNNの欠点を、データ数が少なくても精度が出る「従来の機械学習手法」で補強するという方法が、画像解析の分野でも応用されています。 以下は、SAS Viyaに搭載のディープラーニング(CNN)で、ImageNetのデータを学習させ、そのモデルに以下の複数のイルカとキリンの画像をテストデータとして当てはめたモデルのpooling層で出力した特徴空間に決定木をかけている例です。 In [17]: te_img.show(8,4) 以下はCNNの構造の定義です。 Build a simple CNN model   In [18]: from dlpy import Model, Sequential from dlpy.layers import * from dlpy.applications import *   In [19]: model1 = Sequential(sess, model_table='Simple_CNN')   Input Layer   In [20]: model1.add(InputLayer(3, 224, 224, offsets=tr_img.channel_means))   NOTE: Input

Advanced Analytics | Analytics | Artificial Intelligence | Machine Learning
機械学習のパイプラインを簡素化するPython向けパッケージ「Pipefitter」

SASでは、Python向けパッケージ/ライブラリとして、機械学習のパイプラインの実装を簡素化する「Pipefitter」を提供しています。 SASの「Pipefitter」パッケージは、SAS Viyaまたは、SAS v9の反復可能なワークフローの一つの段階として、データ変換とモデルフィッティング向けパイプラインを開発するためのPython APIを提供します。 このパッケージを使用すると、SASでデータを操作して、次のような処理を実装できます: ・欠損値補完 ・デシジョンツリー、ニューラルネットワーク、およびその他の機械学習テクニックを使用したパラメータ推定値の適合 ・ハイパーパラメータチューニングを使用したモデル選択の高速化 ・スコアリングとモデル評価 「Pipefitter」のもう一つの重要な特徴は、SASが提供する他の2つのPythonパッケージの能力に基づいていることです。 SWAT: SAS Viyaプラットフォームのインメモリー分析エンジンであるSAS Cloud Analytic Services(CAS)を活用し様々なデータ操作や分析を可能にするPython向けパッケージ SASPy: SAS9.4の機能を活用し、分析、データ操作、および視覚化を行うためのPython向けパッケージ ロジスティック回帰でのパラメータ推定などのパイプライン処理は、SASPyを介してSAS 9で、SWATを介してCASで同じように実行されるように設計されています。 以下は、タイタニック号の乗船者データに基づくパイプラインの例です。 まず、KaggleのサイトからPandas DataFrameにデータをダウンロードします。 In [1]: import pandas as pd In [2]: train = pd.read_csv('http://s3.amazonaws.com/assets.datacamp.com/course/Kaggle/train.csv')   In [3]: train.head() Out[3]: PassengerId Survived Pclass 0 1 0 3 1 2 1

Advanced Analytics | Internet of Things | Machine Learning
Adam Goldsmith 0
Steak & chips - how IoT and machine learning will disrupt risk in Animal Insurance

On the face of it, a partnership between the Internet of Things (IoT) and animals is not an obvious one. However, a number of trials and larger-scale implementations of IoT use with household pets and in farming are showing that connected ’Smudge’ and ‘Daisy’ can provide real benefits. This should

Advanced Analytics | Analytics | Data Management | Fraud & Security Intelligence
Mitigar el riesgo, una prioridad para las compañías en la economía digital

La economía digital surgió a raíz del avance de la tecnología en la informática y las telecomunicaciones. El último Modelo de Gestión de Riesgos de Seguridad Digital entregado por el Ministerio de Tecnologías de la Información y las Comunicaciones -MinTIC-, afirma que en los últimos 20 años el acceso a

Advanced Analytics | Artificial Intelligence | Machine Learning
Mark Bakker 0
From concept to value — the machine learning curve

Advanced analytics is an important part of artificial intelligence (AI). Machine learning, or the ability of computers to learn from data, rather than through programming rules, means that more complex problems can be addressed than would otherwise be possible. It is significantly easier to supply lots of data and examples

Advanced Analytics | Data Visualization
Sertalp B. Cay 0
Visiting all 30 Major League Baseball Stadiums - with Python and SAS® Viya®

Ballpark Chasers A cross-country trip is pretty much an all-American experience, and so is baseball. Traveling around the country to see all 30 Major League Baseball (MLB) stadiums is not a new idea; there's even a social network between so-called "Ballpark Chasers" where people communicate and share their journeys. Even

Advanced Analytics | Artificial Intelligence | Machine Learning
Ilknur Kaynar Kabul 0
Interpret model predictions with partial dependence and individual conditional expectation plots

Continuing our series on model interpretability, this post explains two methods for plotting variables that can give insight into how a model is working. Assessing a model`s accuracy usually is not enough for a data scientist who wants to know more about how a model is working. Often data scientists

1 2 3 4 5 36

Back to Top