Advanced Analytics

Move beyond spreadsheets to data mining, forecasting, optimization – and more

Advanced Analytics | Analytics | Artificial Intelligence | Machine Learning
Makoto Unemi (畝見 真) 0
PythonやRで開発されたモデルの精度をビジュアルパイプラインで簡単比較

データサイエンティスト(以降、DSと表記)は、お好みのプログラミング言語を使用して、日々モデリングを行っています。昨今は、その中でもオープンソースのプログラミング言語であるPythonやRを使用されている方の割合が多くなってきているようです。その結果として、企業の分析組織やチーム内には複数の異なる言語を活用するDSが混在するケースも見受けられます。(一人で両方の言語を操る方もいます。) 「Pythonを操るAさんが作成されたモデルと、Rを操るBさんが作成されたモデル、どちらの精度が高いのかを容易かつビジュアルに比較することができたら…」  ということで、今回は、SAS ViyaのModel Studioを使用し、ビジュアルなパイプライン上での異なる言語間モデル精度比較をご紹介します。  手順は以下の通りです。 ① プロジェクトの新規作成と学習用のデータソース選択 ② パイプラインの作成と実行 ③ 実行結果(モデル精度)の確認 ① プロジェクトの新規作成と学習用のデータソース選択 「SAS Viya: ビジュアルパイプラインで予測モデル生成(基本編)」の「1.プロジェクトの新規作成と学習用のデータソース選択」を参照ください。 ② パイプラインの作成と実行 画面上部にある「パイプライン」をクリックします。 パイプラインには「データ」ノードのみが表示されています。左端の機能ノードアイコンをクリックすると、 パイプラインに追加可能な機能ノードのリストが表示されます。 まずは学習データに対する前処理として、欠損値補完を行います。 「データマイニングの前処理」内にある「補完」を「データ」ノード上にドラッグすると、 「データ」ノードの下に「補完」ノードが追加されます。 同様の手順で、「その他」内にある「オープンソースコード」を「補完」ノード上へドラッグすると、「補完」ノードの下に「オープンソースコード」ノードが追加されます。 機能ノードごとのオプション設定は、右側画面内で行います。 「言語」が「Python」であることを確認し、「開く」をクリックします。 開かれた画面内に、比較対象のPythonのコード(ランダムフォレストのモデル)をコピーします。右上の「保存」(フロッピーディスクアイコン)をクリックし、「閉じる」をクリックします。 ※ターゲット変数名や入力変数リスト名など、画面左側の変数名を使用することによって、オープンソースコードノードとその他のノード間でのデータ連携が可能となり、異なる言語のモデル間での精度比較も可能になります。各種規定変数名の詳細に関しては、オンラインマニュアルを参照してください。 「オープンソースコード」ノードの右側にある3つのドットが縦に並んでいる(スノーマン)アイコンをクリックし、「名前の変更」を選択し、 「Pythonフォレストモデル」に変更します。 このようにドラッグ操作でノードを追加する以外に、パイプライン上のメニューからノードを追加することもできます。 「補完」ノードのスノーマンアイコンをクリックし、「下に追加」>「その他」>「オープンソースコード」の順に選択すると、 「補完」ノードの下に「オープンソースコード」ノードが追加されます。 以降、同様の手順で比較対象のRのコード(ランダムフォレストのモデル)をコピーし、ノードの名前を変更します。 「オープンソースコード」ノードは、データに対する前処理として使用することもできます。デフォルトでは、「オープンソースコード」ノードは、データに対する前処理として認識されているので、これを「教師あり学習」に切り替えます。 PythonとRのモデルノードそれぞれのスノーマンアイコンをクリックし、「移動」>「教師あり学習」を選択します。 すると、「モデルの比較」ノードが追加され、PythonとRのモデルノードと接続されます。 パイプラインが完成したので、右上の「パイプラインの実行」アイコンをクリックし、実行します。 ③ 実行結果(モデル精度)の確認 処理が正常に完了したら、「モデル比較」ノードのスノーマンアイコンをクリックし、「結果」を選択します。 Rのフォレストモデルの方が精度が高い、チャンピオンモデルであると表示されました。 リフトやROC、様々な統計量で、精度を詳細に比較することもできます。 以上が、ビジュアルパイプラインでPythonとRのモデル精度を比較する手順です。 もちろん、必要に応じて、PythonやRのモデルとSASのモデルの精度を比較することもできます。 ※ビジュアルパイプラインでPythonとRのモデル精度を比較は、SAS Viya特設サイトにある動画でもご覧いただけます。 ※実際にPythonとRのモデル精度比較を試してみたい方は、Githubに公開されているアセットを活用ください。

Advanced Analytics | Analytics | Artificial Intelligence | Internet of Things | Machine Learning
0
¿Hasta dónde podría llegar con la Inteligencia Artificial?

Hablar de Inteligencia Artificial parece muy lejano para algunas personas y para otras es algo que ya se está implementado a una gran velocidad.  En este artículo espero iniciar con una serie de reflexiones y conversaciones acerca de lo que esperamos desarrollar hoy y a dónde queremos llegar en el

Advanced Analytics | Machine Learning
Rick Wicklin 0
Feature generation and correlations among features in machine learning

Feature generation (also known as feature creation) is the process of creating new features to use for training machine learning models. This article focuses on regression models. The new features (which statisticians call variables) are typically nonlinear transformations of existing variables or combinations of two or more existing variables. This

Advanced Analytics | Analytics | Artificial Intelligence
Cameron McLauchlin 0
How are AI and advanced analytics transforming health and life sciences?

The potential for artificial intelligence (AI) and the Internet of Things (IoT) to transform the way health care and therapies are delivered is tremendous. It’s not surprising that the health care and life sciences industries are being flooded with information about how these new technologies will change everything. While it’s

Advanced Analytics | Artificial Intelligence | Internet of Things
Christian Goßler 0
Bolschewistische Rotationsbeschleunigung im Internet of Tumble (IoT8)

„Für mich heißt Internet of Things, dass hier alles rotiert wie in einem Wäschetümmler und es weder Durcheinander noch Stillstand gibt.“ Frau Dönmek hatte Lenin und mich am Werkstor in Cedorf abgeholt und uns gleich in die Halle zu ihrer Anlage geführt: „Wir arbeiten an der Kapazitätsgrenze. Was wir wegen

Advanced Analytics | Analytics | Artificial Intelligence
Pedro Felipe Cerón 0
Los gobiernos digitales transforman la forma de trabajar

La transformación digital y la modernización de los sistemas siguen siendo dos tendencias que constituyen prioridades de misión crítica para el sector público en 2019, según la consultora internacional Gartner. En ese camino, y para este nuevo año que inició, la aplicación de la Analítica Avanzada y de la Inteligencia

Advanced Analytics | Artificial Intelligence | Internet of Things
SAS Korea 0
디지털 트랜스포메이션의 필수 요소, 인공지능(AI)과 사물인터넷(IoT)

햄버거와 감자튀김, 떡볶이와 순대, 와인과 치즈를 보통 찰떡궁합이라고 하죠. 기업과 조직의 디지털 트랜스포메이션(Digital Transformation) 추진에 있어 인공지능(AI)과 사물인터넷(IoT)은 뗄래야 뗄 수 없는 찰떡궁합입니다.  인공지능과 사물인터넷, 지능형사물인터넷(AIoT) 기술은 서로 연관되어 있습니다. 사람의 인체에 비유한다면 사물인터넷 없는 인공지능은 데이터 수집 능력이 없는 두뇌와도 같고, 반대로 인공지능 없는 사물인터넷은 데이터에서 인텔리전스를 추출할 수 없는

Advanced Analytics | Analytics | Artificial Intelligence
José Mutis O. 0
Tres tendencias que impactarán la industria del consumo masivo en 2019

La implacable búsqueda del consumidor para satisfacer sus necesidades impulsa cada cambio que vemos en el ámbito del consumo masivo. La desaparición de la empresa Toys R Us en Estados Unidos, el récord de la plataforma Alibaba consiguiendo ventas por US$25.000 millones diarios en 2018, la promesa de JD.com de

Advanced Analytics | Machine Learning
SAS Korea 0
딥러닝을 활용한 객체 탐지 알고리즘 이해하기

인공지능의 기반 기술 중 하나인 딥러닝은 눈부신 혁신을 거듭하고 있습니다. 텍스트 번역이나 이미지 분류 애플리케이션에 적합한 새로운 수준의 신경망이 개발되면서 사물인터넷(IoT)과 자율주행 관련 기술에도 활용되고 있는데요. 딥러닝 기술의 발전과 함께 객체 탐지 기법도 많은 주목을 받고 있습니다. 그렇다면 객체 탐지(Object Detection)는 무엇일까요? 객체 탐지는 이미지에서 관심 객체를 배경과 구분해 식별하는 자동화

Advanced Analytics | Data Visualization
Gerhard Svolba 0
Wien und die Donau – Paradies für Data Science und die Big Data Flut

Wien und die Donau: Zahlreiche Lieder, Geschichten und Filme dokumentieren die innige Beziehung zwischen der österreichischen Hauptstadt und „ihrem“ Fluss. Das war aber nicht immer so: Über Jahrhunderte stellte das Gewässer eine große Bedrohung für die Stadt dar – und es erforderte beträchtliche Ingenieurskunst, um die Donauauen in ein echtes

Advanced Analytics | Learn SAS | Machine Learning
SAS Korea 0
머신러닝 해석력 시리즈 4탄: 라임(LIME)으로 모델 해석력 개선하기!

그 동안 머신러닝 해석력 시리즈를 통해서 머신러닝의 부분 의존성(PD; Partial Dependence), 데이터 세트 해석 등을 소개해드렸는데요. 오늘은 라임(LIME; Local Interpretable Model-Agnostic Explanation)을 통해 머신러닝 모델의 해석력을 개선할 수 있는 방법에 대해서 알아보겠습니다. 머신러닝 모델 해석력 시리즈 1탄, 2탄, 3탄을 놓치셨다면 아래 링크를 통해 확인해주세요! 머신러닝 해석력 시리즈 1탄: 인공지능(AI)과 머신러닝을 신뢰하기 위한 필수

Advanced Analytics | Customer Intelligence | Machine Learning
SAS Korea 0
SAS 커스터머 인텔리전스 360(SAS Customer Intelligence 360): 블랙 박스 모델의 해석 기법 알아보기

머신러닝의 블랙 박스 모델을 소개하는 첫 번째 블로그와 두 번째 블로그를 통해서 머신러닝 모델의 복잡성과 머신러닝의 뛰어난 예측 결과를 활용할 수 있는 해석력이 필요한 이유, 적용 분야에 대해서 소개해드렸는데요. 이번에는 기업 실무자 입장에서 SAS 비주얼 데이터 마이닝 앤드 머신러닝(SAS Visual Data Mining and Machine Learning)을 활용한 SAS 커스터머 인텔리전스 360(SAS Customer Intelligence 360)에서 해석 기법과

Advanced Analytics | Customer Intelligence | Machine Learning
SAS Korea 0
SAS 커스터머 인텔리전스 360(SAS Customer Intelligence 360): 블랙 박스 모델의 해석력 이해하기

지난 'SAS 커스터머 인텔리전스 360(SAS Customer Intelligence 360): 머신러닝의 블랙 박스 모델이란’ 블로그에서 머신러닝 모델은 다면적이고 계속 진화하는 주제라고 소개해드린 바 있는데요. 오늘은 머신러닝 모델의 해석력(Interpretability)에 대해 자세히 살펴보고자 합니다. 머신러닝 모델은 놀라운 예측 능력을 제공하지만 매우 복잡하여 이해하기 쉽지 않습니다. 또한 머신러닝 모델은 예측한 결과에 대한 명확한 설명도 제공하지 않기

Advanced Analytics | Customer Intelligence | Machine Learning
SAS Korea 0
SAS 커스터머 인텔리전스 360(SAS Customer Intelligence 360): 머신러닝의 블랙 박스 모델이란?

머신러닝이 마케팅 생태계 내에서 지속적으로 발전함에 따라 현대화된 알고리즘 접근법의 해석력이 중요해지고 있습니다. 지난 번 게시했던 머신러닝 해석력 관련 블로그에서 인공지능(AI)과 머신러닝을 신뢰하기 위한 필수 조건, 데이터 세트를 이해하고 해석하는 방법, 그리고 머신러닝 모델의 작동 원리에 대한 인사이트를 도출하는 변수를 표시하는 방법에 대해 설명한 바 있는데요. “우리는 머신러닝에 의해 구동되는 애플리케이션에 둘러싸여 있으며,

Advanced Analytics | Internet of Things
Ivan Fernando Herrera 0
El Internet de las Cosas y la Analítica habilitan nuevas soluciones de negocio en diferentes industrias

La conexión de objetos cotidianos a Internet ha evolucionado tanto en los últimos años, que ahora es posible conectar desde electrodomésticos y equipos de salud, hasta elementos de medición usados en la agricultura, en las redes eléctricas y en empresas de logística y del sector Retail. En 2010, algunas estimaciones

1 20 21 22 23 24 53

Back to Top