Makoto Unemi (畝見 真) 0

データサイエンティスト(以降、DSと表記)は、お好みのプログラミング言語を使用して、日々モデリングを行っています。昨今は、その中でもオープンソースのプログラミング言語であるPythonやRを使用されている方の割合が多くなってきているようです。その結果として、企業の分析組織やチーム内には複数の異なる言語を活用するDSが混在するケースも見受けられます。(一人で両方の言語を操る方もいます。) 「Pythonを操るAさんが作成されたモデルと、Rを操るBさんが作成されたモデル、どちらの精度が高いのかを容易かつビジュアルに比較することができたら…」  ということで、今回は、SAS ViyaのModel Studioを使用し、ビジュアルなパイプライン上での異なる言語間モデル精度比較をご紹介します。  手順は以下の通りです。 ① プロジェクトの新規作成と学習用のデータソース選択 ② パイプラインの作成と実行 ③ 実行結果(モデル精度)の確認 ① プロジェクトの新規作成と学習用のデータソース選択 「SAS Viya: ビジュアルパイプラインで予測モデル生成(基本編)」の「1.プロジェクトの新規作成と学習用のデータソース選択」を参照ください。 ② パイプラインの作成と実行 画面上部にある「パイプライン」をクリックします。 パイプラインには「データ」ノードのみが表示されています。左端の機能ノードアイコンをクリックすると、 パイプラインに追加可能な機能ノードのリストが表示されます。 まずは学習データに対する前処理として、欠損値補完を行います。 「データマイニングの前処理」内にある「補完」を「データ」ノード上にドラッグすると、 「データ」ノードの下に「補完」ノードが追加されます。 同様の手順で、「その他」内にある「オープンソースコード」を「補完」ノード上へドラッグすると、「補完」ノードの下に「オープンソースコード」ノードが追加されます。 機能ノードごとのオプション設定は、右側画面内で行います。 「言語」が「Python」であることを確認し、「開く」をクリックします。 開かれた画面内に、比較対象のPythonのコード(ランダムフォレストのモデル)をコピーします。右上の「保存」(フロッピーディスクアイコン)をクリックし、「閉じる」をクリックします。 ※ターゲット変数名や入力変数リスト名など、画面左側の変数名を使用することによって、オープンソースコードノードとその他のノード間でのデータ連携が可能となり、異なる言語のモデル間での精度比較も可能になります。各種規定変数名の詳細に関しては、オンラインマニュアルを参照してください。 「オープンソースコード」ノードの右側にある3つのドットが縦に並んでいる(スノーマン)アイコンをクリックし、「名前の変更」を選択し、 「Pythonフォレストモデル」に変更します。 このようにドラッグ操作でノードを追加する以外に、パイプライン上のメニューからノードを追加することもできます。 「補完」ノードのスノーマンアイコンをクリックし、「下に追加」>「その他」>「オープンソースコード」の順に選択すると、 「補完」ノードの下に「オープンソースコード」ノードが追加されます。 以降、同様の手順で比較対象のRのコード(ランダムフォレストのモデル)をコピーし、ノードの名前を変更します。 「オープンソースコード」ノードは、データに対する前処理として使用することもできます。デフォルトでは、「オープンソースコード」ノードは、データに対する前処理として認識されているので、これを「教師あり学習」に切り替えます。 PythonとRのモデルノードそれぞれのスノーマンアイコンをクリックし、「移動」>「教師あり学習」を選択します。 すると、「モデルの比較」ノードが追加され、PythonとRのモデルノードと接続されます。 パイプラインが完成したので、右上の「パイプラインの実行」アイコンをクリックし、実行します。 ③ 実行結果(モデル精度)の確認 処理が正常に完了したら、「モデル比較」ノードのスノーマンアイコンをクリックし、「結果」を選択します。 Rのフォレストモデルの方が精度が高い、チャンピオンモデルであると表示されました。 リフトやROC、様々な統計量で、精度を詳細に比較することもできます。 以上が、ビジュアルパイプラインでPythonとRのモデル精度を比較する手順です。 もちろん、必要に応じて、PythonやRのモデルとSASのモデルの精度を比較することもできます。 ※ビジュアルパイプラインでPythonとRのモデル精度を比較は、SAS Viya特設サイトにある動画でもご覧いただけます。 ※実際にPythonとRのモデル精度比較を試してみたい方は、Githubに公開されているアセットを活用ください。

Charlie Chase 0
Practical approaches to new product forecasting using structured and unstructured data

When it comes to forecasting new product launches, executives say that it's a frustrating, almost futile, effort. The reason? Minimal data, limited analytic capabilities and a general uncertainty surrounding a new product launch. Not to mention the ever-changing marketplace. Nevertheless, companies cannot disregard the need for a new product forecast

Mary Beth Moore 0
NLP for military intelligence

Every day, military intelligence analysts sit behind computers reading a never-ending stream of reports, updating presentation templates and writing assessments. But intelligence is more than documenting events and sharing breaking news. It involves understanding and predicting complexities in human behavior across various organizational constructs and using facets of information to

Augusta Zhang 0
How to spot counterfeit company logos with AI – no SAS programming experience needed

As one of SAS' newest systems engineers, recently joining the Americas Artificial Intelligence Team, I’m incredibly excited to gain expertise in artificial intelligence and machine learning. I also look forward to applying my knowledge to enable others to leverage the advanced technologies that SAS offers. However, as a recent graduate

¿Hasta dónde podría llegar con la Inteligencia Artificial?

Hablar de Inteligencia Artificial parece muy lejano para algunas personas y para otras es algo que ya se está implementado a una gran velocidad.  En este artículo espero iniciar con una serie de reflexiones y conversaciones acerca de lo que esperamos desarrollar hoy y a dónde queremos llegar en el

Andreas Becks 0
Dem Algorithmus in die Blackbox schauen: KI-Entscheidungen erklärbar machen

Im vorangegangenen Blog habe ich die „vier Säulen des Vertrauens“ für automatisierte Entscheidungen vorgestellt. Dieser hat gezeigt: Erklärbarkeit und Transparenz beziehen sich auf den gesamten analytischen Prozess. Wie sieht es aber mit der „Blackbox“ der maschinellen Lernalgorithmen aus? Auch dort muss Transparenz durch eine analytische Plattform gewährleistet sein. Die gute

Christian Goßler 0
AC&DC und Sherlock im Internet of True Detectives (IoT9)

Lenin schaut übellaunig wie ein Bolschewik: „Sherlock? Der hat mit leistungsfähiger künstlicher Intelligenz so wenig zu tun wie mit echter Detektivarbeit! Wir brauchen weder Sherlock noch seinen Doktor!“ Lenin hatte mich zum Challenger Workshop eingeladen. Ein Berater der Accelerator Change & Disruption Consultancy (AC&DC) bat nach kurzem Impulsvortrag (Change! Disruption!)

Jeanne (Hyunjin) Byun 0
공공 기관을 위한 효과적인 인공지능 전략

2019년에도 인공지능(AI)은 여전히 모든 기관 및 조직들에게 큰 화두일 것으로 보입니다. 인공지능 기술을 통해 기관은 대량의 데이터를 빠르게 분석하고 반복적인 업무 프로세스를 자동화하며, 투명성을 높임으로써 전반적인 운영 효율을 개선할 수 있습니다. 이러한 혁신은 이제 더 이상 첨단 IT 기업들만의 성공 사례가 아닙니다. 새해를 맞이하여 공공 기관이 효과적으로 AI 전략을 구현하기

Andreas Becks 0
Nachvollziehbarkeit und Vertrauen: Oberste Prämisse für ethische KI-Entscheidungen

Im ersten Teil meines Blogs habe ich argumentiert, dass die Beschäftigung mit künstlicher Intelligenz (KI) und Ethik keine rein philosophische oder gesellschaftspolitische Fragestellung ist. Eines ist klar: Die Ethik-Debatten werden in diesem Jahr weitergehen und sich stärker an den realistischen Möglichkeiten und Risiken von KI orientieren. Unternehmen und Organisationen, die

Cameron McLauchlin 0
How are AI and advanced analytics transforming health and life sciences?

The potential for artificial intelligence (AI) and the Internet of Things (IoT) to transform the way health care and therapies are delivered is tremendous. It’s not surprising that the health care and life sciences industries are being flooded with information about how these new technologies will change everything. While it’s

Anita Lakhotia 0
Myth-busting: was macht ein Data Scientist den ganzen Tag?

Diese Frage bekomme ich von Nicht-Data-Scientists immer häufiger gestellt. Und es ranken sich viele Meinungen und Mythen um diese Expertengruppe. Genau aus diesem Grund habe ich mich mit Simon Greiner, einem angehenden Data Scientist und erfahrenen IT-Berater, unterhalten. Ein Mythos über Data Scientists: sie lesen keine Bücher mehr. Stimmt nicht!

Melanie Carey 0
How SAS Visual Analytics' automated analysis takes customer care to the next level - Part 3

In the second of three posts on using automated analysis with SAS Visual Analytics, we used the automated analysis object to get a better understanding of our variable of interest, X-Sell and Up-sell Flag, and how it is influenced by other variables in our dataset. In this third and final

Christian Goßler 0
Bolschewistische Rotationsbeschleunigung im Internet of Tumble (IoT8)

„Für mich heißt Internet of Things, dass hier alles rotiert wie in einem Wäschetümmler und es weder Durcheinander noch Stillstand gibt.“ Frau Dönmek hatte Lenin und mich am Werkstor in Cedorf abgeholt und uns gleich in die Halle zu ihrer Anlage geführt: „Wir arbeiten an der Kapazitätsgrenze. Was wir wegen

Melanie Carey 0
How SAS Visual Analytics' automated analysis takes customer care to the next level - Part 2

In the first of three posts on using automated analysis with SAS Visual Analytics, we explored a typical visualization designed to give telco customer care workers guidance on customers most receptive to upgrade their plans. While the analysis provided some insight, it lacked analytical depth -- and that increases the risk of  wasting time, energy and

Melanie Carey 0
How SAS Visual Analytics' automated analysis takes customer care to the next level - Part 1

You're the operations director for a major telco's contact center. Your customer-care workers enjoy solving problems. Turning irate callers into fans makes their day. They also hate flying blind. They've been begging you for deeper insight into customer data to better serve their callers. They want to know which customers

Pedro Felipe Cerón 0
Los gobiernos digitales transforman la forma de trabajar

La transformación digital y la modernización de los sistemas siguen siendo dos tendencias que constituyen prioridades de misión crítica para el sector público en 2019, según la consultora internacional Gartner. En ese camino, y para este nuevo año que inició, la aplicación de la Analítica Avanzada y de la Inteligencia

SAS Korea 0
지능형사물인터넷(AIoT)은 유틸리티 산업을 어떻게 발전시킬까요?

지능형사물인터넷(AIoT)에 대해 들어본 적 있으신가요? 지능형사물인터넷은 사물인터넷(IoT)을 통해 연결된 스마트 기기 데이터에 인공지능(AI)을 적용하는 것입니다. AIoT가 활성화되면 연결된 기기(커넥팅 디바이스)에서 수집된 정보를 기반으로 머신러닝 학습과 분석은 물론 서비스 제공까지 동시에 이루어질 수 있을 텐데요. 학습과 자동화를 기반으로 사람의 업무 처리 영역을 돕는 인공지능 기술은 경험 학습, 새 입력값(Input)을 통한 조정, 별도의 수동 조작이

SAS Korea 0
디지털 트랜스포메이션의 필수 요소, 인공지능(AI)과 사물인터넷(IoT)

햄버거와 감자튀김, 떡볶이와 순대, 와인과 치즈를 보통 찰떡궁합이라고 하죠. 기업과 조직의 디지털 트랜스포메이션(Digital Transformation) 추진에 있어 인공지능(AI)과 사물인터넷(IoT)은 뗄래야 뗄 수 없는 찰떡궁합입니다.  인공지능과 사물인터넷, 지능형사물인터넷(AIoT) 기술은 서로 연관되어 있습니다. 사람의 인체에 비유한다면 사물인터넷 없는 인공지능은 데이터 수집 능력이 없는 두뇌와도 같고, 반대로 인공지능 없는 사물인터넷은 데이터에서 인텔리전스를 추출할 수 없는

José Mutis O. 0
Tres tendencias que impactarán la industria del consumo masivo en 2019

La implacable búsqueda del consumidor para satisfacer sus necesidades impulsa cada cambio que vemos en el ámbito del consumo masivo. La desaparición de la empresa Toys R Us en Estados Unidos, el récord de la plataforma Alibaba consiguiendo ventas por US$25.000 millones diarios en 2018, la promesa de de

José Mutis O. 0
El análisis predictivo: impactando los negocios y sus procesos de transformación digital

La tecnología y la sociedad están evolucionando en un entorno digital que exige cambios en el modelo de negocio, la infraestructura y la cultura de una organización. Sin embargo, uno de los mayores retos a los que se están enfrentando las empresas en este momento se basa en el desconocimiento

Michael Rabin 0
Das moderne Aktuariat: Warum KI und Tempo künftig Umsatz bringt

Die Versicherungsbranche (Aktuariat) ist ein langer, ruhiger Fluss, auf dem träge Dampfer kreuzen. Sagen die einen. Sie ist ein Haifischbecken, das nur die stärksten überleben. Sagen die anderen. Recht haben sie beide. Denn zum einen ist der Versicherungsmarkt ganz klar ein reifer Markt, in dem der Handlungsspielraum für die einzelnen

