今回は「オペレーショナル・アナリティクス for Data Scientist」をメインテーマとしてご紹介します。企業で分析業務を行うデータサイエンティストの皆様はご存知の通り、モデルは開発しただけでは意味がありません。そのモデルを業務に実装(デプロイ)してはじめて、ビジネス課題を解決し、価値を創出することができるわけです。SASが長年蓄積してきたナレッジをご覧ください。 1.Using SAS® Viya® to Implement Custom SAS® Analytics in Python: A Cybersecurity Example この論文は、SASの分析機能により支えられているプロダクションレベルのアナリティクスソリューションを開発しようとしているデータサイエンティストを対象としています。本文では、SAS ViyaとCloud Analytics Service(CAS)に基づく、CASの構築基盤とサイバーセキュリティを説明します。そして、SASアナリティクスを本番環境でPythonで実装する方法を説明します。 2.What’s New in FCMP for SAS 9.4 and SAS Viya この論文では、下記いくつかポイントをメインとして議論していきます。まず、SASが提供しているFunctionコンパイラー(FCMP)の新しい特徴を紹介し、それから主にFCMPアクションセットを中心とし、リアルタイムアナリティクススコアリングコンテナ(ASTORE)とPythonのインテグレーションについても説明します。それらの説明により、SASの新しいテクノロジーに対し、更なる理解を頂けることを期待しています。 3.Influencer Marketing Analytics using SAS® Viya® この論文はSAS Viyaを使って、マーケティングアナリティクスを行う事例を紹介します。近来、マーケティングはますますインフルエンサーが大きな役割をしめるようになってきています。それらのインフルエンサーたちはソーシャルメディアのコンテンツ作成者であり、多くのフォロワーを持ち、人々の意見に影響を与え、購入を検討する人々にも影響を与えています。インフルエンサーマーケティングは、より伝統的なマーケティングチャンネルと同じようにコストがかかるため、企業にとって最も効果的なインフルエンサーを選択することは非常に重要です。 こういった背景において、この論文では、ソーシャルメディアで本当に影響力をもつ人、そしてその影響程度はなにかについて分析することを目指しています。ケーススタディは、感情面の影響を与えることに焦点を当てています。また、多くのフォロワーを持つインフルエンサーとその色んな投稿とアクティビティを分析します。実施するには、Pythonのライブラリとコードが使用されます。次に、彼らのアクティビティとネットワークを分析して、それらの影響範囲を分析します。これらの分析には、SAS Viyaのテキストおよびネットワーク分析機能が使用されます。データ収集ステップ(Python)はクライアントとしてJupyter Notebookを使用していますが、分析ステップは主にSAS Visual Text Analytics(Model Studio)とSAS Visual Analyticsを使用して行われています。 4.Take
Tag: machine learning
The startup ecosystem is dynamic and the flow of venture capital into tech is at an all-time high. Billions of dollars are invested in tech startups every year. Many tech startups market themselves as ‘powered by AI’ and pitch investors with buzzword laden phrases such as, ‘we leverage state of
前回に引き続き、SAS Global Forum 2019で公開された論文をご紹介します。今回は、SASユーザを含め、SAS言語とオープンソース言語の機能を共に活用することで、様々なビジネス課題に対応できるようなコーディング事例をいくつかピックアップします。 1.Deep Learning with SAS® and Python: A Comparative Study ご存知の通り、SASはディープランニングに関する専門性の高いかつ豊富な機能と製品を提供しています。この論文では、SASとPythonに対し、それぞれ違うデータタイプ(例えば:構造化と非構造化、イメージ、テキスト、シーケンシャルデータ等々)を使ったディープラーニングのモデリングを比較する論文となります。主にSAS環境でのディープランニングフレームワーク、そして、SASとPython言語のディープランニングプログラミングの違いによって、それぞれのメリットとデメリットの紹介となります。 2.Utilization of Python in clinical study by SASPy Pythonは近年最も使われているプログラミング言語になってきました。そして現在、機械学習とAI領域でもよく使われています。Pythonの一番のアドバンテージはその豊かなライブラリを通じ、多種多様な分析をインプリメントできることです。SASは臨床研究領域で最も強力な分析製品でありながら、さらにPythonを使うことによって、そのレポーティング機能、例えば、データ管理、データ可視化を拡張できます。これもSASプログラマーユーザのキャリアに対し、潜在的なメリットです。その様な背景において、SASPyはその可能性を実現します。SASPyはPythonコードの中でSASのセッションをスタートできるPythonパッケージライブラリとなります。この論文では、基本的なSASPyの使用方法とSASのデータセットを処理するヒントについて紹介しています。そして、Pythonを使って、臨床研究で使えそうなレポーティング機能について検討します。 3.Everything is better with friends: Executing SAS® code in Python scripts with SASPy SASPyはSASがPythonプログラミング用に開発したモジュールで、SASシステムに代わるインタフェースを提供しています。SASPyを通じて、SASプロシージャはPythonスクリプトと構文で実行することができ、かつ、SASデータセットとそれに相当するPythonデータフレームの間にデータを転送することも可能です。それにより、SASプログラマーはPythonの柔軟性を利用してフロー制御を行うことができ、PythonプログラマーはSAS分析をスクリプトに組み込むこともできます。この論文では、Pythonスクリプト内で通常のSASコードとSASPyの両方を使用した一般的なデータ分析タスクの例を幾つか紹介し、それぞれの重要なトレードオフを強調し、多種プログラミング言語ユーザになれることの価値を強調しています。SAS University Edition用のJupyterLabインタフェースを使用し、それらの例を再現するための説明も含まれています。それらのSASとPythonのインテグレーション例はJupyter Notebookとしてダウンロードできます。 ダウンロード:https://github.com/saspy-bffs/sgf-2019-how 4.Modeling with Deep Recurrent Architectures: A Case Study of
Most insurance companies depend on human expertise and business rules-based software to protect themselves from fraud. However, people move on. And the drive for digital transformation and process automation means data and scenarios change faster than you can update the rules. Machine learning has the potential to allow insurers to
The range of potential payment services has expanded rapidly over the last few years. Increasingly, we all want the flexibility of being able to pay with new payment methods, from contactless through to Apple Pay, mobile wallets and beyond. Digital natives, such as millennials, don’t just want this – they
El análisis de la información en las empresas ha dejado de ser un elemento opcional para convertirse en uno fundamental que puede ser la diferencia entre mantenerse competitivo o salir del mercado. Como ejemplo, los analistas de KPMG han demostrado, a través de un estudio-consulta, que el 33% de las
Hoy en día, las organizaciones necesitan analítica de alto rendimiento para mejorar todos sus indicadores de negocio, ya no es un lujo: es una necesidad. La transformación digital y el análisis empresarial son una prioridad en la agenda de muchas empresas que buscan destacar en un mundo hiper competitivo que
It can be hard to get a handle on what artificial intelligence (AI) and machine learning (ML) will actually do. We all understand – in theory, at least – that they could change the way we live and work. In most cases and for most of us, however, the precise
Learn how Bayesian optimization works through a simple demo.
In this blog, I use a Recurrent Neural Network (RNN) to predict whether opinions for a given review will be positive or negative. This prediction is treated as a text classification example. The Sentiment Classification Model is trained using deepRNN algorithms and the resulting model is used to predict if new reviews are positive or negative.
What if, apart from the new organisation of production assets, the fourth industrial revolution also implies a significant evolution in the knowledge management intrinsic to each domain? What if new digital technologies allow the operational actors to simply access this knowledge, mostly derived from empirical methods, thanks to analytical methods and
Artificial intelligence is the attention-grabbing, overhyped, shiny object that every organization is searching to make use of. Yes, it is overhyped, but it’s also very real and very powerful. “We do not want to add to the hype. We do not want to add to the confusion. We want to
Have you ever wondered if love at first sight really exists? And if it exists, what qualities are people drawn too? Watch any romantic comedy and you’ll see this phenomenon play out on the big screen. Which begs the question, “If it can happen to them why not me?” Let’s
El fraude en seguros siempre ha existido, presentándose de diferentes maneras para adaptarse a cada época. Hoy en día, la magnitud del fraude en seguros no solamente es sorprendente, sino que aumenta. Las actividades fraudulentas prevalecen a lo largo de todo el ciclo de vida de la póliza. A medida
There's been a lot of hype regarding using machine learning (ML) for demand forecasting, and rightfully so, given the advancements in data collection, storage, and processing along with improvements in technology. There's no reason why machine learning can't be utilized as another forecasting method among the collection of forecasting methods
El uso de herramientas de analítica avanzada permite a las organizaciones desplegar capacidades de “Customer Decisioning” para entregar a sus clientes una experiencia de consumo excepcional, gracias a una mayor relevancia en cada interacción. En la actualidad, los clientes esperan una experiencia perfecta, altamente personalizada y relevante ya sea en
Jim Harris says curating AI’s curriculum is the responsibility of data stewards.
El comercio electrónico en México continúa avanzando de forma importante. El intercambio de bienes y servicios a través de Internet pasó de $ 481,232 millones de pesos (mdp) a $ 803,103 mdp, lo que representa el 4 % del Producto Interno Bruto (PIB). La Asociación de Internet.MX y ComScore, por
Hablar de Inteligencia Artificial parece muy lejano para algunas personas y para otras es algo que ya se está implementado a una gran velocidad. En este artículo espero iniciar con una serie de reflexiones y conversaciones acerca de lo que esperamos desarrollar hoy y a dónde queremos llegar en el
Each day, more than 130 Americans die from opioid overdoses. Combating the opioid epidemic begins with understanding it, and that begins with data. SAS recently partnered with graduate students from Carnegie Mellon University (CMU) 's Heinz College of Information Systems and Public Policy to understand how data mining and machine
Im vorangegangenen Blog habe ich die „vier Säulen des Vertrauens“ für automatisierte Entscheidungen vorgestellt. Dieser hat gezeigt: Erklärbarkeit und Transparenz beziehen sich auf den gesamten analytischen Prozess. Wie sieht es aber mit der „Blackbox“ der maschinellen Lernalgorithmen aus? Auch dort muss Transparenz durch eine analytische Plattform gewährleistet sein. Die gute
Feature generation (also known as feature creation) is the process of creating new features to use for training machine learning models. This article focuses on regression models. The new features (which statisticians call variables) are typically nonlinear transformations of existing variables or combinations of two or more existing variables. This
I previously discussed how you can use validation data to choose between a set of competing regression models. In that article, I manually evaluated seven models for a continuous response on the training data and manually chose the model that gave the best predictions for the validation data. Fortunately, SAS
Machine learning differs from classical statistics in the way it assesses and compares competing models. In classical statistics, you use all the data to fit each model. You choose between models by using a statistic (such as AIC, AICC, SBC, ...) that measures both the goodness of fit and the
A nadie le gusta pagar impuestos. Y no son pocos los contribuyentes -personas físicas y morales- que buscan formas de declarar ingresos más bajos que los reales con tal de desembolsar lo menos a las autoridades fiscales (como el Sistema de Administración Tributaria de México). De hecho, estas organizaciones son
“Hoy fue revelado un prototipo de computadora que se espera, sea capaz de hablar, caminar, ver, escribir, reproducirse y ser consciente de su existencia”. Allá por 1958, cuando aun cuando no existía internet y una computadora era algo más pesada que un elefante, el New York Times publicaba un artículo
Los sistemas de transporte son, sin duda, un importante factor para el crecimiento económico de un país. Cuanto más eficientes, ágiles, puntuales y seguros sean, mayor será su impacto en la movilidad de la población y las distintas actividades productivas. Las opciones son muy variadas: autobuses, microbuses, taxis, trenes, metro,
In machine learning and other model building techniques, it is common to partition a large data set into three segments: training, validation, and testing. Training data is used to fit each model. Validation data is a random sample that is used for model selection. These data are used to select
In the second of three posts on using automated analysis with SAS Visual Analytics, we used the automated analysis object to get a better understanding of our variable of interest, X-Sell and Up-sell Flag, and how it is influenced by other variables in our dataset. In this third and final
„Für mich heißt Internet of Things, dass hier alles rotiert wie in einem Wäschetümmler und es weder Durcheinander noch Stillstand gibt.“ Frau Dönmek hatte Lenin und mich am Werkstor in Cedorf abgeholt und uns gleich in die Halle zu ihrer Anlage geführt: „Wir arbeiten an der Kapazitätsgrenze. Was wir wegen