Analytics

Find out how analytics, from data mining to cognitive computing, is changing the way we do business

Analytics | Data Visualization
SAS Japan 0
指数関数的成長の倍加時間を推計する

この記事はSAS Institute Japanが翻訳および編集したもので、もともとはRick Wicklinによって執筆されました。元記事はこちらです(英語)。 2020年における新型コロナウイルスの世界的流行のようなエピデミック状況下では、各国の感染確認者の累計数を示すグラフがメディアによって頻繁に示されます。多くの場合、これらのグラフは縦軸に対数スケール(対数目盛)を使います。このタイプのグラフにおける直線は、新たなケースが指数関数的ペースで急増していることを示します。直線の勾配はケースがどれほど急速に倍加するかの程度を示し、急勾配の直線ほど倍加時間が短いことを示します。ここでの「倍加時間」とは、「関連状況が何も変わらないと仮定した場合に、累計の感染確認者数が倍増するまでに要する時間の長さ」のことです。 本稿では、直近のデータを用いて倍加時間を推計する一つの方法を紹介します。この手法は、線形回帰を用いて曲線の勾配(m)を推計し、その後、倍加時間を log(2) / m として推計します。 本稿で使用しているデータは、2020年3月3日~3月27日の間の、4つの国(イタリア、米国、カナダ、韓国)における新型コロナウイルス感染症(以下、COVID-19)の感染確認者の累計数です。読者の皆さんは、本稿で使用しているデータとSASプログラムをダウンロードすることができます。 累計感染者数の対数スケール・ビジュアライゼーション このデータセットには4つの変数が含まれています。 変数Region: 国を示します。 変数Day: 2020年3月3日からの経過日数を示します。 変数Cumul: COVID-19の感染確認者の累計数を示します。 変数Log10Cumul: 感染確認累計数の「10を底とする対数」(=常用対数)を示します。SASでは、LOG10関数を用いて常用対数を計算することができます。 これらのデータをビジュアル化する目的には、PROC SGPLOTを使用できます。下図のグラフは感染確認者の総数をプロットしていますが、総数の縦軸に常用対数を指定するために「type=LOG」と「logbase=10」というオプションを使用しています。 title "Cumulative Counts (log scale)"; proc sgplot data=Virus; where Cumul > 0; series x=Day y=Cumul / group=Region curvelabel; xaxis grid; yaxis type=LOG logbase=10 grid values=(100 500 1000

Analytics
Rick Wicklin 0
How many imputations are enough?

Recently I read an excellent blog post by Paul von Hippel entitled "How many imputations do you need?". It is based on a paper (von Hippel, 2018), which provides more details. Suppose you are faced with data that has many missing values. One way to address the missing values is

Advanced Analytics | Analytics | Fraud & Security Intelligence
Yuri Rueda 0
Cinco acciones para combatir el fraude en la era de la digitalización

Los usuarios de los servicios bancarios han reducido sus visitas a las sucursales y están optando por utilizar los canales digitales que tienen a su disposición para realizar operaciones financieras (transferencias, hacer compra de productos, pago de servicios, solicitar préstamos e invertir su dinero). La digitalización ha aportado agilidad, rapidez

Analytics | Fraud & Security Intelligence
Carl Hammersburg 0
How analytics is helping state governments head off unemployment claims fraud

If you’re in state government, you're well aware of the unprecedented challenges that come with off-the-charts unemployment numbers due to COVID-19. Crashing websites at state unemployment insurance offices and multi-hour phone hold times for the millions of people who've lost their income due to the pandemic are only the most

Advanced Analytics | Analytics | Machine Learning | Programming Tips | Students & Educators
Cristiane Rodrigues 0
9 passos para uma modelagem preditiva eficaz

Modelos de machine learning estão cada dia mais em alta no mercado de trabalho. Mas o que são esses modelos? Por que eles ganharam tanto destaque? Por que todos querem usar? Gosto de dizer que modelos de machine learning são modelos estatísticos acrescidos de poder computacional, e que as empresas

Advanced Analytics | Analytics | Data for Good
Ivan Fernando Herrera 0
COVID-19 Infodemia ¿Cómo interpretar los datos de una pandemia?

*Este articulo surge de la motivación que generó un taller para periodistas de Latinoamérica, cuyo tema central fue hablar de la Infodemia y principalmente responder a la pregunta ¿Cómo interpretar los datos de una pandemia?   Dada la coyuntura de la pandemia que ha afectado a todos los países y

Analytics | Internet of Things
Sanjeev Heda 0
An approach to enabling predictive maintenance for industrial assets

Today, many assets across multiple industries are becoming more instrumented and connected to enterprise platforms to provide additional insight into their health and operation. IDC estimates that Internet of Things (IoT) investment will reach $1.12 trillion in 2023. One important area for many industrial organizations that are focused in using

Analytics | Data for Good | Work & Life at SAS
José Mutis O. 0
Liderar con inteligencia y humanidad: la mejor manera de enfrentar el virus de la incertidumbre

Antes de marzo, los líderes de las empresas vivíamos nuestra vida más o menos normal, yendo a las oficinas y tratando de hacer nuestras labores lo mejor posible, aunque ya atentos a lo que podría ocurrir con el COVID-19, a las medidas que los gobiernos tomarían y a las alteraciones

Analytics
0
SAS Visual Forecastingで、セグメンテーション予測を実践し、複雑な需要傾向を持つ時系列予測を簡潔に実現

商品やサービスを販売している企業においては、過剰在庫を防止したり、欠品による機会損失を防止し、収益を最大化するために需要予測が行われています。しかし、実際のビジネスの現場では、需要や売れ行きの傾向が異なる品目が混在するようなケースでは、その予測に多くの手間と時間がかかってしまうなどのいくつかの課題があります。 例えば、通年売れる品目や動きが遅い品目、新規品目、季節に影響を受ける品目などがあり、これらは同じ時系列モデルで処理できるわけではありません。このような課題に対する一つの解決策としては、パターンの近い商品をサブセグメントに小分けし、そのセグメントに応じて予測戦略を適用しわけることで、精度を向上します。つまり、時系列データの特徴を自動に分析して需要のパターンごとにデータを分類し、需要パターンごとに予測作業をすることです。この需要パターンの自動分類と予測については、すでにブログでご紹介しているので、こちら「SAS Viya: ビジュアルパイプラインで需要分類&予測」を参照してください。 一方で、単に時系列データとしての特徴だけではなく、品目の種類や販売地域など、業務的な観点での品目属性によって予測を管理したり、または、属性情報を加えて特徴エンジニアリングし、その特徴量と属性を加味することで精度向上を期待することもあります。そうすると、さらに自由に複雑な属性を持つ大量な時系列データを小分けして精度の高い予測結果が期待できます。つまり、ビジネス的な品目属性に基づいてデータを分割し、業務システムから属性ごとの品目データを抽出、加工処理し、それぞれ別々にモデリングを行うケースです。予測結果の全体像を把握するためには、個別に予測を実施した後、それらの結果を収集し、統合する必要もあります。 しかし、このような、データの分割や再集約には多くの手間がかかりますし、データを管理するための命名ルールなども慎重に行う必要があります。こうした課題を解決し、需要傾向の異なる商品が混在する大量のデータに対して、一つのモデリングプロジェクで最適な需要予測を一括で行うことができたら、便利だと思いませんか? 今回は、このような実際の背景にもとづき、こうした複雑な分析処理を一元的に、手軽に実現できるSAS Visual Forecastingのセグメンテーション予測機能を紹介させていただきます。 SAS Visual Forecastingの機能を活用することで、時系列データを、データの性質(動きが遅い品目、新規品目、季節品目など)に基づき、複数の類似する時系列セグメントに分割することができます。その上で、予測プロジェクト内で各セグメントを個別にモデル化できます。これにより、ユーザーは各セグメントにおける時系列のパターン/特性をより的確にモデル化するためのモデリング戦略の調整を行えるようになりますし、予測結果を全体的に把握することも可能になります。 それでは、一つの具体例を見ながら、Visual Forecastingのセグメンテーションの有用性を実感していきましょう。 今回は、米国でスキンケア商品の販売を手掛ける企業における、需要予測の課題を解決することを想定しています。この企業は、スキンケア商品の時系列売上データに基づき商品セグメントごとに二週間先の売上高を予め把握(予測)しておきたいと考えていました。 まずはスキンケア商品の時系列データを見てみましょう: 上図のように、毎日各倉庫から在庫の各商品を発送して売上高を計上、また店から各商品に行われたプロモーションやキャンペーンなどの情報を収集し、商品時系列データにまとめます。今回は、各倉庫の管理している商品売上高に基づき予測を行います。 上記の情報を表にすると下記の時系列データになります。 商品は「ProductKey」、販売倉庫は「DistributionCenter」、販売時間の時系列データは「DATE」、販売に影響する変数として割引率の「Discount」。最後に、予測目標の売上高は「Revenue」になります。 この販売トランザクション情報に、商品マスターの属性情報を加味します。 商品マスターの属性情報というのは、上図のような販売チャンネルや商品カテゴリーなどの商品が販売プロセスにおける各種補足情報のことです。例えば、販売量の高い商品はどの販売チャンネルから売れたか、どの商品カテゴリーのものか、これらの情報は商品の販売曲線の可視化にも使えるし、精確な予測にも不可欠であり、将来の販売推進方針にも繋げます。 一つの具体属性データサンプルを見ます。 商品のカテゴリーが「ProductCategory」、商品名は「ProductName」、商品の販売チャンネルが「ProductType」です。そして、商品セグメントが「_seg_」になります。セグメントという項目を少し紹介します。例えば、小売業界にとって通年売れる商品や季節限定の商品などが必ず存在すると思います。しかし、小売業者にとって、具体的に自社商品の中でどのようなものが通年売れる商品なのか、どのようなものが特別な時間にしか売れないのか、その商品を担当する担当者しか把握きません。長年にわたり、商品ごとに「通年売れる商品」や「夏限定商品」、「クリスマス商品」、「新規開発の商品」などの特徴を明白なビジネスノウハウにし、需要予測にも使いたいと考えています。このような情報を商品セグメントと称し、セグメントごと明らかに時系列特徴もはっきり分かれています。 最後に、下図のように、時系列データと属性データを結合させ、予測モデルに利用するマスターデータの準備が完成です。 今回はSAS Visual Forecastingを活用することで、時系列データを、データのセグメント属性(通年販売品目、新規品目、季節品目など)に基づき、複数の類似する時系列セグメントに分割し、精確な予測を実現することを目的としています。それを実現するため、本来であれば、各商品セグメントのマスターデータをそれぞれ抽出してモデル開発と予測を実施する必要があります。例えば、通年売れる商品に関しては従来通りにARIMAモデルで予測し、一方で、新たに開発し、販売後間もない新規開発の商品に関してはニューラルネットワークでのモデリングを適用したい場合があります。しかし、現在商品セグメントが多数もあり、データの前準備にも手間がかかります。 SAS Visual Forecastingのセグメンテーション予測機能を利用すれば、データの分割をせずすべての商品カテゴリーのデータを含むマスターデータで簡潔かつ精確にモデリングを行えます。     ここまでは今回のセグメンテーション予測イメージの説明になります。これからは実際にSAS Visual Forecastingで操作する様子を体験していきます。 まずは、Visual Forecastingのプロジェクトを一つ立ち上げます。プロジェクト名をセグメンテーション予測にして、テンプレートに外部セグメンテーションを選びます。データは先ほど説明したスキンケア商品の時系列データ「SKINPRODUCT」を選択します。 次はプロジェクトデータ設定画面で、予測用の時系列データの各列に役割を指定します。 例えば、以下のように役割を割り当てます 「時間」:「DATE」列(日付) 「独立変数」:「Discount」(値引額) 「従属変数」(ターゲット変数):「Revenue」(売上高) By変数というのは、時系列データをグループにまとめる単位を指しています。 そしてデータソースとして時系列データの属性情報を持っているマスター表「SKINPRODUCT_ATT_SEG」も追加します。この表を追加したことによって、さらに細かいグループベースで予測することができます。 この表には予めセグメンテーシ予測用に作成しておいた「_seg_」列が含まれます。中身は商品セグメント名で、計7セグメントが入っています。例えば、「Long term - All year goods」(通年販売商品)、「Long

Analytics | Learn SAS | Students & Educators
Jeanne (Hyunjin) Byun 0
[SAS #집콕챌린지] 도전! 방구석 데이터 사이언티스트

올해 초부터 시작된 코로나19 사태가 전 세계적으로 장기화되면서 ‘사회적 거리두기’가 새로운 일상으로 자리잡았습니다. 이에 따라 요즘 대부분의 시간을 집에서 보내며 온라인 강의를 듣는 학생들과 재택근무를 하는 직장인들도 많아졌는데요. #언택트 #집콕 #홈코노미 #홀로(HOLO) 등의 신조어들이 이러한 달라진 트렌드를 보여주고 있습니다. 공부를 하든 일을 하든, 집에서 오랜 시간을 보내는 것에는 꽤 명확한

Analytics | Data Visualization | Students & Educators
Nihan Yami 0
Şimdi dünyanın eskisinden de fazla veri bilimcisine ihtiyacı var

Yeni tip korona virus (COVID-19) ile yapılan global mücadeleye veri bilimi ışığında katkıda bulunmak ister misiniz? Uzmanların belirttiği üzere, “sosyal mesafe”ye dikkat etmek ve temel hijyen kurallarını takip etmek başta olacak şekilde, almamız gereken önlemler var. Veri bilimciler ise bu pandeminin en etkili şekilde yönetilmesinde çeşitli projelerle yardımcı olmaktalar. Sizler

Advanced Analytics | Analytics | Artificial Intelligence | Data for Good
José Mutis O. 0
Así es que los gobiernos, bancos, telcos y retailers pueden activar alivios sin tener que correr riesgos

Estamos en una época de máximo cuidado y de decisiones cruciales. Tenemos que salvaguardar la salud de la población por encima de cualquier otra consideración, pero también debemos pensar que de esta situación debemos salir con muchos aprendizajes y fortalecidos para el futuro. Muchos líderes por fin están entendiendo que

1 46 47 48 49 50 141

Back to Top