All Posts

비운의 영화 배우, 파킨슨병 치료를 위해 앞장서다 타임머신과 시간 여행을 다룬 영화 하면 무엇이 가장 먼저 떠오르시나요? 전 세계적으로 가장 크게 흥행한 영화 중 하나는 단연 스티븐 스필버그 감독 제작의 SF 영화 ‘백 투 더 퓨처(Back to the Future)’일텐데요. 1985년에 개봉된 이 영화는 11주 동안 미국 박스 오피스 1위를 차지하고,

인공지능(AI)은 금융 사기 탐지, 보험 비즈니스 모델 다각화, 의료 진단 개선, 스포츠 경기 성과 향상 등 다양한 분야에서 상상을 현실화하고 성과를 도출하고 있습니다. 최근 마케팅 분야도 예측 분석, 추천 엔진 등 다양한 형태의 인공지능 알고리즘을 적극 활용하면서 혁신을 체감하고 있는데요. 대기업은 물론 중소기업에 적합한 여러 인공지능 활용 마케팅 툴이 등장하면서 변화의 속도는 더욱 빨라지고 있습니다.

We North Carolinians frequently find ourselves in the paths of hurricanes. And, this year was no different. Much of our state is still recovering from Hurricane Florence with many residents still unable to return to their flooded or ravaged homes. Our hearts and prayers remain with our fellow NC families

Nach dem diesjährigen SAS Global Forum in Denver bin ich weiter nach San Francisco gereist. Und wie viele Touristen bin ich auch zur Golden Gate Bridge gefahren und habe sie Fuß überquert. In der Mitte der Brücke, bemerkte ich einen Windsurfer in der Bucht von San Francisco, der sich der

This article shows how to use SAS to fit a growth curve to data. Growth curves model the evolution of a quantity over time. Examples include population growth, the height of a child, and the growth of a tumor cell. This article focuses on using PROC NLIN to estimate the

第3回のブログでは、SAS Visual Analytics の活用例として統計解析のひとつである線形回帰を紹介しました。その続きのブログとなる今回は、ロジスティック回帰について説明します。 回帰分析は変数どうしの関係を分析することができます。そのなかでも以前紹介した線形回帰はシンプルでよく利用されますが、すべての場合において最も適当な分析手法であるとは限りません。たとえば、目的変数が離散的な場合(例:喫煙の有無、就業状態、移住の意思)には、ロジスティック回帰のほうが当てはまりのよい結果を得ることができます。本記事では、ロジスティック回帰を用いて待機児童の有無に影響を与える変数の分析を紹介します。 このスライドでは、厚生労働省が公開している保育所等関連状況取りまとめ(平成30年4月1日)から申込者の状況についてのデータと、総務省が公開している平成28年度地方公共団体の主要財政指標一覧から全市町村の主要財政指標を利用しました。データのインポートについてスライド内でも説明していますが、インポートの際の注意点など詳細に関してはこちらのブログを参考にしてください。 SAS Visual Analytics 8.3 におけるロジスティック回帰の利用 from SAS Institute Japan ロジスティック回帰オブジェクトでは、自動的に最適なモデルが選択されます。オブジェクトを最大化し、詳細を表示すると使用したモデルを確認することができます。 スライド内の分析では、ロジットモデルを使用していました。 また、詳細からは当てはめの統計量、パラメータ推計値などの情報を確認することができます。 今回の分析結果の解釈として、待機児童の有無に影響を与えている要因は「財政力指数」「経常収支比率」「ラスパイレス指数」「実質公債費比率」でした。それぞれの変数についてパラメータ(効果量)推定値をみると、「財政力指数」が最も大きい正の値(2.49)となっており、「財政状況のよい市区町村ほど待機児童が発生しやすい」といえます。対して「申込者数」の推定値は(5%有意であるものの)0.000094と非常に小さく、申込者数の多寡が待機児童の有無に与える影響は小さいと言えます。ここから、自治体規模の大小と待機児童の有無は関係していないと推測できます。 そのほかのパラメータをみても、財政状況がよいほど待機児童がいることが分かりますが、ここから単純に「待機児童を減らすためには、財政状況を悪化させればよい」ということにはなりません。たとえば、待機児童が多い自治体では共働きが多く、結果として住民税収が増加し財政状況がよくなるなど、さまざまなストーリーを想定することができます。回帰分析から因果関係を主張するときには注意が必要です。 この分析では、財政指標を利用しましたが、他にも女性の就業率、出生率、世帯構成などのデータを利用するとより効果的な分析ができるでしょう。データセット内に2値の変数がない場合でも、スライド内の例のように自分で基準を決めることで新しい変数を作成することができます。これによって分析の幅が広がりますが、レポートには必ず変数の定義を記述してください。 引き続き本ブログのシリーズでは、図表・グラフの作成や統計解析の方法について紹介いたします。 第2回和歌山県データ利活用コンペティションへの参加も募集中ですので、高校生・大学生のご参加をお待ちしています。(追記:募集は締め切られました)

全世界のSASユーザーが集う年次のイベント SAS Global Forum。 次回は2019年4月28日から5月1日まで、米国テキサス州ダラスで開催予定です。 現在、SAS Global Forum 2019での発表演題を募集しています。 本イベントは、600を超えるセッションでワークショップ、プレゼンテーション、e-ポスター、デモおよび交流プログラムが用意されており、アナリティクス活用についての事例やテクノロジーが多数紹介されます。昨年は5400人もの登録者があり、世界中のデータサイエンティストと情報交換が可能です。(2017年の様子を過去のブログで紹介しています。その1, その2, その3) 学生向けのプログラムも用意されており、多くの大学生・教育関係者が参加します。 Student Ambassador Program ... 「学生大使」として無料でイベントに招待(旅費や宿泊代もサポートされます!) Student Symposium ... 学生がチームで戦うコンテスト。ファイナリストはイベントに招待されます。 Academic Summit ... 学生と教育関係者向けの講演と交流プログラム。昨年、参加した日本の学生によるレポートはこちら。 ビジネスやアカデミアのユーザーが一堂に会するグローバルイベントで、学生が自身の分析・研究・提案を発表することで、ビジネスやアナリティクスの専門家からのフィードバックにより自身のアイデアを深めると同時に、国際的にネットワークを広げることができます。 まずは、10月22日の締切までにアブストラクトを投稿しましょう! SAS Japan アカデミア推進室では、投稿に向けて学生の皆さんをサポートいたします。 興味のお持ちの方は JPNAcademicTeam@sas.com までご連絡ください。

An abundance of data does not equal an abundance of wisdom. At the SAS Government Leadership Forum, leaders from federal, state and local agencies will discuss how analytics can bridge the gap between data and wisdom to make meaningful changes in how government operates. Analytics, however, is not just about

El Estudio de Evasión Fiscal Global, realizado por la Universidad de las Américas Puebla (UDLAP), por encargo del SAT, revela que la evasión fiscal le cuesta a México alrededor de $510,000 millones de pesos, particularmente en rubros como el impuesto sobre la renta, el impuesto al valor agregado y combustibles

Deep learning (DL) is a subset of neural networks, which have been around since the 1960’s. Computing resources and the need for a lot of data during training were the crippling factor for neural networks. But with the growing availability of computing resources such as multi-core machines, graphics processing units

Focus on data governance, quality and storage if you want to do data management for analytics right.

The SAS INFILE statement can read multiple text files in a single DATA step. Use file name wildcards (like * and ?) and a special FILENAME= option to keep track of which records come from which files.

This Fall 2018 issue of Foresight, our 51st, opens with Fotios Petropoulos’s review of Paul Goodwin’s latest book, How to Profit from Your Software: A Best-Practice Guide for Sales Forecasters. Fotios notes that the author doesn’t single out any one software system, but keeps the discussion general and so applicable to many products.

Schaut man auf die Digitalisierungsprojekte der Versicherer, dann fällt auf, dass ein Großteil im Wesentlichen Prozessverbesserungen und Kosteneinsparungen sind. Prozesse und Kosten – das sind nicht gerade „moderne“ Begriffe und sie sind gefühlt das Gegenteil dessen, was an Buzzwords und Statements im Kontext Digitalisierung und Innovation genannt wird. Dass solch

I attended the Scottish Highland Games this past weekend ... nearby in Scotland County, North Carolina! They put on a great event, with kilt-wearing Scotsmen throwing things, bands playing bagpipes, kids dancing, and clans sharing their family history. And to get into the mood for this event, I decided to