Tag: SAS

Analytics
0
夏といえばひまわり

夏といえばひまわり。鮮やかな黄色は一輪でも強い存在感を放ち、我が家の食卓を飾る花でもある。ひまわりの花は常に太陽に向かって咲き、時間とともに太陽を追いかけるとされている。しかし、実際にはこのように動くのは芽生えから開花前のつぼみの時期までの話だ。 自然界にあるひまわりの成長には、太陽、気温、降水量、土壌など多くの要因が影響するが、これらの要因がどう関係するのだろうか。人工的な実験でも可能だが、たとえばひまわりの成長データを収集し、統計分析を用いることで最適な成長条件や栽培環境が特定できるはずだ。また、ビッグデータならではの機械学習アルゴリズムを使えば成長のルールやパターンを見つけることもできる。アナリティクスを駆使すれば(SASで開講中のアナリティクスコースはこちら⇒トレーニングコース | SAS)、収穫量の予測や最適な施肥方法、栽培条件も見つけられるだろう。実際、ひまわりの市場は世界で5.6兆円に登る巨大なマーケットなのだ。 ところで、ひまわりといえば気象衛星を連想するのは私だけだろうか。初代号が1977年に打ち上げられ、今度が10号になるが、最初は愛称で呼ばれていたものが後に正式名称となった。気象庁のサイト(気象庁 Japan Meteorological Agency)では、ほぼリアルタイムでひまわりの衛星写真がさまざまな切り口から見られるが、天気や防災に関する情報のほか、上記のような分析に欠かせない環境や気象のデータも豊富に提供されている。 2024年9月初旬 相吉

Analytics
0
バラといえばナイチンゲールのバラ

幼い頃、家の庭にたくさんのバラがあり、手入れが大変だった思いがある。トゲに刺されて痛い思いをしたり、傷になったりしたことを覚えている。興味深いことに、統計学の歴史にはナイチンゲールの「バラ」というグラフが登場する。 「白衣の天使」として知られるイギリスの看護師フロレンス・ナイチンゲールは、優れた統計学者でもあった。彼女は19世紀のクリミア戦争で看護師として派遣され、膨大な戦死者・傷病者データを分析し、多くの兵士が戦傷ではなく劣悪な衛生状態のために命を落としていることを明らかにした。その後、政治や行政に向けに「ローズダイアグラム」という革新的なグラフで報告した。 ローズダイアグラムは、円グラフの一種で、死因を視覚的に示すチャートである。月ごとの死亡者数を戦傷を赤、衛生状態や栄養不足を青、その他の要因を黒で色分けし、それぞれの面積で表現したものである(Florence Nightingale's Rose Diagram)。このグラフにより、衛生改善の必要性が明確になり、医療環境の改善が進んで傷病兵の死亡率が大幅に減少したのは言うまでもない。 統計学は記述統計と推測統計に分かれ、記述統計はデータの特徴を分かりやすく表現することを目的とする。ナイチンゲールの事例は、記述統計とデータ可視化が如何に重要かを物語っている。SASには「SAS Visual Analytics」という優れた可視化ツールがあり、基礎から上級までの関連コースも提供されている(SASトレーニングコース)。 2024年8月初旬 相吉

Analytics
0
アジサイと書いて統計学と機械学習と読む

この時期の私の楽しみは、散歩の途中でかわいらしい色とりどりのアジサイの花を眺めることだ。アジサイは、「集まる」や「寄せ集める」という意味があり、花弁がいくつも集まっている咲き姿に由来しているそうだ。別名「七変化」とも呼ばれており、土の性質によって花色が変わるのが特徴。土が酸性だとブルー系、中性からアルカリ性だとピンク系になるそうだ。面白いことに、ブルーのアジサイをアルカリ性の土に植え替えると薄紫色のアジサイに変化するそうだ。 「統計学と機械学習の違いは何か」という質問を受けることがある。土の性質で色が変わるアジサイのように、機械学習と統計学も同じような関係ではないかと思う。両者の目的は似ているが、ビッグデータと高度な計算能力という土俵の違いが機械学習の発展に大きく寄与したのは間違いない。ただ、機械学習の歴史は比較的新しいが、統計学がなければその発展は考えにくい。例えば、決定木分析は機械学習が流行る前から統計学の手法の一つだったが、機械学習の進展とともに進化してきた。ちなみに決定木分析は樹形図の形式で結果を出力し、そのため初心者でも理解しやすい分析手法の一つ。SASでは、機械学習をはじめとして、ニューラルネットワーク、AI関連のトレーニングコースが年に数回開催されている(SASトレーニングコース)。 ※Google Trendによると日本での検索数は、2016年当りから交差する形で機械学習が統計学を上回るようになった。機械学習が統計学より広まったのは、ビジネスパーソンであろうが消費者であろうが、意思決定の場面で使われる頻度や処理速度に関連があると思う。 2024年7月初旬 相吉

Analytics
0
タンポポの生存分析をしてみたい

タンポポは、生き生きとしたかつとても響きの良い、好きな日本語の一つである。 語源は、江戸時代頃までは「鼓草(ツヅミグサ)」と呼ばれていたものの、花のかたちが太鼓に似ている、または太鼓を叩くポンポンという音を連想させるとかで、たんぽぽになったという説が有力らしい。英語では「dandelion」と、たんぽぽの花の形がライオンのタテガミに似ているからかと思いきや、ギザギザの葉をライオンの歯に見立てたことから由来しているそう。 タンポポは、春に花を咲かせて夏には枯れてしまう短命のイメージがあるが、実はとても長生きする草本だそうだ。花が散った後、綿毛のタネを飛ばして(あのひらひらとした傘の形の綿毛で運が良ければ100キロ先まで飛ぶそうなので驚く。もちろん大概は数メートルのはずだが)、葉を枯らしてしまうが、しっかり根は残っていて(だからうちの庭の草むしりが大変だった)、そして翌年の春になるとまた茎を立ち上げて葉を伸ばし、花をつける。毎年それを繰り返し、根株が死なない限り何年でも生き続け、寿命は、10年から15年程度だそうなのでこれまた驚きである。 話が変わるが、統計学には生存分析、あるいは生存時間解析というのがあり、生物の死亡や機械の故障など寿命が分析対象で、医学や社会科学の多くの分野に利用されている。医学研究の例を挙げると、ある時間を過ぎて生存する人々の割合はどの程度か、生き残った人々はどの程度の割合で死亡するのか、特定の状況または特性が生存確率にどのような影響を与えるのか、などが挙げられる。SASでは6〜8月に生存時間解析、予測分析、といった講座が開設されているので(SASトレーニングコース )、「寿命」に興味関心がある方はぜひ受講してみて頂きたい。 2024年6月初旬 相吉

Analytics
0
春になると回帰分析を思いだす

春になった。桜の開花時期が気になるが、今年の開花(※)は平年より少し遅かったそう。気温が上がると通常よりも早く咲くことがあるそうだが今年はそうはいかなかった。 桜の開花は主に気温が関わっており、簡単に予想できる方法がある。400度の法則といい、2月1日以降の日々の平均気温を合計して400度を超えると開花する、という代物。600度の法則というものもある。こちらは、平均気温ではなく、最高気温を合計したものだ。 いずれの法則も桜の花芽は秋から冬にかけて「休眠」状態に入り、真冬の寒さで目覚める「休眠打破」を2月1日とし、1日以降の気温の積み上げたものである。この法則が今年は当たらず、公式な開花日は予想より1週間くらい遅れての3月29日だったがとくに700度を超えた時であった。暖冬の影響で休眠スイッチがうまく作動しなかったからという説がある。異常気温の影響もあるだろうし、まさに異常値だった。 実は、上記のシンプルな指標以外に、桜の開花予測には回帰分析というデータ分析の手法が利用されている。気温、降水量、日照量などの気象データで統計モデルを構築して開花日を予測する。この手法は、例えば、一般的にはマーケティングの販売促進やロイヤルティ向上、金融業界では信用取引のスコアリングや不正検出に、医薬業界では疾病リスクや治療効果予測などに広く利用されている。具体的な紹介は、ぜひとも別の機会にしたい。 機械学習やAIばかり注目を浴びている中、その基盤となるものは回帰分析のようなデータ分析の手法であることに忘れてはいけない。5~6月には回帰分析をテーマにしたトレーニングコースが多く開催されるが(SAS Training | スケジュール)、春になったし新たなチャレンジの始まりと、ぜひ受講して新しいスキルを身につけて頂きたいところ。 ところで桜は、実に種類が多く、日本だけでも600種以上が分布しており、色もよく見かける白やピンク色だけでなく緑色もあるそう。とりわけ、日本でよく見かける桜を時間軸でいうと、河津桜、染井吉野、枝垂れ桜、八重桜、冬桜といったところ。うちの近所でピンク色で輝いていたカワズザクラはとくに散ってしまい、染井吉野と八重桜が満開の日を迎えている。 ※桜の開花日とは、標本木で5~6輪以上の花が開いた最初の日をいい、観測対象は主に染井吉野を対象としている(気象庁 | 生物季節観測の情報)。 2024年4月初 相吉

Advanced Analytics | Analytics | Risk Management
KiWan Lee 0
금융기관 '조기경보시스템'을 위한 체크리스트!

급변하는 대외 환경 변화와 지속 가능한 성장을 위한 금융기관 조기경보시스템의 조건   최근 국내 대외 환경은 경기변동성 증가와 저성장 국면 진입의 가속화로 요약할 수 있습니다. 또한, 최근 30년을 돌아보면 ‘97년 외환 위기, ‘08년 글로벌 금융 위기와 ‘20년 COVID19 팬데믹 등 주기적인 경제위기 발생과 더불어 글로벌 경기 민감도 역시 증가한 상황입니다.

Analytics
Hyeshin Hwang 0
증가하는 디지털 금융 사기, 어떻게 대처해야 할까요?

금융 사기 설문 응답자 3분의 2가 금융 사기 경험이 있거나 더 철저한 보안을 원할 경우 이용 업체를 전환하겠다고 응답 보안 인증에 생체정보 활용 선호, 보안 강화 위해 개인 정보 공유 허용 SAS가 최근 16개국 13,500명의 소비자를 대상으로 한 설문조사(Faces of Fraud: Consumer Experiences with Fraud and What It Means for

Advanced Analytics | Programming Tips
Noah Han 0
결측 대체 함수, ‘COALESCE, COALESCEC’ 들여다보기

실무에서 데이터를 다루다 보면 필연적으로 결측 데이터를 만나게 됩니다. 핑계 없는 무덤이 없다는 속담이 있듯, 데이터가 결측인 이유도 정말 다양합니다. 특별한 경우에만 값이 있는 경우, 서버 장애로 관측되지 않은 경우, 응답자가 응답을 거부하는 경우, 데이터 구조가 바뀌면서 새로운 컬럼이 추가된 경우 등등 너무 다양하죠? 오늘 포스팅에서는 이와 같은 결측치를 처리하는

Analytics | Learn SAS | Programming Tips
Noah Han 0
SoDA 서비스 가입하기

SoDA를 이용해 쉽게 배우는 데이터 과학 #2 지난 포스팅에서는 SoDA(SAS Ondemand for Academics)의 장점과 필요성을 중심으로 SoDA가 어떤 제품인지 소개해 드렸습니다. 이번 포스팅에서는 ‘서비스 가입 방법’을 알아보겠습니다. 먼저 SoDA가 서비스 되는 브라우저 환경을 알아보고, 이어서 서비스 가입의 각 단계를 살펴보겠습니다. * 편집자 주 : 이번 글은 SAS코리아  컨설팅 본부 한노아

Analytics | Learn SAS | Programming Tips
Noah Han 0
SoDA로 데이터 과학 시작하기

SoDA를 이용해 쉽게 배우는 데이터 과학 #1 SoDA(SAS OnDemand for Academics)는 SAS가 무료로 제공하는 교육용 데이터 분석 소프트웨어 프로그램입니다. 앞으로 4회에 걸쳐 'SoDA 를 이용해 쉽게 배우는 데이터 과학'을 자세히 소개해 드리도록 하겠습니다.  SoDA란? SoDA (SAS OnDemand for Academics; SoDA)는 데이터 과학을 처음 배우는 입문자들에게 SAS를 무료로 배울 수 있도록

Advanced Analytics | Analytics | Work & Life at SAS
Luis Barrientos 0
ESG, la base para las finanzas sostenibles y el cumplimiento de metas climáticas en el sector bancario

Si bien los datos financieros se han utilizado tradicionalmente para evaluar y comparar el desempeño de las empresas, recientemente se ha sumado un nuevo criterio que va ganando relevancia: la información sobre iniciativas ambientales, sociales y de gobierno (ESG, por sus siglas en inglés), que se está utilizando para evaluar

Analytics
Andrés Mauricio Torres 0
¿Puede la “analítica” acertar en que Inglaterra ganará el mundial de fútbol?

Quienes vivimos en el mundo de los datos y promovemos su aprovechamiento a través de ciencias como las de la analítica predictiva nos enfrentamos constantemente ante preguntas como: ¿puede la analítica acertar el resultado de la lotería? ¿decirme dónde invertir para ganar más? ¿anticipar quién ganará la próxima copa mundial

Work & Life at SAS
Kleber Wedemann 0
Lo mejor de ambos mundos

Asumir nuevas responsabilidades suele ser un momento muy importante para un líder. Más allá de todo el reconocimiento personal, la expansión de las competencias es también un momento muy intenso y humilde: hay muchos colegas con los que conectar, procesos que ajustar, cosas que aprender. También es un momento muy

Analytics
Mike Gilliland 0
Announcing: SAS/IIF Research Grants

The International Institute of Forecasters and SAS® announce two $10,000 grants to support research on forecasting. Per the announcement: Forecasting research has seen major changes in the theoretical ideas underpinning forecasting effectiveness over the last 30 years. However, there has been less impact on forecasting practice. We aim to put this right.

Advanced Analytics | Analytics
José Mutis O. 0
SAS, Microsoft y el futuro de la analítica

Quienes seguimos el Virtual SAS Global Forum 2020 realizado este 16 de junio, tuvimos la oportunidad de disfrutar una conferencia de talla mundial hecha de manera virtual, como bien lo describió nuestra Vicepresidente Mundial de Marketing, Jennifer Chase. Asimismo, tuvimos la oportunidad de presenciar múltiples anuncios hechos durante este día, tal

Analytics
Mike Gilliland 0
Forecasting with SAS (free eBook)

Forecasting with SAS®: Special Collection SAS Press has added to its selection of free downloadable eBooks with the new Forecasting with SAS®: Special Collection. From the description: Want to get the most insight out of your data and improve the quality of your forecasts? SAS offers many different solutions to

1 2 3 9