Uncategorized

Analytics | Data for Good | Internet of Things | Learn SAS
0
サステナビリティ経営へのアナリティクス (1)

はじめに 近年サステナビリティ経営は多くの分野で注目されています。環境・社会の変化や価値観の変革に対応しながら、長期にわたり市場から求められ、継続的に価値提供を行い、社会から信頼され続けることが企業にとって最も重要と考えられています。 最近では、気候変動、COVID-19パンデミックなどの社会環境の変動により、生活者、消費動向、企業活動、サプライチェーンなどに大きな影響を及ぼす中で、どのように対応し取り組んでいくかが喫緊の課題となっています。 今回のブログでは、これらの変化対して持続可能な世界を実現するための「サステナビリティ経営」に関してSASのアナリティクスアプローチをテーマに数回にわたり見ていきたいと思います。 SDGsとESG 地球規模の課題を踏まえた全世界共通の持続可能な成長戦略であるSDGsは、今や大企業の多くがサステナビリティ経営*1の計画にマテリアリティ(重要課題)として織り込み取り組まれています。また、環境・社会・ガバナンスの観点で企業活動を分析評価するESG*2は、企業価値を見通す上での重要性として認識されています。 アナリティクスが果たす役割 環境や社会で起こっている多くの変化は、生活者の価値観および消費活動に変化をもたらします。企業は、その変化を的確に捉え迅速に対応していくことが求められます。それらの変化を近年のデジタル・テクノロジーを用いて迅速に把握し、AIやアナリティクスによるインサイトに基づく意思決定や課題解決、商品やサービスの継続的な改善や高度化などにより新たな価値を提供することは、企業のサステナビリティと競争力を創出し、サステナビリティ経営において非常に重要となります。 中長期計画のマテリアリティとして掲げられたSDGsの達成度評価やESG評価においてもアナリティクスの手法を用いた評価手法やツールが多く用いられ、企業活動の見える化を推進するとともに、投資家などへ開示することでESG投資を促すとともに、企業価値向上や創造を進めています。SASは、AIによるESG管理とレポート作成に関するサービスを提供しています。 また、企業や組織の活動においても、AIやアナリティクスによるインサイトや予測といったデータ利活用をもとに、CO2削減、エネルギー対策、フードロス削減、水資源保全、汚染軽減など様々なサステナビリティに関する課題解決に向けて、アナリティクスが活用されています。*3*4 SASの取り組み SASは自社のCSR活動として、エネルギー節約、GHG(温室効果ガス)排出管理、汚染軽減、水保全、グリーンビルディング、およびその他のプログラムにより環境を改善などに取り組んでいます。また、サステナビリティ経営のリーダーおよび提唱者として、高度なテクノロジーと経験豊富なスタッフにより、多くのソフトウエア、ツール、サービスなどを企業や組織に提供してきています。これらは追って紹介いたします。今回はSASのCSRレポート*5から抜粋してSASの取り組みをいくつか紹介します。 アナリティクスによる人道支援/社会支援 ビッグデータアナリティクスが世界中の短期および⾧期の開発⽬標の達成に役立つという広範な証拠があります。アナリティクスの世界的リーダーとして、SASは、貧困、病気、飢餓、⾮識字などの社会の最⼤の問題のいくつかを解決するために、最先端のテクノロジーと専⾨知識を適⽤することに情熱を注いでいます。 SASは、常により良い世界を構築するためにそのテクノロジーを使⽤することを挑戦しています。国連のSDGsが不平等を減らし、健康的な⽣活を確保するために取り組んでおり、SASはそれがすべての⼈にとってより明るい未来を創造するのを助けることができる機会を探しています。 SASの社会イノベーションイニシアチブは、世界の進歩を加速させ、世界をより持続可能な未来に向けて動かす創造的な⽅法の発見を支援します。 SASがこの⽬標をサポートする⽅法の1つは、 Data for Goodを推進する運動です。貧困、健康、⼈権、教育、環境に関する⼈道問題を解決するために有意義な⽅法でデータを使⽤することを奨励します。 ⾼度なアナリティクスとIoTによる健康なミツバチの個体数の増加 World Bee Countを使用すると、ミツバチのデータをクラウドソーシングして、地球上のミツバチの個体数を視覚化し、これまでのミツバチに関する最大かつ最も有益なデータセットの1つを作成できます。 SASのデータ視覚化により、クラウドソーシングされたミツバチや他の花粉交配者の場所が表示されます。 プロジェクトの後の段階で、研究者は作物の収穫量、降水量、その他のハチの健康に寄与する要因などの重要なデータポイントを重ね合わせて、世界の花粉交配者のより包括的な理解を集めることができます。 Joseph Cazier, アパラチア州立大学分析研究教育センター教授兼常務理事   ミツバチを救うことは私たちの⾷糧供給にとって最も重要であり、⾼度なアナリティクスがミツバチと私たちの未来を維持するための鍵となる可能性があります。 SASのモノのインターネット(IoT)、機械学習、視覚アナリティクス機能により、健康なミツバチの個体数の維持とそのサポートができる可能性があります。 2020年、SASは、テクノロジーが世界中の花粉交配者の個体数を監視、追跡、改善する3つの別々のプロジェクトに参加しました。まず、SASのデータサイエンティストは、聴覚データと機械学習アルゴリズムを通じて、侵入しないで蜂の巣のリアルタイムの状態を監視する⽅法を開発しました。 SASはまた、世界のミツバチの数についてアパラチア州立⼤学と協力して、世界のミツバチの個体数データを視覚化し、それらを保存するための最良の⽅法を抽出しました。さらに、SAS Viya Hackathonの受賞者は、機械学習を通じてハチのコミュニケーションを解読し、⾷料へのアクセスを最⼤化し、⼈間の⾷料供給を増やしました。 困っている⼈を助けるための最善のサポートを理解する 私たちの優先事項は、人生の最も困難な季節を通して家族を支援することです。その仕事の多くは、目に見えないところに隠れているホームレスを支援することです。それが私たちの最善の策です。SASは私たちの目の前でデータを取得し、以前は見ることができなかった隠された洞察を発見することができました。それはSASが最も得意とすることです。正直なところ、完璧な組み合わせでした。 Leslie Covington, Executive Director, The Carying Place     ホームレスに苦しんでいる多くの人は、自給自足できるための指導と支援を求めてThe Carying Place(TCP)に目を向けます。 手書きのドキュメントと一貫性のないスプレッドシートの山の中に27年分のデータがあるため、TCPはSASを利用して、参加者の成功の指標をより適切に測定し家族にふさわしい支援を提供しました。 SASボランティアは、デモグラフィック、保険、住宅、退役軍人のステータス、障害のステータス、予算ファイルなど、参加している家族のデータを分析し、TCPのニーズを最もよくサポートできるモデルを選択しました。

Analytics | Data for Good | Students & Educators
0
あなた自身の「好奇心」に耳を傾けよう

Curiosity Forever SASは約束します。データの探索や、アナリティクスそして学習、これらの進化を止めません。好奇心と能力が出会う時、世界は前進するからです。 SASは、”Curiosity=好奇心”から生まれるユニークで大胆な問いに対して、アナリティクスを用いて解を探すことを大切にしています。これまでにも自然やウェルネス・教育・スポーツなど多岐にわたる分野の好奇心溢れる問いに取り組んでいます。そしてこのCuriosity Foreverを、現代の子どもたちが体験できる環境を築くことが、私たちの未来を豊かにすると考えられます。 データネイティブの世代を育てる準備ができていますか? 1990年代半ばから2000年代前半に生まれたZ世代は、これまでで最も多様性に富み、最も教育水準の高い世代であり、社会変革の原動力として位置づけられています。2014年、Monica Rogati氏は データネイティブという言葉を作り、「データネイティブは、自分たちの世界がスマートで、自分たちの好みや習慣に一貫して適応することを期待している」と述べました。データネイティブの子どもたちは読書量、成績、スクリーンの使用時間などを記録するようになります。スマートで、プログラム可能で、データが豊富な世界で育ちながら、彼らは毎日データに浸かっていると言えるでしょう。 Z世代が社会で活躍する時代の到来とともにテクノロジーも進化し、私たちは膨大なデータを持つことになります。データはこれまで学術研究や政府の政策など、社会の一部に限定されたツールでしたが、今や主流になりつつあり、専門家だけでなく全ての人がデータリテラシーを身につけることが不可欠です。 若者がデータリテラシーへの関心を高める鍵は、生徒が関心を持つ問題にデータリテラシーを結びつけることにあります。これまでの学校教育におけるデータは、数学などの科目でデータの基礎として扱われることが多いです。しかしデータの活用が出来る分野には、社会的不公正との戦い、環境保護、飢餓との戦いなど世の中の実際に起こっていること・子どもたちにも身近なことに広がっていて、それらを通じて若者の生来の情熱に訴えかけることができます。また、データがどのように責任を持って使われ、進歩やイノベーションを促進するのか、子どもたちに伝えましょう。それと同じくらい重要なのは、データサイエンスの分野に自分たちが反映されていることを確認することです。この分野への参加を広げ、多様性を高めることは、社会的格差の縮小に取り組む上で最も重要なことです。 わたしたちはデータに慣れ親しむZ世代の探究心や情熱とともに、私たちは創造性と革新性を育む環境を育み、社会全体をよりよい方向に進めていく必要があります。 ※このセクションはAre we prepared to raise a generation of data native?の内容を要約しています。詳細はこちらをご参照ください。 Curiosity: 東京は暑い! 筆者もZ世代の学生として、好奇心からアナリティクスにつながるちょっとした体験をしました。 上京してきた際に「東京って思ったよりも暑いんだ」と感じてから、都市部の暑さに興味を持ちました。近年、夏に注意を促される熱中症。毎年患者数が増加しており、日本全体で暑さに関する対策として緑のカーテンなど緑化を行っています。しかし、その緑化はどれくらい効果があるかピンとこない気がしていました。そこで今回は仮説として、「緑地率が高い区ほど熱中症患者数が少ない」を立てたので、東京都23区の緑地率と熱中症患者数にどのような関係があるかについて確かめたいと思います。 上図は、年次ごとに東京都23区の100万人当たりの熱中症患者数と緑地率(AVNIR-2の光学センサの衛星データより緑地を抽出して求めた割合)の相関を確かめるために作成した散布図です。 散布図から、6年分全体でみて緑地が増えると熱中症患者が減るという傾向は読み取れませんでした。相関係数0.4と正の方向に相関が少し出ていますが、年次で色分けした部分で縦軸方向に層ができているように見えるので、相関係数のみで判断するのは難しいと考えました。また区ごとに時系列で比較したとき、たった6年で緑被率に大幅な差がありました。これは私が取得できた衛星データに雲がかぶっているなどの原因で、緑地率のデータが正確でないためである可能性もあります。 今回の観察期間で熱中症患者数は年々増加しており、機会があれば、緑地率以外に考えられる要因を集めて影響度を確かめてみたいと思いました。 このように日常生活でふと気づいた疑問を積極的に考えて、実際はどうなんだろうか、何か出来ることはないかとアナリティクスを用いる動きは、学生の好奇心を刺激しデータ活用の第一歩となります。学生の皆さん、いま浮かんだ疑問をデータを使って深掘りしてみませんか? What are you curious about?

Analytics | Students & Educators
0
データアナリティクスにおける統計学の必要性

現代において統計学は様々な分野で利用されており、データアナリティクスとは切っても切れない関係にあります。しかし、実際にデータアナリティクを行う人すべてが、その内容を適切に理解しているのでしょうか。「有意差がつくかどうかとりあえず検定を行ってみる」、「集めたデータ全てをモデルに組み込んでみる」このような経験を持つ方も実は多いのではないでしょうか。分析に用いる手法の仮定や限界、その他解釈や留意事項への理解がないまま行われるデータアナリティクスは、誤った解釈を生む可能性があります。しかし、実社会においては、統計学はその活用事例が注目されがちであり、適切ではない事例が身の回りにあるというのもまた事実です。データアナリティクスを行う側としても、その結果を受け取る側としても、統計学を一般教養として学んでみてはどうでしょうか。 今回紹介するのは、e-learningコース「Statistics 1: Introduction to ANOVA, Regression, and Logistic Regression」です。統計学を学ぶ時に、学習がうまく進まない一つの理由として、各種内容が実際にどう活用されるか、そのイメージがつかないという声を多く耳にします。本コースは純粋な統計学の知識だけでなく、そのような具体的なデータアナリティクスに至るまでの「何を目的とするのか」、「目的によってどのような手法が適切であるのか」といった「データリテラシー」に関する内容も潤沢に用意されているため、一環した流れの中で学習を行う事ができます。このような何のために統計学を学ぶ必要があるのかという点は、どうしても”学問としての”統計学の学習の際には意識がされないため、統計学を初めて学ぶ方だけではなく、簡単にその内容を触れたことがある中級者の方にも最適な学習教材です。 統計学は「記述統計学」と「推測統計学」に分類されます。前者はデータの持つ特徴(最大値、平均など)を記述し、整理することによって、そのデータ自体への理解を行おうというものです。それに対し後者は、データをとある大きな集団からのサンプルであると仮定し、データからその大きな集団(母集団)の持つ特徴について、推測を行うものです。ここでは、実際に推測統計学でよく用いられている「統計的仮説検定」と「統計モデル」という、2つの手法について紹介します。これらについてもコース中ではより詳細に、活用されている事例とともに紹介されているので、ご興味のある方はぜひ一度コースに登録・受講してみてください。登録手順はこちらの以前の記事を参照ください。   統計的仮説検定 ある大きな集団(母集団)に対しその特徴を知りたい場合、すべてのデータを得ることができるのは非常に稀です。例えば、日本国民全員があるテレビ番組Aを見ているかどうかの情報を得ることは、労力的にも、費用的にもほぼ不可能です。統計的仮説検定はそういった場合に、標本である一部のデータを用いて、母集団に対する特定の仮説が成立するか否かを、背理法的に判断する方法です。先のテレビ番組の視聴率調査は、実際にこの考えに基づくものであり、よく見かける視聴率はおおよそ1万世帯のデータをもとに、統計的に推定されています。検定の手順は以下の通りです。 母集団に対し、帰無仮説とそれに対応する対立仮説の計2種類の仮説を設定する 帰無仮説の下で、得られたデータ(とそれ以上に極端な結果)が得られる確率(P値)を計算する 事前に設定した基準(有意水準)とその確率を比較する 基準よりも確率が低いのであれば、そもそも帰無仮説が妥当ではないと判断する(帰無仮説を棄却) 統計学でよく誤解を生みやすい「P値」というものが利用される内容になります。仮説検定は非常によく用いられる方法ですので、自分でどういった手順で検定は行われているのか、その解釈はどう行えばいいのか、を説明できない方は受講してみることをお勧めします。   統計モデル データから母集団の特徴について推定を行う場合には「統計モデル」というものが用いられます。このモデルはなぜ必要なのでしょうか?ここで、日本人の男性と女性の身長について、それぞれ推測をするという例を考えます。また、現実に得られるデータは、男性のみデータだけだとします。すると一つ問題が生じます。それは「女性については推定を行うことができない」ということです。男性については、得られたデータが男性50名の身長データですので、妥当な推定が可能です(ここにも男性の身長分布は正規分布であるという仮定は置きます)。しかし、女性の身長について推定を行おうとしても手元には男性のみのデータしかないため、推定ができません。もし何の仮定もなければ、男性の身長データを女性の身長の推定のために用いることは妥当ではありません。ではここに、『女性の身長の分布は男性の分布より10cm低く、分布の形状は同じである』という仮定があるとどうでしょうか?(いくつかの調査によると期待値としては12~13cmほど低いそうですが) 上記の仮定があるのであれば、男性の身長分布から女性の身長分布が想定可能なので、男性のみのデータからデータには含まれていない女性についても推定を行うことが可能になります。つまり、「統計モデル」とは観測されたデータにはない未知の部分について推測を行うために、仮定する一種の数学的・統計学的な制約条件になります。ただ一概にモデルといっても様々なものがあるため、データの置かれている状況によって想定される適切なモデルは異なり、どれを選択すべきかはケースバイケースです。このモデルの選択をどうすべきかは先行研究やこれまでの知見による部分が大きいため、様々な場面でのデータアナリティクスを学ぶ必要があります。   学生の方であれば今後、卒業研究やコンペティション参加など、多くの場面で統計学の知識が必要になるかと思います。数日学習を行えば統計学への理解が深まるだけでなく、SASから学習認定デジタルバッジを無料でもらうこともできます。ぜひこの機会に一度統計学について、学習を行ってみてはいかがでしょうか?

Analytics | Learn SAS | Students & Educators
0
SASのオンライン学習コース「Skill Builder for Students」の紹介(4)Statistical Analysis, Predictive Modeling, and Machine Learning編

以前の記事では、学生であれば無料で利用可能なオンライン学習コース「Skill Builder for Students」についての紹介を行いました。このSkill Builder for Studentsには5つのコースが準備されており、今回の記事ではStatistical Analysis, Predictive Modeling, and Machine Learningコースについての概要を紹介します。このコースでは統計的仮説検定から回帰分析、予測モデル、教師あり機械学習まで「統計・機械学習モデル」の基礎的な部分と、SASソフトウェアでの実践を学習することができます。 データ析を行う際には、しばしば統計モデルや数理モデルと呼ばれる「モデル」を利用します。このモデルの学術的理論や実装方法を学習する機会は多数ありますが、モデルを利用する目的をはっきり意識できているでしょうか。モデルは現象を数式等で模式的に表現したものですが、このようなモデルによる表現の目的が、その現象に対する説明を行いたいのか、未知のイベントの予測を行いたいのかを区別する必要があります。前者は記述的アナリティクス(および診断的アナリティクス)、後者は予測的アナリティクスと呼ばれます。 記述的・診断的アナリティクスでは、現象を観察して得られたデータから、その現象に関する情報の関連や因果関係を推測し、現象を説明することが目的です。例えば、住宅価格を考えるとき、価格を決定する要素(面積、駅からの距離、築年数、階数、近隣施設など)は何か、どの要素が最も価格と強い関係を持っているかといったことを理解するために統計モデルを活用します。 一方、予測的アナリティクスでは、面積や駅からの距離といった既知の情報から住宅の価格を推定・予測するためにモデルを活用します。記述的・診断的アナリティクスのような「現象の理解」よりも、「予測の精度」に注目することになります。 今回のコースは、このような「何のためにデータアナリティクスを行うのか」という点が特に意識されており、SASでの実装を紹介するだけではなく、統計学の概要、モデルを使って何を考えるのかについてのイメージや理論の説明が豊富に用意されています。近年、アナリティクスに関係する職種を目指す方が増加しており、統計検定に代表されるような資格を取得しようとしている方も多いと思います。それに伴い、関連した書籍・講座が世に出るようになってきていますが、手法のみに着目しているものも多く、「なぜ」、「どんな場面で」その手法を利用するのかをイメージできないものも見られます。今回この記事で紹介しているコースは、そのような今後データに関連する分野に関わっていきたいという初学者の方に特におすすめです。単に統計的手法の実施方法や結果の見方を紹介しているだけではなく、どういったモチベーションでその手法の利用を考えるのか、現実に起こり得るシナリオに沿って理解できる教材だと思います。    Statistical Analysis, Predictive Modeling, and Machine Learningコースへのアクセスは以下の手順です。 Skill Builder for Studentsへログイン 「Learn SAS」というタブをクリック 画面中央の「Start Learning」をクリック 「Statistical Analysis, Predictive Modeling, and Machine Learning」をクリック 展開される各種e-learningコースをクリック 画面下部にある「enroll」をクリック このコースは後述のように、6つの項目に分かれており、各項目にはさらに複数のLessonが準備されています。各項目に含まれるLessonをすべて終了すると学習完了を証明する「SAS digital Learn Badge」(下図)が発行されます。   コースで学習できる内容 Statistics 1:

Advanced Analytics | Data Management | SAS Administrators
SAS Viya Blog ~Azure Fileを利用したWindowsとSAS Viya間のデータ共有方法の紹介~

背景の紹介 これまでのSAS製品は、SAS 9でもSAS Viya 3.5でも、ほとんどがWindowsやLinuxのプラットフォームで動作していました。 そのため、Windowsクライアントを持つユーザーは、SMBサービスやWindowsのファイル共有機能を介して、これらのプラットフォームに保存されたファイルに簡単にアクセスすることができていたのです。 SASが開発した最新のクラウドネイティブ・データアナリティクス・プラットフォーム「SAS Viya」は、WindowsやLinuxなどのOS上で直接動作するのではなく、コンテナ/ポッドの形でKubernetes(以下、K8s)上で動作し、従来の製品とはアーキテクチャが大きく変わっています。K8s上で動作するサービスのコンテナ内のデータは一時的なものなので消えてしまう特徴があります。この点に対して、お客様は最新の製品を使用する際に、K8sに保存したデータをローカルのWindowsシステムからどのようにアクセスするのか、SASで作成したレポートなどのデータをどこに保存するのかという疑問を持つことが多いようです。 今回は、下記の図の構造のような、K8sに保存されているファイルを、比較的簡単な方法でWindowsクライアントと共有する方法をご紹介したいと思います。 本記事の内容は、Microsoft Azure上にデプロイされたSAS Viya Stable 2021.2.3に基づいています。centos 7.9上で、kubectl、kustomization、azure cliなどのコマンドラインツールを利用する作業が含まれているので、Linux、Kubernetes、SAS ViyaのデプロイメントとAzureに関する一定の知識が必要です。また、お使いのクラウドベンダーや製品のバージョンによって、設定方法が異なる場合もありますので、詳細は各ドキュメントをご確認ください。 SAS Viya on Kubernetesが利用するストレージの紹介 まず、K8s上にデプロイされたSAS Viyaサービスを使用した場合のデータの保存方法について簡単に説明します。 例えば、SAS Studioを利用する場合、ユーザーがセッションを作成するたびに、SAS ViyaはK8s上に一つのコンテナを作成します。これは、ユーザーがセッションで実行したすべてのコードや操作がこのコンテナに入っているミニLinux内で実行されます。 ご存知のように、コンテナの最大の利点は、インストール作業や設定などが一切いらず、配置したらすぐに使えることです。コンテナが提供するサービスや機能を使用するために設定を行う必要はありませんが、同時に、コンテナ内のデータに加えた変更も保存されず、新しいセッションを作成するたびに、まったく同じ設定を持つまったく新しいコンテナが作成されます。 そのため、SAS Studioで作成した新しいデータを保存したい場合は、コンテナの外部にあるストレージに保存する必要があります。K8sではこの外部ストレージは永続ボリュームと呼びます。 永続ボリュームを利用することにより、SAS Studioのセッションが終了しても、作業中にユーザーが作成した新しいデータはちゃんと保存されています。次にユーザーが新しいセッションを作成する時、以前使用していた永続ボリュームが新しいセッションに自動的にマウントされ、ユーザーが永続ボリュームに保存されていたデータを使って引き続き作業できます。この記事で紹介するデータ共有方法も、こちらの永続ボリュームを利用しています。 データ共有するための設定方法 次に、K8sで作成したファイルをWindowsと共有する方法を紹介します。前述したように、作業中に発生したデータを永続ボリュームに保存することができるので、永続ボリュームをWindowsにマウントするだけで、作業用PCとK8sの間でデータを共有することができますが、実現方法は使用する永続ボリュームの外部ストレージの種類によって異なります。 AzureのK8sサービス上でSAS Viyaを利用する場合、使用する外部ストレージは、大体以下の3種類です。Azure Fileを共有ストレージとして使用する場合、追加のサーバは必要なく、使い方も比較的簡単なので、本記事ではAzure Fileを外部ストレージとして使用する場合の共有方法を紹介します。 - ネットワークファイルシステム(以下NFS) - Azure Disk - Azure File(本記事で紹介する方法) データを共有するためには、次のような手順が必要です。 これらの手順には、AzureとK8sの管理者権限と関連する知識が必要なため、一般的にはサーバ管理者やSAS Viya導入の担当者が行うことになることに注意してください。 1.ストレージクラスの作成 2.永続ボリューム要求の作成

Analytics | Learn SAS | Students & Educators
金融業界のデジタル化を担うデータサイエンティストの業務とは? 【アナリティクスを活用するキャリア: 信金中央金庫】

「お客様とFace to Faceで向き合うことができるという信用金庫の強みが、コロナ禍により十分発揮できなくなっています。そんな今だからこそ、業界のセントラルバンクである信金中金で、業界のデジタル化を推し進める役割を皆さんも一緒に担いませんか?」 信金中央金庫 しんきんイノベーションハブの狩野 詩生(かのう しゅう)氏は、アカデミア向けにアナリティクス・データサイエンスのキャリアを紹介するイベント「SAS アナリティクス・キャリアシンポジウム」でこう学生に問いかけました。 本イベントは、2021年12月22日(水)、SAS Japan六本木オフィスで開催され、同時にオンライン配信されました。「データサイエンティストが21世紀の最もセクシーな仕事」と言われて10年近くが経とうとしており、企業や組織でデータ活用の役割は徐々に広がりを見せていますが、どのようなスキルをどんな業務に活用しているかについては、まだ一般的ではありません。「データサイエンティストになりたい」と考える学生も、業務内容やキャリアを明確にイメージできないのではないでしょうか。このイベントでは、社会におけるアナリティクス・データサイエンスの活用をアカデミアに紹介するとともに、教育の側からのアプローチも論じます。 信金中央金庫は、全国の信用金庫の「セントラルバンク」として、信用金庫からの預金を投資・融資して運用しています。金融機関では、以前より金融リスクの管理や不正取引の検知の業務において、アナリティクスが活用されてきました。国の経済インフラを担う金融機関が健全な取引を行い、金融犯罪を防止するための対策は、監督省庁が目を光らせる規制業務であり、金融機関が必ず整備しなければいけない領域です。例えば、金融機関が保有している資産が将来どのような価値を持つのか、そのばらつきを予測するために統計学と金融工学をフル活用したり、また、国際犯罪組織による資金洗浄(マネー・ロンダリング)目的の海外送金を検知し、ストップをかけるために、統計モデルや機械学習モデルを構築したり、実は、データサイエンティストが世界の金融を支えているのです。 狩野氏は大学でマーケティングや経営学を専攻し、信金中央金庫で融資業務やコンサルティング業務を経験後、信用スコアリングモデルを作成・研究する業務に従事しました。信用スコアリングとは、端的に言えば、融資先が返済不能になる可能性がどれぐらいあるかを数値化することです。このために、場合分けのルールや統計モデルを活用します。また、最近では、EBM(Event Based Marketing)でのデータ活用に取り組んでいます。入出金データなどから、顧客の資金ニーズを予測し、適切なタイミングで商品を提案できるようにすることが狙いです。従来であれば、大まかな顧客カテゴリに応じた提案しかできなかったのが、予測モデルの活用により、よりパーソナライズされた提案ができるようになります。 このような目的のために、次のような業務があります。 どのようなデータをどのように受け取り、蓄積するかを設計する データのありかを整理し、内容を理解した上で、基礎分析により特徴を把握する 予測モデリングのためにデータの整形・加工を行う 統計学や機械学習を駆使してモデルを構築する データサイエンティストといえば、4番のモデル構築のスキルが重要に思われがちですが、それまでの準備も大切です。狩野氏は、データサイエンティストの業務において求められるスキルとして、「データ理解」「プログラミング」「モデル構築」に加え、「企画・立案」「サービス提供」を挙げています。特に、しんきんイノベーションハブのような組織では、顧客である信用金庫がどのように活用するかも考えてサービスを設計することが必要です。さらに、統計やデータ分析の専門家ではない顧客に説明し、使ってもらえるようにすることも求められています。特に金融機関のアナリティクス活用では「説明力」に重きが置かれており、モデリングにおいても、ブラックボックスのAI・機械学習より、説明力の高い統計モデルが利用されることが多いようです。 また、普段はSASやPythonプログラミングで業務にあたりますが、「どのような分析環境が利用できるかは組織によって異なるので、プログラミング言語については、広く勉強したほうが有利かもしれない」と狩野氏は述べました。「データ理解」についても、入社しないと業務についての知識を得ることは難しいので、組織のなかで学ぶ意欲とコミュニケーション力が重要になります。 信金中央金庫では、全国の信用金庫のデジタル体制の整備を担うため、幅広い業務があり、今後人材需要が高まります。データサイエンスに興味のある学生のみなさん、金融業界での活躍を目指してみませんか? 学生のみなさんは、統計学や機械学習を用いた予測モデルについて、SAS Skill Builder for Students で学習することができます。特に、「Predictive Modeling Using Logistic Regression」や「Machine Learning Using SAS Viya」は、SASソフトウェアの学習と同時に、予測モデルを利用する目的や、モデル構築や評価での注意点を学習できます。SAS Skill Builder for Student については、こちらのブログ記事シリーズもご参照ください。

Analytics | Data Visualization | Learn SAS | Students & Educators
0
SASのオンライン学習コース「Skill Builder for Students」の紹介(3)Visual Analytics and Visual Statistics編

前回の記事では、学生であれば無料で利用可能なオンライン学習コース「Skill Builder for Students」のProgrammingコースについての概要を紹介しました。今回は引き続きまして、Visual Analytics and Visual Statisticsコースについて紹介していきます。 データアナリティクスへの興味・関心は近年急激に増加しています。ただ特に学習を始めた学生では、データアナリティクスと聞くと、どうしても複雑なモデルを組むことや機械学習を実施することだけに意識が向いている印象を受けます。しかしデータアナリティクスの本質はそこではありません。根幹にあるのは意思決定や業績の改善にどれほど貢献できるかです。データの可視化、見える化は学生ですとしばしば軽視されがちな部分ではありますが、意思決定や現状の把握においては非常に有用な有用な方法の一つです。 今回紹介するコースではSAS Viyaプラットフォーム上でSAS Visual AnalyticsとSAS Visual Statisticsを使用し、様々な可視化方法、予測モデルについて学習を行います。これらを学習することによってデータに潜む傾向やパターンを把握し、そしていかにその後のリスク管理や傾向の予測などへとつなげていくかといった実践的なデータアナリティクスを学ぶことが可能です。またSAS ViyaはSASによるプログラミング以外にもRやPythonといった他のプログラミング言語をサポートしているため、SASのコーディングができない方であっても不自由なく利用することが可能となっています。 Visual Analytics and Visual Statisticsコースへのアクセスは以下の手順です。 Skill Builder for Studentsへログイン 「Learn SAS」というタブをクリック 画面中央の「Start Learning」をクリック 「Visual Analytics and Visual Statistics」をクリック 展開される各種e-learningコースをクリック 画面下部にある「enroll」をクリック     Visual Analytics and Visual Statisticsコースの概要 本コースは SAS Visual Analytics 1 for SAS

Analytics | Learn SAS | Students & Educators
0
SASのオンライン学習コース「Skill Builder for Students」の紹介(2)Programming編

前回の記事では、学生であれば無料で利用可能なオンライン学習コース「Skill Builder for Students」についての紹介を行いました。このSkill Builder for Studentsには5つのコースが準備されており、今回の記事ではProgrammingコースについての概要を紹介します。このコースではSASプログラミング言語、そのコーディング方法について学習を行います。 近年、データ解析をプログラミングをせずに行うGUIデータ分析ツールが普及し始め、SASからもEnterprise Guideといった製品が提供されており、データ分析の民主化が進んでいます。もちろんこういったツールによって多くの人がデータ解析に関わる各種機能にアクセスできるようになったことは大変大きなメリットです。 しかし、もし将来データ解析を行う職に就きたいという思いがあるのであれば自分でコードを書き、前処理や解析を行うことができるようになるべきだと個人的には考えています。あくまで個人的な意見になりますがツールに依存してしまうと解析や前処理で実行できることには限界がありますし、またデータに関連する分野の学生であればシミュレーションなどを自由に行うことも難しいです。誤解がないように言うとGUIツールを使うことが悪というわけではなく、GUIのほうが生産性や共有性が高い場面もありますが、いざという時に自らの力で実装できるというのがプロフェッショナルなのではないでしょうか? この記事を見ている方の大部分は、今後データ解析に本格的に携わっていきたい、自らのスキルを増やしたいという方だと考えています。このコースを修了したからと言ってデータ解析のプロフェッショナルになれるかというとそうではありません。しかし、その第一歩としては非常に良い内容だと思います。私自身もこのコースを受講しています。ぜひ一緒に学びましょう!!   Programmingコースへのアクセスは以下の手順です。 Skill Builder for Studentsへログイン 「Learn SAS」というタブをクリック 画面中央の「Start Learning」をクリック 「Programing」をクリック 展開される各種e-learningコースをクリック 画面下部にある「enroll」をクリック コース内にある各レッスンではそれぞれのテーマに沿った内容が動画で紹介がされており、また適宜「Activity」や「Practice」という形で問題も出題されています。学生という立場からの個人的な感想ですが、単に動画を視聴するだけではなく、手を動かしつつ学習を行うことができるという点は非常に良いと感じています。デモとして紹介されている内容についてもプログラミングコードやデータセットも提供がされているので、動画を見つつ別画面で同じ手順を踏むとより理解も深まるかなと思います。 なおこのオンライン学習コースはすべて英語での提供です。もし英語が苦手でちょっと....という方は、動画の下部に動画の内容がすべてテキスト化されているので、適宜翻訳をかけつつ学習を行っていただければいいかなと思います。   Programinngコースの概要 programmingコースでは統計解析を行うためのプログラミングだけではなく、そもそものSASプログラミングの構成や、グラフ・レポートの作成、マクロなどを幅広く学ぶことができます。この記事の最後にあるように8つの項目に分かれており、各項目にはさらに複数のLessonが準備されています。各項目に含まれるLessonをすべて終了すると学習完了を証明する「SAS digital Learn Badge」(下図)が発行されます。   コース内容を実行する環境としては大きく3つあります。 SAS Virtual LabのSAS Studio SAS OnDemand for Academics のSAS Stuido 自らが契約しているSASソフトウェア ただ、今回の学習にあたり推奨するのは一番上の「SAS Virtual Lab」です。各コースでは様々なデータセット、プログラミングファイルを使いますが、SAS virtual Labではそれらがすべて既に保管されています。SAS

Analytics | Learn SAS | Students & Educators
0
SASのオンライン学習コース「Skill Builder for Students」の紹介(1)

私は現在大学で生物統計学を専攻していますが、「SASを使えるようになりたいけど具体的に何をすればいいかわからない...」といった声をしばしば耳にします。医療系に限らず、このような思いを抱えている学生の方も多いのではないでしょうか。以前にSAS Blogに投稿された 【冬休みに勉強しよう】アナリティクスの学習(1) Skill Builder for Students では、学生を対象として、SASソフトウェアや統計解析・機械学習を中心とした基礎的な知識、スキルをe-Learningを通じ習得可能な無料のオンライン学習プラットフォーム「SAS Skill Builder for Students」を紹介しました。 このSkill Builder for Studentsで提供されているe-learningの各項目の内容について、学生目線での簡単な感想とともに連載していきます。ぜひこの機会に一緒にSASを勉強してみましょう!   Skill Builder for Studentsの内容 Skill Builder for Studentsへログインすると「Learn SAS」「Get SAS Certified」「Career Resources」の3つのタブが存在しています。それぞれのリンク先では以下のような情報、学習コースが提供されています。 Learn SAS SASが提供している無料利用なソフトウェアやSAS認定資格についての概要 E-lerningコースと各種資格に対する対策 Get SAS Certificated SAS認定資格受験料割引の機会 試験日程のスケジュールやスコアレポート・デジタルバッジの請求 Career Resources データアナリティクスの専門性を学ぶ意義とキャリアの見つけ方 SASが提供しているインターンシップやフェローシップの紹介 SASコミュニティの紹介 SASソフトウェアに対する知識だけでなく、その後の長期的なキャリアプランも見据えた内容となっています。特に学生の方については、SASを学ぶことによってどのようなキャリアプランがあるのかのイメージがなかなかつきにくいかなと思いますので、その点でもオススメです!   E-Learning コースとSAS認定資格の内容 E-Learning コースと各種SAS認定資格については、「Learn SAS」のタブから、「Start

SAS Administrators
SAS Japan 0
Apache Log4jのCVE-2021-44228脆弱性に関するアップデート

Log4jの脆弱性に関する最近のニュースは、SASのお客様の多くにとって依然として最大の懸念事項です。ここでは、SASによる最新の活動と発見事項を皆様と共有したいと思います。 SASのお客様へ: SASソフトウェア環境およびSAS Cloudホスティング環境のセキュリティと完全性は常に当社の最優先事項です。SASのチームは、Log4j脆弱性に関する報道が出た後の早い時期(2021年12月中旬)に迅速に対応しました。オンプレミス環境のお客様のためには、影響を受けるSAS製品に関する情報はもとより、推奨されるアクションもご案内しました。SAS Viya 2021.2.2には、アップデートされたバージョンのLog4jが含まれています。加えて、当社は「loguccino」という無償ツールをリリースしました。お客様はこれを使うことで、ご利用中のSAS 9.4およびSAS Viya 3.x環境内にある脆弱なlog4jファイル群を検出し、パッチを適用することができます。 SAS Cloudホスティング環境のお客様のためには、「こうした脆弱性が悪用される可能性のある、この環境の複数の側面」を即座に強固にしました。具体的には、ネットワークベースのポリシーの厳格化や監視の増強などです。当社では「これらの公表された脆弱性に特化した形での、SASソフトウェアに関連した攻撃」のエビデンスは一切検知しておりません。 さらなる調査の結果、当社では「Log4j脆弱性自体は深刻であるものの、SASがホスティングされているシステム内におけるLog4jのコンフィグレーションおよび利用法では、エクスポージャーは極めて限定的」と判断しました。いかなる未認証ユーザー(=既存のアクセス権限を持たないユーザー)も、リモートコード実行脆弱性(RCE脆弱性)をトリガーすることはできません。これらの発見事項と既に実施済みの予防措置とを踏まえ、当社では「SAS Cloud内のお客様のSASアプリケーションとデータは安全性が維持されている」という確信を感じています。 さらなる詳細については、本件に関するSAS Security Bulletin(セキュリティ速報)をご覧ください。 ご利用中のSAS環境の生産性・安全性の維持に関する皆様の継続的なパートナーシップに感謝いたします。また、SASのお客様でいてくださり、ありがとうございます! セキュリティ速報のハイライト 上記の速報のアップデートに関する通知を受け取るには、SAS Support Communitiesのトピック「Updates on log4j Remote Code Execution Vulnerability (CVE-2021-44228)」をサブスクライブするか、このRSSフィードをフォローしてください。 SASでは、お客様のために “監査済みの自動化されたアプローチ” を提供する取り組みの一貫として、「loguccino」という脆弱性パッチスクリプトを開発済みです。このloguccinoは「logpresso」に似たツールですが、SASソフトウェア向けにカスタマイズされています。このツールはSAS 9.4およびSAS Viya 3環境を修復するために特別に設計されており、脆弱なLog4j JARファイルを再帰的に検索し、JndiLookupクラスを取り除いた上で、この脆弱性を含まない状態でJARを再パッケージ化します。 上記の速報には、SASがアップデート済みバージョンのLog4jを自社ソフトウェア内にデリバリーするにあたっての計画とタイムラインも記載されています。 SAS Viya 2020.1、SAS Viya 3.5、SAS Viya 3.4プラットフォームおよびSAS 9のSAS Logonプロセス内でのLog4jの利用に関してSASが実施した継続的および継続中の調査では、「CVE-2021-44228に関するコミュニティの理解を踏まえると、未認証のRCEエクスプロイトは現時点では不可能である」という結論に達しています。 大手の脆弱性スキャニング・ベンダー(Qualys、Rapid7、Tenable)はすべて、「この脆弱性に関連した最も一般的な攻撃ベクトル群をチェックするための、アップデートされたシグニチャ群」をリリース済みです。 最後に念のため繰り返しますが、お客様はいつでも当社のSupportサイトで最新のセキュリティ速報(英語)をご覧いただけます。 この記事は、英語版のオリジナルをもとにSAS Institute Japanが翻訳および編集したものです。

1 3 4 5 6 7 14