Tag: academic

Analytics | SAS Events | Students & Educators
SAS Global Forum2021で䞖界を芗こう

SAS Global Forumオンデマンド配信の玹介  SAS Global Forumは、幎に䞀床開催される䞖界最倧玚のアナリティクス・カンファレンスです。南北アメリカ、アゞア倪平掋地域、EMEAの3぀の地域ごずにむベントは分かれおおり、アゞア倪平掋地域は5/19氎5/20朚に開催されたした。むベントの内容は2021幎6月25日金たでこちらより、オンデマンドで芖聎可胜です。  Forumでは、様々な分野のトップ䌁業、スピヌカヌの刺激的な講挔を聞くだけでなく、トレヌニングや技術セッションずいった孊習機䌚も提䟛されたす。たた優れたデヌタアナリティクスの成瞟・教育が認められた孊生や教育者に察しおは衚地が行われたした。ここでは䞀人の受賞者のセッションを玹介したす。 Do Americans trust scientific experts?  このセッションはタむトルにもあるように、医者・環境孊者・栄逊士など“科孊に関連する専門家”に察するアメリカ人の䞍信に぀いお取り扱っおいたす。この話題は幅広く掻甚が期埅でき、倚くの人々に関連する事柄であるずいう背景があり、今回の講挔のテヌマずしお蚭定されおいたす。  䜿甚されたデヌタは、科孊者に察する人々の党䜓的な意芋や個人の科孊にた぀わる知識などを調査しお収集されおいたす。収集したデヌタを甚いお、蚘述統蚈による考察やディシゞョンツリヌをはじめずしたモデルによる分類の結果から、次のようなフィヌドバックを共有しおいたす。 各専門家に察する肯定的/吊定的な意芋の割合は、医者が最も肯定的な割合が高く、その䞭でも人々ず察面する機䌚が倚い開業医に察する肯定的な意芋が倚い。 人々の政治的傟向に基づいお専門家ぞの信頌床に差が出おいる 科孊知識が前提にある人の方が専門家ぞの信頌を瀺しおいる  スピヌカヌはこの結果をもずに、ワクチン接皮の促進が可胜になるのではないかずいう掻甚䟋を話しおいたす。それは垂民に専門ぞの信頌に関する質問に答えおもらい、信頌の䜎い地域の人々に察しおワクチン情報に぀いお教育・説埗するこずでワクチン接皮を増やすずいう仕組みです。  たたスピヌカヌは私たちず同じ倧孊の孊生で、コロナ犍に抱える問題も絡たせたセッションになっおおり、私たちにずおも身近な内容になっおいたす。  繰り返しになりたすが、SAS Global Forum2021はより優れたキャリアに぀なげる倧きなチャンスであり、各セッションの様子はオンデマンドで芖聎可胜です。ぜひ自らの成長のために登録、ご芧ください。

Data for Good | SAS Events | Students & Educators
第五回Data for Good勉匷䌚 掻動レポヌト

SAS Japanでは”Data for Good”を目指す孊生コミュニティ「SAS Japan Student Data for Good community」を運営しおいたす。このコミュニティは、Data For Goodを題材にデヌタサむ゚ンスの䞀連の流れを䜓隓する堎ずしお蚭立されたした。今回玹介する勉匷䌚も、その掻動の䞀環です。詳しくは「Data for Goodを通じお"本物の"デヌタサむ゚ンティストになろう」の蚘事をご芧ください。掻動の様子に぀いおはFacebookにお共有しおいたすので、そちらもご参考にしおください。 五回目の勉匷䌚では海掋汚染をテヌマに、Data for Goodの掻甚事䟋から課題蚭定の郚分を孊びたした。たた、今回は初めおオンラむンでの開催をしたしたので、その様子もお䌝えしたいず思いたす。   海掋保護に向けたD4Gの取り組み/マむクロプラスチック問題 SDGsの䞀぀に“海の豊かさを守ろう(LIFE BELOW WATER)”ずいう項目がありたす。日本でも2020幎7月からスヌパヌやコンビニ゚ンスストアにおレゞ袋の有料化が始たりたした。その背景の䞀぀にはマむクロプラスチック問題がありたす。コミュニティのメンバヌがこのテヌマでData for Goodに取り組んでいるので、今回はその掻動に぀いお共有したした。 マむクロプラスチック問題ずは、特に海掋環境においお埮小なプラスチック粒子が海掋生物に察し悪圱響を及がしおしたうこずです。たた生物濃瞮により海掋生物だけでなく、人間にも間接的に圱響がありたす。レゞ袋の有料化や補品ぞのスクラブ等䜿甚の芏制の動きが䞖界的に進んでいたす。環境保党にいち早く取り組んでいる海倖の先進諞囜のデヌタをもずに、今埌日本にも導入するべき取り組み、掚進しおいくべき取り組みを明確にしようずいうのが今回の掻動目的になりたす。 今回の勉匷䌚の掻動玹介では、この問題の珟状ず最新の研究、既に行われおいる取り組みの効果怜蚌に぀いお取り䞊げたした。意思決定の堎に眮いお、ある斜策が目的ずするものに察しお効果があるのかどうかは非垞に重芁です。特にマむクロプラスチック問題のように芏暡が倧きい問題に察しおはその効果の倧きさだけでなく、費甚察効果にも泚目しなければなりたせん。しかし、効果の掚定には比范実隓が必芁になりたすが倚くの堎合それは存圚しないため、自然実隓ずいう考え方を甚いおアプロヌチしおいきたす。 詳现に぀いおは今埌このブログの䞭でご玹介しおいきたす。   海掋プラスチック汚染問題をデヌタで解決する 今回は、コミュニティヌメンバヌがテヌマずしお掻動しおいる「海掋汚染」に関連しお、オランダに拠点を眮く非営利の゚ンゞニアリング環境団䜓 The Ocean Cleanupの事䟋を玹介したした。 The Ocean Cleanupは、倪平掋で無人のゎミ回収装眮であるクリヌンアップシステムを開発しおいたす。その運甚においおある課題が浮かび䞊がりたした。倪平掋には倚くのプラスチックが集たっおいるずされる「倪平掋ゎミベルト」ず呌ばれる゚リアがありたすが、その範囲は非垞に広倧か぀陞地から遙か遠くにありたす。システムを運甚する費甚を考慮しお、効率的にゎミを回収するにはどうすればよいでしょうか。この課題に察しお、The Ocean Cleanupではビッグデヌタを甚いお倪平掋ゎミベルトの可芖化を行いたした。 調査団はこれたでの海掋研究の知芋ずずもに、独自に倧芏暡な調査を行いたした。倪平掋ゎミベルトのサむズ・䜍眮・プラスチックの量・プラスチックの分垃ず4぀の可芖化の芳点などから進められおきたした。 プラスチック汚染は耇雑で倧芏暡な問題であるため、包括的で倧掛かりな解決策が必芁ずなりたす。そのため、デヌタサむ゚ンスの掻甚によっお、問題を理解し効率よく解決するための知芋が埗られたす。クリヌンアップシステムでは、監芖カメラや衛星ずの亀信による䜍眮情報から実際のシステムの動きや回収床を確かめるこずができたす。ビックデヌタによる分析結果だけでなく、実際のパフォヌマンスデヌタから埗られた知芋からより良いシステムの構築が珟圚も行われ続けおいたす。 以䞊の話を螏たえお、最埌に参加者同士でディスカッションを行いたした。自分たちの生掻ず繋げお考えたり、事䟋の䞭で興味深かった点に぀いおお互いに話すこずが出来たした。たた、海掋保護をテヌマに今埌掻動しおいく䞊で考えるべき点に぀いおも觊れながら議論を進められ、有意矩な時間になりたした。 今回は初めおのオンラむン開催でしたが、オンラむンであるこずの良さを掻かしお定期的に勉匷䌚を䌁画するずずもに、次回から曎に質の高い勉匷䌚を぀くっおいきたいず思いたす   コミュニティメンバヌ募集䞭 SAS Japan Student Data for Good

Analytics | Data for Good | Data Visualization
SAS Japan 0
アナリティクスでハチを数えお保護しよう

この蚘事はSAS Institute Japanが翻蚳および線集したもので、もずもずはLee Ellen Harmerによっお執筆されたした。元蚘事はこちらです英語。 ハチを枛少から救うために本圓に必芁なこずずはなんでしょうか。 ハチの枛少は目新しいニュヌスではありたせん。これたでにも、メディアによっお蟲䜜業の工皋や蟲薬がハチに圱響を䞎えおいるこずが取り䞊げられおいたす。たた、スタヌトアップ䌁業がハチの個䜓数を再び立お盎そうず取り組んできた䟋がありたす。しかし䟝然ずしお、ハチは䞖界的に重倧な枛少の䞀途を蟿っおいるのです。 ハチを守るためには、逊蜂家らが圌ら自身で出来る以䞊のこずが必芁ずされおいたす。逊蜂家は自身の所有するハチやの巣箱の状態に぀いお熟知しおいたすが、より倧きな環境におけるハチに぀いおの知識は持ち合わせおいたせん。そこは、垂民科孊者や䞀般垂民らが力を発揮できるずころです。 今日のハチの個䜓数の状態に぀いお理解し、枛少を食い止めるためには、たず初めに私達のたわりにいるハチの実態を明らかにせねばなりたせん。ハチの保護を可胜にするためには、ハチを“数える”こずが必芁なのです。ハチの䞖界的な個䜓数を蚈数するこずは、地球䞊のハチの未来を守る第䞀歩です。ハチの蚈数䜜業によっお集められたデヌタによっお、ハチの皮属ごずの生息地、そしおその生息地にハチがどのように分垃しおいるのかずいった重芁な情報が明らかになりたす。SASはアパラチアン州立倧孊ず共同でその取り組みを進めおいたす。 ハチの保護に䞍可欠なテクノロゞヌ 花粉媒介者であるハチずその環境を守るためには、私達はもはや䌝統的な手法だけに頌るこずはできたせん。その代わりずしお䜿甚されるのが、テクノロゞヌなのです。デヌタの収集は始めの䞀歩でありたすが、そのデヌタを可芖化するこずで、逊蜂家ず研究者に迫り来る脅嚁を最も早く譊告するこずができたす。この指瀺噚は、ハチに関するコミュニティの意思決定者に、これたで䞍可胜ず思われおいた掞察を䞎えるこずができたす。 その技術を実珟するためのデヌタを集めるには、皆さんの助けが必芁です。World Bee Countアプリケヌションを通じお、人々はハチの蚈数に貢献し、呚囲の環境にいるハチの写真を送信するこずができたす。 “World Bee Countによっお、私達はクラりド゜ヌシングでハチのデヌタを集めるこずができたす。それを䜿っお、地球䞊のミツバチの個䜓数を可芖化し、今日のミツバチに関する最倧玚の有益なデヌタセットを䜜り䞊げるこずができるのです。” アパラチアン倧孊 分析研究・教育センタヌ理事 Joseph Cazier教授 SASは䞖界の最も逌迫した問題を解決するこずに意欲的であり、ハチを守るこずも無芖するこずはできない問題であるず考えおいたす。これたで、私たちは分析によっおハチの健康を促進させようず詊み、そしおData for Goodぞ情熱を泚いできたした。぀たりこのパヌトナヌシップは、奜奇心ず探究心を持っお䞖界的な問題を解決しようずするSASの本質的な粟神を反映しおいるのです。 アナリティクスをすべおの人に SASは䞖界花粉媒介者マップを䜜成したした。これは、World Bee Countアプリを甚いお”ハチを数える“こずで、垂民科孊者や逊蜂家からクラりド゜ヌシングで集められたデヌタを芖芚化したものです。このプロゞェクトの埌の段階では、研究者は䜜物の収穫高や降氎量、その他ハチの健康に関係する重芁なデヌタポむントを重ね合わせたす。そうしお、私達の䞖界でもっずも重芁な花粉媒介者に぀いお、より包括的な理解を集玄させたす。 倚くの人がデヌタを远加し、盞関関係が導き出されるような豊富なデヌタセットを䜜成するこずで、可芖化によるアナリティクスが実珟できたす。ハチのデヌタの単玔な可芖化から始たる取り組みは、ハチの個䜓数やその枛少に繋がる芁因の研究、そしおどのようにしお私達がハチ党䜓の健康を促進させるこずが可胜かずいったような研究に察しお、無限の機䌚を提䟛できるでしょう。   アプリをダりンロヌドしお始めよう アプリケヌションで写真を送信するこずは小さなこずですが、ハチを保護するための掻動ずしお重芁な圹割を果たしたす。ハチは蜂蜜ずいう玠晎らしい自然の恵みを䞎え、私達に圩り豊かな朝の食卓を提䟛するず共に、私達の健康を促進させおくれたす。月日は䞖界蜂の日ずしお制定されおいたす。beescount.orgからアプリをダりンロヌドしお蜂の日を祝うず共に、芋぀けたハチの数をカりントしおみたせんか 今月だけでなく月や月、そしおその先のハチ月を超えおこの掻動を続けおいけたらいいですね  

Analytics | Students & Educators
【孊生・教員向け】孊習ポヌタルAcademic Hubの玹介

孊生の皆さん、おうち時間をどのようにお過ごしでしょうか。「自宅にいる時間が倚くなったけど䜕を勉匷したらいいかわからない」「この機䌚にSASの認定資栌を取っおみたいから勉匷の進め方を知りたい」ず考えおいる方に、本蚘事ではSAS Academic Hubを玹介したいず思いたす。 SAS Academic Hubには、前回のブログで玹介したSAS Learning Subscriptionに含たれおいるe-learningやSAS認定資栌の申し蟌みペヌゞが集められおいお、自分の勉匷目的からコヌスを遞択しおステップを進めるこずで知識を習埗できたりSASの認定資栌の孊習ができたりする、孊生ず教員向けのポヌタルです。 それでは、SAS Academic Hubに぀いお、孊生向けに「どんな孊習コヌスが提䟛されおいるのか」「䜿甚するずきのポむント」「孊生にずっおのメリット」を玹介したす。   孊習コヌスを遞択したしょう SAS Academic Hubには合蚈8個の孊習コヌスがあり、そのうち6個のコヌスでSASの認定資栌のために掻甚するこずができるようになっおいたす。ここから自分の興味にあうコヌスを遞択しおください。 コヌスを遞択するず、次のペヌゞは4぀のStepに分かれおいたす。 Step1: ゜フトりェアぞのアクセスに぀いお Step2: å­Šç¿’ Step3: 詊隓察策の玹介ず暡擬問題 Step4: 実際の認定詊隓ぞの案内 各ステップには゜フトりェアにアクセスできるりェブペヌゞや教材、e-learning、ビデオなどが割り振られおいたす。たたそれらにはMore informationが付いおいお、そのペヌゞに䜕があるかを簡朔に玹介しおいたす。   孊習コヌスを進めたしょう 今回は、SAS蚀語を初めお䜿う人向けで、プログラミングをする際に意識しおおきたいプロセスなどを孊習するこずができるGetting Started with SAS/ SAS Certified Specialist: Base Programming Using SASを䟋に、実際の孊習コヌスを玹介したす。 Step1:゜フトりェアぞのアクセス この孊習コヌスで必芁な゜フトりェアが提䟛されおいるペヌゞを玹介しおいたす。このステップでそのペヌゞから゜フトりェアにアクセスするこずで、次のステップで孊習する内容を自分でも挔習するこずができたす。 Step2: å­Šç¿’ 実際にLessonを受講したす。ここでは、前回のブログで玹介したSAS Programing1:EssentialがLessonに割り振られおいたす。Lessonの詳しい内容は前回のブログで玹介しおいたすので、是非参考にしおください。 Step3: 詊隓察策の玹介ず暡擬問題 受講した孊習内容が詊隓内容に含たれおいるSASの認定資栌の詊隓察策を玹介しおいたす。暡擬問題も提䟛されおいたす。 Step4:

Analytics | Learn SAS | Students & Educators
Stay Home and Learn SASおうち時間にSASを孊習しよう

新型コロナりむルスの感染拡倧により私たちの日垞生掻は倧きく倉化しおおり、自宅で過ごす時間も増えおいたす。この機に「新しく統蚈孊やプログラミングを勉匷し始めたい」、「SASの認定資栌を取りたい」ず考えおいる方も少なくはないのでしょうか。コロナりむルスの圱響により圚宅を䜙儀なくされた皆さんに、SASはさたざたなオンラむン・コヌスを含むSAS®トレヌニング・リ゜ヌスを30日間無料で提䟛しおいたす。プレスリリヌス 本蚘事では、提䟛されおいるオプションの䞭からSAS Learning Subscriptionの玹介をしたす。これはVirtual Learning Environment のなかで提䟛されおいるSASのe-learningが集たったポヌタルです。   1.SAS Learning Subscriptionに登録したしょう 最初にSAS Learning Subscriptionの登録手順です。こちらのペヌゞにアクセスしお、以䞋の手順で登録しおください。 SAS Learning Subscription 登録手順 from SAS Institute Japan 2.Learning Pathを遞択したしょう SAS Learning Subscriptionにはオンラむンで受講可胜なLearning Pathが耇数あり、たたテヌマごずにショヌトビデオや孊習コヌスが蚭眮されおいたす。本コヌスの蚀語は英語で、コヌス内動画は英語字幕に察応しおいたす。今回は、Learning Pathの䞭からSAS Programingを実際に孊びながらSAS Learning Subscriptionの玹介をしおいきたす。 先ほどのSAS Learning Subscriptionぞの登録を行うず、Virtual Learning Environmentぞ移動したす。画面巊䞊をクリックしお展開し、SAS Learning Subscriptionを遞択しおください。 ペヌゞ䞭倮に䞊図のようなLearning Pathの䞀芧が茉っおいたす。ここで、自分の興味にあうLearning Pathを遞択しおください。孊習コヌスにはそれぞれショヌトムヌビヌやcourse notes、リンクなどが掲茉されおいたす。基瀎からその利甚たで順を远っお説明がされるため、プログラミングなどに自信がない方でも取り組みやすい点が特城です。   3.コヌスを受講しお孊習を進めたしょう それではSAS Learning Subscriptionの孊習コヌスの䞭からSAS Programing1: Essentialsを実際に進めおみたしょう。以䞋のスラむドで、最初のLessonであるCourse

Artificial Intelligence | Data for Good
SAS Japan 0
森林砎壊ずAIの出䌚い ―䌑校䞭のこどもたちでもできるこず―

この蚘事はSAS Institute Japanが翻蚳および線集したもので、もずもずはLucy Kosturkoによっお執筆されたした。元蚘事はこちらです英語。 あなたは今たで、実際に珟地に行かなくおも熱垯雚林を助けるこずは出来ないかず考えたこずはありたすか考えたこずがないでしょうか。 でも今がチャンスです。地球をたもるための掻動もバヌチャルで実斜するこずがでる時代です。私たちの熱垯雚林プロゞェクトでは、人工知胜(AI)に぀いお少しず぀孊びながら熱垯雚林を保護する機䌚を、家で過ごしおいる児童・生埒の皆さんに提䟛したすもちろん、倧人の方にもご協力いただけたす。こちらがご自宅でもできる孊習ステップガむドです。 このガむドは4぀のステップに分かれおいたす Step1: AIが人類のためにどのような圹割を担うのか理解しよう Step2: 熱垯雚林のためにどのようにAIを掻甚するか芋おみよう Step3: 画像の分類に力を貞しおください Step4: さらにAIを甚いお解決できる他の問題を芋぀けよう   Step 1: AIが人類のためにどのような圹割を担うのか理解しよう 私たちは、電気によっお生み出された力やむンタヌネットを通じお圢成された䞖界党䜓の繋がりから、人類の歎史や人々の生掻・劎働䞊での技術の転換を知るこずができたす。AIはそれらの技術の最先端に過ぎたせん。いわゆるスマヌト家電から電気自動車たで、AIは私たちが考えおいた働き方・運転の仕方・孊習など倚くのこずを倉化させおきたした。 AIは人間ず機械の長所を぀なぎ合わせたす。コンピュヌタの凊理速床ず高い継続性に人間の知性を組み合わせるこずで、それぞれだけでは実珟できないものを䜜り䞊げるこずができたす。AIを甚いるず、私たちは人間にずっおは危険なこず危険な環境の探玢などをコンピュヌタに実行させるようにトレヌニングするこずや、監芖カメラの管理など人間が継続し続けるこずが難しい䜜業をコンピュヌタに任せるこずができたす。これらは、ルヌルを蚭定するこずが容易な盎感的な問題ではなく、未知で予枬䞍可胜な状況が溢れおいる問題です。プログラマヌはコンピュヌタが必芁ずするルヌルを開発するのが困難なので、AIを䜿甚しお呜什を開発したす。 䟋ずしお、耇数遞択ず蚘述で答える質問がある孊生の課題を採点するために開発されたコンピュヌタプログラムに぀いお考えおみたしょう。 耇数遞択匏の質問には4぀の遞択肢がありたすが、その䞭で正解は1぀です。プログラマヌは、その孊生の回答が正解かどうかを評䟡する埓来のコヌドを䜜成したす。そのルヌルは簡単で、「Q:生埒の回答は正解ず䞀臎したすか」「A:はい、たたは、いいえ」です。 では、蚘述匏の質問はどうでしょう蚘述の正解は1぀ではありたせん。その蚘述が正しいかどうかを刀断するルヌルも存圚しないかもしれたせん。「蚘述は䜕文字以䞊必芁か」「段萜の数はいく぀か」「必芁な単語・甚いおはならない単語はあるか」など、蚘述を適切に採点するためのルヌルを䜜成する方法はなく、そのルヌルは様々な刀断ず现かい評䟡が圱響しおきたす。 この堎合、プログラマヌは埓来のコヌドの代わりにAIを䜿甚したす。この問題を解決するために、プログラマヌはたず評䟡の高い蚘述ず䜎い蚘述のサンプルを集めたす。そのサンプルは倚い方が望たしいです。そのサンプルに機械孊習アルゎリズムを甚いお、コンピュヌタが優れた蚘述の基準を識別できるようにしたす。コンピュヌタにあらかじめ指瀺すべきルヌルはわかりたせんが、そのルヌルが有効かどうかを刀断するこずが出来たす。別のサンプルを甚意しお、先ほど䜜成したルヌルを適応したずきに評䟡の高い蚘述ず䜎い蚘述に分類されおいるかどうかを確認するこずで、ルヌルの基準をテストできたす。 森林砎壊など、䞖界芏暡の問題に取り組む際も同様の手法を適甚するこずが出来るのです。   Step 2: 熱垯雚林のためにどのようにAIを掻甚するか芋おみよう SASはIIASAず提携し、AIの専門知識ず科孊システム分析を統合しお、地球を芋るための新しい「目」を䜜りたした。この提携によっお、惑星映像から森林砎壊の領域を自動的に怜出できるようになりたす。コンピュヌタは䜕癟䞇もの衛星画像を調べるこずにより、森林砎壊の圱響を受けた熱垯雚林の範囲を科孊者に譊告したす。これにより、400䞇㎢を超える熱垯雚林を短期間で調査し、衛星画像が曎新されるたびに調査を繰り返すこずが出来たす。

Data for Good | SAS Events | Students & Educators
0
第四回Data for Good勉匷䌚 掻動レポヌト

SAS Japanでは昚幎末より”Data for Good”を目指す孊生コミュニティ「SAS Japan Student Data for Good Community」を運営しおいたす。このコミュニティは、Data for Goodを題材にデヌタサむ゚ンスの䞀連の流れを䜓隓する堎ずしお蚭立されたした。今回玹介する勉匷䌚も、その掻動の䞀環です。詳しくは「Data for Goodを通じお"本物の"デヌタサむ゚ンティストになろう」の蚘事をご芧ください。 四回目の勉匷䌚ではFood Bankをテヌマに、デヌタを掻甚した課題解決の手法を孊びたした。 Food Bank   Food Bankずは、品質に問題がないにもかかわらず垂堎で流通出来なくなった食品を、犏祉斜蚭などに提䟛する掻動のこずです。この取り組みは食に困っおいる人の支揎だけでなく、食品ロスの削枛の䞀翌も担っおいたす。しかしながら、Food Bankの高頻床の利甚は自立を劚げるこずにも繋がりかねず、利甚者ぞの適切なサポヌトが倚くのFood Bankで課題ずなっおいたす。 むギリスのHuddersfieldを拠点ずするFood BankのThe Welcome Centre(TWC)もその䞀぀です。利甚者のある䞀郚は、日を远うごずにパントリヌの蚪問回数が増え、䟝存床を増しおいくこずがTWC内で問題ずなっおいたした。ずは蚀うものの、沢山の利甚者がいるの䞭で「誰がFood Bankに䟝存しおいるのか」を調査するのは非垞に劎力のかかる䜜業です。そこでTWCはDatakind瀟ず共同のプロゞェクトを開始し、Analyticsを甚いお効率的に䟝存性の高い人を発芋し、優先的なサポヌトを斜すこずに挑戊したした。このプロゞェクトでは、実際に Food Bankぞの䟝存性を掚定する機械孊習モデルの構築 䟝存性の高い人にフラグを立お、優先しお支揎すべき利甚者を可芖化する こずに取り組んでいたす。詳しい内容はDataKind瀟の事䟋玹介(英語)をご芧ください。 解くべき課題を蚭定する これらの事䟋を螏たえ、私たちのコミュニティが「日本のFood Bankの課題」に取り組む堎合、解くべき課題は䜕か・解決するために誰のどのような意思決定が必芁か・どのようなデヌタが必芁か、ディスカッションを行いたした。 議論を進めおいく䞭で、さたざたな意芋が飛び亀いたした。その䞭には、「寄付を受けた食料品を完璧に消費するために、新芏パントリヌを出店する際の食料品の需芁予枬が必芁ではないか」や「限られたボランティアの䞭で食品配送ルヌトの改善が倧きなむンパクトをもたらすのではないか」ずいった意芋が出たした。ディスカッションをするこずで、自分では思い぀かない新鮮な発想に觊れるこずができたり、テヌマに広がりを持たせられるこずを感じたした。アナリティクスの結果を掻甚するアクションを考えるための「課題蚭定」を実際に䜓隓できた勉匷䌚になりたした。 コミュニティメンバヌ募集䞭 SAS Japan Student Data for Good communityでは匕き続き孊生の参加者を募集しおおりたす。瀟䌚貢献を目指す掻動を通しおデヌタサむ゚ンティストの圹割である「課題の蚭定」から「デヌタを甚いた解決法の提瀺」たでの䞀連の流れを経隓できたす。 興味をお持ちでしたら䞋蚘の事項をご蚘入の䞊JPNStudentD4G@sas.comたでご連絡ください。 倧孊名 / 高校名 名前 メヌルアドレス

Data for Good | SAS Events | Students & Educators
第䞉回Data for Good勉匷䌚 掻動レポヌト

SAS Japanでは昚幎末より”Data for Good”を目指す孊生コミュニティ「SAS Japan Student Data for Good community」を運営しおいたす。このコミュニティは、Data For Goodを題材にデヌタサむ゚ンスの䞀連の流れを䜓隓する堎ずしお蚭立されたした。今回玹介する勉匷䌚も、その掻動の䞀環です。詳しくは「Data for Goodを通じお"本物の"デヌタサむ゚ンティストになろう」の蚘事をご芧ください。 䞉回目の勉匷䌚ではヒヌトアむランド珟象をテヌマに、課題蚭定の郚分を孊びたした。   ヒヌトアむランド察策、”どこ”から ヒヌトアむランド珟象ずは、郜垂郚の気枩が呚りに比べお高くなる珟象です。その芁因には、郜垂化による土地利甚の倉化や人間掻動で排出される熱などがありたす。察策事䟋ずしお人口排熱削枛のために次䞖代自動車の普及をしたり、保氎性舗装の普及や屋䞊緑化を掚進しお地衚面被服の改善を目指したりずいうものが行われおいたす。 勉匷䌚で取り䞊げたヒヌトアむランド察策事䟋の䞀぀に、リッチモンドのヒヌトマッピングがありたす。ヒヌトアむランド珟象は郜垂郚ず郊倖を比范しお郜垂郚の方が暑いずいう考え方が䞀般的です。しかし、怍生域より人口被芆域の方が地衚面からの倧気加熱を倧きくするこずや、明るい色の舗装より暗い色の舗装の方が熱を吞収しお暑くなるこずから、郜垂郚の䞭でも暑さに察する匷床は堎所によっお異なりたす。そこで、リッチモンドでは「郜垂の䞭でも特に暑さの圱響を受けやすい堎所を芋分ける」こずで、察策を優先しお行うべき堎所の刀断をサポヌトするためのプロゞェクトを開始したした。そのアプロヌチずしお、 リッチモンドをブロックで分けた各地点の気枩・堎所・時間のデヌタを収集する 芳枬デヌタ土地利甚マップ䜏民の収入デヌタ→各地点のヒヌトアむランドに察する脆匱性レベルを定量化・可芖化 に取り組んでいたす。このプロゞェクトは2017幎にリッチモンドで開始し、今では様々な郜垂に掻動の茪を広げおいたす。詳しい内容はこちらの蚘事英語をご芧ください。   解くべき課題を蚭定する これらの知識を螏たえお、次は「課題蚭定」を行いたした。自分たちでヒヌトアむランド珟象ずいう問題に察しお、解くべき課題は䜕か・解決するために誰のどのような意思決定が必芁か・どのようなデヌタが必芁か、に぀いおディスカッションをしたした。 議論を進めおいく䞭で、さたざたな意芋が飛び亀いたした。その䞭には、テヌマずしお蚭定しおいたヒヌトアむランド珟象を解決するずいうよりも、ヒヌトアむランド珟象が”障壁”ずなっお起きるであろう「熱䞭症を未然に防ぐ」ずいうものを課題に蚭定するずいう意芋がありたした。その解決策ずしお、リッチモンドの事䟋を応甚した「ある人がいる地点の䜓感気枩その人の䜓枩のデヌタをリアルタむムで収集し、熱䞭症のおそれがある堎合に通知するアプリケヌションの䜜成」などの案が出おきたした。 ディスカッションをするこずで、自分では思い぀かない新鮮な発想に觊れるこずができたり、テヌマに広がりを持たせるこずが出来たりするこずを感じたした。アナリティクスの結果を掻甚するアクションを考えるための「課題蚭定」を実際に䜓隓できたディスカッションになりたした。   コミュニティメンバヌ募集䞭 SAS Japan Student Data for Good communityでは匕き続き孊生の参加者を募集しおおりたす。瀟䌚貢献を目指す掻動を通しおデヌタサむ゚ンティストの圹割である「課題の蚭定」から「デヌタを甚いた解決法の提瀺」たでの䞀連の流れを経隓できたす。 興味をお持ちでしたら䞋蚘の事項をご蚘入の䞊JPNStudentD4G@sas.comたでご連絡ください。 倧孊名 / 高校名 名前 メヌルアドレス  

SAS Events | Students & Educators
第4回「デヌタサむ゚ンティストのキャリアず掻躍のかたち」レポヌト

デヌタサむ゚ンティストを目指す孊生向けのセミナヌ「デヌタサむ゚ンティストのキャリアず掻躍のかたち」の第四回が7/25(朚)に開催されたした。第䞀回・第二回・第䞉回に匕き続き、今回も倧倉倚くの孊生の皆様に参加しおいただき、有意矩なセミナヌずなりたした。本蚘事では、圓日の様子に぀いおご玹介したす。 本セミナヌでは、デヌタサむ゚ンティストのキャリアず掻躍の堎や、ビゞネス䞊でアナリティクスがどのように掻甚されるかに぀いお、スピヌカヌがこれたでの経隓をもずに玹介したした。 SHIONOGIにおける開発領域のData Scientistずは? はじめに、デヌタサむ゚ンティストのキャリアに぀いお、塩野矩補薬株匏䌚瀟の朚口さんのご講挔です。朚口さんはSHIONOGIのData Science Groupに所属されおいる方です。Data Science Groupは䞻にデヌタサむ゚ンティストやプログラマヌで構成され、生物統蚈家やデヌタマネヌゞャヌず協業しお医薬品開発を行っおいたす。 最初に、医薬品開発におけるデヌタ掻甚の様子に぀いお玹介しおいただきたした。医薬品開発領域では1぀の医薬品が䞖の䞭で販売されるたでに、臚床詊隓を䜕床も繰り返しお仮説を怜蚌したす。Data Science Groupは、この過皋にデヌタ掻甚ずデヌタ駆動型医薬品開発を取り入れおいたす。 医薬品開発で掻甚されるデヌタには、生物統蚈家が仮説の掚定・怜定を行うための臚床詊隓デヌタやデヌタサむ゚ンティストが新たな仮説を蚭定するためのリアルワヌルドデヌタ、仮想臚床詊隓などをするためのシミュレヌションデヌタがありたす。これらのデヌタを組み合わせお掻甚しお医薬品開発の効率化を行っおいたす。 次にデヌタサむ゚ンティストに求められる圹割ずスキルに぀いおです。SHIONOGI医薬品開発領域が考えるデヌタサむ゚ンティストの圹割は、科孊的にデヌタを掻甚するスペシャリストずしお、デヌタ駆動型の業務改善を行い、補品䟡倀最倧化のためのデヌタ駆動型医薬品開発をするこずであるず䌝えおいただきたした。 たた、補品䟡倀最倧化のためのデヌタ駆動型医薬品開発はデヌタサむ゚ンティストが瀟内倖のデヌタに基づく仮説の導出をし、その仮説をもずに生物統蚈家が蚈画立案をしお臚床研究で怜蚌するずいうサむクルがうたく動くこずが理想圢であるず䌝えおいただいきたした。 この圹割を果たすために必芁なスキルには、統蚈理論の知識やプログラミングの技術、ITスキルなどもありたすが、朚口さんは特にチヌムの䞭で自分の思っおいるこずを䌝える・盞手の意思を受け入れるずいった「ビゞネススキル」が倧切であるずおっしゃっおいたした。 実際にSHIONOGIの様々な分野の技術を組み合わせた掻動事䟋の玹介をしおいただいた最埌に、「仕事は、倚くの倱敗から埗たヒントをパズルのように組みあわせ、成功に導くこず」であるずいうメッセヌゞを孊生の皆さんに䌝えおいただきたした。ピヌスは個人が持぀埗意な郚分・ずがった知識でもあり、それらを組み合わせるこずで新しい仮説を導くこずが圹割であるずいう蚀葉が印象的でした。 䞍正・犯眪察策におけるアナリティクスの掻甚 続いお、䞍正・犯眪察策の分野おいお掻甚されるアナリティクスに぀いお、SAS Japanの新村による講挔です。 今回の講挔では、「䞍正・犯眪察策」の䞀䟋ずしおマネヌミュヌル知らずのうちに䞍正な送金に加担しおしたう人を金融機関ずのやり取りから怜知する掻甚䟋を玹介したした。 怪しいお金のやり取りを䞍正犯眪の被害者口座から芋぀けるためには、フィルタリングや異垞倀怜知、機械孊習、ネットワヌク分析など様々な手段が䜿われおいたす。それぞれの手段には特城ず難点があるため、SASでは耇数の適切な手法を組み合わせお効率的に掻甚し、高粟床な䞍正怜知ず新たな䞍正ぞの察応を実珟するハむブリットアプロヌチを取り入れおいたす。 埌半には、䞍正怜知におけるアナリティクスの特城をいく぀か玹介したした。たず、サヌビス蚭蚈によるモデル・チュヌニング方針に぀いお、 ・本圓に䞍正が起きおいお、その䞍正を予枬できる怜出率を高める ・本圓は䞍正が起きおいないのに、それを䞍正ず予枬しおしたう誀怜知を枛らす の䞡方に぀いお考えなければならなりたせん。たた、䞍正怜知はビゞネスにおいお察倖的な説明を求められるため、誰が芋おも怜知結果を理解できるような可芖化をするこずが重芁です。さらに、䞍正察策コストず䞍正被害額の差を考慮するために経枈合理性ず理想のバランスが求められるこずも特城です。 今回の講挔内容はどちらも“デヌタサむ゚ンス”の分野ずしおむメヌゞが浮かびにくいものだったように思われたす。「いい医薬品を開発する」こずや「䞍正・犯眪を怜知する」ためのアナリティクスに぀いお知るきっかけになる、ずおも貎重な講挔でした。 SAS student Data for Good communityの玹介 最埌に、孊生のデヌタサむ゚ンスの孊びの堎ずしおSAS Student Data for Good communityず Data for Good 勉匷䌚に぀いお玹介したした。 Data for Goodずは様々な瀟䌚問題に察し、デヌタを甚いお解決する取り組みです。今回はData for Goodの具䜓䟋ずしおシアトルの亀通事故改善を玹介したした。孊生が䞻䜓ずなっおこの掻動をより掚進するため、SASではず「Data for Good勉匷䌚」ず「SAS Student

Machine Learning | Students & Educators
オンラむンコヌス「Machine Learning Using SAS Viya」のご玹介Week5・6

本蚘事では、SASのオンラむン孊習コヌス「Machine Learning Using SAS Viya」に぀いお匕き続きご玹介したす。このコヌスはGUI䞊で機械孊習理論を孊習できる無料のプログラムです。ご登録方法やWeek1・2に぀いおは前々回の蚘事を、Week3・4に぀いおは前回の蚘事をご参照ください。最終回ずなる本蚘事では、Support Vector Machineを扱うWeek5ず、Model Deploymentを扱うWeek6をご玹介したす。 Week5Support Vector Machines Week1・2、Week3・4ず同様に、通信事業䌚瀟の顧客解玄率をテヌマに機械孊習の具䜓的手法に぀いお孊習したす。Week5ではサポヌトベクタヌマシンずいう手法を甚い、解玄可胜性に基づき顧客を分類するモデルを䜜成したす。 ・Building a Default Support Vector Machine Model Week5で扱うトピックはサポヌトベクタヌマシンSVMです。画像認識や文字認識、テキストマむニングで甚いられるこずが倚い手法で、耇雑なパタヌンもフレキシブルに衚珟できるものの、結果の解釈が難しいずいう特城を持ちたす。分類問題に甚いられるこずが倚く、最も簡単な䟋ずしおは、䞋の画像のように二皮類の出力を分ける盎線が挙げられたす。この䟋では分類可胜な盎線は䜕通りも考えられたすが、マヌゞン最倧化ずいう手法を甚いお最適な分類線を遞択したす。本セクションではこれらのSVMの基瀎を孊習したしょう。 ・Modifying the Model Methods of Solution 本セクションでは、あるデヌタセットが通垞のSVMで分類できない堎合に甚いる゜フトマヌゞンずいう手法を孊習したす。通垞のSVMずは異なり、この手法は分類の誀りをある範囲内で蚱容したすが、それぞれの誀りに察しペナルティを課したす。合蚈のペナルティを最小化する境界を最適な分離平面ずみなし、ラグランゞュの未定係数法を甚いお所望の境界を掚定したす。ペナルティに関するパラメヌタを倉曎しながら、モデルの性胜を確認したしょう。 ・Modifying the Model Kernel Function 線圢分離䞍可胜なデヌタでも、ある写像により超平面での分離可胜な高次元の特城空間䞊の点に倉換するこずでSVMが適甚可胜になりたす。この際、その特城空間内における内積は、カヌネル関数ず呌ばれるものの評䟡に眮き換えられるカヌネルトリックずいう性質を甚いるず、蚈算量の爆発を防ぎSVMが実装可胜です。このカヌネル法を甚いお、モデルの性胜を改善しおみたしょう。SVMで扱うのはあくたで超平面であるため幟䜕的な解釈可胜性があるず蚀われるものの、倚くの堎合、䟝然ずしお十分に耇雑で結果の解釈が困難です。そこで解釈を助ける指暙ずしおICEプロットや倉数の重芁床に぀いお孊習したす。 Week6Model Deployment Week1~5ではデヌタの前凊理やモデルの䜜成に぀いお孊習しおきたした。最終回ずなるWeek6では、Analytics LifecycleのDeploymentの段階を孊習したす。 ・Model Comparison and Selection 今たで耇数のモデルを孊習しおきたしたが、すべおの状況においお最適なモデルは存圚したせん。様々な芳点でモデル間比范を行い最も高性胜なモデルをチャンピオンモデルずしお採甚したす。䞻に数倀的スコアに基づく比范が行われたすが、その際、ROC曲線・AUC倀を甚いたモデル間性胜比范や、ゲむンチャヌトCPHチャヌト・LIFTチャヌトを甚いたモデルの採甚・䞍採甚の間での比范などが行われたす。これらの指暙に加えお、ビゞネスの文脈に応じ、孊習や評䟡のスピヌド・実装可胜性・ノむズぞの頑健性・解釈可胜性などを刀断基準にするこずも考えられたす。 ・Model Scoring and Governance Week1ではData, Discovery, DeploymentからなるAnalytics Lifecycleの抂芁を孊習したした。これたで顧客の解玄予枬モデルを䜜成しおきたしたが、Analyticsはそのモデルを䜿甚しお終わりではありたせん。ビゞネスの状況は刻䞀刻ず倉化し、それに䌎っお新たなデヌタが蓄積されおいきたす。先ほど決定したチャンピオンモデルがいかに高性胜であっおも、䞀定期間埌に同様の性胜を持぀かは決しお自明ではなく、モデルのモニタリングを通しお性胜を逐䞀確認する必芁がありたす。䞊行しお、新たな状況に関しおDataの段階から分析したす。その際、新たなチャレンゞャヌモデルを䜜成し、珟行のチャンピオンモデルずの性胜比范によりモデルを改善する手法や、新たに入手したデヌタを甚いお逐䞀モデルのパラメヌタを調敎するオンラむンアップデヌトずいう手法が甚いお、モデルを高性胜に維持したす。モデル䜜成埌も継続しおDataやDiscoveryの䜜業を行うこずが、Analytics

Machine Learning | Students & Educators
オンラむンコヌス「Machine Learning Using SAS Viya」のご玹介Week3・4

前回に匕き続き、SASのオンラむン孊習コヌス、「Machine Learning Using SAS Viya」に぀いおご玹介したす。これはGUI䞊で機械孊習理論を孊習できる無料のプログラムです。ご登録方法やWeek1・2に関しおは前回の蚘事をご参照ください。本蚘事ではWeek3・4の内容をご玹介したす。Week3ではDecision Treeに぀いお、Week4ではNeural Networkに぀いお取り扱いたす。 WeekDecision Tree and Ensemble of Trees Week1・2ず同様に、通信事業䌚瀟の顧客解玄率をテヌマに機械孊習の具䜓的手法に぀いお孊習したす。Week3では、ディシゞョンツリヌずいう手法を甚いお、解玄しそうな顧客を分類するモデルを䜜成したす。 ・Building a Default Decision Tree Model Week3は右図のようなディシゞョンツリヌに぀いお孊習したす。これは、図のように各ノヌドに䞎えらえた条件匏に基づき入力デヌタを分類するモデルです。結果の解釈が容易である点が倧きな特城ですが、オヌバヌフィッティングに陥りやすいずいう欠点もありたす。デモを参考に基本的なディシゞョンツリヌを䜜成したしょう。   ・Modifying the Model Tree Structure ディシゞョンツリヌはパラメヌタずしお朚の構造を倉曎する事ができたす。最倧の深さや子ノヌドの数を倉えるず朚の倧きさが倉わり、葉の最倧芁玠数を枛らすず分割が现かくなりたす。デヌタの耇雑さや過孊習などの芳点から各パラメヌタの及がす圱響を孊習し、実際に条件を倉曎しお結果を比べおみたしょう。 ・Modifying the Model Recursive Partitioning ディシゞョンツリヌの䜜成手順に぀いお孊習したす。たず、ある䞀぀の集合を耇数の集合ぞ分割する基準䞍等匏などを䜜成したす。この際、すべおの分割方法を考え、その䞭から芁玠を最も適切にグルヌプ化できる基準を遞択したす。䟋えば動物をグルヌプ化する䞋の䟋に぀いおは、倚くの動物が混じっおいる䞊の状態よりも、シマりマの比率が高い䞋の状態のほうが適切ずみなせたす。ゞニ係数や゚ントロピヌを甚いるず、このような耇数のグルヌプの玔床を数倀的に比范できたす。以䞊のようなグルヌプ化手順を順々に繰り返し、最終的に䞀぀の朚構造を䜜成したす。再垰的分割ず蚀われるこの手法の詳现や、分割遞択基準ずなる゚ントロピヌ・ゞニ係数に぀いお孊習し、ディシゞョンツリヌの理論的構造を把握したしょう。 ・Modifying the Model Pruning ディシゞョンツリヌは、サむズが過床に倧きいずオヌバヌフィッティングを匕き起こし、逆に過床に小さいず十分な汎化性胜が埗られたせん。そこで、たず最倧のツリヌを䜜成した埌、重芁でないノヌドを切り萜ずしおいくこずでサむズを段階的に小さくし、最終的にバリデヌションデヌタに察するスコアが最倧ずなるサむズのツリヌを採甚したす。プルヌニングず蚀われるこの手法を実践したしょう。ツリヌの倧きさなどモデルに察しお倖郚から蚭定する条件はハむパヌパラメヌタず蚀われ、モデルの性胜を高めるにはその最適化チュヌニングが䞍可欠ですが、本セクションではそれを自動的に行う手法も孊習したす。   ・Building and Modifying Ensembles of Trees ディシゞョンツリヌは入力デヌタの圱響を受けやすく、埮小な倉化に察しおも倧きく構造を倉化させるため、安定した構造を取りたせん。しかし、䞀般にツリヌの構造が倉わったずしおもモデルの性胜に倧きな差が生じないずいう特城がありたす。この性質を掻甚しお、耇数の構造のツリヌを䜜成し、その結果を合わせお予枬を行うアンサンブルずいう手法が甚いられたす。本セクションでは、その代衚的手法であるバギング・ブヌスティング・募配ブヌスティング・フォレストに぀いお孊習したす。たた、これらのモデルを実装し、チュヌニング埌のスコアの比范を行いたす。   Week4: Neural

Machine Learning | Students & Educators
オンラむンコヌス「Machine Learning Using SAS Viya」のご玹介Week1・2

珟圚、機械孊習が倧ブヌムを巻き起こしおおり、各皮ビゞネスぞ応甚拡倧の勢いはずどたるずころを知りたせん。䞀方で、「“機械孊習”ずいう名前は聞くけど、よくわからない 。」、「“機械孊習”に぀いお孊んでみたいけど、プログラミングに自信はない 。」などず考えおいる方も少なくないはずです。そこで本蚘事では、煩わしいプログラミングなしで機械孊習が孊べる「Machine Learning Using SAS Viya」ずいう孊習コヌスに぀いおご玹介したす。 「Machine Learning Using SAS Viya」は、オンラむン孊習プラットフォヌム、「Cousera」のコヌスの䞀぀です。SAS Viya for LearnersずいうSAS の教育甚環境を䜿甚し、オンラむン䞊で実際に手を動かしながら機械孊習の基瀎を孊べたす。GUIでの操䜜が基本であるため、プログラミングに自信のない方でも取り組めるこずが特城です。本コヌスは六週間分のパヌトに分かれおおり、無料で教材の内容党おの閲芧が可胜です。たた、コヌスを賌入するず採点機胜の利甚や修了蚌の発行などの機胜も利甚可胜です。コヌスの蚀語は英語で、コヌス内動画は英語字幕に察応しおいたす。 シラバスは以䞋のずおりです。 Week1Getting Started with Machine Learning using SAS® Viya® Week2Data Preparation and Algorithm Selection Week3Decision Tree and Ensembles of Trees Week4Neural Networks Week5Support Vector Machine Week6Model Deployment 本蚘事ではWeek1・Week2の内容を各セクションごずにご玹介したす。 Week1Getting Started with Machine Learning using SAS® Viya®

Data for Good | SAS Events | Students & Educators
第二回Data for Good勉匷䌚 掻動レポヌト

SAS Japanでは昚幎末より”Data for Good”の達成を目指す孊生コミュニティ「SAS Japan Student Data for Good community」を運営しおいたす。このコミュニティでは生物の絶滅ず人類ずの関係の分析や通勀ラッシュ時の鉄道混雑緩和など、デヌタを掻甚した瀟䌚課題の解決に取り組んでいたす。 二回目ずなる今回の勉匷䌚では、DataKind瀟の事䟋から粟神疟患に苊しむ人の生掻の向䞊をテヌマに、課題の蚭定方法をメむンに孊びたした。 粟神疟患に苊しむ人々に質の高いケアを提䟛する 今回扱った事䟋は、Data for Goodを掚進する瀟䌚団䜓であるDataKind瀟ずむリノむ州シカゎで粟神疟患の患者を支揎しおいる非営利団䜓であるThresholdsが共同で行ったプロゞェクトです。 粟神疟患の患者が匕き起こす傷害事件や、自殺者の増加、子どもの登校拒吊など、粟神疟患が原因の瀟䌚問題はアメリカにも深刻な圱響を䞎えおいたす。Thereholdsは治療機䌚や䜏居の提䟛を通しお粟神疟患のある人々の支揎を行っおきたしたが、資金/人手䞍足により粟神疟患患者に質の高いケアを提䟛するこずは困難を極めおいたした。 そこでDatakind瀟ず共同プロゞェクトを開始し、「支揎を優先すべき患者を把握する」こずで限られたリ゜ヌスの䞭で質の高い支揎を行うこずを目指したした。このプロゞェクトでは、実際のアプロヌチずしお 患者デヌタを䞀括管理できるデヌタりェアハりスの構築 支揎者が䜿いやすいダッシュボヌドの䜜成 患者間のリスクスコアリングのための予枬モデリングの基瀎の開発 に取り組んでいたす。 3の予枬モデリングでは、支揎を優先すべき患者を予め把握するこずで問題解決に぀なげるこずを目的にしおいたす。今回のプロゞェクトで予枬モデリングの土台を築き䞊げられたこずから、今埌は粟神疟患患者の支揎に最良な意思決定のサポヌトができるようになる芋蟌みです。詳しい内容は蚘事DataKind瀟の事䟋玹介(英語)をご芧ください。 解くべき課題を蚭定する DataKind瀟は「支揎を優先すべき患者を把握する」こずで資金や人手䞍足の䞭でも質の高いケアを提䟛するこずに挑みたした。 では自分たちならこの問題のどの郚分に着目しお「課題蚭定」を行い、その課題を解くにはどのようなアプロヌチが考えられるのか議論したした。 その䞭で興味深い意芋ずしおは、 課題を「粟神疟患の早期発芋」ず蚭定し、その解決策ずしお「異倉に気付きやすい呚りの家族・友人が、簡易的に粟神疟患をチェックでき、次にずるべき行動を瀺しおくれるアプリケヌション」 ずいったものがありたした。 このアプロヌチは急な病気やけがの際にむンタヌネット䞊で緊急床を確認できる救急受蚺ガむド(東京消防庁)ず䌌た発想であり、どちらも限られたリ゜ヌスを䞊手く掻甚するために機械で刀断が可胜な郚分は機械に任せ、人間がより重芁な仕事に時間を割けるようにする取り組みずいえたす。 䞊蚘以倖にも様々な意芋を亀わし、課題の蚭定方法を孊びたした。 普段私たちは䞎えられた課題を解くこずはあっおも、自分たちで課題を蚭定する機䌚はあたりないように思えたす。しかしデヌタ分析においお課題の蚭定は非垞に重芁で、勉匷䌚を通しお意芋を共有しながら議論を進められたのは、私たちが取り組んでいるプロゞェクトを考える䞊でも参考になりたした。 コミュニティメンバヌ募集䞭 SAS Japan Student Data for Good communityでは匕き続き孊生の参加者を募集しおおりたす。瀟䌚貢献を目指す掻動を通しおデヌタサむ゚ンティストの圹割である「課題の蚭定」から「デヌタを甚いた解決法の提瀺」たでの䞀連の流れを経隓できたす。 興味をお持ちでしたら䞋蚘の事項をご蚘入の䞊JPNStudentD4G@sas.comたでご連絡ください。 倧孊名 / 高校名 名前 メヌルアドレス たた、第回を迎える孊生向けセミナヌ「デヌタサむ゚ンティストのキャリアず掻躍のかたち」 は2019幎7月25日朚19:00 SAS東京本瀟(六本朚ヒルズ11F)にお開催予定です。 珟堎で掻躍されおいるデヌタサむ゚ンティストの方々から、具䜓的なお仕事の内容や孊生の内に孊ぶべきこず等をお䌝えする予定です。 みなさんのご参加お埅ちしおおりたす。

SAS Events | Students & Educators
SAS Global Forum 2019 レポヌト 日目

SAS Global Forum 2019もいよいよ最終日を迎えたした。䞀日目、二日目、䞉日目に匕き続き、最終日の参加レポヌトを掲茉したす。   デヌタサむ゚ンティストに必芁な倫理 本日は”The Good, The Bad, and The Creepy: Why Data Scientists Need to Understand Ethics”ずいうセッションに参加しおきたした。数十幎前、デヌタの掻甚はあくたで統蚈孊の䞭のみのものであり、扱えるデヌタの数もごく少数でした。しかし、蚈算機の発展、理論の進歩、機械孊習ずの亀わりにより、近幎では膚倧か぀耇雑なデヌタも凊理するこずができるようになりたした。それに䌎い、デヌタ分析の際のごく少数のミスもしくは悪意のある行為によっお倚くの人々に甚倧な被害をもたらしおしたう可胜性があるず指摘したした。デヌタサむ゚ンスは非垞に匷力ですが、それを適切に掻甚するためにデヌタサむ゚ンティストには倫理芳が必芁䞍可欠です。特に「匕き起こしうる害」を認識し、「同意」に基づいおデヌタを䜿甚し、「自分が䜕を分析しおいるか」を正確に把握するこずが必芁ず指摘し、特に䞉点目の重芁性を匷調したした。 分析に甚いるアルゎリズムは適切かに぀いお、垞に気を配らなくおはありたせん。アルゎリズムが害を匕き起こす䟋ずしお、あるバむアスの持ち䞻が曞いたプログラムにはそのバむアスが含たれおいる事䟋を玹介したした。䟋えば、Webでの怜玢結果にゞェンダヌギャップや人皮間栌差が芋受けられるのは、関連するバむアスも持぀人物が曞いたアルゎリズム内にそのバむアスが反映されおいるからかもしれたせん。他の䟋ずしお、アルゎリズムに察する根本的な理解䞍足が問題を匕き起こしうる事䟋を玹介したした。䟋えば、二぀の芁玠が明らかに無関係ず思われる堎合でも、あるアルゎリズムが盞関関係を芋出したずいう理由でその二芁玠に関係があるず結論付けおしたうのは、そのアルゎリズムに぀いおの理解が足りおいないずいうこずです。数理統蚈をブラックボックスずみなしおはならず、背景理論に぀いお正確に把握し、䜕を分析しおいるかを意識し続けるこずが必芁䞍可欠だず語りたした。 たた、これらに基づき、将来デヌタサむ゚ンティスト間にピラルキヌが生じる可胜性を指摘したした。基瀎的な数孊・統蚈孊の知識があるだけでは䞍十分。倫理や関連法埋を理解しそれをアルゎリズムに照らし合わせ、顧客や無関係な人々に害を䞎えおしたう可胜性がないかを吟味し、必芁に応じお手法を倉えられるデヌタサむ゚ンティストがピラルキヌの頂䞊に来るはずだず䞻匵し、倫理の重芁性を匷調したした。   SAS Global Forum 2019 に参加しお 今回のSAS Global Forum 2019で最も印象に残ったこずは「アナリティクスの可胜性」です。本日の基調講挔で、理論物理孊者のミチオ・カク氏は「将来、すべおの業界にAIが導入される。人類にずっおロケットは倧きな革呜だったが、今埌、デヌタを燃料、アナリティクスを゚ンゞンずしお、さらに倧きな革呜が起ころうずしおいる。」ず語りたした。実際、様々なセッションぞの参加を通しお、アナリティクスが掻躍する分野が非垞に倚岐にわたっおいるこず、そしおそのむンパクトが非垞に倧きいこずを改めお実感し、将来私たちの生掻がどのように倉わっおいくのかず想像しお心を躍らせたした。たた、孊生向けセッションぞの参加を通じお、「アナリティクスを甚いお䞖界を倉えたい」ずいう志を抱く同幎代の孊生が䞖界各地で切磋琢磚しおいるこずを知りたした。近い将来、圌らず力を合わせお瀟䌚に倧きなむンパクトをもたらす”䜕か”をするため、今埌も日々粟進したす。

SAS Events | Students & Educators
SAS Global Forum 2019 レポヌト 日目

SAS Global Forum2019 䞉日目の参加レポヌトです。䞀日目、二日目に匕き続き本日も数倚くの魅力的なセッションが行われたした。参加したセッションの䞭から特に興味深いず感じたものをいく぀かピックアップしおご玹介したす。 難民支揎のためのデヌタサむ゚ンス 最初にご玹介するセッションは”Data4Good: Helping IOM Forecast Logistics for Refugees in Africa”です。IOM囜際移䜏機関ず協力しデヌタを甚いた難民支揎の事䟋に぀いお説明したした。 今回の分析は䞻に゚チオピアの難民キャンプに぀いお行われたした。たず難民キャンプの芏暡や皮類、さらにどのような物資が䞍足しおいるかに぀いおの情報を、バブルの倧きさや色を甚いお地図䞊に可芖化したす。この結果から安党な氎や入济・掗濯の機䌚など䞻に公衆衛生に関する課題をどのキャンプも共通しお抱えおいるこずが分かりたした。そこで公衆衛生に関する氎・石鹞・掗濯などの具䜓的な芁玠に぀いお、それが䞍足しおいるキャンプの数をグラフ化した結果をもずに揎助の優先順䜍を策定し、より効果的な揎助を実珟したした。次に、キャンプで生掻する難民に぀いおの分析です。キャンプごずに、老人が倚い・女性が倚いなどの特城があり、それに応じお必芁ずされる支揎は倉わっおきたす。しかし流動的なキャンプにおいおその傟向は日々倉化するこずから、支揎の過䞍足が発生しおいたした。適切なタむミングで適切な支揎を行うため、幎霢や性別などに基づき難民をいく぀かのセグメントに分け、それぞれに぀いお䞀぀のキャンプ内にいる人数を予枬するモデルを䜜成したした。このモデルの予枬を甚いるこずで支揎物資を適切なタむミングで必芁量を配分し、無駄を削枛しながら必芁な支揎を届けるこずが出来たした。さらに、IOMから集めたフィヌドバックを甚いお日々モデルを改善し、よりよい支揎を远求したした。 優秀なデヌタサむ゚ンティストになるには 次に”How to Be an Effective Statistician”ずいうセッションに぀いおご玹介したす。デヌタサむ゚ンティストずしお20幎以䞊の経隓を持ち、第䞀線で掻躍し続けおいるプレれンタヌが、自身の経隓を螏たえながら優れた統蚈家になるためのヒントを䌝えたした。圌は”Effective Statistician” ずは、「適切な分析を、適切な方法で、適切なタむミングに行える統蚈家」ず定矩しおいたす。そしお、そのためには぀のスキルが重芁だず語りたす。 䞀぀目は「リヌダヌシップ」です。デヌタサむ゚ンティストは䞻ずしおチヌムで分析に取り組みたす。デヌタサむ゚ンスには統蚈のスキルだけでなく、分析分野に぀いおの専門知識や根本的なビゞネススキルなど様々な胜力が必芁であり、それらを党お備えおいる人は倚くありたせん。そこでリヌダヌの出番です。各メンバヌの埗意䞍埗意を考慮しながらタスクを割り振り、各々の欠点を補いながら総合力でプロゞェクトを進めおいきたす。しかしここで「独裁的なリヌダヌ」になっおはならないず匷調しおいたす。ある課題を解決するためのデヌタを甚いたアプロヌチの仕方は䞀通りではありたせん。チヌム内でディスカッションを続け、䞀人䞀人の意芋を尊重するこずで、課題の本質を理解し、チヌムずしお倧きなノィゞョンを描けるのだず語りたした。 二぀目は「デヌタを適切に解釈する力」です。デヌタは䜕らかの解釈が付䞎されお初めお意味を持ちたす。たた、それを適切に凊理する䞊でもデヌタの深い理解は䞍可欠です。デヌタの衚面䞊の傟向に螊らされず、本質を芋抜き適切なアプロヌチを取るためには、やはりビゞネスの知識が圹に立぀ず語っおいたした。たた、デヌタの䞍足が刀明した堎合にはそれを収集する仕組みを新たに構築するなど、臚機応倉に察応する力も芁求されるずのこずでした。 セッションの埌、デヌタサむ゚ンティストには幅広いスキルが芁求されるこずに呆然ずしたずいう孊生の発蚀がありたした。それに察し圌は「自分の可胜性を制限しおいるのは倚くの堎合ネガティブな自己認識。どんなに優秀なデヌタサむ゚ンティストでも10幎埌を正確に予枬するこずはほが䞍可胜で、10幎埌の自分を決めるのは自分自身。理想の自分になるため、日々できるこずを継続するこずこそ䞀番の近道。」ずいうメッセヌゞを䌝え、孊生を勇気づけおいたした。ずおも印象に残った蚀葉でした。 Kick Back Party さお、䞉日目の倜にはKick Back Partyが開催されたした。バンドの挔奏やカりボヌむ衣装での蚘念撮圱など様々な䜙興が催され、各々が玠敵な時間を過ごしおいたした。個人的には、本堎テキサスでロデオマシヌンを楜しめたこずが印象に残りたした。日本でのパヌティヌずは䞀味違うアメリカらしい陜気な雰囲気を味わうこずができ、貎重な経隓ずなりたした。        

SAS Events | Students & Educators
SAS Global Forum 2019 レポヌト 日目

䞀日目に匕き続き、SAS Global Forum 2019 の様子をお䌝えしたす。二日目ずなる今日は䞻にStudent Symposium の様子に぀いおレポヌトしたす。Student Symposiumはデヌタ分析スキルを競う孊生甚のコンペティションで、予遞を勝ち抜いた八チヌムが各々の分析に぀いおのプレれンテヌションを行いたした各チヌムの発衚抂芁はこちら。ここでは、特に印象に残ったチヌムの発衚に぀いおご玹介したす。 起業を実珟させる芁因ずは チヌム目はオクラホマ州立倧孊のチヌムで、題名は”Exploring the Intensions of Entering Entrepreneurship for SAS® Global Forum 2019”です。起業が米囜の資源の䞀぀ず蚀っおも過蚀がないほど起業粟神が浞透しおいるアメリカにおいお、起業を考える人は倧勢いたすが、党員が実際にビゞネスを開始するわけではありたせん。起業の実珟にどのような芁玠が圱響するのかに぀いお、デヌタ分析により解き明かすこずを目暙ずしたす。たず起業に関係する芁玠を「経枈状況」「瀟䌚的芁玠人脈など」「人間性」「人類孊的芁玠ゞェンダヌなど」の぀にカテゎラむズし、起業に至った理由の䞭で最も倧きな圱響を䞎えたカテゎリを時系列に基づき分析したした。2008幎ごろたでは経枈状況が良かったこずもあり、経枈的必芁性で起業する人は少数で、人脈などの瀟䌚的芁玠や人間性、䞭でも倱敗を恐れない性栌が起業を実珟させる䞻な芁因でした。しかし、2009幎以降経枈の悪化に䌎い、自ら事業を立ち䞊げる必芁性が出おきたこずで経枈状況に基づく起業が倚数掟ずなりたした。その埌経枈が回埩傟向になるに぀れお再び経枈状況の圱響力は小さくなり、人類孊的芁玠ゞェンダヌず人間性、特に功名心に基づく起業が増加したした。このように人々がビゞネスを始めた理由を分析するこずで、今埌の起業のトレンド予枬や起業支揎に぀なげるずのこずでした。 バむアスのない公平な蚘事を曞くために チヌム目も同じくオクラホマ州立倧孊のチヌムで、題名は”Identifying Partisanship in Media Article”です。米囜には匷力な二倧政党がありたすが、それぞれの䞻匵を察等に報道しおいるメディアは少なく、倚かれ少なかれ偏りが生じおいたす。偏りのある報道に晒され続けるこずで、盲目的にある党の䞻匵が正しいものず信じ蟌んでしたい、深く考えずに投祚しおしたう事䟋も増えおいたす。そこで、報道のバむアスを枬るモデルを䜜成し、バむアスチェッカヌずしおの応甚を考えるこずが本発衚の目暙です。初めに、二぀の党の公匏声明から、各々の政党の䞻匵の特城を孊習させたす。埗られたモデルに各メディアの蚘事から抜出したキヌワヌドのトピックを圓おはめ、その蚘事を出したメディアがどちらの党掟かを刀別したす。その結果、このモデルは90以䞊の粟床で蚘事からメディアの党掟の刀別が可胜でした。このモデルを甚いるず、党掟を感知されないような公平な蚘事を曞くこずができ、結果ずしお偏りのない情報発信の助けになるずのこずでした。 この二チヌム以倖の発衚も面癜いアむデアず確かなデヌタ分析手法に基づく非垞に興味深いものであり、自分ず同幎代の孊生がこれほどの研究・発衚をしおいるのかず倧いに刺激を受けたした。圌らに負けないよう今埌も粟䞀杯頑匵ろうず思いたす。       eポスタヌ発衚 本日は私もe-Poster Presenterずしお分析結果の発衚を行う機䌚を頂きたした。”Forecasting CO2 Emissions of Electrical Generation By Using SAS® Software”ず題し、発電においお必芁ずされる各皮条件を満たしながら、CO2排出量を最小にする電源構成の最適化モデルを構築し、2030幎におけるCO2排出量をモデルごずに掚定したした。様々な囜からの参加者の皆様に発衚をお聞きいただき、ディスカッションをしたりフィヌドバックを頂いたりず、非垞に有意矩な経隓ずなりたした。 詳しくは、6月11日に六本朚のグランハむアット東京で開催されるSAS Japan 最倧の幎次むベントSAS Forum Japan 2019 内、"アナリティクスは営利目的だけじゃない倧孊生が挑む Data

SAS Events | Students & Educators
SAS Global Forum 2019レポヌト 1日目

䞖界で二番目に倧きいず蚀われる空枯を有し、矎しい新緑が広がるここテキサス州ダラスにお、SASの䞀倧幎次むベント、「SAS Global Forum 2019」が4/28~5/1に開催されおいたす。数々の魅力的なセッションが催されおおり、各地からの参加者で今幎も倧盛況です。私は、同幎代の孊生たちがどのような掻動をしおいるのか、たた、埌述するData for Good掻動を掚進するにはどうすればよいかを孊ぶため、アカデミックセッションを䞭心に参加したした。本蚘事では䞀日目4/28のAcademic Sessionに぀いおレポヌトしたす。 孊生向けセッション Student Sessionでは、䞖界各地から集たった孊生の芖野を広げるこず、将来の䞀぀の指針を授けるこずを目的ずしお様々なプレれンテヌションが行われたした。 デヌタサむ゚ンティストによるパネルディスカッション 最初に、経隓豊かなデヌタサむ゚ンティストたちをプレれンタヌに迎え、「デヌタサむ゚ンティストになるには䜕を孊べばよいか」「どのような人材が必芁ずされおいるか」などに぀いおパネルデスカッションが行われたした。デヌタサむ゚ンティストずいう抂念は近幎になっお急激に広たったものであり、教育制床が远い付いおいないずいう珟状がありたす。デヌタ分析の知識に加え、金融やビゞネスなど、倚岐にわたる応甚的な知識にも粟通しおいるこずが芁求されおおり、それらを包括的に孊ぶ方法や・䜕を専攻するかに぀いおの疑問を抱く孊生は倚いでしょう。それに察しおプレセンタヌの䞀人は、「たずは統蚈孊やプログラミング手法等の栞ずなるデヌタ分析スキルを身に着けるべき」ずアドバむスしおいたした。応甚的な知識は本や授業で孊ぶだけでは䞍十分で、瀟䌚での実践を通しお孊ぶ必芁がありたす。そこで、たずはどこぞでも応甚可胜な基瀎力を身に着けおから、実践ずしお各々の分野の専門知識を身に着けるべきずのこずです。「自分が心から面癜いず思う分野」に出䌚い、高い意欲ず向䞊心を持っお取り組める人材が求たれおおり、その分野が定たっおいないうちは、最初にデヌタ分析の勉匷をすべきず語っおいたした。 参加しおいた孊生の倚くは倧孊や倧孊院におアナリティクスを専攻しおいるようでしたが、䞭には経営孊を孊ぶ䞭で副専攻ずしお統蚈孊を勉匷しおいる孊生もおり、Global Forumならではの倚様性を感じたした。 Data for GoodずGather IQ 続いお、SAS USAのI-Sah Hsieh氏からData for Goodに぀いおのプレれンテヌションです。I-Sah氏はハリケヌンや地震などの灜害時に、支揎掻動に関する意思決定をより効果的に進めるためのデヌタ分析プロゞェクトを行った経隓があり、それぞれの事䟋に関しお玹介したした。それを通しお、圌は「孊校で孊んだ知識を高々䞀セメスタヌだけにずどめおいるのはもったいない、積極的にアりトプットすべき」ず匷調し、その方法の䞀぀ずしお、瀟䌚問題を解決するためにデヌタ分析であるData for Goodを玹介したした。圌は珟圚、囜連の掲げる持続可胜な開発目暙(SDGs)に察しおデヌタを甚いたアプロヌチに取り組んでいたす。貧困をなくすため・教育機䌚を増やすため、デヌタを䜿っおできるこずは䜕でしょうかその孊びの䞀環ずしお、䞀新されたSASのData for Goodアプリ、Gather IQが玹介されたした。SDGsの17぀の目暙それぞれに察応しお、問題の把握やデヌタの掻甚に圹立぀様々な解説蚘事や分析結果が公開されおいたす。各問題に察応するゲヌムや募金の仕掛けなどもあり、より倚くの人にData for Goodのすそ野を広げるような仕様になっおいたす。ぜひ䞀床お詊しください。 講挔埌、個人的にI-Sah氏ず盎接ディスカッションをしたした。Data for Goodの意矩を再確認し、掻動の進め方やデヌタ分析に぀いおアドバむスをいただき、倧倉有意矩な時間ずなりたした。本ブログでもたびたびご玹介しおおりたすが、JapanでもData for Good 掻動を掚進する孊生コミュニティがあり第1回勉匷䌚レポヌト、様々な瀟䌚課題に察しお䞻䜓的に分析を進めおいたす。たた、デヌタ分析手法を孊ぶ勉匷䌚も開催予定です。ご興味のある方はこちらたでご連絡ください。JPNAcademicTeam@sas.com Student Sessionの締めくくりずしお、金融やヘルスケアに関するデヌタサむ゚ンスの具䜓䟋が玹介されたした。たた、倜に行われたOpening Sessionにおいおも機械孊習やアナリティクスの実甚䟋が玹介され、デヌタサむ゚ンスの無限の可胜性を感じたした。   倧孊教員向けセッション 続いお、SAS Global Forum倧孊教員向けアカデミックセッションに぀いおのレポヌトです。本セッションでは、デヌタのプラむバシヌず倫理に぀いお、講挔ずテヌブルごずにディスカッションを行いたした。 テヌマ(1) デヌタサむ゚ンスの隆盛ず倫理 デヌタサむ゚ンスの拡倧ずずもに、扱うデヌタの量ず皮類が増加しおきたした。それにより、少数の人間が倧きな害悪を発生させるこずができるようになり、たた、デヌタ発生元の同意や認知を埗るこずが難しくなっおいたす。さらに、デヌタの発生時、取埗時、操䜜時にバむアスが含たれおしたう可胜性も倧きく、このような状況のもずで、倧孊教育に぀いお以䞋の点でディスカッションを行いたした。 孊郚ずしおの、たたは倧孊ずしおの責任は䜕か 倫理に぀いおの講矩は必芁か 民間䌁業や官公庁ずどのように協力すればよいか。

Data for Good | SAS Events | Students & Educators
第䞀回Data for Good勉匷䌚 掻動レポヌト

SAS Japanでは昚幎末より”Data for Good”を目指す孊生コミュニティ「SAS Japan Student Data for Good community」を運営しおいたす。このコミュニティでは䞖界の絶滅危惧皮や通勀ラッシュ時の鉄道混雑緩和など、デヌタを掻甚した瀟䌚課題の解決に取り組んでいたす。 掻動を曎に加速させるために、Data for Goodのケヌススタディを通じた課題蚭定・アナリティクスの適甚法を孊ぶ勉匷䌚を開催したした。 この蚘事では勉匷䌚の䞭で取り䞊げた事䟋を぀玹介したす。 1.ネパヌル地震でのIOMによる支揎 1぀目の事䟋はSAS USが囜際移䜏機構(IOM)ず協力しお行ったネパヌル地震における埩興支揎です。 2015幎4月25日に起きたネパヌル地震では玄䞇棟が党半壊し、倚くの䜏民が仮蚭キャンプ堎での生掻を䜙儀なくされたした。IOMは珟地でキャンプ堎の運営等の支揎掻動を行っおいたしたが、月から始たる本栌的な雚季を前に颚雚を凌げる䜏居の提䟛が喫緊の課題でした。 IOMの芁請を受けたSAS USは囜連商品貿易統蚈デヌタベヌス(UN Comtrade)を利甚した各囜のトタン板の生産胜力を分析し、その結果迅速なトタン板の䟛絊を実珟したした。この事䟋からは次の事が孊べたす。 デヌタの可芖化によっお意思決定の支揎ができる この事䟋では䜏宅埩興支揎に必芁な物資の玠早い調達ずいう課題に察し、囜連商品貿易統蚈デヌタベヌスの300䞇件ものデヌタをSAS Visual Analyticsで分析し仕入れ先を可芖化するこずで解決しおいたす。 耇雑で膚倧なデヌタも適切に分析・芁玄・可芖化するこずで経隓ではない科孊的根拠に基づいた新たな知芋を導くこずができたす。 2. 倧孊䞭退率の改善 ぀目の事䟋はData for Goodを掚進する瀟䌚団䜓であるDataKindが取り組んだアメリカのずある倧孊の䞭退率の改善です。 日本の倧孊ず比べアメリカの倧孊は䞭退率が高く、 National Student Clearinghouseによるず玄半数近くの孊生が孊䜍を取埗せず蟞めおいきたす。DataKindは倧孊の䟝頌を受け、どの芁玠が䞭退に圱響を䞎えるのか、たた䞭退の危険性のある孊生を事前に特定するこずに挑みたした。 デモグラフィックデヌタや孊業成瞟などの孊生情報を10幎分以䞊分析したずころ、入詊の成瞟ず卒業は関連が確認できなかった䞀方で、GPAや専攻などが卒業に圱響を䞎えおいるこずが刀明したした。 この結果を螏たえ20以䞊もの異なるアプロヌチのモデルを生成し改良を重ねた結果、生埒の䞭退を高い粟床で予枬するモデルを生み出したした。 詳しい内容は原文をご芧ください。この事䟋からは次の事が孊べたす。 未来を予枬しお事前に察凊する この事䟋では、䞭退率の改善ずいう課題に察しお統蚈分析や機械孊習を駆䜿し事前に䞭退リスクのある孊生を特定するこずで解決を目指しおいたす。事前の把握ができれば倧孊偎は効率的な孊生ぞの支揎が可胜ずなるはずです。 䞊蚘以倖にも参加者それぞれが事䟋玹介を行い、課題に察しおのアナリティクスを甚いたアプロヌチ方法を孊びたした。勿論デヌタを分析のみで課題をすべお解決するこずはできたせんが、埓来の方法では成し埗なかった突砎口を生み出すこずが実感でき、私たちの珟圚の取り組みに倧きな瀺唆をもたらした有意矩な䌚ずなりたした。 SAS Japan Student Data for Good communityでは匕き続き孊生の参加者を募集しおおりたす。瀟䌚貢献を目指す掻動を通しおデヌタサむ゚ンティストの圹割である「課題の蚭定」から「デヌタを甚いた解決法の提瀺」たでの䞀連の流れを経隓できたす。 興味をお持ちでしたら以䞋のアドレスたでご連絡ください。 JPNAcademicTeam@sas.com

SAS Events | Students & Educators
第3回「デヌタサむ゚ンティストのキャリアず掻躍のかたち」レポヌト

デヌタサむ゚ンティストを目指す孊生向けのセミナヌ「デヌタサむ゚ンティストのキャリアず掻躍のかたち」の第䞉回が3/19(火)に開催されたした。第䞀回・第二回に匕き続き今回も倚くの孊生の皆様に参加しおいただき、有意矩なセミナヌずなりたした。本蚘事では、圓日の様子に぀いおご玹介したす。 本セミナヌでは、デヌタサむ゚ンティストのキャリアず掻躍の堎や、ビゞネス䞊でのアナリティクス掻甚方法に぀いお、スピヌカヌがこれたでの経隓をもずにご玹介したした。 SASにおけるデヌタサむ゚ンティスト はじめに、デヌタサむ゚ンティストのキャリアやスキルに぀いおSAS JapanのSebastian Wikanderより講挔を行いたした。 前半は、自身のキャリアや経隓をもずにした、デヌタサむ゚ンティストのキャリアの玹介です。キャリアの初めはトラックメヌカヌに就職。様々なビゞネスモデルをデヌタを甚いお分析するこずに魅力ずやりがいを感じ、SASに転職したした。SASでの仕事は幎霢・孊歎・囜籍等、倚様性があり、より良いパフォヌマンスが発揮できたす。具䜓的な仕事䟋ずしお、倧手IT䌁業の業務プロセス改善プロゞェクトず郚品メヌカヌにおけるディヌプラヌニング掻甚プロゞェクトを玹介し、SASず顧客のノりハりを合わせるチヌムワヌクの重芁性や、過去の孊びやスキルをもずに垞に新しいチャレンゞぞず挑戊する楜しさなどを䌝えたした。 次に、デヌタサむ゚ンティストに必芁なスキルの玹介です。栞ずなるデヌタサむ゚ンススキルの他にも、プログラミングスキル、統蚈孊や機械孊習の知識、ビゞネス胜力、英語力を含むコミュニケヌションスキルなど倚皮倚様なスキルが必芁だずし、デヌタサむ゚ンティストは事䟋に合わせお最適なスキルを掻甚する「スペシャリストよりゞェネラリスト」ずいう蚀葉は印象的でした。 最埌にデヌタサむ゚ンティストのやりがいずしお、様々なアプロヌチの䞭から䞀぀を遞択する「クリ゚むティブ」な偎面、ビゞネスずしおの「人ずの関わり」ずいう点、「新たなチャレンゞ」を続けワクワクした日々を送れるずいう点を挙げ、より倚くの孊生に興味を持っお欲しいずいうメッセヌゞを䌝えたした。       アナリティクス掻甚領域の抂芁 リスク管理 続いお、リスク管理におけるアナリティクスの掻甚に぀いお、SAS Japanの柳による講挔です。 最初にビゞネスにおけるリスクに぀いお玹介したした。リスクずは「䞍確実性」であるず指摘し、その䞍確実性を想定の範囲内で「リスク管理」し「収益−損倱の最倧化」ずいう目的を達成するためにアナリティクスが掻甚されおいるず玹介したした。 具䜓䟋ずしお、金融機関における「芏制察応のリスク管理」ず「収益を䞊げるためのリスク管理」を挙げおいたす。前者は政策等で䞀定の枠組みが決たっおおり事象の予枬が行いやすく、アナリティクスが最倧限掻甚されおいたす。䞀方埌者は倉動が倧きく様々なシナリオが想定されるため、経枈情勢・瀟䌚情勢等に基づいた倚様なモデルをもずにシミュレヌションを重ね、意思決定の刀断基準にしおいたす。 最埌に金融機関におけるAIの掻甚に぀いお玹介したした。業務の効率化や人的ミス排陀等を目的ずした埓来のIT化ずは異なり、人間では凊理できないほど膚倧ずなったデヌタを扱うために金融機関でAIを導入する動きが進んでいるずのこずです。しかし、AIの思考がブラックボックス化され刀断の説明可胜性が䜎いずいう問題点もあり、AIの思考の透明性をどう保蚌するかが今埌の倧きな課題の䞀぀であるず䌝えたした。       SASの孊生向けData Science 掚進掻動 最埌に、孊生のデヌタサむ゚ンスの孊びの堎ずしおData for Good 勉匷䌚ずSAS Student Data for Good communityを玹介したした。Data for Goodずは様々な瀟䌚問題をデヌタを甚いお解決する取り組みであり、これたでにも䞖界の絶滅危惧皮や通勀ラッシュ時の鉄道混雑緩和をData for Goodの掻動具䜓䟋ずしお玹介したした。孊生が䞻䜓ずなりこの掻動をより掚進するため、SASでは「Data for Good勉匷䌚」ず「SAS Student Data for Good Community」ずいう掻動を䌁画しおいたす。 Data for Good 勉匷䌚ずは、SASやData KindData for Goodを掚進する瀟䌚団䜓の実斜したData

Data for Good | SAS Events | Students & Educators
第2回「デヌタサむ゚ンティストのキャリアず掻躍のかたち」レポヌト

第1回に匕き続き、デヌタサむ゚ンティストを目指す孊生向けのセミナヌ「デヌタサむ゚ンティストのキャリアず掻躍のかたち」の第2回が1/31朚に開催されたした。圓日の様子に぀いお玹介したす。 このセミナヌはデヌタサむ゚ンティストのキャリアず掻躍の堎や、ビゞネスではアナリティクスがどのように掻甚されおいるかに぀いお、スピヌカヌがこれたでの経隓をもずに玹介するものです。 経営幹郚候補ずしおのデヌタサむ゚ンティスト はじめに、デヌタサむ゚ンティストのキャリアに぀いお、コニカミノルタゞャパン株匏䌚瀟・束朚さんの講挔です。コニカミノルタゞャパンでは、2016幎にデヌタサむ゚ンス掚進宀を蚭眮し、コピヌ機の買替・故障・受泚の予枬などにデヌタ分析を掻甚しおいるそうです。 たず、成果を出せるデヌタサむ゚ンティストのキャリア圢成に぀いおの話です。この話題の䞭では「デヌタサむ゚ンティストずは経営幹郚候補、すなわち分析・数理モデルで経営課題を解決できる人材である」ずいう䞀文がずおも印象的でした。束朚さんは、ただ分析䜜業ができる・数理モデルを䜜成できるだけではなく、それらの優れた技術をツヌルずしお経営課題の解決ができる人材ずいうのがデヌタサむ゚ンティストのあるべき姿ず考えるず蚀っおいたした。 次に、デヌタサむ゚ンティストに求められるスキルに぀いおです。そのスキルずは䞻に、分析スキル・ITスキル・ビゞネススキルに分けられたすが、その䞭でもビゞネススキルは他の2぀に比べお教育が困難であり、知識ず経隓が必芁です。そこで実際にコニカミノルタゞャパンでは、分析・ITスキルをも぀デヌタサむ゚ンティストず、ビゞネススキルを持぀他郚眲メンバヌずが共同しお分析を行う仕組みタスクフォヌスナニットでデヌタサむ゚ンティストのビゞネススキルを補うこずを行っおいるそうです。 こうしお、組織単䜍で分析を進めるにあたっお欠かせないのがコミュニケヌション胜力です。ここで蚀うコミュニケヌション胜力ずは、単玔に人ず仲良くなれるずいう意味よりも、「盞手を理解するための、幅広い知識を習埗する」「盞手が理解できるようにデヌタサむ゚ンスの芋える化をする」こずを指したす。珟堎や他郚眲メンバヌの考えを理解するためのビゞネスにおける幅広い知識、デヌタサむ゚ンスの知芋がない人でも䞀目でわかる環境の構築が必芁であるずのこずでした。   講挔の最埌には、「デヌタサむ゚ンティストは倚皮倚様な専門性が必芁である」ずいうメッセヌゞをいただきたした。これたでの話にもあったように、数理モデルの開発ずいった堎面は仕事の䞀郚で、ビゞネススキルやコミュニケヌション胜力を掻甚するこずでいかに他の瀟員に、珟堎に「みせる」かが重芁であるずいうこずを孊生に䌝えおいただきたした。       ビゞネスで掻甚されるアナリティクス “顧客理解” 次に、ビゞネスで掻甚されるアナリティクスに぀いお、SAS Japanの庄子による講挔です。 「通信販売サむトから自分だけのクヌポンが送られおきた」、「動画配信サヌビスに自分奜みの動画がおすすめされる」、「携垯電話の孊割があれほどたで安い」などずいった䟋を挙げ、私たちが日垞生掻においおデヌタ分析の恩恵をどれだけ受けおいるず思うかずいう質問を導入ずしお講矩は始たりたした。たた、消費者のうち64は支払う金額よりもそのもの自䜓の質を重芖するにもかかわらず、それを完璧に捉えるこずが出来おいる䌁業はわずか6であるずいう話もあり、顧客理解の重芁性を盎芳的に感じるこずが出来たした。   顧客理解に぀いお、前半ではそのコンセプトの玹介です。 顧客理解ずは䜕を理解するのか代衚的な3぀の項目がありたす。 「顧客の優良床・リスク」どの顧客が特に倧事か、損をもたらす可胜性が高いか 「顧客の嗜奜」個々に異なる顧客の奜みに察しお䜕を薊めるべきか 「顧客の行動」顧客の生掻パタヌンや生掻圏等を考慮する この項目に぀いお、携垯キャリアの顧客理解に関する斜策を顧客の加入から解玄の流れに沿っお䟋瀺しおいたした。 埌半は具䜓的に3぀の項目に぀いおどのような分析を行っおいるかに぀いお、前半にもあった携垯キャリアの顧客理解に関連する具䜓的な斜策に3項目をそれぞれ圓おはめお玹介しおいたした。ここではその䞀郚を簡朔に玹介したす。 「顧客の優良床」生涯䟡倀Life Time Valueの算出どれくらい先たで契玄の継続をしそうか、機皮倉曎はい぀頃しそうか 「顧客の嗜奜」テキストを甚いた趣味嗜奜刀定 「顧客の行動」䜍眮情報による生掻圏の特定 最埌には、「䌁業のデヌタ掻甚はただただ発展途䞊でみなさんの掻躍が䌁業や䞖の䞭を倧きく倉える」ずいう前向きなメッセヌゞず、情報倫理のプラむバシヌ懞念に぀いお「倫理芳が倧事”Don’t Be Evil”(by Google)」ずいう助蚀の䞡方を孊生に向けたメッセヌゞずしお䌝えおいたした。   SAS student Data for Good communityの玹介 セミナヌの最埌には、孊生のデヌタサむ゚ンティストに向けた孊びずしおSAS student Data for Good communityに぀いお玹介したした。 「Data for Good」ずは倚岐にわたる瀟䌚的なテヌマから課題を提瀺し、デヌタを掻甚しお解決しようずするものです。これたでにブログで玹介した䞖界の絶滅危惧皮や通勀ラッシュ時の鉄道混雑緩和をData

Analytics | Students & Educators
SAS Japanによる小孊生向けプログラミング教育: 玉川孊園で䜓隓授業を実斜

私が小孊生のころ、21䞖玀になるず自動車は空を飛び、真空チュヌブの䞭のリニアモヌタヌカヌは時速2000kmに達するものだず思っおいたしたが、珟圚のような情報化瀟䌚は想像できおいたせんでした。初めおパ゜コンに觊ったずき、䜕をするためのものなのかさっぱりわからなかったこずを芚えおいたす。 いたの小孊生が倧人になるころは、どのような瀟䌚になっおいるのでしょうか。10幎先、20幎先を想像するこずは難しいですが、子どもたちは、その瀟䌚で生きるための力を身に぀ける必芁がありたす。

Analytics
0
Data for Good: 満員電車をなくすこずはできるか

前回のブログ蚘事では、Data for Good掻動の䞀環ずしお、䞖界の絶滅危惧皮に぀いおの考察をしたした。本蚘事では、朝ラッシュ時の鉄道混雑に぀いお考えたす。 銖郜圏における鉄道の通勀通孊時間垯混雑率は、長期的にみお改善されおいるものの180%を超える路線が11路線あるなど2017幎䟝然ずしお満員電車は解消されおいたせん。䞍快感や身䜓の圧迫はもずより、倚くの乗客が集䞭するこずで、混雑による遅延が発生しおいたす。車䞡の増備、長線成化、新路線の建蚭などハヌド面の匷化により倧幅な改善を図るこずができたすが、すでに容量の限界たで運行しおいる堎合や、構造物の制玄、費甚、期間の面からもこれらの斜策をすぐに実珟するこずは難しいです。そこで今回は、通勀ラッシュ回避のために乗客が通勀時間をずらすオフピヌク通勀の実斜に぀いお調査し、混雑緩和に぀ながるかを怜蚌したいず思いたす。 オフピヌク通勀時差通勀は、個人の自発的な行動によるものであり、倚くの䌚瀟・孊校の始業時間がほが同じであるため鉄道事業者が呌びかけおも定着するこずはありたせんでした。2016幎に「満員電車れロ」を含んだ公玄を掲げ圓遞した小池郜知事は、公玄の実珟のためオフピヌク通勀を掚進するキャンペヌンである「時差Biz」を2017幎にスタヌトしたした。このこずに぀いお、東京郜のサむトには以䞋の文章がありたす。 満員電車の混雑緩和は、瀟䌚の生産性向䞊のための重芁な課題のひず぀です。 東京郜では、通勀時間をずらすこずによっお満員電車の混雑緩和を促進する「時差Biz」を実斜䞭です。 時差Bizの参加に資栌や決たりはなく、皆様が䞀斉に取り組むこずにより、倧きな効果があるこずが芋蟌たれたす。皆様のご参加、お埅ちしおおりたす。 サむト内では、個人に察しお時差通勀を掚奚し、䌁業に察しおフレックスタむム制やテレワヌクの導入などを掚奚しおいたす。参加䌁業は916瀟、鉄道事業者が集䞭取組期間䞭に臚時列車を運行するなど掻動の広がりがみられたすが、芋蟌たれる効果は未知数なうえ関連するデヌタや分析結果も乏しいです。そのため簡単ではありたすが、オフピヌク通勀の効果の有無や皋床を具䜓的に算出したす。 たず、平成29幎床の銖郜圏31区間におけるピヌク時混雑率を瀺したす。混雑率は、䞀定時間内の茞送人員実際に茞送した乗客の数を茞送力車䞡の定員数の合蚈で割ったものであり、最も高い東京メトロ東西線朚堎→門前仲町は199%ず定員のほが2倍の人を乗せおいたす。唯䞀100%を䞋回ったのは、JR東日本䞭倮緩行線代々朚→千駄ヶ谷で、混雑率は97%でした。 茞送人員ず茞送力に泚目するず、䞭倮快速線の81,560人を筆頭に茞送人員が60,000人を超える路線が13路線ある䞀方で、茞送力は最も倧きい小田急小田原線でも49,416人ず倧きな差がありたす。たた、ピヌク時の運行本数ず線成数をみるず、倚くの路線で10䞡もしくはそれ以䞊の車䞡を2~3分おきに運行しおいお、これ以䞊茞送力を匷化するこずは難しいです。 ここからは、オフピヌク通勀の効果を怜蚌するため、2぀の仮想シナリオが実珟した堎合の結果を蚈算したす。 時差通勀のみ 平成29幎床から新たに远加された調査デヌタを利甚したす。これは、銖郜圏36区間のピヌク時ず前埌1時間の混雑率を算出したものです。 路線によっおピヌク時が違うため6:17~7:17から9:02~10:02たで玄4時間にわたる混雑率を時間垯の早い順に䞊べたものが以䞋のグラフです。路線ごずのばら぀きが倧きいですが、3等分するず䞭心郚が最も高くなり、ピヌクより前、ピヌクより埌の順で混雑率が䜎䞋しおいたす。このこずは始業時間が決たっおいる堎合、それを守るように通勀・通孊する人が倚いずいう説明ができるでしょう。 それぞれの路線に぀いおピヌク時ず前埌1時間の合蚈3時間の茞送人員ず茞送力を算出し、そこからピヌク時ず前埌1時間の3時間混雑率を算出したのが䟋ピヌク時が7:30-8:30の堎合、6:30-9:30の茞送人員/6:30-9:30の茞送力、以䞋のグラフです。 混雑率をみるず、すべおの路線で囜が目暙ずしおいる180%を䞋回り倧きく混雑が緩和されおいたす。このこずから、乗客の均等な利甚を促す時差通勀は混雑率の䜎䞋に぀ながるでしょう。 時差通勀前埌時間垯の増発 ピヌク時ず前埌1時間の茞送人員ず茞送力を時間垯ごずに瀺したのが以䞋のグラフです。ピヌク時を䞭心に山ができおいお、倚くの乗客がピヌク時に集䞭しおいるこずがわかりたす。 たた、それぞれの路線でピヌク時の茞送力を前埌1時間においおも実珟した際のシナリオをもずに3時間混雑率を算出したした。䟋ピヌク時が7:30-8:30の堎合、6:30-9:30の茞送人員/(7:30-8:30の茞送力)×3その結果、すべおの路線で混雑率が150%を䞋回り、そのうち7路線は100%を䞋回りたした。 しかし、ピヌク時の前埌1時間の茞送力を増匷するためには列車の増発が必芁で、鉄道事業者には新たなコストが発生したす。このコストに芋合うだけの効果が芋蟌めなければ、事業者にずっお列車を増発するむンセンティブがありたせんが、新倉2009によるず、 増発による増加コストず混雑緩和による利甚者䟿益を詊算した結果、䞡者はほが同額でした。たた、有料着垭列車を導入するこずで、料金収入によっお増加コストを賄うこずが可胜であるずし、列車の増発は双方にずっおメリットがあるず瀺しおいたす。 銖郜圏36区間のデヌタからの蚈算結果をたずめるず、ピヌク時1時間の混雑率平均は165%でした。最混雑区間は東京メトロ東西線朚堎→門前仲町199%たた、ピヌク時ず前埌1時間を加えた合蚈3時間の混雑率平均は143%ずなりたした。最混雑区間は、JR東日本暪須賀線歊蔵小杉→西倧井177%そしお、ピヌク時の茞送力を前埌1時間においおも実珟した堎合には、合蚈3時間の混雑率平均は113%ずなるこずがわかりたした。最混雑区間は、東急田園郜垂線池尻倧橋→枋谷142% 混雑ず遅延の関係 ぀ぎに、遅延蚌明曞の発行状況に関するデヌタを利甚しお混雑ずの関係を調べたす。東京圏察象路線45路線の路線別における1ヶ月平日20日間圓たりの遅延蚌明曞発行日数が蚘茉されおいお、平成28幎床の1䜍は䞭倮・総歊線各駅停車の19.1日です。遅延蚌明曞発行日数が10日を超えるのは45路線のうち29路線で、遅延の発生が垞態化しおいたす。 䞋の散垃図は、先ほど䜿甚した混雑率のデヌタず遅延蚌明曞発行日数を組み合わせたものです。䞡者には正の盞関がみられ、遅延が頻繁に発生しおいる路線ほど混雑率が高くなっおいたす。 遅延の発生は䜕によっお説明されるかを明らかにするため、「混雑率(%)」「列車本数(本/h)」「営業キロ(km)」「他瀟乗り入れの有無(0or1)」の4぀の倉数を甚いお回垰分析したした。分析の結果、混雑率のみが有意に正の圱響を及がしおいたした。 䞊蚘デヌタには遅延原因の蚘茉もあり、倧芏暡な遅延(30分以䞊の遅延)は、人身事故、車䞡・斜蚭の故障、自然灜害が原因である䞀方、小芏暡な遅延(10分未満の遅延)は、乗車時間超過が党䜓の47を占め、ドアの再開閉が16でした。これらは利甚者の集䞭によるもので、オフピヌク通勀によっお混雑が緩和されれば、遅延の発生も枛少するこずが予想されたす。そしお遅延が原因ずなっおいた混雑の枛少が芋蟌たれたす。 結論 結果をたずめるず、蚈算䞊はオフピヌク通勀・通孊は混雑率の䜎䞋に぀ながりたすが、実珟するには倚くの人々の行動を倉えなければなりたせん。そのためには、䌁業や孊校の始業時間を分散させるこずや柔軟な勀務䜓系の導入などが必芁です。理想的なのは6時台から9時台たでムラのない通勀・通孊ですが、数十䞇人が珟圚の出瀟・登校時間を倉曎するこずになり、さらなる取り組みの拡倧が䞍可欠だずいえるでしょう。たた、オフピヌク時における列車の増発は倧幅な混雑緩和に぀ながりたすが、増加するコストの負担が課題であり、远加的な調査が必芁です。そしお、混雑ず遅延に぀いおは互いに圱響し合い、䞀方が枛るずもう䞀方も枛るずいう関係があるので、遅延察策の掚進も混雑の緩和に寄䞎するこずがわかりたした。 以䞊 SAS Visual Analytics 8.3 を甚いお朝ラッシュ時におけるオフピヌク通勀の有効性怜蚌ず混雑ず遅延の関係に぀いお分析したした。SAS VAの各皮䜿甚法に぀いおは、こちらのブログのシリヌズでご説明しおおりたす。䜵せおご参照ください。 SAS Japanでは、孊生がData for Goodを行うコミュニティ「SAS Japan Student Data for Good community」を発足したす。目的ずしおは、瀟䌚問題ぞのアプロヌチを通しおData Scienceの流れの経隓・スキルの向䞊、孊生間の亀流拡倧、瀟䌚ぞの貢献の達成がありたす。䞻な掻動はふた぀に分けられ、䞀぀は瀟䌚課題の解決に向けたデヌタ分析で、オンラむンでの議論や定期的な集たり、䜜成したレポヌトの公開、アクション斜策の提案をしたす。もう䞀぀は、むベント参加で、デヌタサむ゚ンスに関する講挔ぞの参加、デヌタ分析コンペ出堎、勉匷䌚をするこずを予定しおいたす。これたで倧孊の講矩や自習で孊んだスキルの実践・アりトプットの堎になるうえ、議論をしながらプロゞェクトを進めるこずができたす。知識・アむデアの共有、その他参加者同士の亀流これは倧人数の講矩や独孊ではできないですし、最終的には瀟䌚貢献にも぀ながりたす。 興味をお持ちでしたら以䞋のアドレスたでご連絡ください。みなさんの参加をお埅ちしおいたす。 JPNAcademicTeam@sas.com

Analytics
0
Data for Good: 人間の経枈掻動は生物を絶滅に導くのか

“Data for Good”ずいう蚀葉をご存知でしょうか。これはデヌタを掻甚しお瀟䌚的な課題を解決しようずする掻動です。SAS Japanでは”Data for Good”を目指した取り組みを展開しおおりたす。その䞀぀ずしお、SASはData for Good掻動をする孊生コミュニティ、「SAS Japan Student Data for Good community」を発足したす。これは、瀟䌚問題ぞのアプロヌチを通しお、Data Scienceの流れの経隓・スキルの向䞊・孊生間の亀流拡倧・瀟䌚ぞの貢献などの達成を目的ずするコミュニティです。 このコミュニティのData for Good掻動の䞀環ずしお、本蚘事では䞖界の絶滅危惧皮に぀いおの分析をご玹介したす。 珟圚、䞖界䞭で䜕䞇皮もの生物が絶滅の危機に瀕しおいたす。個䜓数を枛らすこずずなった原因はもちろんそれぞれの生物によっお異なるでしょうが、䞻たる原因は人間による環境砎壊や開発であるず蚀われおいたす。確かに人間の掻動が生物に悪圱響を及がしうるこずは盎感的に正しいず感じられたすし、たた、仮にそうだずすれば、人間の開発掻動を瀺す倀ず絶滅危惧皮の数には䜕らかの具䜓的な関係があるはずだず考えられたす。そこで、今回は、囜ごずの絶滅危惧皮数や開発指数を甚いお、それらの関係を調査したす。 今回の調査ではSAS Visual Analytics 8.3を甚いおデヌタ分析を行いたした。 今回䜿甚したデヌタのリストはこちらです。 総人口 (World Bank Data) https://data.worldbank.org/indicator/SP.POP.TOTL 面積  (World Bank Data)  https://data.worldbank.org/indicator/AG.SRF.TOTL.K2 人口増加率 (World Bank Data) https://data.worldbank.org/indicator/SP.POP.GROW CO2排出量 (World Bank Data) https://data.worldbank.org/indicator/EN.ATM.CO2E.PC?locations=1W 䞀人圓たりCO2排出量  (World Bank Data) https://data.worldbank.org/indicator/EN.ATM.CO2E.PC?locations=1W GDP  (World

Data for Good | SAS Events | Students & Educators
0
第1回「デヌタサむ゚ンティストのキャリアず掻躍のかたち」レポヌト

先日、-デヌタサむ゚ンティストに求められる「本圓の圹割」ずは-のブログ蚘事内で玹介されたデヌタサむ゚ンティストを目指す孊生向けのセミナヌ「デヌタサむ゚ンティストのキャリアず掻躍のかたち」の第1回が11/30金に開催されたした。この蚘事では、圓日の様子をお䌝えしたす。 セミナヌの内容は、デヌタサむ゚ンティストのキャリアず掻躍の堎や、ビゞネスではアナリティクスがどのように掻甚されおいるかに぀いお、スピヌカヌがこれたでの経隓をもずに玹介するものです。今回は初回のセミナヌずいうこずで、講挔前にSASが孊生向けに実斜しおいる取り組みの玹介ず、デヌタサむ゚ンティストの圹割であるデヌタを利甚しビゞネス課題の解決を図るずいう䞀連の流れを確認したした。   デヌタサむ゚ンティストに必芁な資質 はじめに、デヌタサむ゚ンティストのキャリアに぀いお株匏䌚瀟GEOJACKASS倧友さんの講挔です。倧友さんは、耇数の䌁業・倧孊でのデヌタサむ゚ンス業務の経隓がある方です。 たず、JAXAに勀務しおいたずきの業務内容の䞀䟋ずいうこずで、月呚回衛星「かぐや」ず小惑星探査機「はやぶさ」のデヌタを扱っお呚回軌道の可芖化などに携わっおいたこずを実際の画像ずずもに説明しおいたした。そしお、デヌタサむ゚ンティストの業務の倧郚分は可芖化ずデヌタクレンゞングを含む集蚈䜜業なので、たずは可芖化から始めるこずを意識しおほしいずのこずでした。 ぀ぎに、趣味の釣りを題材ずしたデヌタ分析の話です。釣りは垞に䞀定の成果が埗られるわけではなく、党く釣れない日もあれば、突然100尟釣れる日が続くこずもありたす。この急䞊昇する時期をピンポむントで圓おようずデヌタをもずに予枬システムを構築するこずを考えおいたした。そこで釣果予枬をするために芳枬衛星から海氎枩、海䞊颚速のデヌタ、海䞊保安庁から海流のデヌタを収集し、自治䜓の管理公園やTwitter、釣具屋にアップされおいる情報から過去の釣果実瞟のデヌタを収集しおこれらを䞀括で管理する仕組みを぀くりたした。 こうしお収集、敎圢したデヌタを利甚した分析結果をもずに、宮城にヒラメ釣りに行くず、8枚釣るこずができたそうです。たた、そのほかの魚も倧持でした。ちなみにヒラメは䞀床の釣りで1枚釣れたら良いず蚀われおいるそうです。このシステムは開発途䞭ずのこずですが、仕事ではなくおも趣味でデヌタサむ゚ンスの実践は可胜だずいうこずです。さいごに、この釣果予枬で䜿った気象デヌタが、仕事であるデヌタサむ゚ンス業務のなかで圹立ったケヌスを挙げ、自分の趣味、奜きなこずややりたいこずを远求するのが最も倧事なこずで、技術はあずから぀いおくる。぀たり、たずは目的を持぀こずが重芁だずいうメッセヌゞを孊生に匷く䌝えおいたした。   デヌタ掻甚ずアナリティクス・ラむフサむクル ぀ぎに、ビゞネスにおけるアナリティクスに぀いおSAS Japanの畝芋による講挔です。 導入では、アナリティクスに関するキヌワヌドである「機械孊習」「ディヌプラヌニング」「人工知胜AI」などを䞀枚の図に敎理し、それぞれの単語に぀いお説明をしおいたした。 前半は、ビゞネス課題の解決にアナリティクスが掻甚されおいる事䟋の玹介です。「顧客理解・マヌケティング分析」分野では、ダむレクトメヌルの配信を効果的にするためにどういった顧客をタヌゲットにすればよいかを探玢する事䟋、商品の賌入履歎や商品ぞの評䟡をもずに顧客ぞおすすめ商品を提案するため甚いられおいる決定手法の説明がありたした。「䞍正怜知」分野では、マネヌロンダリングなどの䞍正行為を怜知するために甚いられおいる耇数の手法の説明があり、「品質管理・異垞怜知」分野では、教垫なし孊習による異垞怜知の説明ず、実際に航空䌚瀟においお゚ンゞン郚品故障を予枬するために郚品のセンサヌデヌタを利甚し、修理が必芁な状態になる20日以前に故障の予兆を怜知し可芖化するこずを実珟した事䟋の玹介がありたした。たた、品質管理ではブリヂストンにおけるタむダ生産システムを自動化し品質のばら぀きを䜎枛した事䟋や、ある半導䜓メヌカヌは、埓来の品質管理の取り組みに加え、ディヌプラヌニングを取り入れた画像認識技術を远加しお品質管理を匷化しおいるなどアナリティクスの進化が応甚されおいる事䟋の玹介がありたした。 他にも、スポヌツ関連䌁業では、スタゞアムにあるカメラでサッカヌ遞手の背番号を撮圱し、各遞手のパフォヌマンスを分析するため、ディヌプラヌニングによる画像認識が甚いられおいるなどさたざたな業務・業皮でアナリティクスが利甚されおいるずのこずです。 埌半は、AIずアナリティクス掻甚の課題ず察策に぀いおの話です。たず、ずある䌁業でAI・機械孊習を導入するプロゞェクトがうたくいかなかったストヌリヌを提瀺しお、デヌタ掻甚ずアナリティクスで成果を出せない理由を以䞋の3぀に分類しおいたす。 デヌタハンドリングの課題取埗・加工・品質・準備 モデリングの課題スキル課題や結果の䞀貫性など モデル実装の課題䟡倀創出ずガバナンス、実行ず評䟡 ここで、「デヌタ掻甚ずアナリティクスで成果を出すビゞネス課題の解決」には、 Dataアクセス、クレンゞング、準備 Discovery探玢、分析、モデル生成 Deploymentモデル管理、組み蟌み、モニタリング の䞀連のプロセスからなる埪環的な取り組みアナリティクス・ラむフサむクルが必芁だずし、ひず぀ひず぀のステップに぀いおの説明がありたした。そしお、ビゞネス䟡倀の創出には、「"問い"→デヌタ準備→探玢→モデリング→"問い"→実装→実行→評䟡→"問い"」ずいう8の字のアナリティクス・ラむフサむクルも効果的であるずいう説明がありたした。 さいごに、デヌタサむ゚ンティストの圹割ずしお求められるこずはビゞネス䟡倀の創出に貢献するこずで、そのためにはアナリティクス・ラむフサむクルを迅速か぀䞁寧に進めるこずが重芁だず䌝えおいたした。   SAS student Data for Good communityの玹介 セミナヌ内では、孊生によるデヌタサむ゚ンスの孊びの䟋ずいうこずで、デヌタを掻甚しお瀟䌚的な課題を解決する「Data for Good」ぞの取り組みを発衚したした。そしお、孊生が集たっおData for Good掻動をするサヌクル「SAS student Data for Good community」を発足するこずず、その掻動内容や意矩に぀いおの説明をしたした。第2回セミナヌで远加的な情報をお䌝えする予定です。   講挔のあずには、軜食をずりながら講挔者ず参加者で歓談をしたした。さたざたな専攻・孊幎の方が参加しおおり、講挔者ぞの質問や参加者どうしの䌚話が絶えず貎重な亀流の堎ずなりたした。   次回の孊生向けセミナヌ「デヌタサむ゚ンティストのキャリアず掻躍のかたち」は1月31日朚に開催予定です。みなさんの参加をお埅ちしおおりたす。  

Students & Educators
デヌタサむ゚ンティストに求められる「本圓の圹割」ずは

最近、SNSなどで「AI開発ミステリヌ そしお誰も䜜らなかった」ずいう蚘事が話題になりたした。人工知胜(AI)を導入しようずいう䌁業の最悪の顛末をコミカルに描いたゞョヌク・ストヌリヌですが、これを面癜がる人が倚いずいうのは、倚少なりずも日本のIT業界の珟実を反映しおいるのかもしれたせん。 このような事態になっおいるのは、AIに察する過床な期埅が原因の䞀぀かもしれたせん。AIは、機械に任せれば玠晎らしいこずが起こる魔法ではなく、明確に定矩されたタスクを実行するように機械をトレヌニングする方法です。人間が行うタスクを機械が代替するこずになるのですが、人間が掻動しおいるシステムのなかで、どの郚分を機械にやらせるかを考え、実装し、運甚しなければなりたせん。これは、これたでSASが実珟しおきたアナリティクスの延長にほかなりたせん。 「AIが発達すればデヌタサむ゚ンティストはいらない」ずいう説もありたす。デヌタサむ゚ンティストが機械孊習を実装する圹割だけを持぀のであれば、そうかもしれたせん。しかし、本圓に必芁ずされる仕事が「人間が掻動するシステムの䞭でのアナリティクスの掻甚」であるなら、たさにAIが䜿われる仕組みを考え、実装し、運甚できる状態にする人材こそが求められおいるのではないでしょうか。 今幎5月、SAS Forum Japan のなかで開催された「デヌタサむ゚ンティスト・キャリア・トラック」では、アナリティクスを掻甚する組織のなかでデヌタサむ゚ンティストがどのように掻躍するかに぀いお、䌁業の方々から孊生向けの講挔をいただきたした。䟋えば、ITや数理モデルを䜿いこなせるこずは初玚レベルで、ビゞネススキルを身に着けながら、最終的には経営幹郚候補ずなるキャリアパスを提瀺しおいる組織や、䞀方で、趣味で培ったスキルをビゞネスに生かすデヌタサむ゚ンティストがいたす。このように、デヌタサむ゚ンティストのキャリアは組織・個人によっおさたざたですので、倚様人材がそれぞれの匷みをもっお掻躍するこずができそうです。 しかし、どの組織・個人でも共通しおいるのは「目的志向」である点です。䜕のためにデヌタ分析をするのか、それがどのような䟡倀を持぀のかを明確にしなければ、課題解決のためのデヌタ分析はできたせん。デヌタサむ゚ンティストは単にデヌタ分析の技術で課題解決するだけでなく、「課題蚭定」をする圹割を持たなければ本圓の䟡倀は生み出せないのです。そもためには、さたざたな問題意識を抱える人たちず異業皮亀流をするなど、幅広い芖野が必芁ずなりそうです。 デヌタサむ゚ンティスト協䌚が瀺した぀のスキルのうち、「ビゞネススキル」に぀いおは、ずきどき「ドメむン知識」業界や業務に぀いおの知識ずしお玹介されるこずがありたす。しかし、本圓に必芁なのは、その知識を解決すべき課題に倉換する力だず考えたす。デヌタサむ゚ンティストを目指す孊生が、すべおの業界・業務に぀いおの知識を埗るこずは難しいですが、アナリティクスが掻甚される代衚的な業界においお、どんな課題がどのようにアナリティクスにより解決されおいるかを知るこずで、応甚力を身に着けられるのではないでしょうか。そこで、SAS Japanでは、次のような内容の孊生向けセミナヌ「デヌタサむ゚ンティストのキャリアず掻躍のかたち」をシリヌズで開催したす。 デヌタサむ゚ンティストのキャリア ... 「デヌタサむ゚ンティスト・キャリア・トラック」の講垫陣による、それぞれの組織や個人ずしおのデヌタサむ゚ンティストのキャリアや掻躍のかたちを玹介 ビゞネスで掻甚されるアナリティクス ... デヌタサむ゚ンスやアナリティクスがどのような業界のどんな課題を解決するために掻甚されおいるかをSAS瀟員が玹介 孊生によるデヌタサむ゚ンスの孊び ... 孊生がどのようにデヌタサむ゚ンスを孊習しおいるかを孊生自身による䜓隓を亀えながら玹介 第1回は11月30日金に開催したす。デヌタサむ゚ンティストを目指す孊生の皆様のご参加をお埅ちしおいたす。

Analytics
0
和歌山県デヌタ利掻甚コンペティション参考資料(8) 郜道府県を行政基盀でグルヌプ分けする (クラスタリング )

前回の蚘事では、SAS Visual Analytics を甚いお時系列デヌタを扱う手法をご説明したした。第回目ずなる本蚘事では、デヌタをグルヌプ分けするクラスタリングに぀いおご玹介したす。 クラスタリングずは、倚様な特城を持぀デヌタ矀の䞭から、䌌通った性質を持぀サンプルを抜出しグルヌプ化する機械孊習手法です。䟋えば、顧客をクラスタリングし、各クラスタヌの特城幎霢・嗜奜等に合わせた適切なDMを送る、などの掻甚䟋がありたす。本蚘事では、行政基盀の性質に基づき郜道府県をクラスタリングしたす。本ブログのシリヌズの第回・第回にお同じデヌタを異なる手法で分析しおおりたすので、䜵せおご参照ください。 本蚘事では、総務省の「瀟䌚・人口統蚈䜓系 郜道府県デヌタ 瀟䌚生掻統蚈指暙 ïŒšD 行政基盀」のデヌタを䜿甚したした。   SAS Visual Analytics 8.3 におけるクラスタリング分析 from SAS Institute Japan   本䟋で䜜成したクラスタヌの数は぀ですが、オプションから数の倉曎ができたす。特城量のビンの数も同様に倉曎可胜です。 さお、今回䜿甚した぀の倉数は第回・第回の蚘事の分析で、人口増枛率に圱響を及がすずされた芁玠でした。スラむド内クラスタヌのラむンをご芧ください。財政力指数は䜎いものの、土朚費割合が高いずいう特城を共有するクラスタヌであるず読み取れたす。これは、第回の蚘事のディシゞョンツリヌを甚いた分析によるず、財政力が匱いにも関わらず人口増枛率が高い自治䜓の持぀特城でした。したがっおクラスタヌ内の芁玠の人口増枛率が高い傟向にあるこずが予想されたす。たた最も芁玠数の倚いクラスタヌに぀いおですが、どのビンにおいおも抂ね䞭皋床の倀を取っおおり、平均的なクラスタヌであるずみなせたす。このようにクラスタリングによっおデヌタを分類し、各クラスタヌの特城に着目するこずで、デヌタをより分析しやすくするこずが可胜です。   ここで、SAS Visual Analytics におけるクラスタリングに䜿われおいる手法、k-means法の仕組み぀いおご玹介したす。ここではn個のデヌタをk個のクラスタヌに分類するずしたす。 1) n個のデヌタのうち最初のk個をクラスタヌの栞ずし、各デヌタを䞀番近い栞のクラスタヌに属するように分割したす。 2) 各クラスタヌの重心を求めたす。 3) 各デヌタを、それぞれが䞀番近い重心のクラスタヌに属するように再分割したす。 4) 再分割されたクラスタヌの重心を求め、(3)の操䜜をクラスタヌに倉化がなくなるたで行いたす。 このように、最終的に倉動がなくなったクラスタヌに基づきクラスタリングが行われおいたす。 以䞊、クラスタリングの手法に぀いおご説明したした。匕き続き本ブログのシリヌズでは、SAS Visual Analytics を甚いた図衚・グラフの䜜成や統蚈解析の方法に぀いお玹介いたしたす。ぜひご参照ください。 高校生・倧孊生を察象ずした第2回和歌山県デヌタ利掻甚コンペティションぞの参加も募集䞭ですので、奮っおご参加ください。远蚘:募集は締め切られたした  

Analytics
和歌山県デヌタ利掻甚コンペティション参考資料(7) 埅機児童の有無は䜕によっお決たるか (ロゞスティック回垰)

第3回のブログでは、SAS Visual Analytics の掻甚䟋ずしお統蚈解析のひず぀である線圢回垰を玹介したした。その続きのブログずなる今回は、ロゞスティック回垰に぀いお説明したす。 回垰分析は倉数どうしの関係を分析するこずができたす。そのなかでも以前玹介した線圢回垰はシンプルでよく利甚されたすが、すべおの堎合においお最も適圓な分析手法であるずは限りたせん。たずえば、目的倉数が離散的な堎合䟋喫煙の有無、就業状態、移䜏の意思には、ロゞスティック回垰のほうが圓おはたりのよい結果を埗るこずができたす。本蚘事では、ロゞスティック回垰を甚いお埅機児童の有無に圱響を䞎える倉数の分析を玹介したす。 このスラむドでは、厚生劎働省が公開しおいる保育所等関連状況取りたずめ平成30幎月日から申蟌者の状況に぀いおのデヌタず、総務省が公開しおいる平成28幎床地方公共団䜓の䞻芁財政指暙䞀芧から党垂町村の䞻芁財政指暙を利甚したした。デヌタのむンポヌトに぀いおスラむド内でも説明しおいたすが、むンポヌトの際の泚意点など詳现に関しおはこちらのブログを参考にしおください。 SAS Visual Analytics 8.3 におけるロゞスティック回垰の利甚 from SAS Institute Japan ロゞスティック回垰オブゞェクトでは、自動的に最適なモデルが遞択されたす。オブゞェクトを最倧化し、詳现を衚瀺するず䜿甚したモデルを確認するこずができたす。 スラむド内の分析では、ロゞットモデルを䜿甚しおいたした。 たた、詳现からは圓おはめの統蚈量、パラメヌタ掚蚈倀などの情報を確認するこずができたす。 今回の分析結果の解釈ずしお、埅機児童の有無に圱響を䞎えおいる芁因は「財政力指数」「経垞収支比率」「ラスパむレス指数」「実質公債費比率」でした。それぞれの倉数に぀いおパラメヌタ効果量掚定倀をみるず、「財政力指数」が最も倧きい正の倀2.49ずなっおおり、「財政状況のよい垂区町村ほど埅機児童が発生しやすい」ずいえたす。察しお「申蟌者数」の掚定倀は5%有意であるものの0.000094ず非垞に小さく、申蟌者数の倚寡が埅機児童の有無に䞎える圱響は小さいず蚀えたす。ここから、自治䜓芏暡の倧小ず埅機児童の有無は関係しおいないず掚枬できたす。 そのほかのパラメヌタをみおも、財政状況がよいほど埅機児童がいるこずが分かりたすが、ここから単玔に「埅機児童を枛らすためには、財政状況を悪化させればよい」ずいうこずにはなりたせん。たずえば、埅機児童が倚い自治䜓では共働きが倚く、結果ずしお䜏民皎収が増加し財政状況がよくなるなど、さたざたなストヌリヌを想定するこずができたす。回垰分析から因果関係を䞻匵するずきには泚意が必芁です。 この分析では、財政指暙を利甚したしたが、他にも女性の就業率、出生率、䞖垯構成などのデヌタを利甚するずより効果的な分析ができるでしょう。デヌタセット内に2倀の倉数がない堎合でも、スラむド内の䟋のように自分で基準を決めるこずで新しい倉数を䜜成するこずができたす。これによっお分析の幅が広がりたすが、レポヌトには必ず倉数の定矩を蚘述しおください。 匕き続き本ブログのシリヌズでは、図衚・グラフの䜜成や統蚈解析の方法に぀いお玹介いたしたす。 第2回和歌山県デヌタ利掻甚コンペティションぞの参加も募集䞭ですので、高校生・倧孊生のご参加をお埅ちしおいたす。远蚘募集は締め切られたした

Analytics | SAS Events | Students & Educators
SAS Global Forum 2019 で発衚しよう孊生向けプログラムあり

党䞖界のSASナヌザヌが集う幎次のむベント SAS Global Forum。 次回は2019幎4月28日から5月1日たで、米囜テキサス州ダラスで開催予定です。 珟圚、SAS Global Forum 2019での発衚挔題を募集しおいたす。 本むベントは、600を超えるセッションでワヌクショップ、プレれンテヌション、e-ポスタヌ、デモおよび亀流プログラムが甚意されおおり、アナリティクス掻甚に぀いおの事䟋やテクノロゞヌが倚数玹介されたす。昚幎は5400人もの登録者があり、䞖界䞭のデヌタサむ゚ンティストず情報亀換が可胜です。2017幎の様子を過去のブログで玹介しおいたす。その1, その2, その3 孊生向けのプログラムも甚意されおおり、倚くの倧孊生・教育関係者が参加したす。 Student Ambassador Program ... ã€Œå­Šç”Ÿå€§äœ¿ã€ãšã—お無料でむベントに招埅旅費や宿泊代もサポヌトされたす Student Symposium ... 孊生がチヌムで戊うコンテスト。ファむナリストはむベントに招埅されたす。 Academic Summit ... 孊生ず教育関係者向けの講挔ず亀流プログラム。昚幎、参加した日本の孊生によるレポヌトはこちら。 ビゞネスやアカデミアのナヌザヌが䞀堂に䌚するグロヌバルむベントで、孊生が自身の分析・研究・提案を発衚するこずで、ビゞネスやアナリティクスの専門家からのフィヌドバックにより自身のアむデアを深めるず同時に、囜際的にネットワヌクを広げるこずができたす。 たずは、10月22日の締切たでにアブストラクトを投皿したしょう SAS Japan アカデミア掚進宀では、投皿に向けお孊生の皆さんをサポヌトいたしたす。 興味のお持ちの方は JPNAcademicTeam@sas.com たでご連絡ください。

Analytics
0
和歌山県デヌタ利掻甚コンペティション参考資料(6) 蚪日倖客数・出囜日本人数の傟向ず予枬 (時系列デヌタの利甚)

これたでのSAS Visual Analytics 掻甚䟋では、䞀時点のデヌタを衚やグラフに瀺し、分析しおいたしたが、統蚈デヌタには毎幎、毎月や四半期ごずに集蚈されおいるものが倚くありたす。そこで今回はデヌタのなかに時間情報が存圚する時系列デヌタの操䜜に぀いお説明したす。 時系列デヌタには囜や地方自治䜓が公衚しおいるデヌタに加え、気象情報、商品の売䞊、株䟡、為替レヌトなど様々なデヌタがありたす。時系列デヌタを利甚するこずで、過去の傟向やパタヌンを把握したり、将来はどうなるのか予枬するこずができたす。SAS Visual Analytics のオブゞェクトには、時系列デヌタではないず䜜成できないものがあり、その䞭でも今回は、二軞の時系列プロットず予枬の利甚䟋を説明したす。 このスラむドでは、日本政府芳光局JNTOが公開しおいる「幎別 蚪日倖客数・出囜日本人数・囜際旅行収支IMF方匏の掚移」を利甚したした。このファむルには、1959幎から2016幎たでの幎ごずの蚪日倖客数、出囜日本人数ずその䌞び率、囜際旅行収支のデヌタがありたす。デヌタのむンポヌトに぀いおスラむド内でも説明しおいたすが、むンポヌトの際の泚意点など詳现に関しおはこちらのブログを参考にしおください。   SAS Visual Analytics 8.3 における時系列デヌタの利甚 from SAS Institute Japan   予枬オブゞェクトでは、自動的に最適な予枬モデルが遞択されたす。オブゞェクトを最倧化し、詳现を衚瀺するず䜿甚された予枬モデルを確認するこずができたす。 スラむド内の予枬では、ARIMAが䜿甚されおいたした。 たた、デヌタ圹割からWhat-If 分析を遞択するず、シナリオ分析ずゎヌル探玢を実行するこずができたす。シナリオ分析では、芁因の倀を蚭定するこずで、予枬倀がどれくらい倉化するかを確認できたす。ゎヌル探玢では、予枬の目暙倀を蚭定するこずで、その目暙を達成するために必芁な芁因の倀を決定するこずができたす。 今回スラむド内で玹介したほかに時系列デヌタを利甚するオブゞェクトずしおは、時系列プロットず比范時系列プロットがありたす。䜜成したオブゞェクトを右クリックするずメニュヌが衚瀺されるのでそこから倉曎するこずができたす。 匕き続き本ブログのシリヌズでは、図衚・グラフの䜜成や統蚈解析の方法に぀いお玹介いたしたす。 第2回和歌山県デヌタ利掻甚コンペティションぞの参加も募集䞭ですので、高校生・倧孊生のご参加をお埅ちしおいたす。远蚘募集は締め切られたした

Analytics
0
和歌山県デヌタ利掻甚コンペティション参考資料(5) 人口増枛率に圱響を䞎える行政基盀の解明 (ディシゞョンツリヌ)

本ブログのシリヌズでは、SAS Visual Analyticsを甚いた図・グラフの䜜成や統蚈解析に぀いおご玹介しおいたす。第回目ずなる今回は、ディシゞョンツリヌを甚いた分析方法をご説明したす。 第1回和歌山県デヌタ利掻甚コンペティション倧孊生の郚の課題は「人口枛少問題を解決するための斜策」でした。前々回の蚘事では、各自治䜓の行政基盀が人口増枛率に䞎える圱響を線圢回垰を甚いお評䟡したした。この手法は説明倉数の䞎える圱響の倧きさを定量的に評䟡できるものの、各説明倉数間の関係の読み取るこずは困難でした。そこで本蚘事では同じ題材を甚いお「ディシゞョンツリヌ」による分析方法をご説明したす。ディシゞョンツリヌでは、各説明倉数が目的倉数に及がす圱響を階局ごずに分析するこずができたす。 前々回の蚘事ず同じく、総務省の「瀟䌚・人口統蚈䜓系 郜道府県デヌタ 瀟䌚生掻統蚈指暙 ïŒšD 行政基盀」ず「人口掚蚈郜道府県別人口増枛率総人口」のデヌタを䜿甚したした。 SAS Visual Analytics 8.3 ã«ãŠã‘るディシゞョンツリヌの利甚 from SAS Institute Japan   今回の分析においお、人口増枛に最も倧きな圱響を䞎える芁玠は「財政力指数」でした。郜垂郚など財政力が匷い地域の人口が増加しやすいこずは感芚的に自然な結果でしょう。 泚目すべきは、財政力指数が䜎い自治䜓においお次に倧きな圱響を䞎える芁玠が「土朚費割合」であったこずです。無論むンフラの敎備は垂民の暮らしやすさに欠かせない芁玠ですが、人口増加に぀ながる理由ずしおは、「公共事業による雇甚の創出」ず捉えるこずが適切でしょう。今回は行政基盀のみを説明倉数に蚭定したしたが、有効求人倍率や最䜎賃金等、垂民の生掻や劎働に関連する芁玠を説明倉数に据えるこずで、より詳现な分析が可胜であるず予想されたす。第䞀回和歌山県デヌタ利掻甚コンペティションのサむトにこのテヌマに関する優秀䜜品が掲茉されおおりたすので、ご参照ください。 ディシゞョンツリヌによる分析は、説明倉数が目的倉数に及がす圱響や各説明倉数間の関係が理解しやすいずいうメリットがありたすが、モデル䜜成時に甚いたデヌタに過剰適合し汎化性胜が䜎いずいうデメリットもありたす。目的に応じおツリヌの枝数や階局数を適切に調敎するようにしたしょう。 以䞊、ディシゞョンツリヌを甚いた分析手法に぀いおご説明したした。本ブログのシリヌズの他の蚘事もぜひご参照ください。 第2回和歌山県デヌタ利掻甚コンペティションぞの参加も募集䞭ですので、高校生・倧孊生のご参加をお埅ちしおおりたす。远蚘:募集は締め切られたした