SAS Japan と伊藤忠テクノソリューションズ株式会社は、第2回和歌山県データ利活用コンペティションに共同で協賛し、参加者に「データサイエンス教育プラットフォーム」を提供します。
このブログでは、データサイエンス教育プラットフォームの利用例をシリーズで紹介します。
本コンペティションは次世代のデータサイエンティストを育成することを目的に開催され、全国の高校生及び大学生が腕をふるいます。データサイエンス教育プラットフォームでは、プログラミングを知らない学生でもデータ分析ができるように、データの取り込み、集計、基本的な統計解析、高度な機械学習手法などをビジュアルなインターフェースで実行できる SAS Visual Analytics をWebブラウザから利用できます。
コンペティションのテーマは「高齢者が活躍できる社会づくり」「UIターン就職・若者の定住促進」です。オープンデータや参加者自身が収集したデータを分析して解決策を提案します。そこで、まずは、SAS Visual Analytics にデータをインポートする方法を紹介します。社会課題がテーマということで、政府系のデータを使うことも多いと予想されますので、国が提供するオープンデータを用いた分析を中心に解説します。
まずは、厚生労働省の保育所等関連状況取りまとめ(平成30年4月1日)及び「待機児童解消加速化プラン」と「子育て安心プラン」集計結果から申込者の状況のデータをインポートします。
次に、データをインポートする際の注意点について、総務省統計局の平成29年 就業構造基本調査 都道府県編 「男女,育児の有無・頻度・育児休業等制度利用の有無,年齢,就業希望の有無・求職活動の有無別人口(無業者)-全国,全国市部,都道府県,都道府県市部,政令指定都市」を例に補足します。
インポートされたデータからグラフやレポートを作成することができます。
育児有無・男女別の就業希望者と求職者のレポートその方法や、高度な分析を行う手法についても、本ブログのシリーズで紹介いたします。
第2回和歌山県データ利活用コンペティションへの参加も募集中ですので、高校生・大学生のご参加をお待ちしています。
(追記: 募集は締め切られました)