Author

RSS

SASに入社する前にはプログラマーとしてウェブサイトの開発業務を行っていた。2020年1月からSASに入り、現在は、「Curious」、「Passionate」、「Authentic」、「Accountable」というSASの4つの価値を楽しみながらプリセールスとしてSASアナリティクス・ソリューションの設計、提案の活動を担当。出身は韓国。

Analytics | Data for Good | Learn SAS | Programming Tips
0
CData JDBC Driverを利用したSNS・ファイルストレージサービスとの連携のご紹介

SAS ViyaではCData JDBC Driverを使って下記のソーシャルメディア・ファイルストレージサービスにシームレスにかつ、素早く連結できます。 ・Facebook ・Google Analytics ・Google Drive ・Microsoft OneDrive ・Odata ・Twitter ・YouTube Analytics 本日はCData JDBCドライバーを使ってTwitterと連携し、「天気」に関するツイートを取得してみたいと思います。順番通り説明しますので、最後までお読みいただき、皆さんも是非ご活用ください。   1. Twitter API利用申請 Twitter Developer PlatformにてTwitter APIの利用申請を行います。申請にあたり、名前と住んでいる地域、利用目的などの情報を提供する必要がありますので、事前に用意しておいてください。また、利用申請の承認はTwitter側で数日かかる場合がありますのでご了承ください。 Twitter APIの利用申請が終わったら、申請完了のメールが届きます。 また、申請の検討が終わり、Twitter APIが利用できる状態になりましたら、「Account Application Approved」というメールが届きます。 2. CData Twitter JDBC Driverインストール インストールにはSASの契約とは別途、CData社との契約が必要ですが、30日間トライアルで使うことも可能ですので、ご紹介します。 まず、CData Twitter JDBC Driverインストールページにアクセスします。 次に、Downloadクリックします。 Download Trialをクリックします。 適切なOSを選択してDownloadをクリックします。今回はWindowsを選択しました。 ダウンロードされたTwitterJDBCDriver.exeファイルを開き、画面に表示されるステップに従ってインストールを完了します。   3. Connection String生成

Analytics | Data for Good | Work & Life at SAS
0
米国ノースカロライナ州から学ぶ行政におけるデジタルフォーメーション

◆ はじめに 行政のデジタルトランスフォーメーション(以下DX)は、デジタル化が進み、非対面でのコミュニケーションが日常化するなど、従来の生活形態が変化するにつれて、政府や行政も市民サービスの変革をする必要性が高まっています。その動きとして日本でもデジタル庁を新たに設置し、データ管理やITシステムなどを総括することになります。しかし行政のDXは、システムのデジタル化による行政手続きの効率化だけに焦点が当たり、大規模なシステムを構築しがちですが、本来行政のDXとは、データとそのデータを分析した結果得られた洞察によって、より良い市民サービスにつなげることから考えることが必要だと考えます。本稿では、SAS社の本社がある米国ノースカロライナ州(以下NC州)で行われている行政のDX事例について紹介します。NC州では、データ分析を活用して、様々な政策やサービスを新たに開発し、市民サービスに新たな価値を提供しています。この事例を通して、行政のDX成功のためのポイントについて見ていきたいと思います。   ◆ 行政におけるDXのポイント ポイント1.小さいことから始めよう 行政のDXで一足飛びに100%満足できる成果まで至る事例はあまりありません。また、すべてが理想的に準備されるまで待つ必要もありません。NC州は2007年からGDAC(Government Data Analytics Center)と呼ばれるデータの管理や分析を行う部署の運営を始めました。最初から大きなプロジェクトを行ったわけではなく、まずは各機関米国ノースカロライナ州から学ぶ行政におけるデジタルフォーメーションのデータを収集し、データ管理とモニタリングから始めました。初めの3年間は、データ基盤を構築し、大きなプロジェクトに最初に取り組んだのは2010年の犯罪分野です。GDACはSAS社と共同で「CJLEADS」というプロジェクトを開始しました。CJLEADS(Criminal Justice Law Enforcement Automated Data Services)は、犯罪データの統合管理のシステムです。CJLEADS導入前は、様々な機関のシステムやプロセスを経由して犯罪記録を閲覧したり、更新したりしましたが、現在では各機関がCJLEADSを介して犯罪歴を統合的に管理しています。これにより、NC州は、年間1,200万ドルを節約することができ、犯罪データの紛失や欠落を防ぎ、より安全な社会を作ることができました。その後、犯罪分野だけでなく、様々なプロジェクトに取り組み、行政のDXを進めています。これらのシステムやプロジェクトを最初から完全に構築することは簡単ではありません。NC州のCJLEADSも、最初はデータの収集、統合したデータを活用したレポーティングやモニタリング、そして複雑な課題解決、とステップを踏んでいます。このように、ビジョンは大きく掲げつつ、小さな成果を重ねて発展させることがポイントではないでしょうか。   ポイント2.現場にいるビジネス専門家の協力を得る 行政のDXの目的は、市民サービスの向上です。どうすればデジタル技術を活用したより良いサービスが生まれるのでしょうか。ここでは、例えば、一般的な自然災害である「洪水」を例として挙げてみましょう。世界的に洪水は年間数千万人の命を奪い、経済的な損失も大きくなります。それに対し、NC州は高度なデータ分析力とIT技術力を持つ企業との業務提携を通じて洪水問題を解決しています。 図1.SASとMicrosoftは様々な分野で顧客の課題を解決するために2020年6月に戦略パートナーシップを締結 NC州では、SAS社のデータ分析技術とMicrosoft社のIT技術を用いて洪水による災害を予測し、地域社会に知らせるシステムを構築しました。気象データ、橋の水位、降雨量など、様々な指標をはかり、IoTと機械学習を活用し、洪水による災害を予測・警告する仕組みを構築しました。この取り組みは、2020年11月には米国で毎年行われる政府革新賞(Government Innovation Award)で、公共部門の革新事業賞を受賞しました。NC州の洪水予防システムは企業との協力で公共データを活用し、市民の安全を確立することができたと評価されています。 図2.米国ノースカロライナ州とSASが共同で行ったDX事例 図2にはNC州とSAS社が協力して行った行政での様々な分野のDX事例の一部を記載しています。状況別、時期別、プロジェクト別など多様な課題が存在する行政のDXでは、当該課題を解決できる能力を備えた民間機関や民間企業などの経験と技術が貢献できるのではないでしょうか。   ポイント3.本来の目的に集中する 上記のポイントを成功させるためには、最終的にすべての参加者が「より良い市民サービスの提供」というDXの本来の目的を常に意識する必要があります。行政のデジタル化では、「オンライン行政サービス」、「電子政府の設置」などのシステム化対応に追われ、DXが本来生み出せるはずの「市民サービスの革新的な向上」という目的を見失いがちです。今回例に挙げたNC州ではDXの取り組みそのものを継続的に推進し、市民中心のサービスを提供するためにデジタルガバナンスを構築しました。そのガバナンスの透明性を高めるために毎年「We Are NC Gov」というカンファレンスを開催し、現在のDXの状況や今後の計画について議論しています。また、一般向けに州のDXの取り組みについて理解してもらえるよう、YouTubeへ説明動画をアップロードしています。外部からフィードバックをもらうことで、さらにより良い市民サービスの提供を目指しています。デジタル技術は、それ自体で意味のあるものではなく、その技術を活用して、市民サービスの革新を創出することではないでしょうか。 図3.NC州の情報技術部が2020年6月、YouTubeに公開した動画の一部を日本語に翻訳。GADCのデータ解析センター長が部門の事業について発表した。 ◆ おわりに 米国NC州とSAS社が共同で取り組んでいる行政のDX事例を通じて、行政におけるDXの成功のポイントについて考察してきました。ご紹介した3つのポイントが、革新的な市民サービスの向上へと向かうための一つの道標となるのではないでしょうか。日本におきましても、SASは戦略パートナーシップに基づいてMicrosoft社とスマートシティを推進して参りますので、詳細情報をご希望の方は是非ご相談ください。*お問い合わせ先: JPNSASInfo@sas.com  

Advanced Analytics | Analytics | Data Management | Learn SAS | Programming Tips | Students & Educators
0
SASのIn-Database機能のご紹介

1. はじめに 前回投稿しました「SAS/ACCESSのご紹介とSnowflakeとの連携デモ」はご覧になったでしょうか。SASと外部のデータストレージサービスを連携する「SAS/ACCESS」のご紹介と、実際に「Snowflake」というサービスに連携してみました。今回は、その続きとして、10年以上前からビッグデータ・アナリティクスの基本アーキテクチャである、In-Database機能の代表的な機能である、SQLパススルーという機能をご説明し、デモを準備しました。 2. SQLパススルーについて SAS/ACCESS がインストールされている場合、SQLパススルーを使用してデータストレージサービスにクエリできます。接続方法に応じてSQLパススルーは、「暗黙的パススルー」と「明示的パススルー」に分けることができます。 暗黙的パススルーの価値は、作成したSASコードが自動的にデータストレージサービスが処理できるSQLに変換され、そのSQLをデータストレージサービス側に与えることにあります。ですので、SASで実行されたSQLやSASプロシジャに指定されたWHERE句など、可能な限りデータストレージサービス側で処理を行い、結果だけをSAS側に転送することが可能です。一方、明示的パススルーの場合には、DB依存のSQLを明示的に記述することできます。暗黙的パススルーと明示的パススルーについてまとめた表を下に記載していますので、ご覧ください。今回は、暗黙的パススルーについて詳しくご紹介したいと思います。   ▲SAS CommunityでSQL Pass throughについて質問するユーザー 暗黙的パススルーを使用する方が良いか、明示的パススルーを使用するのが良いのか気になるかと思います。実はこのトピックは、SAS Communityでもよく見られ、SAS/ ACCESSを使用している全世界のユーザーにとっても気になる質問です。どちらを使用するかは、どこに基準を置くか、また、SASとデータストレージサービスの環境のスペックによって異なると思います。ですので、皆さんもこのような疑問が生じた場合は、SASに相談してみてはいかがでしょうか。   3. 暗黙的パススルーのデモ 3-1. データの紹介とデモの概要 今回のデモのために、「pets」と「owners」という名前で2つのテーブルをデータストレージサービス(今回は、Snowflake)側に事前に保存しておきました。 「pets」テーブルには、3つのカラムがあります。 Id: ペット固有のid Name: ペットの名前 Type: ペットの種類(犬、猫、その他) Id Name Type 1 オオビ 犬 2 ローザ 猫 3 ワンチャン その他 … … …   もう1つのテーブル「owners」にも3つのカラムがあります。 Id: オーナー固有のid Name: オーナーの名前

Advanced Analytics | Learn SAS | Programming Tips | SAS Administrators
0
SAS/ACCESSのご紹介とSnowflakeとの連携デモ

01. はじめに 最近多くの人々がクラウド環境をベースにしたデータストレージサービスを利用しています。 ここで皆さん、突然ですが、データを管理するためにローカル(またはオンプレミス)環境を構築していた過去を振り返ってみてください。 以前は、データを保存するために、関連ソフトウェアやハードウェアを購入・設置・インストールし、様々な環境設定を行います。3か月後、データの量が増えてきてデータベースの容量が足りなくなります。そしてまた多くの費用と時間を使って、必要なソフトウェア・ハードウェアを再び購入、同じく様々な環境設定をします。 上記に記載したような様子は現在のビジネス世界ではほとんど見当たりません。今日必要なのは、ただメールアドレスとクレジットカードのみです。最近では様々なデータストレージサービスが生まれてきたからです。このようなサービスはクラウド環境で動いていて、一定期間料金を支払えば利用できる「subscription」(サブスクリプション)ベースであり、前払い方式ではなく、使用した分だけ課金される「pay as you go」(ペイアズユーゴー)方式が特徴です。SASでも様々なデータストレージサービスに対応していますが、今日はその情報について詳しくお伝えします。   02. SAS/ACCESSのご紹介 「SAS/ ACCESS」とは、SASと他のベンダーのデータストレージサービスを連携するインターフェースです。下記のような特徴があり、様々なデータストレージサービスとの連携を支援しています。 シームレスで透過的なデータアクセス (Seamless, transparent data access) 柔軟なクエリ言語のサポート (Flexible query language support) パフォーマンスチューニングオプション (Performance tuning options) 性能最適化機能 (Optimization features for better performance) より詳しい情報はこちらをご参照ください。 様々なデータストレージベンダーの中で、今回は「SAS/ACCESS INTERFACE TO SNOWFLAKE」を使って「Snowflake」というサービスに連携してみたいと思います。* Snowflakeの設定はこちらを見て事前に行いました。   3. SAS/ACCESSデモ 3-1. LIBNAME statementで連携 SASのLIBNAME statementで簡単にSnowflakeとの連携を行うことができます。連携することでSnowflakeのデータをDATA StepやSASプロシージャで参照することが可能になります。LIBNAME Statementのサンプルコードは下記のボックスをご参考ください。 LIBNAME

Advanced Analytics | Analytics | Data Visualization | Learn SAS
0
SAS Viyaのワードクラウド分析を用いた消費者の声分析例

01. はじめに 今回のポスティングでは、SAS Viyaの「テキストトピック」という機能を用いたSNSの消費者の声の分析例を紹介したいと思います。分析の手法として「ワードクラウド分析」という方法を使いましたが、こちらについても後ほどお話します。SNS上の書き込みデータを分析することで、ビジネスに役立てられる洞察を得ることができますので、最後まで読んでいただければと思います。   02. 消費者の声分析の一般的な流れ SNS上の消費者の声分析は、一般的に大きく3つの段階に分けることができると思います。そのステップ①は様々なSNSプラットフォームから消費者の声を集める「データ収集」です。ステップ②は、収集したデータを分析する段階です。データ分析の手段はいくつかがありますが、本記事では、「ワードクラウド分析」という手法を用いることにします。最後のステップは、ビジネスメリットに繋げるように分析結果を活用する段階です。分析結果を元により意思決定し、施策を実施する段階です。本記事では、3つの段階の中で2段階目の「データ分析」、具体的には、「ワードクラウドを用いた分析」について説明します。   03. ワードクラウド分析とは? ワードクラウドというのはテキストデータの意味をより直感的に把握するための分析の一つ手法です。 テキストデータを単語に分割し、単語ごとの出現頻度をカウントし、その頻度に応じた大きさでその単語を視覚的に表示してくれます。 つまり、テキストや文章が何に関して語られているのか、そのキーワードを簡単に見つけ出すことができる手法になります。 例えば、SNS上の書き込みをテキストデータ化して分析し、顧客や消費者が今どんな事に興味を持っているのか、どんな不満があるのか、などを把握することができます。 (出典:https://awario.com/) 私はニュースなどのメディアでアメリカのトランプ大統領がどんな単語を何回使ったか、トランプ大統領のツイッターを分析したワードクラウドを見たことがあります。例えば、上のイメージは、2018年から2019年までのトランプ大統領のツイッターでつぶやかれた単語のワードクラウドですが、「border」と「wall」が一番使われた単語ということが一目で分かります。   04. SAS Viyaのワードクラウドの特徴 SAS Viyaのワードクラウドの特徴についてご紹介します。 まず、自動的に分析対象のテキストデータを単語に分割した上で解析します。所謂テキストマイニングと言いますが、その結果として、それぞれの文章がどんな話題(トピック)に関して語っているのかを分析し、トピックごとにキーワードを頻度に応じた大きさで確認することができます。また必要に応じて、気になるトピックやキーワードの元の文章を確認することもできるようになっています。 また、分析の際、冠詞や、助詞、副詞など、意味がない単語は自動で外して分析を行います。 これも、SAS Viyaのワードクラウドの一つの特徴なのですが、例えば、Open Source系のプログラミング言語で分析をすると、英語の 「the」や「a」などは、 分析者自身でなんとかして、取らなければいけないこともありますが、SASでは自動でその作業を行います。 さらに、書き込み内容がネガティブな内容なのか、ポジティブなのか、中立であるか、確認できる機能もあります。この機能は、「センチメント分析」、 日本語では「感情分析」と呼ばれますが、SASではワンクリックで簡単に実行できます。   05. 消費者の声分析例 それでは、SAS Viya の「テキストトピック」という機能を用いた消費者の声分析デモをご紹介いたします。 ▲ 準備したデータについて 日本では最近「天高く馬肥ゆる秋」になったので、季節感が感じられるように「天気」に関したデータを準備しました。また、オーストラリアのシドニーとカナダのバンクーバーのツイッターデータを収集しました。この二つの地域を設定した理由は、現在のシドニーは昼間の平均気温が約20度で、少し暖かいか、涼しい天候ですが、バンクーバーは約5度と少し寒く、対立的な地域を選ぶことで、明確な結果を得たかったからです。(個人的な理由もあり、キャリア管理の上司がSASオーストラリアのシドニーで働いていて、同期の1人はSASカナダのバンクーバーにいるので、毎回オンライン会議で会う2人の季節環境が気になったのです。同期と出会った新入社員研修についての記事はこちら) データの対象期間は、10月15日から10月23日まで、9日間、データの取得の際に使ったキーワードは、「weather」、「today’s weather」、「weekend weather」、「winter」、「summer」という5つのキーワードを使いました。こういった条件で実際にツイッターから集められたデータは、シドニーが351件、バンクーバーが277件でした。 ▲ 「天気」に関するシドニーの消費者の声分析 まず、シドニーの消費者の声のワードクラウド分析結果を見てみましょう。 「雨」に関するトピックが44件で、トピック全体で1位になっております。こちらのトピックをクリックすると、このトピックに関連する用語・キーワードを右側の画面で確認できます。「rainy」の比重が最も大きいことが分かります。 (出典:https://www.holiday-weather.com) 雨に関するデータが多い理由は、データを収集していた10月15日から23日前後にシドニーは天気が曇ったり、雨が降ったりしたからだと考えられます。

Learn SAS | Work & Life at SAS
0
SAS新入社員研修の体験談

はじめに 2020年5月7日から7月30日まで、約10週間 SAS本社で主催する「Global Customer Advisory Academy」という新入社員研修に参加しました。本来であれば、SAS Global本社があるアメリカのノースカロライナ州に行って受ける予定だったのですが、パンデミックという状況で全ての研修がオンラインで実施となりました。本記事では、Global Customer Advisory Academyをご紹介し、実際に参加して感じたことをお伝えします。   Global Customer Advisory Academyとは? 省略してCAアカデミーと呼ばれますが、Customer Advisoryというのは所謂プリセールスや営業支援部隊のことです。CAアカデミーは分析のコアテクノロジーや、コンサルティングスキルと方法論、SAS製品のポジショニングなどを学ぶ研修プログラムです。SASの全世界の拠点から社員が集められ、約10週間実施します。プログラム終了後は、実際の案件やプロジェクトなどに参加し、お客様の課題を解決するために活動します。具体的な情報と求人はこちらをご参考ください: https://www.sas.com/en_ph/careers/students-and-graduates/sas-academy.html#customer-advisory-academy   CAアカデミーに参加するまでの事前準備 SASに入社する前は、プログラマーとしてウェブサイトの開発業務を行っていました。SASの製品を使ったこともなく、業界も異なり、また、顧客との接点やコンサルティング、営業活動などの経験もなかったので不安でした。 しかし、CAアカデミーに参加するまでに「Pre-work」というプログラムがあり、それを受講することで事前準備ができました。 1ヶ月間行ったPre-workでは、 - SASの会社概要と製品について - ビジネスマナー、リモートで効率的に研修を受ける方法 - 今回のCAアカデミーに一緒に参加する社員とのチームビルディング - CAアカデミーを終了した社員とのミーティング などがありました。特に、19カ国から31名の社員が参加するということで、それぞれの社会経験が異なり、「一緒に頑張って研修を受けるぞ!」という気分になったので心配はなくなりました。   10週間のCAアカデミー研修について CAアカデミーの詳細なカリキュラムは、グローバルトレンドと業界の動向に合わせてタイムリーに毎年変更されますが、いつも最高の研修プログラムを社員に提供するという事に変わりはありません。今回の研修で印象的だった部分は、次回にリリースされるSAS Viyaの新しいバージョンについて学べたことです。本社のR&DチームでSAS Viyaを設計した社員から直接技術的な内容について学ぶことができました。これにより、SASのお客様にも、もっと正確で専門的な技術支援を行うことができます。 また、金融、製造、官公庁、物流、小売、エネルギー、ITなど様々な分野のケーススタディを学ぶことができました。SASのお客様は全世界の多様な業界に存在しています。したがって、どのお客様にもベストソリューションを提供するために業界ごとのシナリオも勉強しました。 研修はすべて英語で行いました。英語で専門的なトピックについて長時間話したことがなくて、少し心配していましたが、研修のセッションに参加する前に準備資料を十分に読んで参加しました。また、一方的に講師が知識や情報を話すだけではなくて、理解ができていない所や気になった点はその場ですぐに質問できる雰囲気だったので積極的に聞いてみました。グループに分かれて1つのトピックについて議論し、意見を共有できた点も良かったです。CAアカデミーで十分なコミュニケーションを通じ、様々な視点から課題や解決策を考えることができました。     実は、上記のすべての研修は、自宅からオンラインで参加しました。驚きませんか?「オンラインで研修を受けることが可能なのか?」と最初は疑っていましたが、本当に問題なく約10週間の研修が無事に終わりました。SASでは全世界の約15,000人のすべての従業員がリモートワークができるような環境を提供しています。今回のCAアカデミー研修でも「6畳の部屋からグローバルネットワーキング」ということで全て自宅で参加しました。研修が終わって約2ヶ月が過ぎた現在では、一緒に研修に参加した31カ国の社員と毎月オンラインで集まってコミュニケーションを取っています。研修で築いた全世界の同期とのネットワークは私の財産です。   難しかったこと 研修のスケジュールに適応するまで少し時間がかかりました。何故かと言いますと、19カ国の31人のSAS社員がリモートで参加したため、すべての時間が異なり、全員の時間を考慮して研修のスケジュールが設定されたからです。ですので、研修スケジュールのほとんどが日本時間の午後9時から翌日午前1時、2時までと自分にとっては夜中のスケジュールとなりました。特に、私は朝早く起きて一日をスタートする、所謂「朝型人間」ですので、研修の時間に適応するまで数週間がかかりました。 日本時間で午後9時は、アメリカ時間では午前8時、スウェーデン時間では午後2時になるなど、19カ国の時間がすべて異なっていたので、31人皆が苦労した所だと思います。オンラインで会うたびに挨拶の言葉で皆が「good morning」、「good afternoon」、「good evening」この3つを全部一気に言ってしまいました。おそらく私一人だけ時差ぼけがあるのではなく、19カ国で参加した31人全員が大変だったので、協力しながら最後まで研修を受講することができたと思います。