SAS Viyaのワードクラウド分析を用いた消費者の声分析例

0

01. はじめに

今回のポスティングでは、SAS Viyaの「テキストトピック」という機能を用いたSNSの消費者の声の分析例を紹介したいと思います。分析の手法として「ワードクラウド分析」という方法を使いましたが、こちらについても後ほどお話します。SNS上の書き込みデータを分析することで、ビジネスに役立てられる洞察を得ることができますので、最後まで読んでいただければと思います。

 

02. 消費者の声分析の一般的な流れ

SNS上の消費者の声分析は、一般的に大きく3つの段階に分けることができると思います。そのステップ①は様々なSNSプラットフォームから消費者の声を集める「データ収集」です。ステップ②は、収集したデータを分析する段階です。データ分析の手段はいくつかがありますが、本記事では、「ワードクラウド分析」という手法を用いることにします。最後のステップは、ビジネスメリットに繋げるように分析結果を活用する段階です。分析結果を元により意思決定し、施策を実施する段階です。本記事では、3つの段階の中で2段階目の「データ分析」、具体的には、「ワードクラウドを用いた分析」について説明します。

 

03. ワードクラウド分析とは?
ワードクラウドというのはテキストデータの意味をより直感的に把握するための分析の一つ手法です。
テキストデータを単語に分割し、単語ごとの出現頻度をカウントし、その頻度に応じた大きさでその単語を視覚的に表示してくれます。
つまり、テキストや文章が何に関して語られているのか、そのキーワードを簡単に見つけ出すことができる手法になります。

例えば、SNS上の書き込みをテキストデータ化して分析し、顧客や消費者が今どんな事に興味を持っているのか、どんな不満があるのか、などを把握することができます。

(出典:https://awario.com/)

私はニュースなどのメディアでアメリカのトランプ大統領がどんな単語を何回使ったか、トランプ大統領のツイッターを分析したワードクラウドを見たことがあります。例えば、上のイメージは、2018年から2019年までのトランプ大統領のツイッターでつぶやかれた単語のワードクラウドですが、「border」と「wall」が一番使われた単語ということが一目で分かります。

 

04. SAS Viyaのワードクラウドの特徴
SAS Viyaのワードクラウドの特徴についてご紹介します。

まず、自動的に分析対象のテキストデータを単語に分割した上で解析します。所謂テキストマイニングと言いますが、その結果として、それぞれの文章がどんな話題(トピック)に関して語っているのかを分析し、トピックごとにキーワードを頻度に応じた大きさで確認することができます。また必要に応じて、気になるトピックやキーワードの元の文章を確認することもできるようになっています。

また、分析の際、冠詞や、助詞、副詞など、意味がない単語は自動で外して分析を行います。
これも、SAS Viyaのワードクラウドの一つの特徴なのですが、例えば、Open Source系のプログラミング言語で分析をすると、英語の 「the」や「a」などは、
分析者自身でなんとかして、取らなければいけないこともありますが、SASでは自動でその作業を行います。

さらに、書き込み内容がネガティブな内容なのか、ポジティブなのか、中立であるか、確認できる機能もあります。この機能は、「センチメント分析」、
日本語では「感情分析」と呼ばれますが、SASではワンクリックで簡単に実行できます。

 

05. 消費者の声分析例
それでは、SAS Viya の「テキストトピック」という機能を用いた消費者の声分析デモをご紹介いたします。

▲ 準備したデータについて
日本では最近「天高く馬肥ゆる秋」になったので、季節感が感じられるように「天気」に関したデータを準備しました。また、オーストラリアのシドニーとカナダのバンクーバーのツイッターデータを収集しました。この二つの地域を設定した理由は、現在のシドニーは昼間の平均気温が約20度で、少し暖かいか、涼しい天候ですが、バンクーバーは約5度と少し寒く、対立的な地域を選ぶことで、明確な結果を得たかったからです。(個人的な理由もあり、キャリア管理の上司がSASオーストラリアのシドニーで働いていて、同期の1人はSASカナダのバンクーバーにいるので、毎回オンライン会議で会う2人の季節環境が気になったのです。同期と出会った新入社員研修についての記事はこちら)

データの対象期間は、10月15日から10月23日まで、9日間、データの取得の際に使ったキーワードは、「weather」、「today’s weather」、「weekend weather」、「winter」、「summer」という5つのキーワードを使いました。こういった条件で実際にツイッターから集められたデータは、シドニーが351件、バンクーバーが277件でした。

▲ 「天気」に関するシドニーの消費者の声分析
まず、シドニーの消費者の声のワードクラウド分析結果を見てみましょう。

「雨」に関するトピックが44件で、トピック全体で1位になっております。こちらのトピックをクリックすると、このトピックに関連する用語・キーワードを右側の画面で確認できます。「rainy」の比重が最も大きいことが分かります。
(出典:https://www.holiday-weather.com)

雨に関するデータが多い理由は、データを収集していた10月15日から23日前後にシドニーは天気が曇ったり、雨が降ったりしたからだと考えられます。

上のイメージは「雨」に関するデータで否定的なニュアンスのデータを表示するために「センチメント分析」をクリックした結果です。中には、雨の日にベッドでネットフリックスを見たいのに仕事をしなければならない、雨の日の育児は大変だというツイートがありました。

また、少し特徴的なところもありました。それは、「patskarvelas」という言葉です。実は、オーストラリアのテレビ局の有名なキャスターさんが「patskarvelas」というユーザー名でツイッターを使っています。つまり、トピックの中で、「patskarvelas」という言葉が発見されたのは、他の人々がそのユーザーを「メンション」して発生した結果です。

もし、影響力が大きいインフルエンサーが特定の単語や商品をツイートし、それを他の人がメンションしたり、リツイートしたりすると、インフルエンサーを使ったマーケティングによって、SNSの大きなトレンドや流行を作ることができるとも考えられます。

▲ 「天気」に関するバンクーバーの消費者の声分析

バンクーバーのワードクラウドの場合、シドニーのデータ条件とまったく同じですが、「雨」のトピックがシドニーで一番多かったのに対し、バンクーバーでは、雨のトピックは14%で2位でした。

また、シドニーでは「冬」に関するトピックはなかったのですが、バンクーバーでは「冬」は、一つのトピックとして3位を示していました。バンクーバーは11月、12月は10月よりもっと寒くなるので、「冬」に関するトピックはさらに上に上がるかもしれません。

外食業、アパレル、遊園地など様々な業界で季節や天気に応じて売上が変わるという論文が沢山あります。したがって、気候に関する消費者の声やパターンなどの分析をSAS Viyaのワードクラウドで行い、分析結果を元に様々な営業戦略を立ててはいかがでしょうか。

 

06. まとめ
最後になりますが、SAS Viyaのワードクラウドでは、今見ていただいたようにシドニー、バンクーバーといった地域ごとにページを分けて作成することもできます。


また、上のイメージのように複数のワードクラウドを1ページにまとめて、気になる所を選択して分析結果を表示することも可能です。今回は、2ヶ所だけだったので、ボタンで地域を選べるように作りました。このような分析やレポート作成がマウスの簡単操作だけでできてしまいます。
以上、最後までご覧いただき、ありがとうございました。

 

Share

About Author


SASに入社する前にはプログラマーとしてウェブサイトの開発業務を行っていた。2020年1月からSASに入り、現在は、「Curious」、「Passionate」、「Authentic」、「Accountable」というSASの4つの価値を楽しみながらプリセールスとしてSASアナリティクス・ソリューションの設計、提案の活動を担当。出身は韓国。

Leave A Reply

Back to Top