Author

小林 泉
RSS
Senior Manager, Analytics Platform and Cloud Solution, Customer Advisory Division

1999年SAS Institute Japan入社後、金融・通信・製造・小売・官公庁を中心に顧客分析やサプライチェーン最適化などのアナリティクス・プロジェクトにて、データウェアハウスやアナリティクス・プラットフォームの設計/構築からアナリティクスのコンサルティングを担当。その後、プリセールスとしてSASアナリティクス・ソリューションの提案、顧客のデータ・マネージメント課題解決への従事、最新技術を利用したビッグデータ活用やSAS on Hadoopビジネスの立ち上げ、普及活動に従事。 データのリアルタイム分析と、大規模分析基盤アーキテクチャ、機械学習についての豊富な知見、経験を持つ。 2016よりSAS Viyaの立ち上げを担当し、OSSの世界へ新しい価値を提供するビジネスを推進。2020年からSAS Cloudソリューションの推進を担当。最近の興味は、「現実世界のデジタライゼーションの限界と展望」。

Advanced Analytics | Analytics | Artificial Intelligence | Data Management
小林 泉 0
自由と統制:変化しながらもガバナンスを担保するための唯一無二のData & AIプラットフォームとは

競争に勝つためのData & AI プラットフォームに完成はない 「ガウディとサグラダ・ファミリアに学ぶデータ分析基盤アーキテクチャのための原則」で考察したように、変化し続ける市場や消費者、経済環境において、企業・組織が意志決定する対象やその内容は刻々と変化していきます。また、よりよい意志決定のためのData & AI活用のためのテクノロジーも日々変化していきます。そのような環境においては、従来のようなある一時点のユーザー要件に基づいてData & AI環境を準備することは、企業・組織の俊敏性を損ない、まだ見ぬ将来への変化対応力(レジリエンシー)を弱め、結果として常に世の中のトレンドから大きく遅れた後追いのData & AI活用になってしまいます。例えば以下のような状況に陥っているとすると、それはその企業・組織の戦略がそのような常に後追いにしかならない方法論で進めていることになります。 「データ統合基盤」の過ち:あらたに「データ統合基盤」(*1) を構築しようとするが蓄積するデータが決まらずプロジェクトが開始できない、あるいは完了しない。また完了したと思ったのに使われない。 「Data Lakehouseツール」の過ち:アジャイル型を標榜して、クラウド型の「Data Lakehouse用」のデータベースを安価に採用したが、ユーザーの利用が進むにつれてより多くのデータが必要になってきたときに、そのデータベースのコストが指数関数的に膨れ上がる価格モデルであったため、必要なデータが結局蓄積できないという結果になった 「簡易なデータ分析ツール」の過ち:上記と同様にクラウドプラットフォームにほぼ無償でついてくるAI/機械学習機能でデータ分析をスタートする企業も多いです。しかし多くの企業が「データ分析始めました」の域を出ることができず、真にビジネス課題を解決するための機能が足らないことに気づかないまま、データ分析とはこの程度のものだと思い込み、結果として「始めましたプレゼンテーション」を最後に、真にビジネス価値を創出した事例発表に至ってない。 「AIガードレールツール」の過ち:生成AIのテクノロジーを活用して、自社のビジネスを成長させたいが生成AIを安全に使うためのAIガードレールツールを選定したが、いざ導入してみると、そもそも生成AIを活用してビジネス価値を出す案件がなかったり、あるいはテクノロジーの進化が速いために、必要なガバナンス機能がすぐに変わってしまい、当初の投資金額だけでなく、その投資にかかった時間や人的リソースが無駄になってしまった 「データモデル」の過ち:過去の経験のベストプラクティスとしてのデータモデルを導入したが、ある時点のデータモデルとして完成しすぎていて、新たな市場の要件に対応するために新たなデータを追加しようとした際に、対応できなかった 「機能特化型パッケージツール」の過ち:たとえば、金融不正対策アプリケーションにおいては、不正の手法が常に変化する中対策に必要なデータやアルゴリズム・手法をどんどん変化させていく必要があるが、限定的なデータモデル、限定的なアルゴリズムしか持たないツールを採用してしまったために、不正対策をスピード感をもって進化させられていない *1) データ統合基盤の過ち補足:そもそも日本市場・日本語でよく聞く、この「データ統合基盤」という言葉が過ちを生み出している元凶でもあります。データ・マネージメントの目的は、「欲しいときに」、「欲しい形で」、「欲しい品質で」、「欲しい人が」特定のビジネス課題を解決するという目的を達成するためにデータを活用できることです。必ずしも一か所にデータが蓄積されている必要はありませんし、データは膨大なため利用頻度や重要度に応じて格納の仕方を変える必要もありますし、目的に応じて必要なデータやその結合の仕方も変わるため、「あらかじめ統合」しておくことにもあまり意味がありません。もちろん、過去データウェアハウスの時代には、一時的に企業の構造化データを一貫性をもってER図的に定義・実装したデータモデル・データベースが非常に役立った時代もあります。特にそれはアドバンスト・アナリティクスというよりは、レポーティングやOLAPによるデータ探索目的に役立ちました。一方で、機械学習や最適化などアルゴリズム的に高度なデータ分析や、昨今のように非構造化データを扱う場合には、常に新しいデータを使いたくなることが多く、あらかじめデータモデルで定義しておくことの価値は低くなります。 なぜ常に時代遅れになりがちで、AIの取り組みの役に立たないData & AIプラットフォームを構築してしまうのか? 上記のような様々な過ちに企業陥ってしまうのはなぜでしょうか? 20年ほど前は一部のアナリティクス成熟度が高い(例えばこちらを参照ください データリテラシーが経営者の嘆きを救う)企業だけが、解決したいビジネス課題とそれを解決した時の期待効果の試算に基づいてあるいは野心的に大規模にData & AIプラットフォームへの投資を、ユーザー部門が主に自分たちの予算で企画・導入していました。 その後、テクノロジーの進化と共に、プログラマーニーズ、あるいはプログラミングを主たる作業とするデータサイエンティストニーズの高まりにより、データ分析、データサイエンスの取り組みのオーナーがあたかもIT部門やアプリケーションデベロッパーかのような時代になり、Data & AIプラットフォーム投資の意志決定のオーナーがITサイドに移動しました。 手段であるIT、データサイエンス、機械学習やプログラミングの底力が高まるのは良いことなのですが、それにより、「ビジネス課題解決(収益向上・コスト削減・リスクの管理)」というData & AIプラットフォームの目的定義がおざなりになり、あたかもERPを導入するかのような要件定義の仕方でData & AIプラットフォームへの投資の仕方に代わってしまいました。従来は目的ありきで作っていたものが、流行にのって作ってしまってから、後から使い方を考えるという世界に変わってしまったのです。データ統合基盤を作ったのに使われないという嘆き(前述の別ブログを参照のこと)はまさにその象徴です。 一方で、昨今の責任あるAIの視点から、ビジネスニーズに沿ってなんでもかんでも自由にやっていいわけではない 少し前までは、AIは、「人間の特定のタスクを置き換えるもの」という定義でしたが、昨今は違います。AIは人間とは異なる方法で知性を身につけており、ときにそれは人間の能力をはるかに超える能力を発揮します。言い換えると、AIは人間の理解ややり方が及ばない方法で、知的なアクションを行えるようになっています。これは次のようなことを意味しています。 人間の仕事が奪われるという視点は近視眼的:AIはすでに人間とは異なる方法で知性を身につけているので、従来の人間のタスクをそのまま置き換えるわけではありません。もちろんAIの能力を過小に使用して人間の従来のタスクをやらせても良いかもしれませんが、それはAIの潜在能力を生かし切っていません。これまで人間にはできなかったことができるAIを、これまで人間がやってこなかった仕事の量や質に当てはめて、仕事の仕方を効率化するのではなく、「変革」することができるという視点が重要です。 我々は人間社会をより良くする必要がある:一方で、人間の能力を超えた知性を人間の社会活動に取り入れることには最新の注意が必要です。人間の能力を超えた知性を人間の知性で開発されたテクノロジーだけで統制することは不可能です。かつて人間は様々な人間の能力を超えたものを開発してきました。例えば自動車です。自動車の利用を統制するには法律やルールが必要だったように、AIの利用を統制するためにはテクノロジーだけではなくルールや法律が必要になってきます。 人間中心のAI活用には人間のインクルージョンが不可欠:教育機関が生徒不在で「生徒はこれが欲しいはずだ」という取り組みを実施して失敗したり、イベントやマーケティングにおいて企画フェーズに実際のオーディエンスを参加させずに(実際の声を反映させずに)企画者が勝手に良かれと思った企画が失敗に終わるケースは後を絶ちません。オーディエンスが画一的ではなく多様化している今の時代「インクルージョン」が非常に大事になってきています。これは、SAS社が提供する責任あるイノベーションのためのリテラシートレーニング(Responsible Innovation and Trustworthy AI)で学ぶ内容です。AIにはデータが必要なため適切なリテラシーがないと現実世界を切り取っただけのバイアスだらけのデータだけを真実と見なしたAIアプリケーションが構築され、人間社会の倫理と公正性が危険にさらされます。AIアプリケーションの開発プロセスに人間が介在できるData & AIプラットフォームが求められます。 Data &

Analytics
小林 泉 0
データリテラシーが経営者の嘆きを救う

経営層による「データ活用がされてない」という嘆き ここ数年のAI・データサイエンスなどの「ブーム」およびクラウド化などのITインフラ・ツールの様相の進化により、数十年前からデータ分析を武器としてきた企業に加えて、より多くの企業で「データ活用」に取り組み始めました。その多くの取り組みは以下のようなものに代表されるのではないでしょうか。 クラウド化を期に「データ基盤構築」と称して様々なデータを一元的に蓄積する データサイエンティストを採用・育成する 民主化と称し全社にBIツール(レポーティング・グラフ化ツール)を配布する DX部門やデータサイエンス部門を配置する しかしその結果として、「これらのことをやってきているのに、経営的な意志決定にデータが十分活用されている実感がない」と嘆く経営層が多いのはなぜでしょうか? このような嘆きのパターンは以下に大別されます。 経営上の意志決定をする上でのファクトが見えないすなわち、「世の中の真実の理解」ができておらず、経営上の意志決定に役立てられていない 色々なビジネス上の取り組みをしている(ようだ)が全体の収益性へのインパクトが見えない、すなわち様々な角度での活動や取り組みの「収益性」管理ができていない データの価値を高められていない。自社内のデータ資産を価値に変えられていない。部門間同志、あるいは他の企業のデータと自社のデータを掛け合わせることで新しい価値を創出できるはずができていない。すわなち「イノベーション」が起こせていない 筆者は、これらの嘆きの理由を、「データリテラシーが不足しているからだ」と考えています。本ブログでは、「データリテラシー」の定義についてあらためて考察することで、その筆者の考えをお伝えします。 まずデータリテラシーとは データリテラシーとは、「データを読み解く力」と言い換えられることも多いですが、そもそも「データを読み解く力」とは何でしょうか?手元にあるデータをグラフ化してレポートを作成し、勝手な仮説の証拠とすることでしょうか?ビジネス上の意志決定というコンテキストの中では「データを読み解く力」を筆者は以下のように3つの力の総体として定義します。 ビジネス上の問いからスタートしてデータの可能性を見極める力 データそのものを正しく理解する力 データを通して真実を理解する力 1.ビジネス上の問いからスタートしてデータの可能性を見極める力 データ活用の取り組みで頻繁に見られ、また成果を発揮していないパターンはほぼ決まっていて、「このデータでなにかできないか」というデータの活用そのものが目的化している場合です。データから出発している時点で、イノベーションのアイディアに制約を課しており、また、思いついたアイディアに飛びつき投資を続けて形になりかけようやく価値を具体的に考え始めたところで、投資対効果が低いことに気づくというパターンです。これは、近年のAIやDXブームにおいて周りに後れを取らないことが目的化している企業に多く見られる結果です。 二十年以上前からデータ分析を武器としてきた企業は、スタート地点が異なります。1999年、筆者が初めてモデリングソフトウェア(当時のSAS Enterprise Minerという製品です)を使用したデータマイニングによる顧客分析プロジェクトでは、お客様の要望は、「このデータで何かできないか?」ではなく、「顧客の顔が見たい」という一言でした。我々はその「ビジネス課題」をデータでの表現に翻訳し現実世界と利用可能なデータのギャップを示しながら、モデリング結果に基づくアクションを実行する支援をしていました。 その当時からそのまま使われている、SASのData & AI ライフサイクル(図1)の定義が他社の類似方法論と大きく異なるのは、プロセスの最初が「問い」すなわち、ビジネス上の課題設定であるということです。社会人1年目の私でもそのデータマイニングプロジェクトでお客様の課題解決の手伝いができたのは、弊社の方法論の最初のステップに「問い」があったおかげです。 「データドリブン経営」の「データドリブン」が誤解を招く一因になっていることもあるようです。「データ」そのものは推進力にはなりません、データを活用し「ビジネス課題を解決するより良い意志決定」そのものがビジネスをドライブします。自動車を動かしているのは、ガソリンや電気ではなく、エンジンやモーターであるのと同じです。「データが語る」というのは正しくなく、「データを(必要に応じて)使って語る」が正しいのです。 また、対としてビジネス活動を正しく定量的に測れるスキルも必要です。バイアスだらけの過去のデータと比較して、企業や事業の成長率を正しく測っているかどうか、オペレーショナルなKPI(例えば在庫金額)が全体収益(売上やオペレーションコスト、調達コストなどを含めた全体の収益性)にどのように貢献しているか、などデータ活用によるビジネス変革を経営視点で正しく測れるようにすることも必要です。こちらのブログ(そのデータ活用は攻め?守り?)でご紹介した、ストラテジック、タクティカル、オペレーショナルの分類ごとに、各活動や業務単位での成果を測定し、連結したレポーティングをするということです。 2. データそのものを正しく理解する力 企業活動で生成されるデータは単に過去の企業活動つまり過去の意志決定とその実行結果と、市場との相互作用の産物でしかありません。例えば、商品Aの売上が下がっているデータがあったとしても、それが市場全体での商品Aの需要の落ち込みを表しているのか?あるいは競争の中でシェアを落としていることは表しているのか?あるいは商品陳列棚に欠品が多発しているのか?はたまた単に商品Aの販売を減らす意志決定を過去にしただけなのか?は、販売データだけを見てもわかりません。 簡単に手に入るデータが表している傾向からだけではその背後にある真実・理由はわからない、ということを理解する力(スキル)が必要になります。 優秀なデータ活用者は、データの出自の確認からスタートします。そのデータがどのように収集されたのか、収集時にはどのような制約があったのか、どのような過去のアクションの結果なのか、収集の精度やシステムはどのようなものなのか、などです。データを加工したり視覚化する前のこの最初の1歩ができているかできていないかで、その企業が真にデータ分析を競争力に変えられているかどうか判断することができます。 3. データを通して真実を理解する力 特にビジネスの世界において、データは世の中の真のあり方(消費者の行動特性や嗜好、市場のトレンド)をそのままの形で表現していることは稀で、一つの断面を切り取っていたり、過去の企業の意志や行動が介在していることがほとんどです。このような性質を持つ企業活動のデータから、真実を見通すにはどのようにすればよいでしょうか? 真実を見通すためには、実験と推定しかありません。仮説を基に計画的に実験を繰り返しその結果のデータを見ることで、真実を「推定」します。これが、データを通して真実を理解するということです。 図2は、ビジネスにおける意志決定を理解するために、歴史的なアプローチを模式化したものですが、右側にあるような一見社会全体をデータが表していると誤解しがちなアプローチでも、インターネット上のデータ、関連企業の販売・マーケティング活動の結果、というバイアスのかかったデータであることを理解することが必要です。 筆者は、以上3つの力が「データを正しく読み解き活用する」力であり、総称してデータリテラシーであると考えます。 データリテラシーを身につけ、嘆かないようにするために その①:まずデータリテラシーを身につける 多くの企業では、データサイエンス教育に力を入れていますが、前述のデータリテラシーの定義を見ると、それらは単にテクニカルにデータを加工し(データエンジニアリング)、分析やモデル開発をする(データモデリング)スキルではなく、経営管理者層が身に着けるべきData & AI 時代の「ビジネス(プロフェッショナル)スキル」であることがわかります。したがって、全社レベルの教育という点では、私は真っ先にデータリテラシー教育に力を入れるべきだと考えます。 例えば「サラリーマンの平均給与」のグラフがTVのニュースで出てきたときに、 そもそも調査方法は?母集団の条件は? そもそも分布が正規分布でないのだから平均よりは中央値を教えてほしい 年代別や勤続年数別でないとライフスタイルも異なるのだから参考にならない このグラフ縦軸が0から始まってなく何か意図的な誘導を感じる

Advanced Analytics | Analytics | Artificial Intelligence | Data Management | Data Visualization | Machine Learning | SAS Administrators
小林 泉 0
データ分析プロセス全体を管理~自己組織的に育てるナレッジのカタログ化とは

自己組織化とは、自然界において個体が全体を見渡すことなく個々の自律的なふるまいをした結果、秩序だった全体を作り出すこと 2010年から存在した解決アイディアがついに実現可能に 今から遡ること十数年前の2010年頃、支援をしていた大手製造業の会社ではすでにデータ分析スキルの社員間でのばらつきと組織全体のスキルの向上、データ分析作業の生産性の向上、人材のモビリティへの耐性としてのデータ分析業務の標準化が課題となっていました。 当時ご相談をいただいた私を含むSASの提案チームは、SASが提供するアナリティクス•ライフサイクル•プラットフォームを活用することで、その問題を支援できることがすぐにわかりました。つまり、ビジネス課題から始まり、利用データ、データ探索による洞察、データ加工プロセス、予測モデリングプロセス、モデル、そしてそれをアプリケーションに組み込むディシジョンプロセスという、一連のアナリティクス•ライフサイクルにまたがるすべての作業を電子的に記録し、全体のプロセスそのものをモデリングし、利活用することで、自己組織的にナレッジが蓄積され、且つ活用されるということです。 しかし、当時のSASだけではない周辺のIT環境、すなわちPCやアプリケーションアーキテクチャなどのインフラ、データの所在、セキュリティ管理などがサイロ化していること、またSAS以外のModelOps環境もシステムごとにアーキテクチャがバラバラすぎたこと、また、お客様社内のデータリテラシーそのものもまだ課題が多かったため、SASを中心としても、実現にはあまりにも周辺の開発コストがかかりすぎたために、提案を断念しました。 時代は変わり昨今、クラウド技術の採用およびそれに伴うビジネスプロセスの変革と標準化が急速に進んでいます。それに歩調を合わせるように、SASの製品も、上記の当時から市場をリードしてきたMLOpsフレームワークをDecisionOpsへと昇華させ、クラウド技術を最大活用すべく、クラウドネイティブなアーキテクチャおよび、プラットフォームとしての一貫性と俊敏性を高めてきました。そしてついに最新版のSAS Viyaでは、アナリティクスライフサイクル全体にわたり、データからデータ分析プロセス全体の作業を電子的に記録し、管理し、活用することが可能となりました。 自己組織的にナレッジを蓄積活用するデータ分析資産のガバナンス 昨今のデータマネージメントの取り組みの課題 詳しくはこちらのブログをご参照いただきたいのですが、多くのケースで過去と同じ過ちを繰り返しています。要約すると、データ分析文化を醸成したい、セルフサービス化を広めたいという目的に対しては、ある1時点のスナップショットでの完成を目的としたデータカタログやDWH/DMのデータモデル設計は問題の解決にはならないということです。必ず5年後にまた別の担当者やプロジェクトが「これではデータ分析しようにもどのデータを使えばわからない、問題だ、整備しよう」となります。 では解決策はなんでしょうか。 静的な情報を管理したり整備するのではなく、日々変わりゆく、どんどん蓄積され、評価され、改善、進化し続ける、データ分析業務に関わるすべての情報を記録統制することです。つまり、以下の三つのポイントを実現することです。各ポイントの詳細は後段でご紹介しています。 ポイント①あらゆるデータ分析資産(ナレッジ)を管理 ポイント②データ品質管理の自動化・省力化とガバナンス ポイント③社内ソーシャルの力による自己組織的情報の蓄積 まずは、それぞれが何を意味しているかを説明する前に、これらを実現するとどのような世界になるのかをユーザーの声によって示してみたいと思います。   個々の自由にデータ分析をしているユーザーによる行動を記録することで、全体を見渡している誰かがヒアリングや調査をして情報を管理することなく、データ分析がどのように行われているかを管理・共有・再利用が可能となるのです。 誰が、どのような目的で、どのデータを、どのように使用したのか、そしてその結果はどうだったのか? このアプリケーションの出した判定結果の説明をする必要がある。このモデルは誰が作ったのか?どのような学習データを使用したのか?どのようなモデリングプロセスだったのか? よく使用されるデータはどれか? そのデータはどのように使用すれば良いのか?注意事項はなにか? データ分析に長けた人は誰か?誰が助けになってくれそうか? 企業全体のデータ品質はどのようになっているか? データ品質と利用パターンのバランスは適切か?誤った使い方をしているユーザーはいないか? など従来、社内勉強会を開催したり、詳しい人を探し出してノウハウを聞いたり、正しくないことも多い仕様書をひっくり返してみたり、そのようにして時間と労力をかけて得られていたデータ分析を自律的に行う際に重要となる社内ナレッジが、自己組織的に形成されるということです。 「情報資産カタログ」とは~一般的な「データカタログ」との違い このような世界を実現する機能をSASでは、「情報資産カタログ」と呼んでいます。データ分析プロセス全体を管理・検索・関連付け・レポートできるようにするテクノロジーです。一般的に言われる、また多くの失敗の原因になる、「データカタログ」と対比するとその大きな違いが見えてきます。 こちらのブログでも述べましたが、データ分析者がセルフサービスでデータ分析を実践したり、初学者がなるべく自分自身で情報収集して、まずは標準的なデータ分析作業をマスターしたりするためには、既存ナレッジを活用する必要があります。一方で、そのようなナレッジは従来一部の優秀なデータ分析者に聞かないとわからなかったり、あるいはITシステム部門に質問して回答までに長い時間を要してビジネス機会を逸してしまう、という結果を招いていました。 既存ナレッジとは、どのようなデータを、どのような意図で、どのような目的で、どのように使い、どのようなアウトプットを得たかという一連の「考え方とやり方」であり、これは管理者が一時的にデータ分析者にヒアリングして「データカタログ」を整備して終わり、というものではなく、日々データ分析者たちの中で自律的に情報が作られていくものです。 ポイント①あらゆるデータ分析資産(ナレッジ)を管理 SAS Viyaでは、上述のアナリティクスライフサイクル各ステップのオブジェクトがすべて一元的に記録・管理されます。日々、新しく作られるレポート、データ加工プロセス、作成されるデータマートの情報が、自動的に管理され検索対象になっていきます。このようにアナリティクス・ライフサイクルの各ステップをすべて管理することで、データ、そのデータを使用しているレポート、そのデータを使用しているデータ加工フロー、その出力データ、さらにはそれを学習データとして使用している予測モデリングプロセスと作成されたモデル、これらを関連付けて見ることが可能となります。それにより例えば、ある目的に使用するデータを探している場合、参考にする業務名やプロジェクト名で検索をすることで、関連するレポートや、データ加工プロセスにたどり着き、そこから使用データやそのデータの使い方にたどり着くという効率的な情報の探し方が可能となります。 もちろん、この機能は昔からあるインパクト・アナリシス機能として、ITシステム部門が、データへの変更の影響調査ツールとして使用することも可能です。 ポイント②データ品質管理の自動化・省力化とガバナンス データ分析を組織的に行う際に気にすべきポイントの一つは、その正確性です。正しいマスターデータを使用しているか、適切な品質のデータを使用しているかは、最終的なアクションや意思決定の精度すなわち収益に影響します。また、結果に対する説明責任を果たすうえでもアクションに使用したデータの品質は属人的ではなく、組織的に管理されている必要があります。またデータ品質を組織的に管理することにより、データ分析の最初に行っていた品質確認という作業が省力化できます。また、属人的に行っていた品質確認作業も標準化されるため、組織全体のデータ分析作業の品質が向上します。 あるお客様では、DWHに格納するデータのETL処理において施すべき処理が実施されていないというミスがあるものの、データの数やETL処理があまりにも多いためそのミスを発見することが困難であるという状況にありました。網羅的な品質管理および品質レポートによってそのようなミスの発見が容易になります。 ポイント③社内ソーシャルの力による自己組織的情報の蓄積 前述のポイント①により基本的にはデータ分析者個人個人の自律的な活動が自動的に記録され、自己組織的に組織全体のナレッジとて蓄積され共有・再利用可能な状態が作られます。これは、データ分析者個人個人が特に意識しなくても自動的に実現できます。それに加えて、さらに意識的にこのプラットフォームを利用することで、蓄積されるナレッジに深みが増します。 例えば、あるビジネス課題をデータ分析で解決使用する場合のスタートは、「問い」です。上述のアナリティクス・ライフサイクルの一番左のスタートにあるものです。その際には、仮説設定をするためや仮説を検証する目的で、様々な角度から「データ探索」を行います。この初期のデータ探索プロセスは、その後のデータ加工やモデリングの根拠になっているため、ナレッジとしてまた説明責任の材料としてはとても重要になります。必ずしも最終的に使用したデータと同じデータを使うとも限らないので、自動的には他のデータ分析資産とは関連づきません。そのような探索プロセスも下記の図のように、同じプロジェクトフォルダに保存しておくことで、関連オブジェクトとして活用することが可能となります。また、プロアクティブに自信が使用したデータやレポートにコメントや評価を付与することで、より価値の高いナレッジへと育つことになります。 昨今企業内SNSなどで、オフィスツールの使い方などノウハウを共有をされている企業・組織もあるかと思います。それを全社規模のアナリティクス・プラットフォームで行うことで、データ分析に関わるナレッジをユーザー同士で培っていくイメージです。 まとめ 「このデータはこの目的に使えますか?」「あ、それはこの情報がないので使えないんですよ。こちらのデータを私は使ってますよ」データ分析者の間でよく交わされる会話です。この問いにいかに迅速に答えられるかが、データ分析の効率性と正確性を高めます。「情報資産カタログ」はまさにこの問いに答えるための機能なのです。

1 2 3 4 16