Advanced Analytics

Move beyond spreadsheets to data mining, forecasting, optimization – and more

Advanced Analytics | Analytics | Artificial Intelligence | Customer Intelligence | Data Management | Machine Learning | SAS Events | Students & Educators
0
SAS Innovate on Tour Tokyo 2025 開催のご報告

2025年7月24日(木)に開催された「SAS Innovate on Tour Tokyo 2025」は、大盛況のうちに無事閉幕いたしました。ご来場いただいた皆さまに、心より御礼申し上げます。また、スポンサーの皆さま、そして運営・制作・広報をはじめとする関係各位の多大なるご支援とご尽力に、深く感謝申し上げます。 開催報告として、弊社代表 手島 主税からの基調貢献に関するメッセージを以下に投稿させていただきます。   SASジャパン創立40周年を迎える節目の年に開催致しました「SAS Innovate on Tour Tokyo 2025」ですが、私が代表を担当させていただいてから3度目となりました。この3年間、毎年ご来場いただく規模が増えておりまして、今年は過去最大の規模で終えることができました。改めまして皆様に心から感謝申し上げます。 意志決定と人との関係性の力をデータ&AIで紐付ける、「人中心型イノベーション」のビジョンのもと、意志決定に携わる経営者とフロントラインワーカー(営業、マーケティング、工場長、主計など)が求める具体的なテーマでお届けしました。 SASは「データはそれ自体では価値を生まない。価値を生むのは意志決定である」という信念のもと、多様化したAIのモデルを統計的な手法と機械・強化学習の組み合わせを実行できる高度なアナリティクス技術を進化させてきました。重要なのは、データをいかに意志決定に結びつけ、行動変容を促すかという「プロセス」です。 私たちが提唱する「意志決定のデータパイプライン」は、ビジネス部門の課題提起から逆算して必要なデータを整備するアプローチです。システム先行ではなく、人の知見や問いを起点にすることで、真に活用されるデータ基盤を構築できます。SASは、意味付けされたデータを各部門に合わせて提供し、お客様の意志決定を支援しています。 今年の基調講演では、日本を代表する経営者、DX推進リーダー、アカデミアのリーダーの皆様とスペシャルゲストとしてお迎えし、示唆に富んだパネルディスカッションを実施しました。 最初のパネルでは、ソニー銀行様、中国銀行様、東京海上ホールディングス様の経営リーダーがご登壇。 益々過去に無い規模でデータが生成されていく時代になり、企業の価値を創り出す宝探しである。またこれから現場への権限移譲とデータリテラシーの底上げを進めながら、最終的な価値を生むのは人のシナリオ、判断力であることが改めて強調されました。特に印象的だったのは、金融商品に“共感価値”を織り込むという発想の転換。金融を単なる機能価値から、人の感性に響く体験へと昇華させる挑戦が語られました。 [パネルディスカッションご登壇者(※登壇順)] ソニー銀行株式会社 南 啓二様 株式会社中国銀行 山縣 正和様 東京海上ホールディングス株式会社 生田目 雅史様 株式会社ソウジョウデータ 西内 啓様 未来の学びの探求’Future Ready’のパネルでは、統計学で多くの著書、大学での教えも推進されてきている西内先生をお迎えし、「問いを立てる力」がAI活用の出発点であること、そして経営から現場まで“問い→仮説→検証”のリズムを組織全体で回すことの重要性が共有されました。 また、アストラゼネカ堀江様、NSW竹村様にもご登壇頂きました。 堀江様には最新のSASのテクノロジー、AIを活用いただいたモダイナイゼーションによるコスト最適化とフロントワーカーの効率性アップの具体的な事例をご紹介いただき、多くの方に反響を頂きました。 [関連記事] アストラゼネカが目指す医療・創薬の新たなステージ──実現に不可欠なデータサイエンス部の役割とは? 竹村様には、新たなSASとの製造業界向けの戦略的パートナーアライアンスの発表をご披露いただき、昨今の製造業界における課題へのソリューション(工場と経営DX)をご紹介頂きました。これからの両社によるパートナーシップに弊社も大きく期待しております。 [関連記事] NSW株式会社様との協業の発表について - SAS Japan 私個人的にも、日本を牽引する各業界のリーダー皆様の志、視座の高さ、人間力に感銘致しました!!改めまして、南様、山縣様、生田目様、堀江様、竹村様に感謝申し上げます。皆様のビジョンの具現化の力になるべく、引続きSASジャパンも社を挙げて果敢に挑戦してまいります。 これからのSASジャパンに乞うご期待ください。 SAS Institute Japan株式会社

Advanced Analytics | Analytics | Artificial Intelligence | Customer Intelligence | Data for Good | Data Management | Data Visualization | Fraud & Security Intelligence | Internet of Things | Learn SAS | Machine Learning | Programming Tips | Risk Management | SAS Administrators | SAS Culture | SAS Events | Students & Educators
小林 泉 0
📣SAS Hackathon 2025 まもなく開幕(応募〆切8/31)📣

SAS Hackathon 2025が間もなく開幕 公式サイトはこちら☞ https://www.sas.com/sas/events/hackathon.html はじめに 課題、テーマや使用データ 課題やテーマ、使用データは参加者ご自身で準備いただきます 2023年の日本からの参加チームは、オープンデータを使用したチーム、普段の自社内の取り組みプロジェクトのデータを使用したチームなどがありました 分析環境や、専門スキルの支援などはSAS側で用意されます コミュニケーションに使用する言語 日本からの参加者をサポートするメンターはSAS Japanから日本語を話す社員が担当する予定ですが、エキスパートや他の参加者との交流は英語になります 成果物に使用する言語 成果物(プレゼン動画やプレゼン資料、アプリケーションなど)は英語になります。昨年の日本からの参加チームはそれぞれ、英語でのプレゼン、無音声英語文字のみのプレゼン、英語機械音声など様々な方法で対応されました 作業場所 オンラインでの約1か月間の作業なので、作業場所は、参加チームそれぞれで確保いただきます 2025 キックオフイベントの様子 ソーシャル メディア プラットフォーム経由で視聴する LinkedIn☞https://www.linkedin.com/events/7333469635326984193/ Youtube☞https://www.youtube.com/live/yp008_MVfF4 SAS Hackathonとは 好奇心は私たちの規範です 素晴らしいアイデアは、どこからでも誰からでも生まれます。さまざまな地域から、さまざまな背景やスキルレベルを持つデータ愛好家が集まると、驚くべきことが起こります。これらの優れた頭脳は、私たちの日常生活、ビジネスのやり方、人道的活動への取り組み方を変えるような新しいものを発明するでしょう。好奇心旺盛な頭脳が協力し合うと、世界が勝利するからです。 特長 仲間のプログラマーと協力する  経験豊富なデータ サイエンティストから初心者の技術者、パートナー、SAS エキスパートまで、誰もがクラウド上の SAS® Viya でオープン ソースを使用します。 無料の学習リソースを活用する トレーニング コースや仮想学習ラボを利用して、AI、クラウド環境、業界に関するコーチングを活用できます。 新しいテクノロジーを簡単に試すことができる SAS ハッカソンは、SAS ユーザーだけでなく、初心者や新規参入者の好奇心を刺激します。Python と R の専門知識を持つオープンソース プログラマーでも、そのスキルを SAS Viya

Advanced Analytics | Data Visualization
0
NSW株式会社様との協業の発表について

ITソリューションプロバイダのNSW株式会社様に、SAS Institute Japan 株式会社との協業について発表いただきました。 NSW、製造業の経営判断を高度化する意志決定プラットフォームの提供を開始 | NSW 以下が全文になります。 2025年7月24日 NSW株式会社 NSW、製造業の経営判断を高度化する意志決定プラットフォームの提供を開始 ~製造業の抱える生産性、安全性、持続可能性にまつわる課題をデータ活用で解決~ ITソリューションプロバイダのNSW株式会社(本社:東京都渋谷区、代表取締役執行役員社長 多田 尚二、以下NSW)は、データとAIのグローバルリーダーであるSAS Institute Japan 株式会社(本社:東京都港区、代表取締役社長 手島 主税、以下SAS)の技術を活用し、製造業向けの意志決定プラットフォーム「Factory Decision Making Platform」の提供を本日より開始します。 本サービスは、製造現場のOperational Technology(OT)データと企業内のITデータを統合し、AIによるインサイトを通じて、現場から経営層までタイムリーな判断と行動を可能にするソリューションです。意志決定までのリードタイムを短縮し、日々のオペレーション改善を従来よりもスピーディかつ確実に実行に移す仕組みを提供します。 ■提供の背景・概要  日本の製造業では、高度なオペレーションの知見が現場に蓄積されていながら、それが経営判断や全体最適に活かされないという構造的な課題が存在しています。 工程ごとにデータが分断されており、たとえ構造化されたデータとして蓄積されていたとしても、現場での可視化にとどまり、スピード感ある経営判断や業務判断に結びついていないのが実情です。 このような課題に応えるべく提供を開始する「Factory Decision Making Platform」は、SASの迅速な意志決定を支援する分析プラットフォームを活用し、NSWが蓄積してきたOT/ITデータ統合・業務改善のノウハウ、現場密着型のコンサルティング・導入・運用支援を組み込んだ、意志決定のリードタイムを短縮し、経営判断のスピードおよび確実性を高めるエンドツーエンド型サービスです。 単なる技術導入にとどまらず、顧客に寄り添いながら、改善サイクルの高速化を伴走型で支援することが最大の特長です。 本サービスにより、製造現場で発生する膨大なデータを、判断と行動につながる形に整理・統合することで、OEE(総合設備効率)やダウンタイム、CO2排出量などの主要KPIを着実に改善できます。現場改善の即応性を高め、生産性、安全性、持続可能性の最適化を実現します。 本サービスでは、以下の機能およびプロセスを通じて、顧客のデータ活用と意志決定を総合的に支援します。 OT/IT間のデータ収集・統合 データマートの構築および前処理 GUIベースで利用可能なプリセットAIモデル 工程改善コンサルティング、導入支援、教育、運用保守、AI活用のBPOに至るまでのエンドツーエンド支援 ■協業の背景と今後の展望 SASは、製造業を含む多様な業界に向けて高度な分析プラットフォームを提供し、企業のデータ活用と意志決定の高度化を支援しています。NSWはIoT/OT機器からのデータ取得やマネジメントにおいて豊富な実績を持ち、多くの製造工程における“リアルデータの利活用”を支援してきました。 両社がそれぞれ強みとする「分析基盤」「工程データの統合・活用力」「業務定着に向けた支援力」を結集することにより、「経営」と「現場」をシームレスにつなぐ意志決定プラットフォームの構築が実現しました。製造業が直面する意志決定の”スピード”と“精度”の両立という課題に対し、技術と人の知見の融合によって新たな解決策を提供します。 今後NSWとSASは、エンタープライズ企業への展開に加え、BPO支援やSaaS連携を通じた中堅中小市場へのスケールも視野に入れ、製造業におけるデータドリブン経営の実現をより広く支援してまいります。 また、本プラットフォームの提供にあたり、両社の知見やユースケースを集約し、顧客が実際のデータや業務シナリオをもとにソリューションを体感・検証できる共創の場を設ける取り組みを進めています。製造工程におけるイノベーションの“出発点”となるようなオンサイト型の拠点として、実践的な価値の創出を目指します。 ■SAS Institute Japan株式会社からのエンドースメント SASは、テクノロジーが人の力を最大限引き出す役割になるべく、人の意志決定をインテリジェンスにし、“人中心型イノベーション’を推進しております。 このたびNSW様との協業により、現場の知見と先進テクノロジーを融合し、製造業におけるDX戦略を支えるソリューション、インテリジェンスプラットフォームを提供できることを大変嬉しく思います。 本サービスは、工場現場で鍵となる生産性・安全性・持続可能性の向上にフォーカスし、製造能率や設備効率の改善、労働災害リスクの低減、エネルギー使用量の削減といった現場KPIを経営の視点で捉え直すことで、経営と現場双方の迅速かつ的確なアクションへとつなげます。 今後もNSW様と連携し、現場と経営をつなぐ新たな意志決定のかたちを共に広げてまいります。

Advanced Analytics | Analytics | Artificial Intelligence | Data Management
小林 泉 0
自由と統制:変化しながらもガバナンスを担保するための唯一無二のData & AIプラットフォームとは

競争に勝つためのData & AI プラットフォームに完成はない 「ガウディとサグラダ・ファミリアに学ぶデータ分析基盤アーキテクチャのための原則」で考察したように、変化し続ける市場や消費者、経済環境において、企業・組織が意志決定する対象やその内容は刻々と変化していきます。また、よりよい意志決定のためのData & AI活用のためのテクノロジーも日々変化していきます。そのような環境においては、従来のようなある一時点のユーザー要件に基づいてData & AI環境を準備することは、企業・組織の俊敏性を損ない、まだ見ぬ将来への変化対応力(レジリエンシー)を弱め、結果として常に世の中のトレンドから大きく遅れた後追いのData & AI活用になってしまいます。例えば以下のような状況に陥っているとすると、それはその企業・組織の戦略がそのような常に後追いにしかならない方法論で進めていることになります。 「データ統合基盤」の過ち:あらたに「データ統合基盤」(*1) を構築しようとするが蓄積するデータが決まらずプロジェクトが開始できない、あるいは完了しない。また完了したと思ったのに使われない。 「Data Lakehouseツール」の過ち:アジャイル型を標榜して、クラウド型の「Data Lakehouse用」のデータベースを安価に採用したが、ユーザーの利用が進むにつれてより多くのデータが必要になってきたときに、そのデータベースのコストが指数関数的に膨れ上がる価格モデルであったため、必要なデータが結局蓄積できないという結果になった 「簡易なデータ分析ツール」の過ち:上記と同様にクラウドプラットフォームにほぼ無償でついてくるAI/機械学習機能でデータ分析をスタートする企業も多いです。しかし多くの企業が「データ分析始めました」の域を出ることができず、真にビジネス課題を解決するための機能が足らないことに気づかないまま、データ分析とはこの程度のものだと思い込み、結果として「始めましたプレゼンテーション」を最後に、真にビジネス価値を創出した事例発表に至ってない。 「AIガードレールツール」の過ち:生成AIのテクノロジーを活用して、自社のビジネスを成長させたいが生成AIを安全に使うためのAIガードレールツールを選定したが、いざ導入してみると、そもそも生成AIを活用してビジネス価値を出す案件がなかったり、あるいはテクノロジーの進化が速いために、必要なガバナンス機能がすぐに変わってしまい、当初の投資金額だけでなく、その投資にかかった時間や人的リソースが無駄になってしまった 「データモデル」の過ち:過去の経験のベストプラクティスとしてのデータモデルを導入したが、ある時点のデータモデルとして完成しすぎていて、新たな市場の要件に対応するために新たなデータを追加しようとした際に、対応できなかった 「機能特化型パッケージツール」の過ち:たとえば、金融不正対策アプリケーションにおいては、不正の手法が常に変化する中対策に必要なデータやアルゴリズム・手法をどんどん変化させていく必要があるが、限定的なデータモデル、限定的なアルゴリズムしか持たないツールを採用してしまったために、不正対策をスピード感をもって進化させられていない *1) データ統合基盤の過ち補足:そもそも日本市場・日本語でよく聞く、この「データ統合基盤」という言葉が過ちを生み出している元凶でもあります。データ・マネージメントの目的は、「欲しいときに」、「欲しい形で」、「欲しい品質で」、「欲しい人が」特定のビジネス課題を解決するという目的を達成するためにデータを活用できることです。必ずしも一か所にデータが蓄積されている必要はありませんし、データは膨大なため利用頻度や重要度に応じて格納の仕方を変える必要もありますし、目的に応じて必要なデータやその結合の仕方も変わるため、「あらかじめ統合」しておくことにもあまり意味がありません。もちろん、過去データウェアハウスの時代には、一時的に企業の構造化データを一貫性をもってER図的に定義・実装したデータモデル・データベースが非常に役立った時代もあります。特にそれはアドバンスト・アナリティクスというよりは、レポーティングやOLAPによるデータ探索目的に役立ちました。一方で、機械学習や最適化などアルゴリズム的に高度なデータ分析や、昨今のように非構造化データを扱う場合には、常に新しいデータを使いたくなることが多く、あらかじめデータモデルで定義しておくことの価値は低くなります。 なぜ常に時代遅れになりがちで、AIの取り組みの役に立たないData & AIプラットフォームを構築してしまうのか? 上記のような様々な過ちに企業陥ってしまうのはなぜでしょうか? 20年ほど前は一部のアナリティクス成熟度が高い(例えばこちらを参照ください データリテラシーが経営者の嘆きを救う)企業だけが、解決したいビジネス課題とそれを解決した時の期待効果の試算に基づいてあるいは野心的に大規模にData & AIプラットフォームへの投資を、ユーザー部門が主に自分たちの予算で企画・導入していました。 その後、テクノロジーの進化と共に、プログラマーニーズ、あるいはプログラミングを主たる作業とするデータサイエンティストニーズの高まりにより、データ分析、データサイエンスの取り組みのオーナーがあたかもIT部門やアプリケーションデベロッパーかのような時代になり、Data & AIプラットフォーム投資の意志決定のオーナーがITサイドに移動しました。 手段であるIT、データサイエンス、機械学習やプログラミングの底力が高まるのは良いことなのですが、それにより、「ビジネス課題解決(収益向上・コスト削減・リスクの管理)」というData & AIプラットフォームの目的定義がおざなりになり、あたかもERPを導入するかのような要件定義の仕方でData & AIプラットフォームへの投資の仕方に代わってしまいました。従来は目的ありきで作っていたものが、流行にのって作ってしまってから、後から使い方を考えるという世界に変わってしまったのです。データ統合基盤を作ったのに使われないという嘆き(前述の別ブログを参照のこと)はまさにその象徴です。 一方で、昨今の責任あるAIの視点から、ビジネスニーズに沿ってなんでもかんでも自由にやっていいわけではない 少し前までは、AIは、「人間の特定のタスクを置き換えるもの」という定義でしたが、昨今は違います。AIは人間とは異なる方法で知性を身につけており、ときにそれは人間の能力をはるかに超える能力を発揮します。言い換えると、AIは人間の理解ややり方が及ばない方法で、知的なアクションを行えるようになっています。これは次のようなことを意味しています。 人間の仕事が奪われるという視点は近視眼的:AIはすでに人間とは異なる方法で知性を身につけているので、従来の人間のタスクをそのまま置き換えるわけではありません。もちろんAIの能力を過小に使用して人間の従来のタスクをやらせても良いかもしれませんが、それはAIの潜在能力を生かし切っていません。これまで人間にはできなかったことができるAIを、これまで人間がやってこなかった仕事の量や質に当てはめて、仕事の仕方を効率化するのではなく、「変革」することができるという視点が重要です。 我々は人間社会をより良くする必要がある:一方で、人間の能力を超えた知性を人間の社会活動に取り入れることには最新の注意が必要です。人間の能力を超えた知性を人間の知性で開発されたテクノロジーだけで統制することは不可能です。かつて人間は様々な人間の能力を超えたものを開発してきました。例えば自動車です。自動車の利用を統制するには法律やルールが必要だったように、AIの利用を統制するためにはテクノロジーだけではなくルールや法律が必要になってきます。 人間中心のAI活用には人間のインクルージョンが不可欠:教育機関が生徒不在で「生徒はこれが欲しいはずだ」という取り組みを実施して失敗したり、イベントやマーケティングにおいて企画フェーズに実際のオーディエンスを参加させずに(実際の声を反映させずに)企画者が勝手に良かれと思った企画が失敗に終わるケースは後を絶ちません。オーディエンスが画一的ではなく多様化している今の時代「インクルージョン」が非常に大事になってきています。これは、SAS社が提供する責任あるイノベーションのためのリテラシートレーニング(Responsible Innovation and Trustworthy AI)で学ぶ内容です。AIにはデータが必要なため適切なリテラシーがないと現実世界を切り取っただけのバイアスだらけのデータだけを真実と見なしたAIアプリケーションが構築され、人間社会の倫理と公正性が危険にさらされます。AIアプリケーションの開発プロセスに人間が介在できるData & AIプラットフォームが求められます。 Data &

Advanced Analytics | Analytics | Artificial Intelligence | Customer Intelligence | Data Management
0
保険業界向けインタラクティブセッション「新しい保険ビジネス創造に向けた事例と成功要因」を開催!【SAS Institute Japan】

2024年5月31日(金)、SAS Institute Japanは、「保険業界向けインタラクティブセッション 新しい保険ビジネス創造に向けた事例と成功要因」 を六本木ヒルズ森タワー11階のSAS Institute Japan本社で開催した。 開会挨拶 保険業界においても顧客ニーズは多様化、高度化している。たとえば、生保ではウェルビーイングのような包括的な顧客ニーズを充足することが求められている。そして、顧客ニーズを充足するためのエコシステムが台頭し、保険商品がエコシステムに組み込まれ、顧客の生活の中でフリクションレスに保険や関連サービスが提供されるようになっている。今、保険会社はどのように新しい商品・サービスを開発し、マーケティングを実行すべきなのか。本イベントでは、保険業界で実際に多数のイノベーションやCX変革に関わっている有識者をゲストに迎え、今取り組むべき課題やその実際を議論していく(SAS Institute Japan カスタマアドバイザリ事業本部 原島 淳氏)。 セッション1:保険業界におけるビジネスアーキテクチャの転換  まず、福島 渉氏(デロイトトーマツコンサルティング 執行役員 保険インダストリリーダー)が「保険業界におけるビジネスアーキテクチャの転換」について話した。  「これまで世界の保険業界において、ランキング上位企業の顔触れは大きく変わってこなかった。100年以上の歴史を持つ保険会社がランキング上位を占めている。それは従来の保険会社はバリューチェーンの各機能を内製化しており、それぞれの知見や能力が競争優位性の源泉であり、また参入障壁になっていたからだ。大手企業は、潤沢な資本を背景とした価格形成力を持ち、販売網を張り巡らせ、そして高い引受・査定能力により収益を維持してきた。 しかし、今日ではバリューチェーン各機能の分立と共有化が進んだことで、この構造が崩れ始めている。保険会社のビジネスモデルは多様化しており、また水平横断的機能提供を狙うプラットフォーマーが出現している。各保険会社は自らの強みを活かしながら、フィナンシャル&ヘルスマネジメント型、経済活動のあらゆるリスクをカバーするフルスペック型、ドメインフォーカス型、もしくはプダクトファクトリー型といったビジネスモデルを選択していくことになると予測する。また、機能特化/集約型プラットフォーマーとして、データアナリティクス、カスタマーエンゲージメント、キャピタル&インベストマネジメント、ITテクノロジーのプラットフォーマーが出現してくるだろう。たとえば、資産運用プラットフォームBlackRock、”Technology as a Service”のOneConnectといった企業はそれに当たる。保険会社はこういったプラットフォーマーを活用することも重要だ。  このような潮流を受けて、保険業界のビジネスアーキテクチャは変化している。これまでは、単一の商品を効率的に販売する”代理店モデル”が主流だった。しかし、これからは商品・サービスとチャネルをターゲット顧客に応じて最適な形で組み立てていくことが重要だろう。前述のような機能プラットフォーマーが提供する”モジュール化”された機能を自社の商品・サービスやチャネルと組み合わせることで新しいビジネスモデルを定義し、多数の顧客セグメントに効率よく価値提供することも可能だ。たとえば、よく知られるエンビデッド保険や、シンガポールIncomeのSNACKの革新的なサービスもその一例だ。  今日の保険業界ではスピーディーなイノベーションが強く求められている。イノベーションを加速させるには、モジュール化された機能を組み合わせることで、商品・サービスをスピーディーにプロデュースする能力が重要と言える。これからの保険会社に求められるのは、ブランド価値とビジネスケースの仮説構築力と、それをもとに商品・サービスをアジャイルで構築できる新しいテクノロジー基盤、そこで仮説検証を高速で廻せる業務プロセスである。今日の保険会社には、商品・サービス開発、マーケティング、テクノロジー、そして全体のガバナンスの各領域で、”モジュール”を活用したスピーディーな競争優位性の創造が求められている。」 セッション2:三井住友海上におけるCXマーケティングとデータ活用の取り組みについて  では、保険会社では実際にどのように商品・サービスを開発し、マーケティングを行っているのだろうか。続いて、佐藤 祐規氏(三井住友海上 CXマーケティング戦略部 データマーケティングチーム長)が「三井住友海上におけるCXマーケティングとデータ活用の取り組みについて」と題して、実際の取組みを紹介した。  「言うまでも無く、保険業界を取り巻く環境は大きく変化した。お客さまが自ら必要な情報を選択する時代では、事故補償時だけの関係性から脱却しなければならない。CXマーケティング戦略部では、お客様ロイヤルティ大手損保No.1を目指している。このためには、顧客接点を増強すること、そして、データ分析やリサーチを通してお客様の解像度を高め、お客さまごとのコミュニケーションを実施することで、新規獲得手法を高度化し、またお客さまの期待を超える体験価値を提供することが重要だ。そして、そのためにはデータ分析やデータ活用が欠かせない。  当社ではマーケティング領域のデータ活用を強化しているが、いくつかの取組事例を紹介する。まず、ドラレコ付き自動車保険のクリエイティブ開発の事例だ。従来、クリエイティブ開発は商品所管部門が担当しており、モノの視点(機能的価値)からの価値訴求が多かった。しかし、実際にお客さまへの訴求を行っている代理店への調査を行ってみると、お客さまは加入後の体験とそれによる安心に価値を感じていることがわかった。そういった体験価値の視点からプロトタイプを作成し、ターゲット層にアンケート調査を行うことでブラッシュアップを行い、より評価の高いクリエイティブを作成することができた。 この事例のように、消費者調査を行なうことで顧客のニーズや求められる価値を理解した上で、商品・サービス開発を進めている。お客さまに選んでいただくためには、良い商品を開発するだけでなく、当社の認知度や好感度、さらに契約体験や事故体験も重要な要因となる。それぞれの体験や認知が契約にどの程度寄与するのかも分析を行っている。 こういった分析を通してマーケティングミックスを最適化するために、弊社ではCDP(Customer Data Platform)を構築し、お客様起点で属性、契約、行動、調査、事故の情報を統合、活用している。この情報は代理店にも還元していて、代理店向け営業支援システムにNBA(Next Best Action)情報を配信している。  今後の方向性として、保険会社はプロダクト中心の発想から抜け出し、カスタマージャーニーにおける価値を中心に考える必要がある。顧客との接触頻度を拡大すべきだが、無意味な拡大は逆効果で、適度な距離感を持って、有用なコミュニケーションを行っていくことが重要だ。そのためにはお客さまの文脈を押さえた(”ジョブ理論”にもとづく)コミュニケーションが欠かせない。現在、ChatGPTを活用しながら、ジョブ理論にもとづくクリエイティブ開発を進めているが、こういった施策を通してCX向上を目指したい。保険会社の商品・サービスは今後拡大していくだろうが、差別化の最大のポイントはCXだと考えている。」 セッション3:保険イノベーションをサポートする新しいSASテクノロジと事例  こういった保険業界のイノベーションやCX高度化に求められるテクノロジーとは何か。原島 淳氏(SAS Institute Japan カスタマアドバイザリ事業本部)が「保険イノベーションをサポートする新しいSAS」と題して、SASが提供するテクノロジーと海外でのその活用事例を話した。  「保険会社は今、新しい商品・サービスとそのマーケティングモデルをスピーディーに創造していくことが求められている。競争力の源泉としてデータとAIを活用し、また新しいマーケットプレイスやテクノロジー企業が提供する”モジュール”との連携も重要だ。 SASはデータから価値実現のプロセスをEnd-to-Endでサポートし、アジャイルにも対応している。また、あらゆるシステム/モジュールとリアルタイムで統合可能なオープン性を持つ。SASを活用することで、データ・AIを活用した判断をカスタマージャーニーに組み込み、顧客体験を最適化できる。たとえば、外部ウェブサイトの顧客行動をリアルタイムで捕捉・分析し、最適な保険・サービスを最適な保険料で提案。申込があれば本人確認を行い、自動引受査定を行い、スピーディーに契約のご案内を行う、といった形で、業務横断のデータ・AI活用が可能だ 保険業界においてもSASを活用した事例は拡大している。その中から、(1)新しい商品・サービスをスピーディーに創造している事例、(2)優れたCXを提供する顧客接点を構築している事例、(3)業務横断の高度なデータ・AI活用を実施している事例を紹介したい。 まず、(1)海外ダイレクト保険プラットフォーマーでは、多数の外部パートナーに対し、APIを通して豊富な商品とSASで開発されたカスタマーエンゲージメントプラットフォームを”モジュール”として提供する。このプラットフォームはスケーラブルで、かつスピーディーに拡張できる点が特徴であり、多数の外部パートナー向けのエンベデッドの保険の提供や、金融・小売といった多数の販売パートナーとの提携によるマーケティングモデルの展開をサポートしている。次に、(2)カナダSun Lifeでは、デジタルアドバイザ”Ella”がアマゾンエコーなどのインターフェースを通して顧客のライフスタイルをサポートしながら、各種データにもとづいて健康や資産運用のための様々なナッジを提供している。(3)海外保険会社の中小企業向け保険のアンダーライティングでは、引受リスクだけでなく、保険+予防予後サービスを含むトータルの顧客LTVを加味して最適な提案(NBO=Next

Advanced Analytics | Analytics | Artificial Intelligence | Data Management | Data Visualization | Machine Learning | SAS Administrators
小林 泉 0
データ分析プロセス全体を管理~自己組織的に育てるナレッジのカタログ化とは

自己組織化とは、自然界において個体が全体を見渡すことなく個々の自律的なふるまいをした結果、秩序だった全体を作り出すこと 2010年から存在した解決アイディアがついに実現可能に 今から遡ること十数年前の2010年頃、支援をしていた大手製造業の会社ではすでにデータ分析スキルの社員間でのばらつきと組織全体のスキルの向上、データ分析作業の生産性の向上、人材のモビリティへの耐性としてのデータ分析業務の標準化が課題となっていました。 当時ご相談をいただいた私を含むSASの提案チームは、SASが提供するアナリティクス•ライフサイクル•プラットフォームを活用することで、その問題を支援できることがすぐにわかりました。つまり、ビジネス課題から始まり、利用データ、データ探索による洞察、データ加工プロセス、予測モデリングプロセス、モデル、そしてそれをアプリケーションに組み込むディシジョンプロセスという、一連のアナリティクス•ライフサイクルにまたがるすべての作業を電子的に記録し、全体のプロセスそのものをモデリングし、利活用することで、自己組織的にナレッジが蓄積され、且つ活用されるということです。 しかし、当時のSASだけではない周辺のIT環境、すなわちPCやアプリケーションアーキテクチャなどのインフラ、データの所在、セキュリティ管理などがサイロ化していること、またSAS以外のModelOps環境もシステムごとにアーキテクチャがバラバラすぎたこと、また、お客様社内のデータリテラシーそのものもまだ課題が多かったため、SASを中心としても、実現にはあまりにも周辺の開発コストがかかりすぎたために、提案を断念しました。 時代は変わり昨今、クラウド技術の採用およびそれに伴うビジネスプロセスの変革と標準化が急速に進んでいます。それに歩調を合わせるように、SASの製品も、上記の当時から市場をリードしてきたMLOpsフレームワークをDecisionOpsへと昇華させ、クラウド技術を最大活用すべく、クラウドネイティブなアーキテクチャおよび、プラットフォームとしての一貫性と俊敏性を高めてきました。そしてついに最新版のSAS Viyaでは、アナリティクスライフサイクル全体にわたり、データからデータ分析プロセス全体の作業を電子的に記録し、管理し、活用することが可能となりました。 自己組織的にナレッジを蓄積活用するデータ分析資産のガバナンス 昨今のデータマネージメントの取り組みの課題 詳しくはこちらのブログをご参照いただきたいのですが、多くのケースで過去と同じ過ちを繰り返しています。要約すると、データ分析文化を醸成したい、セルフサービス化を広めたいという目的に対しては、ある1時点のスナップショットでの完成を目的としたデータカタログやDWH/DMのデータモデル設計は問題の解決にはならないということです。必ず5年後にまた別の担当者やプロジェクトが「これではデータ分析しようにもどのデータを使えばわからない、問題だ、整備しよう」となります。 では解決策はなんでしょうか。 静的な情報を管理したり整備するのではなく、日々変わりゆく、どんどん蓄積され、評価され、改善、進化し続ける、データ分析業務に関わるすべての情報を記録統制することです。つまり、以下の三つのポイントを実現することです。各ポイントの詳細は後段でご紹介しています。 ポイント①あらゆるデータ分析資産(ナレッジ)を管理 ポイント②データ品質管理の自動化・省力化とガバナンス ポイント③社内ソーシャルの力による自己組織的情報の蓄積 まずは、それぞれが何を意味しているかを説明する前に、これらを実現するとどのような世界になるのかをユーザーの声によって示してみたいと思います。   個々の自由にデータ分析をしているユーザーによる行動を記録することで、全体を見渡している誰かがヒアリングや調査をして情報を管理することなく、データ分析がどのように行われているかを管理・共有・再利用が可能となるのです。 誰が、どのような目的で、どのデータを、どのように使用したのか、そしてその結果はどうだったのか? このアプリケーションの出した判定結果の説明をする必要がある。このモデルは誰が作ったのか?どのような学習データを使用したのか?どのようなモデリングプロセスだったのか? よく使用されるデータはどれか? そのデータはどのように使用すれば良いのか?注意事項はなにか? データ分析に長けた人は誰か?誰が助けになってくれそうか? 企業全体のデータ品質はどのようになっているか? データ品質と利用パターンのバランスは適切か?誤った使い方をしているユーザーはいないか? など従来、社内勉強会を開催したり、詳しい人を探し出してノウハウを聞いたり、正しくないことも多い仕様書をひっくり返してみたり、そのようにして時間と労力をかけて得られていたデータ分析を自律的に行う際に重要となる社内ナレッジが、自己組織的に形成されるということです。 「情報資産カタログ」とは~一般的な「データカタログ」との違い このような世界を実現する機能をSASでは、「情報資産カタログ」と呼んでいます。データ分析プロセス全体を管理・検索・関連付け・レポートできるようにするテクノロジーです。一般的に言われる、また多くの失敗の原因になる、「データカタログ」と対比するとその大きな違いが見えてきます。 こちらのブログでも述べましたが、データ分析者がセルフサービスでデータ分析を実践したり、初学者がなるべく自分自身で情報収集して、まずは標準的なデータ分析作業をマスターしたりするためには、既存ナレッジを活用する必要があります。一方で、そのようなナレッジは従来一部の優秀なデータ分析者に聞かないとわからなかったり、あるいはITシステム部門に質問して回答までに長い時間を要してビジネス機会を逸してしまう、という結果を招いていました。 既存ナレッジとは、どのようなデータを、どのような意図で、どのような目的で、どのように使い、どのようなアウトプットを得たかという一連の「考え方とやり方」であり、これは管理者が一時的にデータ分析者にヒアリングして「データカタログ」を整備して終わり、というものではなく、日々データ分析者たちの中で自律的に情報が作られていくものです。 ポイント①あらゆるデータ分析資産(ナレッジ)を管理 SAS Viyaでは、上述のアナリティクスライフサイクル各ステップのオブジェクトがすべて一元的に記録・管理されます。日々、新しく作られるレポート、データ加工プロセス、作成されるデータマートの情報が、自動的に管理され検索対象になっていきます。このようにアナリティクス・ライフサイクルの各ステップをすべて管理することで、データ、そのデータを使用しているレポート、そのデータを使用しているデータ加工フロー、その出力データ、さらにはそれを学習データとして使用している予測モデリングプロセスと作成されたモデル、これらを関連付けて見ることが可能となります。それにより例えば、ある目的に使用するデータを探している場合、参考にする業務名やプロジェクト名で検索をすることで、関連するレポートや、データ加工プロセスにたどり着き、そこから使用データやそのデータの使い方にたどり着くという効率的な情報の探し方が可能となります。 もちろん、この機能は昔からあるインパクト・アナリシス機能として、ITシステム部門が、データへの変更の影響調査ツールとして使用することも可能です。 ポイント②データ品質管理の自動化・省力化とガバナンス データ分析を組織的に行う際に気にすべきポイントの一つは、その正確性です。正しいマスターデータを使用しているか、適切な品質のデータを使用しているかは、最終的なアクションや意思決定の精度すなわち収益に影響します。また、結果に対する説明責任を果たすうえでもアクションに使用したデータの品質は属人的ではなく、組織的に管理されている必要があります。またデータ品質を組織的に管理することにより、データ分析の最初に行っていた品質確認という作業が省力化できます。また、属人的に行っていた品質確認作業も標準化されるため、組織全体のデータ分析作業の品質が向上します。 あるお客様では、DWHに格納するデータのETL処理において施すべき処理が実施されていないというミスがあるものの、データの数やETL処理があまりにも多いためそのミスを発見することが困難であるという状況にありました。網羅的な品質管理および品質レポートによってそのようなミスの発見が容易になります。 ポイント③社内ソーシャルの力による自己組織的情報の蓄積 前述のポイント①により基本的にはデータ分析者個人個人の自律的な活動が自動的に記録され、自己組織的に組織全体のナレッジとて蓄積され共有・再利用可能な状態が作られます。これは、データ分析者個人個人が特に意識しなくても自動的に実現できます。それに加えて、さらに意識的にこのプラットフォームを利用することで、蓄積されるナレッジに深みが増します。 例えば、あるビジネス課題をデータ分析で解決使用する場合のスタートは、「問い」です。上述のアナリティクス・ライフサイクルの一番左のスタートにあるものです。その際には、仮説設定をするためや仮説を検証する目的で、様々な角度から「データ探索」を行います。この初期のデータ探索プロセスは、その後のデータ加工やモデリングの根拠になっているため、ナレッジとしてまた説明責任の材料としてはとても重要になります。必ずしも最終的に使用したデータと同じデータを使うとも限らないので、自動的には他のデータ分析資産とは関連づきません。そのような探索プロセスも下記の図のように、同じプロジェクトフォルダに保存しておくことで、関連オブジェクトとして活用することが可能となります。また、プロアクティブに自信が使用したデータやレポートにコメントや評価を付与することで、より価値の高いナレッジへと育つことになります。 昨今企業内SNSなどで、オフィスツールの使い方などノウハウを共有をされている企業・組織もあるかと思います。それを全社規模のアナリティクス・プラットフォームで行うことで、データ分析に関わるナレッジをユーザー同士で培っていくイメージです。 まとめ 「このデータはこの目的に使えますか?」「あ、それはこの情報がないので使えないんですよ。こちらのデータを私は使ってますよ」データ分析者の間でよく交わされる会話です。この問いにいかに迅速に答えられるかが、データ分析の効率性と正確性を高めます。「情報資産カタログ」はまさにこの問いに答えるための機能なのです。

Advanced Analytics | Analytics | Artificial Intelligence
小林 泉 0
守りの需要予測から、攻めの収益最大化への転換をするために

データサイエンスの使いどころ・・・攻めと守りの圧倒的な違い 以前のブログで、データ活用における攻めと守りについてお話しました。今回は小売業を例に多くのデータ活用プロジェクトが陥りやすい罠と、真の目的達成のための方法についてご紹介します。 小売業の目的はもちろん他の業種企業と変わらず、収益の最大化です。昨今データ分析を武器として売り上げの最大化、コストの削減、業務プロセスの生産性向上を目指す企業が増えてきています。時には、データサイエンティストが、データサイエンスを駆使してプロジェクトを実行しているケースもあるでしょう。 ここで、今一度現在取り組んでいる、またはこれから取り組もうとしているデータサイエンスやAI活用のプロジェクトがどんな利益を自社にもたらすのかを改めて考えてみましょう。昨今、需要予測についての相談が非常に多いので、ここでは需要予測について考えてみます。 弊社にご相談いただくケースの中で、少なくない企業が、需要予測をこのブログで言うところの「守りの意思決定」としてとらえています。多くのケースで、過去の実績をベースに将来の需要を予測することで、在庫過多や欠品を減らそうというプロジェクトに投資をしていたり、しようとしています。言い換えると、過去の実績を学習データとして、将来を予測するモデルを構築し、ひとつの将来の需要予測を作成し、それを在庫を加味したうえで、発注につなげています。 手段が目的化することで見失う可能性のある本来の目的とは 非常に典型的なAI活用、データサイエンス活用かと思いますが、実は、「AIで予測」、「機械学習で予測」といった言葉で最新のデータ活用をしているかのような錯覚に陥っているケースが見受けられます。数十年前から行われており、昨今でも同様に行われている、機械学習を用いた典型的な需要予測は、「守り」です。すなわち、どんなに多くの種類のデータを使うかどうかにかかわらず、過去の傾向が未来も続くという前提のもとに予測モデルを作成している場合には、あらかじめ定義した前提・業務プロセスの制約の下で、機会損失を最小化するために予測精度をあげているにすぎません。 つまり、そのような前提での需要予測は、小売業の収益向上という観点では、期待効果が限定的であるということです。では、最終的な収益の最大化を実現するには、何をすべきでしょうか? 収益を向上させるためにはもちろんより多くの商品を売ることにほかなりません。より多くの商品を売るためには当然、顧客の購買心理における購買機会に対して販売を最大化する必要があります。あるいは、顧客の購買心理そのものを潜在的なものから顕在化したものにすることも必要でしょう。つまり、販売機会を最大限に活用するということは、店舗中心ではなく、顧客中心に考えるということです。 小売業における攻めのデータ活用の1つは、品ぞろえの最適化 このように、顧客中心に考えることで初めて最適な品揃えの仮説検証のサイクルが可能となります。過去のデータは、単に過去の企業活動の結果であり、世の中の「真理~ここでは顧客の本当の購買思考」を表しているわけではありません。真理への到達は、仮説検証ベースの実験によってのみ可能になります。わかりやすく言うと皆さんよくご存じのABテストです。このような実験により、品ぞろえを最適化することで、販売機会を最大化することが可能なります。そのプロセスと並行して、オペレーショナルな需要予測を実践していくことが重要となります。 需要予測と品ぞろえ最適化の進化 昨今、AIブーム、データサイエンティストブーム、人手不足や働き方改革といったトレンドの中で、従来データ活用に投資してこなかった小売業においても投資が進んでいます。しかし多くのケースでこれまで述べてきたような守りのデータ活用にとどまっていたり、古くから行われている方法や手法にとどまっているケースが見受けられます。歴史から学ぶことで、無用なPOCや効率の悪い投資を避けることができます。今、自社で行っていることがこの歴史の中でどこに位置しているかを考えてみることで、投資の効率性の向上に是非役立てていただければと思います。 小売業におけるデータ活用のROI最大化にむけたフレームワーク SASでは長年、小売業や消費財メーカのお客様とともにお客様のビジネスの課題解決に取り組んできました。その過程で、小売業・消費財メーカー企業内の個々の業務プロセスを個別最適するのではなく、それら個々の業務プロセスを統合した、エンタープライズな意思決定フレームワークが重要であるとの結論に至っています。AIやデータサイエンスという手段を活用し、データドリブンな意思決定のための投資対効果を最大化するための羅針盤としてご活用いただければと思います。

Advanced Analytics | Analytics | Artificial Intelligence
小林 泉 0
デジタルツインの話をする前にー将来を見通すために知っておくべき2種類の不確実性

近年、AI/アナリティクス市場に巨大ITベンダーが参入してきたことと、データサイエンティストがその存在感を高めようとしてきたことがあいまって、「予測」、「予測モデル」あるいは「AI予測」、「AIモデル」という言葉が、この市場で一般的になってきました。ビジネスにおいて、データ分析による洞察に基づいてよりよい意思決定と自動化を行うことーこれを「アナリティクス」と言いますーは、筆者がこの世界に足を踏み入れた20年以上前よりもっと前から、一部の「データを武器とする企業」において行われていました。それがより多くの企業に広まってきたということです。 今回は、より多くの方が「予測」について理解を深めてきているところで、その「予測」をもう少し深く理解し、近年の世界情勢において、大きく変化が求められている業界の1つである、流通小売業や製造業のサプライチェーン課題にフォーカスしたいと思います。まさにいま、サプライチェーンの大きな課題はレジリエンス強化です。そのための解決ソリューションとしてデジタルツインが注目されていますが、デジタルツインで何をすべきかを適切に見極めるために必要なおさらいとして、そもそも不確実性とは?について頭の中を整理したいと思います。 アナリティクスとは将来の不確実性に対して勇気を出して踏み出すーつまり行動するーことである。 「予測」という概念が広まることで、「予測」が確率的であるという認知も正しく広まってきました。需要予測値は確率的なものであるため、予測値そのものだけではなく安全在庫を計算するためにその確率を活用し、解約予兆、商品のレコメンデーションへの反応、不正検知、異常検知や歩留まりなど、アナリティクスつまり予測モデルを意思決定に適用するほとんどの意思決定は、すべて確率的なものです。よく見る予測モデル以外でも同様です。最適化も多くの場合その入力となる情報が確率的にばらついているケースが多いですし、近年、古典的な最適化手法が当てはまりずらいビジネス課題、例えばサプライチェーンの最適化、リアルタイムの配送スケジューリングなどの課題やカスタマージャーニーの最適化課題に対して適用される強化学習のアプローチにおいても、将来の報酬を確率的に計算して、目の前の一手を決めているといえます。 ここで唐突に余談ですが、リスクという言葉は日本語だとネガティブな意味に使われることが多いですが、本来はポジティブでもネガティブでもなく、単に確率的なバラツキを意味しています。なのでリスクを管理するということは、単に将来に対して確率的なバラツキを特定し意思決定の要因に組み込むということです。つまりこれはアナリティクスと同義です。なので、アナリティクスとアナリシスは語感は似ていますが、意味はだいぶ異なるということになります。 不確実性の1つは過去の経験から得られる確率 これは、上述した「リスク」です。どのような事象が起きたか?それが起こる確率はどれくらいか?そのインパクトはどの程度か?などについて過去の経験に基づいて洞察が得られるものです。例えば、輸送の遅れ、需要のバラツキ、ITシステムの障害、消費者の購買行動におけるバラツキ、設備などの停止、部品の故障率や製造品質などです。このような不確実性は過去のデータを分析することで予測可能です。このタイプの不確実性を今回は、「予測可能な不確実性」と呼ぶことにします。この「予測可能な不確実性」への対処に関しては、長年の経験から、多くのケースにおいて理論が確立してアナリティクスのベストプラクティスにすでに組み込まれています。 近年ニーズが増えてきたもう一つの不確実性への対応 こちらはずばり、過去に起きてないために予測することが困難な事象です。例えば、COVID-19、自然災害、特定地域での紛争や各国の政治情勢の変化などです。海洋の変化が予測とは大きく異なり漁獲高が計画と大きく乖離して輸出の計画が崩れて困っているという事例も該当します。特にサプライチェーン管理が必要な多くの企業は、近年特にこのような事象により、サプライチェーンが突如として混乱に見舞われるという経験をされているでしょう。このような不確実性は、過去に起きてない事象であっても、あらゆる情報を収集することで将来の起こる可能性についての洞察をある程度得ることができることもあります。ソーシャルメディアを分析することで、その国の経済の先行指標としての洞察を得たり、政治的な変化の予兆につなげるという活用方法も実際にされてきています。しかし、自社のサプライチェーンに関わる世界中のあらゆる状況に対して調べつくすということは、ほとんどの企業にとっては投資対効果的に見合わないと思います。したがって、サプライチェーンにおいては、そのような事象によって混乱した状態からなるべく早く回復するために、自社のサプライチェーンの脆弱性を理解し、起こりうるシナリオを想定して、それに備えることに投資の目を向けます。このようなタイプの不確実性を今回は、「予測困難な不確実性」と呼ぶことにします。 デジタルツインでは二つの不確実性への対応が価値をもたらす デジタルツインですが、そもそもビジネスをデータに基づいた意思決定にしている世界は部分的には47年前からデジタルツインだと言えます(ちょっと強引すぎますかね)。SASは1976年に穀物の収穫高の予測を電子的統計手法で行ったのがスタートです。ITの進化、IOT技術の進化に伴いより多くのデータが観測・収集できるようになり、ビジネスの一部だけでなくより全体がデータの世界で表現できる様になりました。近年ではそれを「デジタルツイン」と呼んでいます。サプライチェーンのデジタルツインを実現して、皆様はどんな課題を解決したいでしょうか?今回取り上げた「予測可能な不確実性」と「予測不可能な不確実性」を理解することで、デジタルツインを活用した「現実世界のよりよい理解」、「その理解に基づく意思決定」、「シナリオ分析」や「シミュレーション」を適切に行うことができるようになり、将来起こりうることに対して、よりよい対処が可能となるでしょう。 この話の続きが気になる方へ SASのデジタルツインの最新の取り組みについてはまずはこちらのプレスリリースをご覧ください。 また、デジタルツインやシミュレーションについて他のユースケースなどご興味ある方は、こちらのCosmo Tech社の(英語)もお役に立つと思います。    

Advanced Analytics | Data Management | SAS Administrators
SAS Viya Blog ~Azure Fileを利用したWindowsとSAS Viya間のデータ共有方法の紹介~

背景の紹介 これまでのSAS製品は、SAS 9でもSAS Viya 3.5でも、ほとんどがWindowsやLinuxのプラットフォームで動作していました。 そのため、Windowsクライアントを持つユーザーは、SMBサービスやWindowsのファイル共有機能を介して、これらのプラットフォームに保存されたファイルに簡単にアクセスすることができていたのです。 SASが開発した最新のクラウドネイティブ・データアナリティクス・プラットフォーム「SAS Viya」は、WindowsやLinuxなどのOS上で直接動作するのではなく、コンテナ/ポッドの形でKubernetes(以下、K8s)上で動作し、従来の製品とはアーキテクチャが大きく変わっています。K8s上で動作するサービスのコンテナ内のデータは一時的なものなので消えてしまう特徴があります。この点に対して、お客様は最新の製品を使用する際に、K8sに保存したデータをローカルのWindowsシステムからどのようにアクセスするのか、SASで作成したレポートなどのデータをどこに保存するのかという疑問を持つことが多いようです。 今回は、下記の図の構造のような、K8sに保存されているファイルを、比較的簡単な方法でWindowsクライアントと共有する方法をご紹介したいと思います。 本記事の内容は、Microsoft Azure上にデプロイされたSAS Viya Stable 2021.2.3に基づいています。centos 7.9上で、kubectl、kustomization、azure cliなどのコマンドラインツールを利用する作業が含まれているので、Linux、Kubernetes、SAS ViyaのデプロイメントとAzureに関する一定の知識が必要です。また、お使いのクラウドベンダーや製品のバージョンによって、設定方法が異なる場合もありますので、詳細は各ドキュメントをご確認ください。 SAS Viya on Kubernetesが利用するストレージの紹介 まず、K8s上にデプロイされたSAS Viyaサービスを使用した場合のデータの保存方法について簡単に説明します。 例えば、SAS Studioを利用する場合、ユーザーがセッションを作成するたびに、SAS ViyaはK8s上に一つのコンテナを作成します。これは、ユーザーがセッションで実行したすべてのコードや操作がこのコンテナに入っているミニLinux内で実行されます。 ご存知のように、コンテナの最大の利点は、インストール作業や設定などが一切いらず、配置したらすぐに使えることです。コンテナが提供するサービスや機能を使用するために設定を行う必要はありませんが、同時に、コンテナ内のデータに加えた変更も保存されず、新しいセッションを作成するたびに、まったく同じ設定を持つまったく新しいコンテナが作成されます。 そのため、SAS Studioで作成した新しいデータを保存したい場合は、コンテナの外部にあるストレージに保存する必要があります。K8sではこの外部ストレージは永続ボリュームと呼びます。 永続ボリュームを利用することにより、SAS Studioのセッションが終了しても、作業中にユーザーが作成した新しいデータはちゃんと保存されています。次にユーザーが新しいセッションを作成する時、以前使用していた永続ボリュームが新しいセッションに自動的にマウントされ、ユーザーが永続ボリュームに保存されていたデータを使って引き続き作業できます。この記事で紹介するデータ共有方法も、こちらの永続ボリュームを利用しています。 データ共有するための設定方法 次に、K8sで作成したファイルをWindowsと共有する方法を紹介します。前述したように、作業中に発生したデータを永続ボリュームに保存することができるので、永続ボリュームをWindowsにマウントするだけで、作業用PCとK8sの間でデータを共有することができますが、実現方法は使用する永続ボリュームの外部ストレージの種類によって異なります。 AzureのK8sサービス上でSAS Viyaを利用する場合、使用する外部ストレージは、大体以下の3種類です。Azure Fileを共有ストレージとして使用する場合、追加のサーバは必要なく、使い方も比較的簡単なので、本記事ではAzure Fileを外部ストレージとして使用する場合の共有方法を紹介します。 - ネットワークファイルシステム(以下NFS) - Azure Disk - Azure File(本記事で紹介する方法) データを共有するためには、次のような手順が必要です。 これらの手順には、AzureとK8sの管理者権限と関連する知識が必要なため、一般的にはサーバ管理者やSAS Viya導入の担当者が行うことになることに注意してください。 1.ストレージクラスの作成 2.永続ボリューム要求の作成

Advanced Analytics | Analytics | Data Management | Learn SAS | Programming Tips | Students & Educators
0
SASのIn-Database機能のご紹介

1. はじめに 前回投稿しました「SAS/ACCESSのご紹介とSnowflakeとの連携デモ」はご覧になったでしょうか。SASと外部のデータストレージサービスを連携する「SAS/ACCESS」のご紹介と、実際に「Snowflake」というサービスに連携してみました。今回は、その続きとして、10年以上前からビッグデータ・アナリティクスの基本アーキテクチャである、In-Database機能の代表的な機能である、SQLパススルーという機能をご説明し、デモを準備しました。 2. SQLパススルーについて SAS/ACCESS がインストールされている場合、SQLパススルーを使用してデータストレージサービスにクエリできます。接続方法に応じてSQLパススルーは、「暗黙的パススルー」と「明示的パススルー」に分けることができます。 暗黙的パススルーの価値は、作成したSASコードが自動的にデータストレージサービスが処理できるSQLに変換され、そのSQLをデータストレージサービス側に与えることにあります。ですので、SASで実行されたSQLやSASプロシジャに指定されたWHERE句など、可能な限りデータストレージサービス側で処理を行い、結果だけをSAS側に転送することが可能です。一方、明示的パススルーの場合には、DB依存のSQLを明示的に記述することできます。暗黙的パススルーと明示的パススルーについてまとめた表を下に記載していますので、ご覧ください。今回は、暗黙的パススルーについて詳しくご紹介したいと思います。   ▲SAS CommunityでSQL Pass throughについて質問するユーザー 暗黙的パススルーを使用する方が良いか、明示的パススルーを使用するのが良いのか気になるかと思います。実はこのトピックは、SAS Communityでもよく見られ、SAS/ ACCESSを使用している全世界のユーザーにとっても気になる質問です。どちらを使用するかは、どこに基準を置くか、また、SASとデータストレージサービスの環境のスペックによって異なると思います。ですので、皆さんもこのような疑問が生じた場合は、SASに相談してみてはいかがでしょうか。   3. 暗黙的パススルーのデモ 3-1. データの紹介とデモの概要 今回のデモのために、「pets」と「owners」という名前で2つのテーブルをデータストレージサービス(今回は、Snowflake)側に事前に保存しておきました。 「pets」テーブルには、3つのカラムがあります。 Id: ペット固有のid Name: ペットの名前 Type: ペットの種類(犬、猫、その他) Id Name Type 1 オオビ 犬 2 ローザ 猫 3 ワンチャン その他 … … …   もう1つのテーブル「owners」にも3つのカラムがあります。 Id: オーナー固有のid Name: オーナーの名前

1 2 3 4