SAS Global Forum では、毎年SASの全てのキーマンが集結します。もちろん2015も例外ではありませんでした。2014年にスマートメーター活用セミナーの講師として来日もした、グローバルセールス&開発マネージメント ビジネスディレクターのTim Fairchildおよび、エネルギーソリューション担当プロダクトマーケティングマネージャーのAlyssa Farrellと短い朝食ミーティングで意見交換をしてきました。日本では電力小売り自由化もありアナリティクスの活用が進んでいますが、世界的に見てもエネルギー業界にアナリティクスの大きな潮流がやってきています。
それを表すかのように、SAS Global Forum 2015において非常に多くのユーティリティ業界に関するプレゼンテーションがありました。それをご紹介します。
生存時間分析を使用した変圧器の寿命予測とSAS Enterprise Minerを使用した過負荷状態で変圧器を使用している際のリスクモデリング(Predicting transformer lifetime using survival analysis and modeling risk associated with overloaded transformers Using SAS® Enterprise MinerTM 12.1)
「いつ変圧器が故障するのか?」 これが米国のユーティリティ企業が毎日頭を悩ませている問題である。ユーティリティ企業のインフラで最も重要なものの一つが変圧器である。コストを削減し計画的にメンテナンスし、故障による損失を低減するためには、この変圧器の寿命を把握することが重要である。そしてもう一つ重要なことは、過負荷による突発的なパフォーマンスダウンを避けるために高リスクな変圧器を事前に特定しメンテナンスすることである。この論文の目的は、SASを使用して変圧器の寿命を予測し、それらの故障に繋がる様々な要因を特定し、メンテナンスを効率的に行うために変圧器を、負荷状態に基づいて、高リスク、中リスクそして小リスクといったカテゴリに分類するモデルを作成することである。この研究で使用したデータは、米国のユーティリティ企業のものであり、2006年から2013年までのデータである。このデータに対して生存時間分析を行った。Cox回帰分析(比例ハザードモデル)を使用して、変圧器の故障の要因を特定した。また負荷に応じたリスクカテゴリを作成するために、いくつかのリスクベースモデルを使用した。(続きはこちら)
顧客クラスタリングにおけるイノベーティブな方法(An Innovative Method of Customer Clustering)
この論文は、SASを使用して顧客セグメントを作成する新しい方法について紹介する。著者はある巨大なユーティリティ企業が提供している9つのプログラムに登録している顧客を調査した。これらにプログラムとは、請求の平準化、支払方法、再生可能エネルギー、効率化、機器の保護、使用量レポートなどである。640,788の家庭のうち、374,441のデータが利用可能であった。これら約半数(49.8%)の分析対象顧客はいくつかのタイプのプログラムに属しており、顧客の特徴を通してこれらプログラムの間の共通性を見出すためには、多くの場合、クラスター分析と相関マトリックスが利用される。しかし、所属しているか否かという二値という性質により、これらの手法の価値はかなり限定的になる。それだけでなく、各プログラムは相互に排他的であることもその一因となる。これらの制限を乗り越えるために、各顧客がどのプログラムに属するかの予測スコアを算出するために、PROC LOGISTICを使用した。(続きはこちら)
ブラジルの電力部門における電力損失の査察のためのターゲット選定の改善のためのモデリング-CEMIGの事例(Modeling to improve the customer unit target selection for inspections of Commercial Losses in Brazilian Electric Sector - The case CEMIG)
電力は社会とって最重要な製品である。ブラジルでは電力部門は、ANEEL (Agência Nacional de Energia Elétrica)によって統制されており、その規制の一つとしては、配電システムにおける電力ロスがある。2013年、生成されたエネルギーのうち13.99%がブラジルでは失われている。その一つの原因は、規制基準が達成されていないことがあげられる。この論文では、ロジスティック回帰、ディシジョンツリーおよびそれらを組み合わせたアンサンブルモデルを使用して、 CEMIG (Companhia Energética de Minas Gerais)における規制の基準を達していない企業に対する査察ターゲット選定業務が改善され、予測結果が35%から50%に改善された。(続きはこちら)
トラック製造企業のメンテナンス履歴のテキストデータを使用した予測分析によるトラックのダウンタイムの最小化(Using Text from Repair Tickets of a Truck Manufacturing Company to Predict Factors that Contribute to Truck Downtime)
昨今のビッグデータ時代において、ビジネスの世界でもテキストアナリティクスによって洞察を得ることが急速に広まっている。平均的には、企業が保有するデータのうち80%以上が非構造化データである。テキスト・アナリティクスによって、この非構造化データから重要な洞察を発見したり、有用なトピックや言葉を抽出することが可能となる。この論文の目的は、テキストデータを使用してトラックのダウンタイムをもたらす要因を予測するモデルを作成することである。この調査では、大手のトラック製造企業の保有する200,000以上のメンテナンス履歴を分析した。SAS Text Minerの機能である、「テキストトピック」ノードを使用して10のトピックを抽出した後に、これらのトピックを使用してトラックのダウンタイムを予測するためのモデルを回帰モデル使用して作成した。予測モデルの作成に際しては、データを学習用と検証用に分割した。ダウンタイムをもたらす要因やそれらの相互関係を知ることにより、メンテナンスのプロセスの合理化と顧客満足度の向上に大きく貢献することとなった。(続きはこちら)
ユーティリティ業界における顧客行動分析-Hadoop, HiveそしてSAS Visual Statisticsという武器を携えて獲物を獲得する(Big-Game Hunting for Customer Behavior Trends Armed with SAS Visual Statistics with Hadoop and Hive)
電気の利用状況からあなたの家族や生活習慣に関する多くの情報が見えてくる。スマートメーターから収集した情報は人の行動パターンに変換することができ、電力システムの最適化に活用することができる。デマンドレスポンスプログラムは、増え続けるエネルギー需要とそのためのコストのバランスを取るための効果的な方法である。ユーティリティ企業はスマートメータから顧客データを収集し、顧客のエネルギー利用や蓄積状況を把握する。収集されたデータは、15分から1時間間隔で送信される。数百万のメータから膨大な量のデータが生成される。それぞれの顧客は、ひと月に約3,000のデータを生成し、百万顧客では一年で360億個以上のデータが収集される。この巨大なデータを処理して、デマンドレスポンスに効果的に活用する必要に迫られている。
デマンドレスポンスのように複雑な問題は、機械が生成する膨大なデータをいかに管理して価値を引き出せるかどうかにかかっている。それにより、たとえばどのような顧客が柔軟に電力の使用パターンを変えることができるかを見つけることができる。従来型のデータウェアハウスシステムは、このような膨大なデータを取り扱う用途としては設計されておらず、非常にコストもかかる。データサイエンティストは、非常に大きなサイロ化されたデータソース、外部データ、非構造化データと格闘し、顧客の電力利用パターンを見つけ出していく必要がある。
汎用的なハードウェアを使用して非常に大きなデータの蓄積と分散並列処理を行うことのできるHadoopの活用はゲームチェンジャーである。Hadoopを使用することで、データの大きさに悩まされることはなくなり、SAS Visual Statisticsによって、記述的あるいは、予測分析モデルを作成する機械学習、人工知能あるいはクラスタリング手法を利用することができる。構造化データや非構造化データ、ログデータなど全てのデータを利用可能である。データサイエンティストは、Hadoopを利用することで、使いたい全てのデータを使って、ときには天候などの外部データも活用しながら、顧客の利用パターンを分析することが可能である。
この論文では、Cloudera Hadoopと、Hive、そしてSAS Visual AnalyticsとSAS Visual Statisticsを使用する。ここでは、非常に大きなデータに対するクエリーをHadoop内で行い、SASのインメモリ分析エンジンに取り込んで利用パターンやデマンドレスポンスへの反応感度、システムの負荷分析を通して、顧客分析やクラスタリングをする様子を紹介します。
(続きはこちら)
SAS/ORを使用した風力タービン配置の最適化(Using SAS/OR® to Optimize the Layout of Wind Farm Turbines)
ある中国の風力エネルギー企業は、年に数百の風力発電所を設計している。設計過程において重要なステップは、風力発電所において風力タービンの配置を決めるマイクロサイティングである。風力発電所の発電量は、地理的要因(設置場所の高度など)、風速、風向に大きく影響を受ける。風力タービンの種類と各風力タービンの相対的な位置関係も同様に重要な要素である。現在、この企業はこのマイクロサイティングにオープンソースソフトウェアのパッケージを使用している。風力発電の規模が増加するにつれ、建設のスピードも速くなっており、もはやオープンソースソフトウェアでは設計過程の要望を満足に満たすことが出来なくなってきている。そこで、この企業は、現在課題となっているスケーラビリティとパフォーマンスを兼ね備えた商用ソフトウェアを利用したいと考えるに至った。この論文は、SAS High-Performance Analytics製品に含まれるOPTMODELとOPTLSOプロシジャを、非線形最適化問題を解くモデルを作成するためのFCMPプロシジャと共に使用した内容をを説明する。実験の結果、この提案する方法でこの企業が求めている拡張性と高パフォーマンスを実現できることが示されている。(続きはこちら)
売上総利益率の予測:SAS Enterprise Minerを活用して製鉄企業における売上総利益率を予測する(GrossMarginPercentPrediction: Using the Power of SAS®EnterpriseMiner™12.3 to Predict the Gross Margin Percent for a Steel Manufacturing Company)
価格感度が非常に高い受注生産市場において将来の受注の収益性を予測することは、競合他社に先んじるために非常に重要である。受注規模や仕様は受注ごと、顧客ごとに異なり、再利用性が非常に低い。営業チームに利益を確保する意図があるにも関わらず、不安定な市場価格と厳しい競争市場により収益性は受注ごとに全く異なり、時には赤字のこともある。利益率に大きな影響を与える要因とその影響度を理解することにより、企業組織は、利益率の低い受注リスクを低減し同時に市場の見通しに対する意思決定をより良いものにする。この論文の目的は、SAS Enterprise Minerを使用して複数の予測モデルから、将来の受注の利益率を正確に予測する最適なモデルを特定することである。
メータデータ・アナリティクス-スマートメータデータを活用してビジネス価値を創出する意思決定をする方法(Meter Data Analytics—Enabling Actionable Decisions to Derive Business Value from Smart Meter Data)
ユーティリティ業界のメータデータは、価値ある資産であるが場合によっては活用しきれない可能性を秘めたデータである。あるひとつの家庭あるいは店舗は、35,000行以上の情報すなわち年8MB以上のデータを生成する。15分間隔で40項目のデータを3万メータ収集すると、12億行になる。SAS Visual Analyticsを使用して、売上の確保、メータ管理業務、顧客分析といった領域でスマートメータデータを活用するサンプルを紹介する。キーとなるのは、使われてないはずのメータの活動、エネルギー盗難の可能性、メータの故障や不調、顧客の分類(例えば、家庭、小さな店舗、工場、など)などである。(続きはこちら)
ビジュアルなシミュレーションツールSAS Simulation Studioの紹介(Practical Applications of SAS® Simulation Studio)
SAS Simulation Studioは、Microsoft Windows環境で利用可能なSAS/ORに含まれるコンポーネントで、グラフィカルなインターフェースで、離散型事象のシミュレーションのための強力で多様な機能を提供する。アイコンベースのドラッグ&ドロップモデリングによって、初心者でもシミュレーションモデルを作成することができるのに加えて、より高度な機能によりより詳細なシミュレーションにも利用することができる。(続きはこちら)
エネルギー効率利用における行動変化を促すためのコミュニケーションチャネルの評価(3401 Assessing the Impact of Communication Channel on Behavior Changes in Energy Efficiency)
郵便とEMAILというコミュニケーションチャネルの特性の違いに基づく効果の仮説の検証
ディープウォーターのデータを掘る:2010年メキシコ湾原油流出事故を分析する(Drilling for Deepwater Data: A Forensic Analysis of the Gulf of Mexico Deepwater Horizon Disaster)
メキシコ湾原油流出事故を題材に、SAS Asset Performance Analytics, SAS Enterprise Miner, SAS Event Streaming Processingを使用して、非定常状態・流体特性の管理とその活用を紹介する。