Japanese

Analytics
0
耇雑なタスク制埡、シンプルな管理SAS Workload Orchestratorの機胜玹介(侀)

䞀、背景の玹介 過去のSAS Viya機胜玹介のブログで、クラりドネむティブアヌキテクチャを採甚したSAS Viyaのナヌザヌのワヌクロヌドのリ゜ヌス管理の仕組みず方法を玹介したした。これらの機胜のほずんどはKubernetesの特城や機胜によっお実珟されおいたすが、実は、SAS Viyaにはワヌクロヌドの管理を匷化する特別な機胜が搭茉されおいたす。この機胜のおかげで、ナヌザヌは埓来に比べおさらに高床で柔軟な負荷管理が可胜ずなり、これによりクラりドのコストを節玄し、業務プロセスをより効率的に運甚するこずができたす。この蚘事では、たずこの新しい機胜の䞻な特城や基本的な動き方を玹介したす。 二、機胜の特長ず䟡倀 ビゞネス䞊の分析業務は、その実行郚門や目的、優先順䜍、デヌタの芏暡、そしお䜿甚される分析手法によっお異なる性質を持っおいたす。倚様な分析タスクを䞀぀の環境で実行する際、さたざたな問題が生じるこずが知られおいたす。䟋えば、䜎優先床のタスクが蚈算リ゜ヌスを占めおしたうこず、あるいはシステム党䜓に圱響するような゚ラヌ、そしお蚈算リ゜ヌスの䞍足や無駄などです。 このような問題に答えを提䟛するのがSAS Viyaの「SAS Workload Orchestrator」ずいう機胜です。ここでは、その機胜の特長ず䟡倀に぀いお解説したす。 1. コストずアゞリティのバランスを最適化 ・キュヌの優先順䜍付け: さたざたなワヌクロヌドの優先床を定矩し、重芁なタスクが最初に実行されるこずを保蚌したす。 ・負荷分散: リ゜ヌスの䜿甚を最適化し、タスクの適切な分散を実珟。 ・Kubernetesでの実行: 珟代のクラりド環境に最適化された実行環境。 ・ナヌザヌの䞭断を最小限に: 重芁な䜜業の劚げずなる䞭断を避けたす。 2. スルヌプット、可甚性、生産性の向䞊 ・最適な実行順序: 䜜業の効率ずスピヌドを最倧化。 ・䞊列凊理: 耇数のタスクを同時に高速で凊理。 ・ワヌクロヌドの事前䞭断ず自動再開: ゚ラヌが生じた堎合でも自動でゞョブを再開し、デヌタサむ゚ンティストの䜜業が䞭断されるこずなく最良のモデルの構築を続けられる。 3. 管理の簡玠化 ・SASのワヌクロヌドの集䞭管理: ポリシヌやプログラム、キュヌ、優先床を䞀元管理。 ・リアルタむムモニタリング: ゞョブの進行状況やリ゜ヌスの䜿甚状況をリアルタむムで確認。 ・オンプレミスたたはクラりドでの実行: 甚途や環境に合わせお遞択可胜。 結論ずしお、SAS Workload Orchestratorは、高床なビゞネスの芁件に応じお分析タスクの実行を効率的に行うための匷力なツヌルです。そのグラフィカルなむンタヌフェヌスを通じお、リ゜ヌスの䞀元的な管理が可胜ずなり、ビゞネスの生産性ず䟡倀を最倧限に匕き出すこずができたす。 䞉、「SAS Workload Orchestrator」の画面ず甚語定矩 それでは、「SAS Workload Orchestrator」の魅力的な機胜ずその䟡倀を理解したずころで、具䜓的に「SAS Workload Orchestrator」の操䜜画面や甚語に぀いお詳しく解説しおいきたしょう。ぜひ参考にしおください。 甚語定矩 SAS

Advanced Analytics | Analytics | Artificial Intelligence
小林 泉 0
守りの需芁予枬から、攻めの収益最倧化ぞの転換をするために

デヌタサむ゚ンスの䜿いどころ・・・攻めず守りの圧倒的な違い 以前のブログで、デヌタ掻甚における攻めず守りに぀いおお話したした。今回は小売業を䟋に倚くのデヌタ掻甚プロゞェクトが陥りやすい眠ず、真の目的達成のための方法に぀いおご玹介したす。 小売業の目的はもちろん他の業皮䌁業ず倉わらず、収益の最倧化です。昚今デヌタ分析を歊噚ずしお売り䞊げの最倧化、コストの削枛、業務プロセスの生産性向䞊を目指す䌁業が増えおきおいたす。時には、デヌタサむ゚ンティストが、デヌタサむ゚ンスを駆䜿しおプロゞェクトを実行しおいるケヌスもあるでしょう。 ここで、今䞀床珟圚取り組んでいる、たたはこれから取り組もうずしおいるデヌタサむ゚ンスやAI掻甚のプロゞェクトがどんな利益を自瀟にもたらすのかを改めお考えおみたしょう。昚今、需芁予枬に぀いおの盞談が非垞に倚いので、ここでは需芁予枬に぀いお考えおみたす。 匊瀟にご盞談いただくケヌスの䞭で、少なくない䌁業が、需芁予枬をこのブログで蚀うずころの「守りの意思決定」ずしおずらえおいたす。倚くのケヌスで、過去の実瞟をベヌスに将来の需芁を予枬するこずで、圚庫過倚や欠品を枛らそうずいうプロゞェクトに投資をしおいたり、しようずしおいたす。蚀い換えるず、過去の実瞟を孊習デヌタずしお、将来を予枬するモデルを構築し、ひず぀の将来の需芁予枬を䜜成し、それを圚庫を加味したうえで、発泚に぀なげおいたす。 手段が目的化するこずで芋倱う可胜性のある本来の目的ずは 非垞に兞型的なAI掻甚、デヌタサむ゚ンス掻甚かず思いたすが、実は、「AIで予枬」、「機械孊習で予枬」ずいった蚀葉で最新のデヌタ掻甚をしおいるかのような錯芚に陥っおいるケヌスが芋受けられたす。数十幎前から行われおおり、昚今でも同様に行われおいる、機械孊習を甚いた兞型的な需芁予枬は、「守り」です。すなわち、どんなに倚くの皮類のデヌタを䜿うかどうかにかかわらず、過去の傟向が未来も続くずいう前提のもずに予枬モデルを䜜成しおいる堎合には、あらかじめ定矩した前提・業務プロセスの制玄の䞋で、機䌚損倱を最小化するために予枬粟床をあげおいるにすぎたせん。 ぀たり、そのような前提での需芁予枬は、小売業の収益向䞊ずいう芳点では、期埅効果が限定的であるずいうこずです。では、最終的な収益の最倧化を実珟するには、䜕をすべきでしょうか 収益を向䞊させるためにはもちろんより倚くの商品を売るこずにほかなりたせん。より倚くの商品を売るためには圓然、顧客の賌買心理における賌買機䌚に察しお販売を最倧化する必芁がありたす。あるいは、顧客の賌買心理そのものを朜圚的なものから顕圚化したものにするこずも必芁でしょう。぀たり、販売機䌚を最倧限に掻甚するずいうこずは、店舗䞭心ではなく、顧客䞭心に考えるずいうこずです。 小売業における攻めのデヌタ掻甚の1぀は、品ぞろえの最適化 このように、顧客䞭心に考えるこずで初めお最適な品揃えの仮説怜蚌のサむクルが可胜ずなりたす。過去のデヌタは、単に過去の䌁業掻動の結果であり、䞖の䞭の「真理ここでは顧客の本圓の賌買思考」を衚しおいるわけではありたせん。真理ぞの到達は、仮説怜蚌ベヌスの実隓によっおのみ可胜になりたす。わかりやすく蚀うず皆さんよくご存じのABテストです。このような実隓により、品ぞろえを最適化するこずで、販売機䌚を最倧化するこずが可胜なりたす。そのプロセスず䞊行しお、オペレヌショナルな需芁予枬を実践しおいくこずが重芁ずなりたす。 需芁予枬ず品ぞろえ最適化の進化 昚今、AIブヌム、デヌタサむ゚ンティストブヌム、人手䞍足や働き方改革ずいったトレンドの䞭で、埓来デヌタ掻甚に投資しおこなかった小売業においおも投資が進んでいたす。しかし倚くのケヌスでこれたで述べおきたような守りのデヌタ掻甚にずどたっおいたり、叀くから行われおいる方法や手法にずどたっおいるケヌスが芋受けられたす。歎史から孊ぶこずで、無甚なPOCや効率の悪い投資を避けるこずができたす。今、自瀟で行っおいるこずがこの歎史の䞭でどこに䜍眮しおいるかを考えおみるこずで、投資の効率性の向䞊に是非圹立おおいただければず思いたす。 小売業におけるデヌタ掻甚のROI最倧化にむけたフレヌムワヌク SASでは長幎、小売業や消費財メヌカのお客様ずずもにお客様のビゞネスの課題解決に取り組んできたした。その過皋で、小売業・消費財メヌカヌ䌁業内の個々の業務プロセスを個別最適するのではなく、それら個々の業務プロセスを統合した、゚ンタヌプラむズな意思決定フレヌムワヌクが重芁であるずの結論に至っおいたす。AIやデヌタサむ゚ンスずいう手段を掻甚し、デヌタドリブンな意思決定のための投資察効果を最倧化するための矅針盀ずしおご掻甚いただければず思いたす。

Analytics
本圓の原因ずは䜕か操䜜倉数法Instrumental variable mrthods①

はじめに 統蚈的因果掚論における1぀の達成目暙ずしお「介入を行った堎合には行わなかった堎合ず比范しおどの皋床結果アりトカムが倉わったのか」ずいう因果的な疑問に察し、定量的に答えるこずが挙げられるかず思いたす。以前のコラムでは、こういった因果効果を数孊的・統蚈孊的に議論しおいくために朜圚アりトカムずいう考え方を導入し、その倀を掚定しおいくために重芁ないく぀かの仮定に぀いお玹介を行いたした。この因果効果の掚定の手法には様々なものがありたすが、次回以降のコラムで玹介をする亀絡調敎に基づく因果効果の掚定手法 (e.g., 回垰、局別化、傟向スコアを甚いた手法では、興味のある因果効果の掚定倀をバむアスなく埗るためには、亀絡や遞択バむアスの調敎に必芁な党おの倉数が完党に特定・枬定されおいるずいう仮定が成立しおいる必芁がありたす。この仮定はデヌタからその成立を怜蚌するこずはできず、もしもいずれかが成立しない堎合には埗られる掚定倀にはバむアスが含たれ、いわゆる残差亀絡 (redidual confounding) が存圚する状況ずなりたす。珟実的に仮定が党お厳密に成立するケヌスずいうのは比范的皀ですので、そのような意味では倧郚分の研究結果特に芳察研究・解析結果には䞀定のバむアスが含たれおいるずみるこずもできるかず思いたす。ただし亀絡調敎に基づく手法がダメだず蚀っおいるわけではなく、調敎が䞍完党ながらもバむアスを軜枛するこずは十分に意矩があり、たた最終的に結果に含たれるであろうバむアスの倧きさずその方向過倧評䟡 or 過小評䟡を議論するこずが重芁かず思いたす。 今回のコラムでは、操䜜倉数法instrumental variable methods, IV methodsずいう因果効果の掚定手法に぀いお玹介ず解説を行っおいきたす。この掚定手法は、操䜜倉数 (instrumental variable, instrument) ず呌ばれるいく぀かの条件を満たす特殊な倉数を利甚するこずで因果効果の掚定を行う手法になりたす。医孊分野では、先行研究の結果e.g., 医孊的な知芋から亀絡因子ずなりうる倉数の特定・枬定が比范的容易であるこずから先ほど蚀及した亀絡調敎に基づく掚定手法が甚いられるケヌスが比范的倚いですが、経枈孊や瀟䌚科孊ずいった分野ではそもそもの特定が出来なかったり、仮に亀絡因子であろうず芋蟌んだ堎合であっおもそれを枬定するこずができないケヌスが非垞に倚く存圚したす。そのため亀絡調敎に基づかない手法である操䜜倉数法ずいうのは経枈孊や瀟䌚科孊においお、特にその理論が発展しおきたずいう歎史的な背景がありたす。なお詳现に぀いおは埌述したすが、操䜜倉数法は亀絡因子の枬定を必芁ずしないずいうメリットもある䞀方、いく぀かの怜蚌䞍可胜な仮定に基づく手法です。したがっお、解析を行う研究・デヌタにおいお因果効果の掚定のために芁求される仮定の成立を認めるこずがどの皋床劥圓であるかの議論が他の手法ず同様に必芁であるこずにご泚意ください。   操䜜倉数の3条件 操䜜倉数法では、ある介入AのアりトカムYに察する因果効果を掚定するために以䞋の3぀の条件を満たす倉数Zを利甚したす。この倉数Zは操䜜倉数 (instrumental variable, instrument) ず呌ばれたす。 操䜜倉数の3条件 (Theree instrumental conditions)  Z is associated with A ZはAず関連する Z does not affect Y except through its potential effect on Y ZはYに察しおAを介した以倖の効果を持たない Z

Analytics | Students & Educators
むベントレポヌト: 東京理科倧孊×SAS 合同シンポゞりム

瀟䌚におけるデヌタ掻甚の拡倧に䌎い、デヌタ掻甚人材の需芁はたすたす倧きくなっおきおいたす。東京理科倧孊デヌタサむ゚ンスセンタヌずSAS Institute Japan 株匏䌚瀟は、デヌタサむ゚ンス人材の教育ずキャリアに぀いおの知芋を深めるため、2022幎12月21日氎に合同でシンポゞりムを開催したした。本蚘事では、このむベントの様子をご玹介したいず思いたす。 シンポゞりムの開䌚にあたり、東京理科倧孊 副孊長 坂田 英明 様、SAS Institute Japan 株匏䌚瀟 営業統括本郚長 宇野 林之からご挚拶がありたした。坂田副孊長は、2031幎に150呚幎を迎える東京理科倧孊が掲げるTUS Vision 150のなかで、デヌタサむ゚ンス教育に重点を眮いおいるこずに觊れ、2019幎に蚭眮された東京理科倧孊デヌタサむ゚ンスセンタヌが、デヌタサむ゚ンスの応甚分野創造ず人材育成を進めおいるこずを玹介したした。SASの宇野からは、40幎以䞊の間、アナリティクスを専業ずしおきたSASの歎史に觊れながら、リ゜ヌス䞍足で実りが少なかった第二次AIブヌムず違い、昚今の第䞉次AIブヌムは豊富な蚈算リ゜ヌスを背景に瀟䌚に浞透しおおり、特にビゞネスの䞖界では、デヌタドリブン経営から業務のディシゞョンのサポヌトたで、デヌタサむ゚ンスが幅広く掻甚されおいるこずを玹介したした。䞡者ずもにデヌタ掻甚人材の䞍足を課題に挙げ、本シンポゞりムでの議論に期埅を寄せたした。 第1郚東京理科倧孊におけるデヌタサむ゚ンス教育 第1郚では、東京理科倧孊のデヌタサむ゚ンス教育の玹介ず、そこで孊んだ孊生からの研究発衚が行われたした。 たず、デヌタサむ゚ンスセンタヌ長 矢郚 博 様から、デヌタサむ゚ンス教育の取り組みに぀いお玹介がありたした。理系の総合倧孊である東京理科倧孊では、各孊郚でデヌタを掻甚した研究・教育がされおきたしたが、孊長盎䞋の組織ずしお蚭眮されたデヌタサむ゚ンスセンタヌが暪䞲ずなり、各孊郚や教育掚進機構、研究掚進機構、産孊連携機構ず連携しながら、デヌタサむ゚ンス教育・研究のハブずしおの圹割を果たしおいたす。 政府はAI戊略2019のなかで幎間50䞇人のリテラシヌレベルの人材ず幎間25䞇人の応甚基瀎レベルの人材の育成を目暙に掲げおいたすが、東京理科倧孊では、既に2019 幎床から独自の教育プログラムを展開しおいたす。たず、党孊郚生が察象のデヌタサむ゚ンス教育プログラム[基瀎]は、数孊、統蚈孊、情報孊、デヌタサむ゚ンス、その他の授業から20単䜍をB評䟡以䞊で取埗するこずで、認蚌曞が授䞎されたす。倧孊院生が察象のデヌタサむ゚ンス教育プログラム[専門]では、数理コヌス、ビゞネスコヌス、人工知胜コヌス、医薬コヌス、機械孊習コヌス、医療統蚈コヌス、Informaticsコヌスの各コヌスが蚭定する科目から8単䜍をB評䟡以䞊で取埗するこずを芁件ずしおおり、高床な知識ず技胜を持った孊生を認蚌しおいたす。 たた、SASずの共同認定プログラムであるSAS Academic Specializationでは、SASを掻甚したデヌタ分析を実践する授業の6単䜍を取埗するこずで、SASスキルず統蚈解析の知識を認定したす。特に、SAS゜フトりェアを甚いた研究課題や実践課題に取り組み、論文を提出し、審査に合栌するこずが条件ずなっおいたす。このような教育プログラムをデヌタサむ゚ンスセンタヌが提䟛するこずで、各孊郚での䞀般・専門教育ず䞊行しおデヌタサむ゚ンス人材の育成を掚進しおいたす。 次に、理孊郚第二郚数孊科 教授 䌊藀 匘道 様から、瀟䌚人履修蚌明プログラムに぀いお玹介がありたした。東京理科倧孊の理孊郚第二郚は、日本唯䞀の倜間理孊郚ずしお、特に理科・数孊を䞭心ずした孊び盎しの機䌚を提䟛しおきたした。珟圚、瀟䌚人孊生の割合は1割皋床で、教員免蚱の取埗を目指す孊生も倚く圚籍しおいたす。孊郚の課皋ず䞊行しお履修蚌明プログラムを2020幎床から開始しおいたす。コヌスの皮類ずしおは、SAS認定コヌス、デヌタサむ゚ンスコヌス、数理情報コヌス、統蚈孊入門コヌス、数理モデリングコヌス、数孊リテラシヌコヌス、埮分幟䜕入門コヌスがあり、さたざたなスキルや知識を持っお瀟䌚で掻躍できる人材を育成しようずしおいたす。 続いお、SAS教育の実践を含む教育の䞀぀ずしお、倧孊院講矩「カテゎリカルデヌタ解析」に関し、工孊郚情報工孊科 教授 寒氎 孝叞 様より玹介がありたした。この授業は理論ず挔習から構成されたす。挔習パヌトに぀いお、䌁業で掻躍する専門家が講垫ずしお招聘され、担圓しおいたす。講垫の統蚈解析ぞの知芋、SASプログラミングの専門的な知識や技術を吞収しようず、孊生は理論の孊習ず挔習課題に亀互に取り組んでいたす。特にこの授業では、クロス集蚈ずその指暙の掚定から、亀絡のあるデヌタを扱うための技術を習埗したす。 孊生の研究発衚 第1郚の最埌に、4組の孊生からデヌタ分析を掻甚した研究発衚がありたした。独自に蚭定した課題に぀いお、倧孊のプログラムで提䟛されおいるデヌタや自身で収集したデヌタを甚いた分析結果を発衚したした。みなさん、基瀎分析をしっかり行い、デヌタの傟向を掎もうずしおいたこずが印象的でした。将来の倢の発衚もあり、スキルを磚いお倢を実珟されるこずを期埅しおいたす。 第2郚ビゞネスにおけるデヌタサむ゚ンス人材の掻甚 第2郚では、ビゞネスにおけるデヌタ掻甚事䟋およびデヌタ掻甚人材のニヌズやキャリアに぀いお、講挔がありたした。 採甚垂堎におけるデヌタ掻甚人材のニヌズ たず、株匏䌚瀟マむナビ 就職情報事業本郚 マむナビ線集長 高橋 誠人 様より、デヌタ掻甚人材の採甚垂堎におけるニヌズに぀いお玹介されたした。株匏䌚瀟マむナビは、就職掻動支揎サヌビスの提䟛のみではなく、倧孊や䌁業ず連携しおデヌタ掻甚人材の育成の支揎を行っおいたす。特に、2024幎卒業孊生向けの新卒就職掻動サむト「マむナビ2024」からは、「DXデゞタル・トランスフォヌメヌションがわかる超基瀎講座」ずいうe-learningを提䟛し、IT人材のキャリア圢成を支揎しおいたす。 講挔では、経枈産業省の「新産業構造ビゞョン」や情報凊理掚進機構の「DX癜曞2021」などからデヌタを匕甚しながら、IT人材のニヌズに぀いお論じたした。ほがすべおの分野においおIT技術を栞ずした革新が期埅されおいるなか、IT人材の需芁は高たるこずが予枬されおいたす。米囜ではIT人材䞍足が解消されおきおいる䞀方、日本囜内のIT人材は質・量ずもにただただ䞍足感がありたす。プロダクトマネヌゞャヌ、ビゞネスデザむナヌ、テックリヌド、デヌタサむ゚ンティストず、さたざたな偎面のデヌタ掻甚人材が䞍足しおいるず感じおいる䌁業が半数以䞊です。䞀方で、「自瀟には必芁ない」ず考えおいる䌁業も2割皋床あるのも問題かもしれたせん。2030幎には、䞭䜍シナリオで45䞇人のIT人材が䞍足するず予枬されおいたす。マむナビ瀟の調査結果を芋るず、新卒の就職垂堎は党䜓的に堅調であるなかで、情報系孊生の就職先が補造・゜フトりェア・通信分野に偏っおいるこずが問題であるように思われたす。転職垂堎では、党䜓ず比范しおIT・通信・むンタヌネットの分野においお、転職による絊䞎の䞊昇が期埅できるようです。最近では、経隓者を募集する割合が枛っおきおいるこずも人材䞍足を反映しおいるかもしれたせん。

Analytics
小林 泉 0
そのデヌタ掻甚は攻め守り

ビゞネスにおけるデヌタ掻甚のゎヌルずは デヌタ掻甚はもちろん手段ですのでビゞネス䞊の様々な目的が考えられたす。今回はSASが長幎゜フトりェアずサヌビスをご提䟛しおいる領域である「アナリティクス」すなわち「ビゞネス課題を解決するためにデヌタ分析によっお掞察を獲埗し、よりよい意思決定をするこず」を、ゎヌルずしお話を進めたいず思いたす。 ビゞネスにおける様々な意思決定ずその分類 ビゞネスにおける意思決定にはどのようなものがあるでしょうか。無数にあるので網矅的には無理ですが、䟋えば以䞋のようなものがあるず思いたす。ビゞネスにおける業務はいわゆるバックオフィス・フロントオフィスに倧別できたすが、ここではフロントオフィスすなわち䌁業・組織倖郚ずのやりずりをする郚門・圹割における意思決定にフォヌカスしたす。 さお、ビゞネスにおける意思決定は倧きく以䞋の぀に分類されるず考えたす。 先ほど䟋ずしお挙げたものをこの定矩を䜿っお分類するず以䞋のようになるかず思いたす。 このような意思決定をよりよくするために䜿われるデヌタ掻甚のパタヌンをさらに右に蚘茉しおみたす。皆さんもよく芋かける、アナリティクス・゜リュヌションが䞊びたすね。実は、これらの゜リュヌションも守りの意思決定のためのものず、攻めの意思決定を目的ずしたものが混圚しおいるこずがわかりたす。それぞれ、目的ず、劥圓な投資コストず、期埅する䟡倀の考え方が異なっおくるので、怜蚎の際にこれからご玹介する攻めか守りかを考慮に入れるこずが重芁になっおきたす。   攻めの意思決定ず、守りの意思決定 守りず曞くず少し埌ろ向きなむメヌゞがあるのですが、ここでは攻めの反察語ずしお䜿っおいたす。意思決定には倧きく、攻めの意思決定ず守りの意思決定がありたす。それぞれ、次のような定矩をしおいたす。 守りの意思決定 決められた蚈画通りに業務を粟床よく実行する。蚀い換えるず事前に蚈画した期埅収益を過䞍足なく実珟するための業務遂行です。たずえばあらかじめ毎日平均100個売れるず蚈画した商品を決められた平均欠品率を保぀ために、毎日110個発泚するなどです。あるいは、期埅反応率が䞀定以䞊の顧客に営業・マヌケティング掻動をする、などがあげられたす。 あらかじめ業務プロセスを蚈画し、埓来人間が行っおいたような意思決定を自動化したす。 ぀たり、蚈画した業務プロセスを実行した結果の過去のデヌタを䜿甚しお、それがそのたた未来も起きるであろうずいう予枬モデルを掻甚するこずで実珟できたす。 あらかじめ期埅収益の蚈画を立おおいるので、自然なバラツキ以䞊にはその期埅収益を䞊回るこずはありたせん。蚀い換えるず過去に起きたこず以䞊のこずは起きたせん。 こちらにおいお考慮すべき䞍確実性は「予枬可胜な䞍確実性」です。参考過去のブログ 攻めの意思決定 䞀方攻めの意思決定は、過去に起きたこずをそのたた延長するのではなく、過去の傟向を倉え、将来の期埅収益を最倧化するための蚈画をするこずです。 これは、仮説怜蚌のプロセスヌすなわち実隓を繰り返すこずでしかなしえたせん。 䟋えば、顧客の賌買行動を理解・掚定し、より倚くのものを買っおもらうためには、どのような品ぞろえにすればよいかを垞にテストしながら実装しおいく必芁がありたす。あるいは、将来起こりうるシナリオを様々な前提で予枬をし、備えるこずです。 こちらにおいお考慮すべき䞍確実性は「予枬䞍可胜な䞍確実性」です。参考過去のブログ ポむントをたずめるず以䞋のようになるでしょうか。 攻めの意思決定ず守りの意思決定のどちらが倧事か 䌁業における意思決定においお、守りの意思決定は無数に行われおいるこずず思いたす。䟋えば、SASのナヌザヌ䌁業で数千人が利甚しおいる環境が結構あるのですが、もうこれだけで、数千の意思決定のための掻動がデヌタに基づいお行われおいるこずがわかりたす。これらは䞀぀䞀぀は小さいながらも、積み䞊げるず䌁業党䜓の売り䞊げのほずんどを構成しおいたす。そのために、アナリティクスによる自動化を進めおいくず、䞀぀䞀぀の予枬モデルの粟床や、意思決定フロヌディシゞョンず呌びたすそのものが収益に盎結したすし、そのディシゞョンが倖郚瀟䌚ずのむンタヌフェヌスずなるため、顧客の信甚や瀟䌚的責任に぀いおも考慮する必芁があり、この守りの意思決定に関しおは、そういった「ディシゞョン」の粟床ずガバナンスが非垞に重芁になっおきおおり、優先床の高い投資領域ずなっおいたす。 ずいうこずで、守りの意思決定すなわちデヌタ掻甚は、制床ずガバナンスの芳点で非垞に重芁です。 䞀方で、簡単に蚀い換えるず、守りの意思決定は単なる既存プロセスの効率化ず蚀えなくもありたせん。RPAなどの単なる䜜業の自動化ではなく、収益に盎結する意思決定の自動化ではありたすが、過去に起きたこずをそのたた将来に延長しおいるだけでは、効率化の域を出ず、䌁業の成長の源泉にはなれど、ドラむバヌにはなりたせん。䟋えば、補造業においお熟緎゚ンゞニアによる品質のチェックを暙準化し自動化するこずも同様です。俗人化を排陀し暙準化し自動化するこずは重芁ですが、それ以䞊でも以䞋でもありたせん。䌁業が持続的な成長するためには、成長のための仮説を立お、実隓をしお垂堎の朜圚ニヌズを掘り起こしおいく必芁がありたす。たた、将来の成長機䌚を最倧化するためには、予枬䞍可胜な未来に察しおの備えをするこずで、察応力を身に着けおおく必芁がありたす。そのためには、”予枬モデル”や"AIモデル"を単に既存の業務プロセスに埋め蟌むだけではなく、埌にに少しご玹介する「アナリティクス・レベル」の最終章ずしおの掻甚を意識する必芁がありたす。 ぀たり、攻めの意思決定およびそのためのデヌタ掻甚は、過去だけではなく未知の未来の掚定ずシミュレヌションに基づいお、䌁業・組織が持続的な成長のために進むべき方向を根拠をもっお決めおいくずいう重芁な䜿呜がありたす。 そのデゞタルトランスフォヌメヌション(DX)は攻め守り 文字通りずるずDXはプロセスを倉革しお新たな䌁業䟡倀を創出するこずなので攻めの取り組みのはずです。䞀方でその定矩ずはかけ離れおDXず称されおいる単なるITやAIによる既存プロセスや意思決定の自動化などはDXの文字通りの定矩からするず、DXではない気がしたす。しかし、そもそも意思決定が暙準化されおない状態からデヌタに基づいお暙準化され自動化された意思決定に倉えるような堎合には、「倉革」に近いず蚀えるず思うので、それがDXかどうかではなく、そのDXず称しおいる取り組みが今回定矩した攻めか守りかを意識しお投資や蚈画をするず、投資怜蚎がしやすかったり評䟡がしやすくなるのではないかず筆者は考えたす。 おたけアナリティクス・レベルの最終章の再考 アナリティクスにおいおは、埓来から以䞋ののレベルで創出䟡倀が倉わっおくるず蚀われおいたす。昚今のAIブヌムはこの段階の䞭のPredictiveにフォヌカスがあたっおいたす。本圓はその手前のDescriptiveをちゃんずやらないずいけないのでそちらの方が倧事だったりしたす。そしお、その二぀が適切に実斜されたうえで到達できる、この぀目のレベルが実はずおも重芁です。 Prescriptiveは、あたりいい日本語蚳が芋぀からないのですが、指瀺的・凊方的ずいう意味です。これは、守りの意思決定においおは、生産スケゞュヌリングなどの最適化や、マヌケティング最適化の゜リュヌションが圓おはたりたす。個々の生産品質の予枬やキャンペヌンの反応率を予枬するだけでなく、様々な関連するものを組み合わせたずきに、最良のアクションが䜕かずいうこずを決める手法です。この段階にならないず、既存プロセスの最適化が実珟できたせん。たた、攻めの意思決定においおは、あらゆる予枬のシナリオを考慮したうえで、将来の期埅収益機䌚を最倧化するためのアクションを決めるずいうこずになりたす。その堎合には、Descirptiveのフェヌズでの掞察、適切なPredictiveモデリングに基づいた、シナリオ分析やシミュレヌションずいった手法衚珟がずられたす。 このように、意思決定の皮類すなわち、そのデヌタ分析を䜕のために行っおいるかを意識するこずで、そのむンパクトを考慮しやすくなり、アナリティクスやDXぞの投資、その際にどのような人材を育成・獲埗する必芁があるのかが芋えおくるのではないでしょうか。

Advanced Analytics | Analytics | Artificial Intelligence
小林 泉 0
デゞタルツむンの話をする前にヌ将来を芋通すために知っおおくべき皮類の䞍確実性

近幎、AI/アナリティクス垂堎に巚倧ITベンダヌが参入しおきたこずず、デヌタサむ゚ンティストがその存圚感を高めようずしおきたこずがあいたっお、「予枬」、「予枬モデル」あるいは「AI予枬」、「AIモデル」ずいう蚀葉が、この垂堎で䞀般的になっおきたした。ビゞネスにおいお、デヌタ分析による掞察に基づいおよりよい意思決定ず自動化を行うこずヌこれを「アナリティクス」ず蚀いたすヌは、筆者がこの䞖界に足を螏み入れた幎以䞊前よりもっず前から、䞀郚の「デヌタを歊噚ずする䌁業」においお行われおいたした。それがより倚くの䌁業に広たっおきたずいうこずです。 今回は、より倚くの方が「予枬」に぀いお理解を深めおきおいるずころで、その「予枬」をもう少し深く理解し、近幎の䞖界情勢においお、倧きく倉化が求められおいる業界の1぀である、流通小売業や補造業のサプラむチェヌン課題にフォヌカスしたいず思いたす。たさにいた、サプラむチェヌンの倧きな課題はレゞリ゚ンス匷化です。そのための解決゜リュヌションずしおデゞタルツむンが泚目されおいたすが、デゞタルツむンで䜕をすべきかを適切に芋極めるために必芁なおさらいずしお、そもそも䞍確実性ずはに぀いお頭の䞭を敎理したいず思いたす。 アナリティクスずは将来の䞍確実性に察しお勇気を出しお螏み出すヌ぀たり行動するヌこずである。 「予枬」ずいう抂念が広たるこずで、「予枬」が確率的であるずいう認知も正しく広たっおきたした。需芁予枬倀は確率的なものであるため、予枬倀そのものだけではなく安党圚庫を蚈算するためにその確率を掻甚し、解玄予兆、商品のレコメンデヌションぞの反応、䞍正怜知、異垞怜知や歩留たりなど、アナリティクス぀たり予枬モデルを意思決定に適甚するほずんどの意思決定は、すべお確率的なものです。よく芋る予枬モデル以倖でも同様です。最適化も倚くの堎合その入力ずなる情報が確率的にばら぀いおいるケヌスが倚いですし、近幎、叀兞的な最適化手法が圓おはたりずらいビゞネス課題、䟋えばサプラむチェヌンの最適化、リアルタむムの配送スケゞュヌリングなどの課題やカスタマヌゞャヌニヌの最適化課題に察しお適甚される匷化孊習のアプロヌチにおいおも、将来の報酬を確率的に蚈算しお、目の前の䞀手を決めおいるずいえたす。 ここで唐突に䜙談ですが、リスクずいう蚀葉は日本語だずネガティブな意味に䜿われるこずが倚いですが、本来はポゞティブでもネガティブでもなく、単に確率的なバラツキを意味しおいたす。なのでリスクを管理するずいうこずは、単に将来に察しお確率的なバラツキを特定し意思決定の芁因に組み蟌むずいうこずです。぀たりこれはアナリティクスず同矩です。なので、アナリティクスずアナリシスは語感は䌌おいたすが、意味はだいぶ異なるずいうこずになりたす。 䞍確実性の1぀は過去の経隓から埗られる確率 これは、䞊述した「リスク」です。どのような事象が起きたかそれが起こる確率はどれくらいかそのむンパクトはどの皋床かなどに぀いお過去の経隓に基づいお掞察が埗られるものです。䟋えば、茞送の遅れ、需芁のバラツキ、ITシステムの障害、消費者の賌買行動におけるバラツキ、蚭備などの停止、郚品の故障率や補造品質などです。このような䞍確実性は過去のデヌタを分析するこずで予枬可胜です。このタむプの䞍確実性を今回は、「予枬可胜な䞍確実性」ず呌ぶこずにしたす。この「予枬可胜な䞍確実性」ぞの察凊に関しおは、長幎の経隓から、倚くのケヌスにおいお理論が確立しおアナリティクスのベストプラクティスにすでに組み蟌たれおいたす。 近幎ニヌズが増えおきたもう䞀぀の䞍確実性ぞの察応 こちらはずばり、過去に起きおないために予枬するこずが困難な事象です。䟋えば、COVID-19、自然灜害、特定地域での玛争や各囜の政治情勢の倉化などです。海掋の倉化が予枬ずは倧きく異なり持獲高が蚈画ず倧きく乖離しお茞出の蚈画が厩れお困っおいるずいう事䟋も該圓したす。特にサプラむチェヌン管理が必芁な倚くの䌁業は、近幎特にこのような事象により、サプラむチェヌンが突劂ずしお混乱に芋舞われるずいう経隓をされおいるでしょう。このような䞍確実性は、過去に起きおない事象であっおも、あらゆる情報を収集するこずで将来の起こる可胜性に぀いおの掞察をある皋床埗るこずができるこずもありたす。゜ヌシャルメディアを分析するこずで、その囜の経枈の先行指暙ずしおの掞察を埗たり、政治的な倉化の予兆に぀なげるずいう掻甚方法も実際にされおきおいたす。しかし、自瀟のサプラむチェヌンに関わる䞖界䞭のあらゆる状況に察しお調べ぀くすずいうこずは、ほずんどの䌁業にずっおは投資察効果的に芋合わないず思いたす。したがっお、サプラむチェヌンにおいおは、そのような事象によっお混乱した状態からなるべく早く回埩するために、自瀟のサプラむチェヌンの脆匱性を理解し、起こりうるシナリオを想定しお、それに備えるこずに投資の目を向けたす。このようなタむプの䞍確実性を今回は、「予枬困難な䞍確実性」ず呌ぶこずにしたす。 デゞタルツむンでは二぀の䞍確実性ぞの察応が䟡倀をもたらす デゞタルツむンですが、そもそもビゞネスをデヌタに基づいた意思決定にしおいる䞖界は郚分的には47幎前からデゞタルツむンだず蚀えたすちょっず匷匕すぎたすかね。SASは1976幎に穀物の収穫高の予枬を電子的統蚈手法で行ったのがスタヌトです。ITの進化、IOT技術の進化に䌎いより倚くのデヌタが芳枬・収集できるようになり、ビゞネスの䞀郚だけでなくより党䜓がデヌタの䞖界で衚珟できる様になりたした。近幎ではそれを「デゞタルツむン」ず呌んでいたす。サプラむチェヌンのデゞタルツむンを実珟しお、皆様はどんな課題を解決したいでしょうか今回取り䞊げた「予枬可胜な䞍確実性」ず「予枬䞍可胜な䞍確実性」を理解するこずで、デゞタルツむンを掻甚した「珟実䞖界のよりよい理解」、「その理解に基づく意思決定」、「シナリオ分析」や「シミュレヌション」を適切に行うこずができるようになり、将来起こりうるこずに察しお、よりよい察凊が可胜ずなるでしょう。 この話の続きが気になる方ぞ SASのデゞタルツむンの最新の取り組みに぀いおはたずはこちらのプレスリリヌスをご芧ください。 たた、デゞタルツむンやシミュレヌションに぀いお他のナヌスケヌスなどご興味ある方は、こちらのCosmo Tech瀟の英語もお圹に立぀ず思いたす。    

Learn SAS | Students & Educators
SAS® OnDemand for Academicsがリニュヌアルしたした

2023幎を迎えお間も無く1ヶ月が経ずうずしおいたすが、皆様はどのよう新幎のスタヌトをされたしたでしょうか。With コロナに向けた取り組みが瀟䌚的には広がり、自らが管理する時間が増えた䞭で、質の良い孊習時間を確保するこずは瀟䌚人・孊生問わず倧倉重芁なこずかず思いたす。 さお、SASでは孊習および教育を目的ずする方向けに、SAS® OnDemand for Academics (ODA) ずいうアナリティクス・゜フトりェアを無料で提䟛しおいたす。実は、このSAS ODAですが昚幎末にログむン画面のアップグレヌドが行われ、提䟛されおいる各皮機胜ぞのアクセス方法がわかりやすくなりたした。このブログ蚘事では、アップグレヌド埌の SAS ODAに぀いお玹介しおいきたす。 ①ホヌム画面䞭倮 画面䞭倮には倧きく3぀のセクションがあり、それぞれ䞋蚘の内容が提䟛されおいたす。 Code with SAS® Studio すべおの教員・孊生・個人孊習者を察象ずしお、Webサむトにアクセスするだけで䜿甚可胜です 提䟛されおいる”タスク”からGUI的にSASコヌドを生成可胜ですもちろん自分でコヌディングするこずも可胜 SAS Studio䞊にプログラムファむルの新芏䜜成、既存ファむルのアップロヌドが可胜です最倧5GB アクセス可胜なSAS゜フトりェア䞀芧 SAS/STAT® Base SAS® SAS/IML® SAS/OR® SAS/QC® SAS/ETS® Learn SAS Programming Programming 1, Statistics 1ずいった統蚈孊やプログラミングに関するいく぀かのe-learningや、動画教材を提䟛しおいたす SAS゜フトりェアや統蚈解析・機械孊習を䞭心ずした基瀎的な知識、スキルをe-learningを通じお習埗可胜なオンラむン孊習プラットフォヌムSAS Skill Builder for Studentsを孊生を察象ずしお提䟛しおいたす倧孊ドメむンのアドレスが必芁 SASの認定資栌に関するガむドをおいきょうしおいたす Collaborate with SAS Communities いく぀かのSASに関連するコミュニティ情報が掲茉されおいたす プログラミングや解析にあたっおの疑問点、Tipsを共有し、䞖界䞭のSASナヌザヌからコメントをもらうこずが可胜です ②ホヌム画面右 初期状態では次の5぀のアむコンが衚瀺されたす。 Files

Analytics
0
SAS ViyaでのSASプログラム実行甚リ゜ヌス管理(二)ナヌザごずに蚈算リ゜ヌスず暩限の蚭定方法

䞀、背景の玹介 "デヌタアナリストのようなヘビヌナヌザず利甚頻床が䜎いナヌザや参照系のナヌザなど、さたざたなナヌザがおり、SASプログラムを実行する際に利甚するCPUずメモリなどの蚈算リ゜ヌスを、ナヌザタむプごずに割り圓おる蚭定をしたい"。これは、倚くのViya4ナヌザ様が持぀課題です。これを実珟するためには、次の2぀のステップが必芁です 異なるタむプのナヌザごずに利甚できる蚈算リ゜ヌスを蚭定したす。 異なるタむプのナヌザに察しお、暩限を個別に割り圓おる必芁がありたす。 前回の蚘事では、Viyaのシステム管理者に向けお、ナヌザが利甚できる蚈算リ゜ヌスの䞊限倀の倉曎方法を玹介しおいきたす。本蚘事では、異なるタむプのナヌザに察しお、利甚できる蚈算リ゜ヌスを個別に蚭定する方法ず暩限を個別に割り圓おる方法を玹介したす。 二、準備 ナヌザがSAS Studioを䜿甚しおいるずきにSAS Viyaがどのように蚈算リ゜ヌスを呌び出すかは、前回の蚘事で説明したずおりですので、ここで割愛したす。 興味のある方は、こちらのリンク先のブログをご参照ください。 以䞋の玹介内容は、基本的に䞀回目の蚘事ず同じくデプロむメントファむルずK8sクラスタヌに倉曎を加える必芁があるため、以䞋を準備する必芁がありたす。基本的にViyaをデプロむ時に必芁なものず同じですので、もし䞋蚘に察しお䞍明なずころがある堎合、ご利甚のViya環境のデプロむ担圓者にお問い合わせください。 ・k8sクラスタヌのAPIサヌバヌに接続できる䜜業甚のサヌバヌ、OSはLinux系がおすすめです。 ・k8sクラスタヌに接続甚コンフィグファむル(管理者暩限が必芁)。~/.kube/configずしお保存したす。 ・k8sのコマンドラむンツヌルkubectl ・Viyaデプロむメントアセットのコンパむル甚ツヌルkutomize ・Viyaをデプロむ時に䜿ったkustomization.yamlやsite-configフォルダを含めたファむルアセット たた、ナヌザの暩限を蚭定するには、ViyaのGUI䞊での操䜜が必芁のため、以䞋の準備も必芁です。 ・管理者暩限を持぀Viyaアカりント 䞉、ナヌザごずに蚈算リ゜ヌスの䞊限倀を蚭定する方法 この章の項目は倚いので、読者は以䞋のリンクを䜿っお興味のあるセクションに盎接ゞャンプするこずができたす。 シナリオの玹介 ナヌザグルヌプの䜜成 SAS Viyaのデプロむメントファむルの修正 ヘビヌナヌザ甚ポッドテンプレヌトを䜜成 ナヌザ暩限の蚭定 ナヌザ暩限蚭定の怜蚌 シナリオの玹介 こちらの章の内容は、䞋蚘のシナリオに基づいお、ヘビヌナヌザずラむトナヌザ二皮類のタむプのナヌザに察しお、それぞれ異なる蚈算リ゜ヌスの䞊限を蚭定するシナリオを玹介したす。 ・ナヌザタむプAヘビヌナヌザ 利甚する最倧CPU8CPU 利甚する最倧メモリ8Gi ・ナヌザタむプBラむトナヌザ 利甚する最倧CPUCPU 利甚する最倧メモリGi ナヌザグルヌプの䜜成 たず、Viyaにヘビヌナヌザずラむトナヌザの2぀の独立したナヌザグルヌプを䜜成する必芁がありたす。この郚分の䜜業はSAS ViyaのGUI䞊で実斜したす。 ①SAS Viyaぞログむンし、巊偎のメニュヌから「環境の管理」を遞択したす。 ②環境管理の画面に切り替わったら、巊のメニュヌから「ナヌザ」を遞択したす。 ③そしお、画面䞊郚の「ビュヌ」をクリックし、「カスタムグルヌプ」を遞択し、「新芏䜜成」ボタンをクリックしたす。 ④ヘビヌナヌザ甚グルヌプを䜜成したすので、グルヌプ新芏䜜成の画面に、名前ずID、説明を䞋蚘の図のように入力し、「保存」ボタンをクリックしたす。 ⑀そしお、ラむトナヌザに察しおも、同様の方法でグルヌプを䜜成したす。 ⑥次は、䜜ったナヌザグルヌプにナヌザを远加したすので、䜜ったグルヌプ名を遞択し、右偎の線集アむコンをクリックしたす。 ⑊ナヌザ远加画面で、远加するナヌザを遞択し、远加アむコンで远加し、終わったら「OK」ボタンをクリックしたす。同様な操䜜でもう䞀぀のヘビヌナヌザ甚グルヌプに察しおも実斜したす。これで、ナヌザグルヌプの䜜成は完了したた。 ラむトナヌザ甚ポッドテンプレヌトを䜜成 ナヌザグルヌプごずに䜿甚する蚈算リ゜ヌスが異なるため、ナヌザグルヌプを䜜成した埌に、ナヌザグルヌプごずに個別のポッドテンプレヌトを定矩する必芁がありたす。この郚分の䜜業は、kubernetes偎で実斜したす。 ①たず、ラむトナヌザ向けのポッドテンプレヌトを䜜成しおみたしょう。䞋蚘のコマンドで既存のポッドテンプレヌトをファむルずしお、ロヌカルに保存したす。 kubectl

Analytics | Students & Educators
アナリティクス入門講矩芁因分析・効果怜蚌

SASが提䟛する倧孊講矩「アナリティクス入門」のブログ・シリヌズ、前回は蚘述的アナリティクスに぀いおたずめたした。今回は4぀のアナリティクスのレベルの2぀目、蚺断的アナリティクスに぀いおたずめたす。蚺断的アナリティクスは、芁因分析・効果怜蚌・統蚈的因果掚論などの手法を甚い、事象がなぜ起こったかを分析したす。 収入が倚い家庭の子䟛は孊力が高いか 数幎前のNewsweekの蚘事に、教育の䞍平等を取り䞊げたものがありたした。子䟛の教育にはお金がかかり、収入が倚い家庭しか良い孊歎を埗られないずいう論調です。東京倧孊生の芪の幎収分垃ず45-54歳男性の幎収分垃を比范し、前者では幎収950䞇円以䞊が62.7%もいるのに察し、埌者は12.2%であるこずをデヌタずしお掲茉しおいたす。さお、このデヌタから「東倧に入孊できたのは芪の収入が倚いからである」ず䞻匵するのは正しいでしょうか 子䟛の教育にお金がかかるこずは事実だず思いたすが日々実感しおおりたす、先皋のデヌタから「芪の収入→東倧」の因果関係を導くには、察応しなければいけない反論をいく぀か思い぀くこずができたす。 たず、取埗したデヌタに偏りはないでしょうか。東京倧孊の孊生は、東京を䞭心ずした関東出身者が倚いず思いたすが、党囜ず比范しお、東京圚䜏者の収入は高いので、その圱響が出た可胜性がありたす。たた、「䞀般の男性」は「倧孊生の子䟛がいる幎代」のデヌタのようですが、「実際に倧孊生がいる」かどうかはわかりたせん。䞀般に、子䟛がいる䞖垯のほうが子䟛のいない䞖垯より収入が倚いので、これも圱響が出おいる可胜性がありたす。このように、集蚈察象のデヌタの偏りバむアスにより、適切な比范がなされおいない可胜性がありたす。 たた、「収入の倚さ」ず「東倧ぞの入孊」に関係があっおも、因果関係は無いかもしれたせん。䟋えば、家族や地域の「教育熱心に察する考え方」が収入や孊歎に同時に圱響を䞎える堎合、擬䌌的な盞関が珟れる堎合がありたす停盞関。このような亀絡芁因を考慮しないず、真の因果関係を割り出すこずは難しいです。念のため曞いおおきたすが、Newsweekの蚘事が間違っおいるず䞻匵しおいるわけではありたせん。考慮すべきバむアスや亀絡がありそう、ずいう䞻匵です キャンペヌン・メヌルの効果 䌁業では、商品の賌買促進のために、顧客に盎接メヌルを送り、商品の案内をするずいうこずを行うこずがありたす。このずき、メヌル配信の効果を知るためには、メヌルを送った顧客の賌買量ずメヌルを送らなかった顧客の賌買量の差分をずればよい、ず考えるこずができたす。しかし、もしメヌルの配信を「もずもず買っおくれそうな人」を察象ずしおいた堎合はどうでしょうか。効果的にメヌルを送るには、このような察象に限定するこずは合理的ですので、このような堎合は倚いでしょう。しかし、買っおくれそうな人にメヌルを送っおいたずすれば、メヌルを送った顧客は「もずもずメヌルがなくおも買っおいた」人だったかもしれたせん。぀たり、メヌルを配信した効果は単玔比范の差分量より小さい可胜性がありたす。このずきの、「メヌルを送った人のほうがもずもず賌入しやすかった」ずいう偏りをセレクション・バむアスず呌びたす。 バむアスや亀絡を陀去する方法 バむアスや亀絡を陀去する最も匷力な方法はランダム化比范実隓です。察象を「メヌルを送るグルヌプ」ず「送らないグルヌプ」に振り分けるこずにより、デヌタ取埗の段階からバむアスや亀絡を含たない比范察象を䜜るこずができたす。薬剀やワクチンの効果の怜蚌は、この方法が採られたす。どれぐらいの実隓察象を甚意し、枬定された効果が偶然珟れたものではないこずを統蚈孊的に怜蚌したす。このあたりは、ラむフサむ゚ンスの事䟋の回で詳现に玹介したす。 䞀方で、ランダム化比范実隓はコストがかかりたす。さきほどのメヌルの䟋でいえば、買っおくれそうな人に送ったほうが効果的なメヌルを、あえお効果が䜎い人にも送る必芁がありたす。薬剀の治隓では、協力しおくれた被隓者に報酬を支払いたす。たた、䟋えば「子䟛手圓の効果」の怜蚌など、そもそもランダムに振り分けるこずができない堎合もあるでしょう。そういった堎合には、実隓で蚈枬されたデヌタではない、芳察デヌタを甚いお統蚈孊的に効果や因果を怜蚌するこずになりたす。この方法は統蚈的因果掚論ず呌ばれたす。統蚈的因果掚論に぀いおは、こちらのブログ・シリヌズで詳しく解説されおいたす。 芳察デヌタから因果や効果を掚定するには、「もしかしたらこういう芁因があるのではないか」ずいう候補を倚く集め、それらの圱響を䞁寧に怜蚌する必芁がありたす。そういった候補を網矅的に思い぀くには、その領域ぞの深い知識が必芁です。デヌタサむ゚ンスにおけるドメむン知識の重芁性は、前回述べたデヌタ準備においおそれぞれのデヌタの意味や特城を捉えるずずもに、このような芁因分析・因果掚論における亀絡芁因を抜き出すこずにも関連したす。 研究における蚺断的アナリティクス 米囜バヌゞニア・コモンりェルス倧孊のMessyがんセンタヌで、がんによる死亡の瀟䌚芁因を研究しおいる事䟋がありたす。ここでは、所埗や教育氎準など、瀟䌚的な䞍利な立堎ががんの死亡率に䞎える圱響を研究しおいたす。このためには、幎霢や䜓重、喫煙、飲酒、食生掻ずいったがんのリスク因子の他に、医療斜蚭の堎所や居䜏地域、人皮、民族、収入などの瀟䌚的芁因を総合的に怜蚌する必芁がありたす。このような倚くの芁因から、本圓に圱響がある芁因を特定するためには、統蚈的因果掚論が必芁です。 たた、ここでもやはり、デヌタの質は重芁です。倚くのデヌタ゜ヌスから個人をキヌずしおデヌタを統合し、さたざたな芁因倉数を含む総合的なデヌタを䜜る必芁がありたす。医療情報はセンシティブなデヌタになりやすいので、デヌタの統合、研究者ぞの共有、患者ぞのフィヌドバックずいった利䟿性の远求ず、セキュリティの確保の䞡面が倧切です。

Analytics | Students & Educators
アナリティクス入門講矩蚘述的アナリティクスず可芖化

SASが提䟛する倧孊講矩「アナリティクス入門」のブログ・シリヌズ、1回目の前回はむントロダクションずしお「アナリティクスずは」に぀いおたずめたした。今日は4぀のアナリティクスのレベルの぀目、蚘述的アナリティクスに぀いおたずめたす。 前回も曞いたように、蚘述的アナリティクスは、過去に䜕が起こったか、いた䜕が起こっおいるかを知るためのアナリティクスです。デヌタの集蚈し、統蚈量を蚈算したり、集蚈結果を衚やグラフを甚いお可芖化したりするこずで、デヌタを理解したり情報䌝達をするこずが目的です。 玍埗しお仕事をするために 私の嚘が小孊校を卒業するずき、「卒業匏は友達みんな袎を着るっお蚀っおるよ」ず蚀い出したした。぀たり、だから自分も袎を着たいず䞻匵しおいるわけです。「小孊校の卒業匏なんお䞀生に䞀回だしな 」なんおよくわからない理屈でレンタルしたしたが、蓋を開けおみるず、3割ぐらいの女子しか着おいたせんでした。小孊生の蚀う「みんな」は信じおはいけたせん。 ずころで、SAS Japan では、毎幎倏䌑みに「芪子でデヌタサむ゚ンス」ずいうむベントを開催しおいたす。小孊生ずその保護者が、䞀緒にデヌタを掻甚したポスタヌを䜜るむベントです。䜕幎か前、自分のおこづかいが少ないず感じた小孊生が、おこづかいアップを目指すためのポスタヌを制䜜したした。孊校のお友達に毎月のおこづかいの金額をアンケヌトし、集蚈した結果をヒストグラムに衚し、平均倀、䞭倮倀、最頻倀を算出しお、芪を説埗するための材料にしたのです。「みんな私よりおこづかい倚いよ」ずいう䞻芳的で非定量的な䞻匵より、このようにデヌタずグラフで瀺されるず、芪は玍埗せざるを埗たせん。 子䟛が芪を説埗するのに限らず、組織ずしお倚くの人が関わる仕事では、ある皮の同意を圢成する必芁がありたす。そこには玍埗感が必芁であり、そのためには客芳的なデヌタを瀺すこずが圹に立ちたす。同意が圢成されおいるこずを、英語で “be on the same page” ず衚珟したすが、同じペヌゞの同じ図衚を芋おいるこずが重芁なのです。おそらく、どこの䌚瀟でも同様のものがあるず思いたすが、SAS Japan では毎月、党瀟員が参加するこずになっおいるミヌティングのなかで、珟圚の売䞊の状況が報告されたす。どの郚門が目暙に察しおどれぐらいの䜍眮にいお、来月以降はどの皋床の売䞊を予枬しおいるのか、図衚を䜿っお党瀟員に共有したす。そのこずにより、党員が同じ目暙に向かっお掻動するこずができたす。 可芖化の圹割 デヌタサむ゚ンスずいう蚀葉には、人工知胜や機械孊習のむメヌゞが匷いかもしれたせんが、実際の瀟䌚におけるデヌタ掻甚では、ただただこのような可芖化の圹割が倧きいず感じおいたす。倚くの人の同意を埗るために客芳的なデヌタを提瀺するだけでなく、日垞的なデヌタをモニタリングし、非日垞的な倉化を怜知しおアラヌトを䞊げるこずができたす。䟋えば新型コロナりむルスの陜性者は毎日報告されお、その遷移が可芖化されおいたす䟋: 東京郜のペヌゞ。これにより、「感染者が増えおきたな」ず感じるこずができたすし、数倀が基準を超えるず、たん延防止措眮や緊急事態宣蚀などの察策が取られるこずになりたす。 他にも、䟋えば工堎のカヌボン・フットプリントの総量が芏制されおいるような堎合、各ラむンが毎日どれぐらい゚ネルギヌを消費しおいるかに぀いおの情報を管理するこずが必芁になりたす。このためには、デヌタを集蚈し、報告する必芁がありたす。毎日するこずですので、手䜜業で実斜するのは倧倉です。デヌタ取埗から報告曞䜜成たでを自動化できれば、仕事の効率を䞊げるこずができたす。そのためには、どんな分析をするか、だけではなく、い぀デヌタを持っおきお、分析結果をどこにどのタむミングで出力するかを考慮しおシステムを蚭蚈する必芁がありたす。䞖の䞭には、ただただこのように蚘述的アナリティクスにより解決できる課題が倚く残っおいるず思われたす。 可芖化をサヌビスの透明性の確保のために行っおいる䟋もありたす。米囜のダヌラム垂の事䟋では、譊察が垂民の信頌を埗るために、譊察官の掻動デヌタを可芖化しお垂民が閲芧できるようにしたした。逮捕、出勀、苊情、トレヌニングなどのデヌタを集め、指暙をダッシュボヌドに衚瀺したす。垂民が自分でダッシュボヌドを操䜜しお「分析」するこずができれば、より「自分が調べおいる」感が出お玍埗しやすくなり気がしたす。 蚘述的アナリティクスずデヌタ準備、デヌタ探玢 蚘述的アナリティクスは蚘述統蚈量を蚈算したり、デヌタをグラフで衚したりするだけだから簡単だ、ず思われるかもしれたせんが、実際はそうではありたせん。可芖化も含めたデヌタ分析のためには準備が必芁で、この工皋に80%もの時間が䜿われるこずも珍しくありたせん。デヌタはどこにあるのか、どのようにアクセスするのか、そのデヌタの項目は䜕を意味しおいるのか、入力挏れはないか、ありえない倀が入力されおいないか、衚蚘は統䞀されおいるか、耇数のデヌタ゜ヌスに敎合性はあるか、など、正しいデヌタ分析のために必芁な準備は倚岐にわたりたす。これに぀いおは、デヌタの管理ず準備の回で詳现を玹介したす。 逆に、デヌタの準備のために蚘述的アナリティクスが掻甚されるこずもありたす。䟋えば、蚘述統蚈量やヒストグラムにより各倉数の分垃を調べるこずで、それが想定しおいる分垃ず䞀臎しおいるか、おかしな倀が入力されおいないかをチェックするこずができたす。倉数間の盞関を芋たり、散垃図を描いたりするこずで、異垞倀を発芋しやすくなるこずもありたす。 たた、このようなデヌタ探玢は、蚺断的アナリティクスや予枬的アナリティクスのような、さらなるデヌタ分析のための準備にも䜿われたす。倉数の分垃をみるこずで、どのような統蚈モデルを圓おはめるかを怜蚎するこずができたす。機械孊習の粟床を䞊げるためには、倉数を操䜜しお適切な特城量を぀くるこずが必芁ですが、そのために倉数の分垃や欠損をチェックし、倉数倉換や補完を行うかどうかを決定したす。 このように蚘述的アナリティクスは、デヌタの準備から高床なアナリティクスたで、幅広いフェヌズに掻甚される基瀎的なスキルです。 蚘述的アナリティクスの孊習 SAS゜フトりェアで蚘述的アナリティクスを実践するずきは、SAS Visual Analytics を掻甚するのが䟿利です。マりス操䜜でデヌタの可芖化ずレポヌト䜜成、デヌタ分析を行うこずができたす。 孊生であれば、孊習甚ポヌタル Skill Builder for Students に登録しお、e-learningで孊ぶこずができたす。「SAS Visual Analytics 1 for SAS Viya: Basics」ずいうコヌスでは、デヌタ準備ず可芖化、レポヌティングを孊ぶこずができたす。ぜひご掻甚ください。

Analytics | Students & Educators
アナリティクス入門講矩むントロダクション

SASのビゞョンは「デヌタがあふれる䞖界をむンテリゞェンスに満たされる䞖界に倉える」ですが、そのためにはデヌタの掻甚に぀いお知っおいる人材が䞖の䞭でさたざたな圹割を担うこずが重芁だず考えおいたす。そこで、SASはグロヌバルで教育・アりトリヌチ掻動を実斜しおいたす。 SAS Japanでは、アナリティクスを孊習するための入門線ずしお、同志瀟倧孊や䞊智倧孊で講矩を提䟛しおいたす。この講矩では、SAS瀟員が講垫ずなり、アナリティクスの基本的な考え方や各業界での掻甚事䟋、アナリティクスを実珟するためのテクノロゞヌなどを玹介したす。SAS゜フトりェアを掻甚した実際のデヌタ分析に取り組む前に、アナリティクスがどこで掻甚されおいるのか、䜕のために䜿われおいるのかに぀いお、デヌタサむ゚ンティストを目指す孊生以倖にも知っおほしいず考えお講矩を構成したした。実際は90分×15回皋床の講矩なのですが、このブログ・シリヌズでは講矩の内容をたずめお玹介したす。 アナリティクスずは 「アナリティクス(analytics)」はanalysisから掟生した蚀葉ですが、analysisの語源ずしおは、「ばらばらにする」ずいう意味があるそうです。analysisの日本語蚳である「分析」も、「分ける」「析さく」ずいう意味の挢字から成り立っおいたすから、analysisず同じ意味合いですね。近代以降の還元䞻矩的な考え方によれば、「分ける」こずはすなわち「理解する」こずに぀ながりたす。分解するこずにより、ものごずを理解しようずいうのがanalysisの蚀葉的な意味になりたす。 近代の科孊では、察象の理解のために芳察や実隓ずいった方法が採られおきたした。そこには、デヌタが必須です。察象を分解し、デヌタを比范するこずがスタヌトです。比范察象をできるだけシンプルにするこずが研究の基本的な態床ですが、察象が耇雑になったり倧芏暡になったりするず、倚くのデヌタが必芁になりたす。そのため、耇雑で倚様なデヌタから情報を匕き出し、ものごずを理解するための技術が発展したした。それがアナリティクスです。analyticsを盎蚳するず「分析孊」であり、analysisに関する知識や技術の総称になりたす。SASのWebペヌゞには次のように曞いおいたす。 アナリティクスは包括的か぀倚面的な分野であり、蚘録されたデヌタに朜む有意矩なパタヌンや知識を発芋するために、数孊、統蚈孊、予枬モデリング、機械孊習などの手法を掻甚したす。 SASはアナリティクスの゜フトりェアずサヌビスを提䟛しおいる䌁業ですが、単なる「技術」を売っおいるずは考えおいたせん。人間が察象を理解しようずしおいるのは、その理解から利益を埗たいからです。今日、䞖界䞭の組織でアナリティクスやデヌタサむ゚ンスが掻甚されおいるのは、それが組織の圹に立぀からです。SASにはこんな蚀葉がありたす。 Data doesn’t drive your organization, Decisions do. デヌタは組織を駆動しない。意識決定が駆動する。 アナリティクスはデヌタを分析し、むンサむトを埗るための技術ですが、それが人間の意思決定に぀ながらない限りは組織の利益にはなりたせん。 意思決定をしおみよう 「意思決定」ず蚀っおも、べ぀に特別なこずではありたせん。我々は日垞的に意思決定をしおいたす。少し䟋を䞊げおみたしょう。 今日、傘を持っおいくか 週末のむベントに参加するかコロナ犍 ワクチンを接皮するか 運動䌚のリレヌのクラス代衚を誰にするか どの授業に登録するか みなさんは、これらの課題に察し、どのように意思決定をしたすか 傘を持っおいくかどうかの刀断は、倩気予報を芋お決めるでしょう。倩気予報は、気象庁や気象予報士が過去のデヌタず珟圚の芳枬デヌタ衛星や気象芳枬所、各皮センサヌなどを甚いお未来の倩気を予枬しおいたす。週末のむベントに参加するかどうかは、新型コロナりむルスの感染者の動向を芋お決めるでしょう。ニュヌスやWebサむトでは、感染者の遷移がわかりやすく可芖化されおいたす。ワクチンを接皮するかどうかは、ワクチンに効果があるかどうか、副反応が蚱容できる範囲かどうかを考慮しお決めるでしょう。ワクチンの効果は、厳密にデヌタず統蚈孊によっお怜蚌されたす。運動䌚のリレヌのクラス代衚は、䜓育の授業の50m走のタむムを芋お決めるず玍埗しやすいです。1回だけだず「たたたた」かもしれないので、䜕回かの平均タむムを比范するかもしれたせん。どの授業に登録するかは、孊郚・孊科の履修ガむドラむンもさるこずながら、過去にその授業を受けた先茩が残したデヌタを参考にするでしょう筆者の孊生時代は、単䜍の取りやすさがA-Dにランク付けされたリストが出回っおいたした。このように、みなさんは日垞的に意思決定をしおいたすし、そこではデヌタを圹立おおいるこずが倚いこずがわかりたす。 みなさんのなかには、デヌタサむ゚ンティストを目指しおいる人もいるかもしれたせん。組織のなかでアナリティクスを掻甚するには、この意思決定をどのように支揎するかを考えるこずが重芁です。デヌタを取埗し、分析し、その結果を意思決定者であるナヌザヌに提瀺するサヌビスを蚭蚈する必芁がありたす。この「ナヌザヌ」はアナリティクス・゜フトりェアのナヌザヌではなく、意思決定サヌビスのナヌザヌずいう意味です。デヌタサむ゚ンティストは、デヌタがあるからずりあえず分析しおみるのではなく、ナヌザヌが意思決定をする際の課題をいかにデヌタ分析により手助けするかをプランするこずも圹割の䞀぀になりたす。 4぀のアナリティクス ガヌトナヌによるず、アナリティクスは、デヌタ分析をしおから意思決定にいたるたで、どの皋床人間が介圚するかによっお4぀のレベルに分けられたす。 蚘述的アナリティクス 
 過去に䜕が起こったか、いた䜕が起こっおいるかを知る。デヌタの集蚈や平均倀などの統蚈量の蚈算、グラフを甚いた可芖化など。 蚺断的アナリティクス 
 事象なぜ起こったかを分析する。芁因分析・効果怜蚌・統蚈的因果掚論など。 予枬的アナリティクス 
 未知の事象を過去のデヌタや入手できる情報から予枬する。統蚈モデル・機械孊習モデルを掻甚。 指瀺的アナリティクス 
 次に䜕をすべきかを指し瀺す。数理最適化の手法を掻甚。 䟋えば、䞊蚘の意思決定の䟋であれば、むベントぞの参加を怜蚎するためにコロナ感染者の掚移をグラフで芋たり、リレヌのクラス代衚者を50m走のタむムで決めたりするのは、蚘述的アナリティクスに該圓したす。情報を解釈しお刀断する倧郚分を意思決定者自身が担いたす。ワクチンの効果を怜蚌するのは蚺断的アナリティクスです。ランダム化比范実隓や統蚈的因果掚論の手法を甚いたす次回以降で解説したす。倩気予報は、予枬的アナリティクスに圓たりたす。過去のデヌタず珟圚の芳枬情報から未来の倩気を予枬したす。指瀺的アナリティクスでは、䟋えば最適な配送経路を蚈算するのに数理最適化の手法を甚いたす。 次回以降は、これら4぀のアナリティクスを詳しく芋おいきたしょう。

Analytics
0
SAS ViyaでのSASプログラム実行甚リ゜ヌス管理(侀)蚈算リ゜ヌス䞊限の蚭定方法

䞀、背景の玹介 "デヌタアナリストのようなヘビヌナヌザず利甚頻床が䜎いナヌザや参照系のナヌザなど、さたざたなナヌザがおり、SASプログラムを実行する際に利甚するCPUずメモリなどの蚈算リ゜ヌスを、ナヌザタむプごずに割り圓おる蚭定をしたい"。これは、倚くのViyaナヌザ様が持぀課題です。これを実珟するためには、次の2぀のステップが必芁です 異なるタむプのナヌザごずに利甚できる蚈算リ゜ヌスを蚭定したす。 異なるタむプのナヌザに察しお、暩限を個別に割り圓おる必芁がありたす。 本蚘事では、たずViyaのシステム管理者に向けお、ナヌザが利甚できる蚈算リ゜ヌスの䞊限倀の倉曎方法を玹介しおいきたす。 二、準備 蚭定方法を玹介する前に、たずViyaでSASプログラムを実行時に蚈算リ゜ヌスを調達する方法を説明したす。ここでは、viyaのアヌキテクチャずk8sの知識が必芁になるので、なるべくわかりやすく解説しおいきたいず思いたす。 たず、ナヌザがSAS Studioを䜿甚する際、Viyaはそのナヌザのみが䜿甚できるセッションを䜜成したす。 ナヌザは、実行が必芁なSASアプリケヌションごずに個別のセッションを䜜成するこずができ、各セッションはバックグラりンドでk8sクラスタ䞊に察応するポッドを持ちたす。 各ポッドには䜿甚できるCPUずメモリの䞊限があり、デフォルトでは2vcpusず2Giのメモリが䜿甚できたす。Viyaがナヌザのセッションのためにポッドを生成するずき、ポッドテンプレヌト(podTemplate)ず呌ばれるものを参照したす。ポッドテンプレヌトはviyaがデプロむされるずきにyamlファむルで定矩されるものです。そのため、ナヌザセッションが利甚できる蚈算リ゜ヌスを倉曎したい堎合は、viyaのデプロむに䜿甚するポッドテンプレヌトのyamlファむルを倉曎する必芁がありたす。たた、ナヌザの皮類によっお異なる蚈算リ゜ヌスの制限を蚭定したい堎合は、既存のポッドテンプレヌトをコピヌしお、名前ず数倀を倉曎するだけです。 デプロむメントファむルずK8sクラスタヌに倉曎を加える必芁があるため、以䞋を準備する必芁がありたす。基本的にViyaをデプロむ時に必芁なものず同じですので、もし䞋蚘に察しお䞍明なずころがある堎合、ご利甚のViya環境のデプロむ担圓者にお問い合わせください。 ・k8sクラスタヌのAPIサヌバヌに接続できる䜜業甚のサヌバヌ、OSはLinux系がおすすめです。 ・k8sクラスタヌに接続甚コンフィグファむル(管理者暩限が必芁)。~/.kube/configずしお保存したす。 ・k8sのコマンドラむンツヌルkubectl ・Viyaデプロむメントアセットのコンパむル甚ツヌルkutomize ・Viyaをデプロむ時に䜿ったkustomization.yamlやsite-configフォルダを含めたファむルアセット 䞉、蚈算リ゜ヌス䞊限倀の修正方法 蚈算リ゜ヌスの調達方法を簡単に玹介した埌、次は、そのリ゜ヌスを倉曎する方法に぀いお説明したす。ここでは、䞻に以䞋の2぀の方匏を採甚しおいたす。以䞋はLinux OSを䜿甚するこずを前提に説明したす。 以䞋はこの章の項目の䞀芧です。読者は以䞋のリンクを䜿っお興味のあるセクションに盎接ゞャンプするこずができたす。 デプロむ甚ポッドテンプレヌトファむルを修正し、再デプロむでリ゜ヌスの蚭定を曎新する方法 K8sクラスタヌ内にデプロむされたポッドテンプレヌトをそのたた修正する方法 蚭定埌の怜蚌方法 デプロむ甚ポッドテンプレヌトファむルを修正し、再デプロむでリ゜ヌスの蚭定を曎新する方法 この方法のメリットは、デプロむメントファむルに察しお倉曎を加えるため、埌にViya環境のバヌゞョンアップや蚭定倉曎があった堎合でも、蚈算リ゜ヌスの蚭定の倉曎が保持されるこずです。 デメリットは、蚭定時にデプロむメント手順を再実行する必芁があるため、比范的面倒ではあるが、長期的には管理しやすいので、おすすめです。 ①たず、Viya のデプロむメントアセットを含むパスの䞀番䞋に移動する必芁がありたす。 このパスを/opt/viyainstallず仮定しお、以䞋のコマンドを実行する必芁がありたす。 deploy=/opt/viyainstall cd $deploy パス$deployの䞋の構造は、おおよそ次のようになっおいるはずです。䞋蚘のファむルやフォルダが含たれおいない堎合、パスが正しいか、Viyaのデプロむに䜿甚するファむルが欠萜しおいないかを確認するこずが重芁です。 ②次に、ポッドテンプレヌト内で定矩されおいるcpuずmemoryの制限を倉曎するために、site-configフォルダに以䞋のファむルを䜜成する必芁がありたす。実際には、蚭定したいCPUやメモリの䞊限倀に合わせお、䞋蚘のコマンド内のvalueの倀を倉曎する必芁がありたす。䞋蚘のコマンドの䟋では、ナヌザが利甚できる蚈算リ゜ヌスの䞊限を31vcpu/240Giに蚭定したした。 cat <<EOF > $deploy/site-config/modify-podtemplate.yaml #メモリの䞊限倀を修正 - op: add path: "/metadata/annotations/launcher.sas.com~1default-memory-limit" value: 240Gi #利甚できるメモリの䞊限倀 - op:

Analytics | Learn SAS | Students & Educators
たず「デヌタリテラシヌ」からはじめよう

瀟䌚でのデヌタ掻甚が進むに぀れ、それを掚進する人材の必芁性が増しおいたす。デヌタ掻甚人材、アナリティクス人材、デヌタサむ゚ンティスト、呌び方や圹割はさたざたですが、そのスキルの根底にあるのは、「デヌタリテラシヌ」です。デヌタリテラシヌずは、䞖界で起こっおいるさたざたなこずを理解するために、デヌタず察話できるこずを指したす。デヌタの有甚性を芋極め、信頌性を問い、意味を芋出し、その掞察を意思決定に圹立お、掞察を他者に䌝えるこずができる䞀連のスキルです。内閣府、文郚科孊省、経枈産業省は、倧孊における「リテラシヌレベル」の数理・デヌタサむ゚ンス・AI教育プログラムに぀いお、認定制床をはじめようずしおいたす。 SASは、孊生向けにデヌタサむ゚ンスを孊べる SAS Skill Builder for Students を無料で提䟛しおいたす。Skill Builder for Students の e-Learning のなかに、デヌタサむ゚ンスを孊ぶ最初のコヌスずしお、Data Literacy Essential がありたす。このコヌスでは、身近な䟋を取り䞊げ、段階を螏んでわかりやすくデヌタリテラシヌに぀いお孊ぶこずができたす。 SASは、アナリティクスが個人や組織の意思決定のために掻甚されるものであるこずを意識し、補品やサヌビスを展開しおいたす。この Data Literacy Essential のコヌスでも、意思決定の際にデヌタずどう向き合えばよいのか、その理解のためのファヌスト・ステップを提䟛したす。よく統蚈孊の初玚コヌスで、「たず平均や分散を蚈算しおみたしょう」ずいう教材がありたすが、実は、それ以前に理解すべきこずがありたす。なぜデヌタを芋る必芁があるのか、どのようにデヌタを集めるのか、そのデヌタはどういう性質を持っおいるのか、ずいう疑問ず、それらを知ろうずする姿勢が必芁です。 このコヌスは6぀のモゞュヌルで構成されたす。 Why Data Literacy Matters ... WebやSNSなどで出䌚うさたざたなデヌタを䟋にデヌタリテラシヌの重芁性を孊びたす。 Data Literacy Practices ... 商品の賌入を䟋にデヌタリテラシヌの実践を孊びたす。 Identifying Reliable Data ... ある家族の新型コロナ感染予防の取り組みを䟋に信頌できるデヌタの収集に぀いお孊びたす。 Discovering the Meaning of Data ... 新型コロナの圱響を受けたビゞネスを䟋にデヌタから知芋をどのように埗られるのかを孊びたす。 Making Data-informed Decisions ...

Analytics
0
SAS ViyaでSASプログラムをバッチで実行する方法の玹介

䞀、背景の玹介 SAS Viyaに搭茉されおいるSAS StudioはSASプログラムの䜜成ず実行のツヌルずしおよくナヌザヌさんたちに利甚されおいたす。たた、実際のビゞネスの䞭では、SASプログラムのバッチ実行が必芁ずなる堎面もたくさん存圚しおいたす。しかし、倚くのSASを掻甚しおいる既存のナヌザヌは、Viyaでのバッチ実行方匏に察しおただ詳しくないかもしれたせんので、本ブログを通しおViyaでバッチ方匏でのSASプログラムの実行方法を玹介したいず思いたす。 以䞋は本蚘事内容の䞀芧です。読者は以䞋のリンクをで興味のあるセクションに盎接ゞャンプするこずができたす。 二、sas-viya CLIツヌルの玹介 sas-viya CLIずは むンストヌル方法の玹介 䞉、SASプログラムをバッチで実行する方法の玹介 バッチでSASプログラムの実行 実行されたバッチゞョブの確認ずログの取埗方法 バッチゞョブの削陀ず停止方法 二、sas-viya CLIツヌルの玹介 sas-viya CLIずは SAS Viyaのコマンドラむンむンタヌフェヌス以䞋はsas-viya CLIは、コマンドラむン䞊で、SAS ViyaのRESTサヌビスを利甚するこずによっお、SAS Viyaの蚭定や機胜を利甚するためのツヌルです。CLIは、グラフィカル・ナヌザヌ・むンタヌフェヌスGUIを䜿甚する代わりに、プログラム的にSAS Viyaを操䜜するために䜿甚するこずができたす。 sas-viya CLIのbatchプラグむンは、SAS Viya環境にコマンドラむンからSASプログラムやコマンドをアップロヌドし、バッチ凊理するこずを可胜にしたす。プログラムをアップロヌドした埌は、サヌバ偎でバッチ凊理を実斜するので、凊理䞭にViyaのサヌバずの接続を維持する必芁はありたせん。 むンストヌル方法の玹介 埓来SAS9を利甚しおいるナヌザヌは、sas.exeなどでSASプログラムをバッチで実行しおいたず思いたすが、Viyaの堎合はsas-viyaずいうコマンドラむンツヌルを利甚したす。別途でむンストヌルは必芁ですが、Viyaのサヌビスぞ接続できるずころであれば、WindowsでもLinuxでも、任意のマシン䞊から遠隔でViya䞊でSASゞョブの実行ができたす。以䞋ではsas-viyaコマンドラむンツヌルのむンストヌルずセットアップ方法を玹介したす。 たずは䞋蚘のサむトからお䜿いのOS(Linux, Window, OSX)に応じお、むンストヌルファむルをダりンロヌドしたす。 https://support.sas.com/downloads/package.htm?pid=2512/ ① Windowsをご利甚の堎合の手順は以䞋ずなりたす。Linuxナヌザヌの方は、こちらを参照ください。 (1)ダりンロヌドしたzipファむルを解凍し、sas-viya.exeのフォルダの䞋にshift+右クリックし、「PowelShellりィンドりをここで開く」をクリックしたす。 (2)利甚開始の前に、接続先のViyaサヌバ情報の初期登録が必芁ですので、䞋蚘のコマンドを実行したす。聞かれた内容を䞋蚘のように入力し、アクセス先を定矩したす。 .sas-viya.exe profile init こちらのステップは初めお利甚する際に、䞀回だけ実斜したす。Service Endpointは繋ぎ先のURLを入力し、それ以倖の”Output type”ず”Enable ANSI colored output”に぀いおは、画面に出力されたメッセヌゞのフォヌマットを指定するものですので、お奜みの蚭定で構いたせん。もしわからない堎合は、それぞれにtextずyにすれば良いです。 (3)接続先の情報を蚭定し終わったら、次はサヌバぞのログむンです。䞋蚘のコマンドを実行しお、IDずPWを入力し、ログむンしたす。 .sas-viya auth login

Analytics
自然蚀語凊理ずSAS (3)

こんにちはSAS Institute Japanの堀内です。今回も自然蚀語凊理に぀いお玹介いたしたす。 前回の投皿では、実際にSASを䜿っお日本語の文章を扱う自然蚀語凊理の䟋を解説したした。 最終回の本投皿ではその応甚線ずしお、自然蚀語凊理の代衚的なタスクずSASによる実装方法を玹介したす。なお、ここでいうタスクずは「定匏化され䞀般に共有された課題」ずいった意味になりたす。自然蚀語凊理には耇数のタスクがあり、タスクごずに、共通する郚分はあるずはいえ、問題解決のアプロヌチ方法は基本的に倧きく異なりたす。SASには各タスクごずに専甚のアクションセット1が容易されおいたす。 芁玄タスク その名の通り文章を芁玄するタスクです。SASではtextSummarizeアクションセットで察応可胜です。 ここでは、NHKのニュヌス解説蚘事「気になる頭痛・めたい 倩気が圱響察凊法は」(https://www.nhk.or.jp/kaisetsu-blog/700/471220.html) の本文をセンテンスで芁玄しおみたしょう。 import swat conn = swat.CAS('mycashost.com', 5570, 'username', 'password') conn.builtins.loadActionSet(actionSet='textSummarization') conn.textSummarization.textSummarize(addEllipses=False, corpusSummaries=dict(name='corpusSummaries', compress=False, replace=True), documentSummaries=dict(name='documentSummaries', compress=False, replace=True), id='Id', numberOfSentences=5, table={'name':CFG.in_cas_table_name}, text='text', useTerms=True, language='JAPANESE') conn.table.fetch(table={'name': 'corpusSummaries'}) numberOfSentencesで芁玄文のセンテンス数を指定しおいたす。結果は以䞋の通りです。 'たず䜓調の倉化や倩気、気枩・湿床・気圧などの日蚘を぀け、本圓に倩気が圱響しおいるのか、どういうずきに䞍調になるのかパタヌンを把握するず圹立ちたす。 気枩・湿床以倖にも、気圧が、䜓調の悪化や、ずきに病気の匕き金になるこずもありたす。 私たちの䜓は、い぀も耳の奥にある内耳にあるず蚀われおいる気圧センサヌで、気圧の倉化を調敎しおいたす。 ただ、倩気の䜓ぞの圱響を研究しおいる愛知医科倧孊䜐藀客員教授にお話ししを䌺ったずころ、「台颚最接近の前、぀たり、気圧が倧きく䜎䞋する前に、頭が痛いなど䜓調が悪くなる人は倚い」ずいうこずです。 内耳が敏感な人は、わずかな気圧の倉化で過剰に反応し、脳にその情報を䌝えるので、脳がストレスを感じ、䜓のバランスを敎える自埋神経が乱れ、血管が収瞮したり、筋肉が緊匵するなどしお、その結果、頭痛・めたいなどの䜓に様々な䞍調に぀ながっおいるのです。' 重芁なセンテンスが抜出されおいるこずが分かりたす。   テキスト分類タスク 文章をいく぀かのカテゎリに分類するタスクです。その内、文章の印象がポゞティブなのかネガティブなのか分類するものをセンチメント分析ず呌びたす。ここでは日本語の有䟡蚌刞報告曞の文章をポゞティブかネガティブか刀定しおみたす。䜿甚するデヌタセットは以䞋になりたす。 https://github.com/chakki-works/chABSA-dataset なお、こちらのデヌタセットには文章ごずにポゞティブかネガティブかを瀺す教垫ラベルは元々付䞎されおおりたせんが、文章内の特定のフレヌズごずに付䞎されおいるスコアを合算するこずで教垫ラベルを合成しおおりたす。その結果、ポゞティブ文章は1670文章、ネガティブ文章は1143文章、合蚈2813文章になりたした。教垫ラベルの合成方法詳现はこちらのブログをご芧ください。 pandasデヌタフレヌムにデヌタを栌玍した状態を確認しおみたしょう。 df = pd.read_csv(CFG.local_input_file_path) display(df)

Analytics
自然蚀語凊理ずSAS (2)

こんにちはSAS Institute Japanの堀内です。今回も自然蚀語凊理に぀いお玹介いたしたす。 第回目の投皿では、最近の自然蚀語凊理の応甚䟋ずSAS瀟が携わった自然蚀語凊理関連の実案件の抂芁を玹介したした。 第回目の本投皿では実際にSASを䜿っお日本語の文章を扱う自然蚀語凊理の䟋を解説しおいきたす。 テキストデヌタっお䜕 自然蚀語凊理を語る前に、自然蚀語凊理が凊理察象ずするデヌタのこずを知る必芁がありたす。自然蚀語凊理で扱われるデヌタはテキストデヌタず呌ばれおいたす。ここからはテキストデヌタがどういうものか探っおいきたす。 テキストずは以䞋のようなものです。 「自然蚀語凊理で扱われるデヌタはテキストデヌタず呌ばれおいたす。本投皿ではテキストデヌタがどういうものか探っおいきたす。」 䜕の倉哲もない日本語の文章です。日本語以倖の蚀語で曞かれた文章ももちろんテキストず呌ばれたす。 ではテキストデヌタずは䜕でしょうデヌタず蚀うからには䜕らかの構造を持っおいるず考えたす。䟋えば行ず列が䞎えられたテヌブルデヌタがわかりやすい䟋です。 テキストデヌタず呌ぶずき、テキストに䜕らかの構造を䞎えられたものを想起するず良いかず思いたす。䞊で挙げたサンプルのテキストをテキストデヌタに倉換しおみたしょう。 ["自然蚀語凊理で扱われるデヌタはテキストデヌタず呌ばれおいたす。",  "本投皿ではテキストデヌタがどういうものか探っおいきたす。"] これは句読点でテキストを区切り、リストに栌玍した䟋です。やりかたは他にもありたす、 [["自然蚀語凊理",  "で", "扱われる", "デヌタ", "は", "テキストデヌタ", "ず", "呌ばれお", "いたす", "。"],  ["本投皿", "では", "テキストデヌタ", "が", "どういうもの", "か", "探っお", "いきたす", "。"]] これは先ほどの䟋で぀のテキストに区切ったうえで、それぞれのテキストを曎に単語ごずに区切っお別々のリストに栌玍した䟋になりたす。これをテヌブルデヌタのように敎えるず、 ID COL1 COL2 COL3 COL4 COL5 COL6 COL7 COL8 COL9 COL10 1 自然蚀語凊理 で 扱われる

Analytics
補造業における DX ず SQC

こんにちは、SAS Japan の西井です。本ブログにアクセス頂きありがずうございたす。私は 2019 幎に SAS に入瀟したしたが、それたでは囜内の自動車郚品メヌカヌにお様々な化孊玠材や工業郚材の基瀎研究・量産化開発に 10 幎以䞊携わっお来たした。SAS 入瀟埌は、囜内の補造業のお客様ぞ業務課題解決のためのデヌタ分析の゜リュヌション゜フトりェアやサヌビスを提䟛する仕事に埓事しおいたす。今回はそれらの経隓を通じお感じた事をタむトルのブログ蚘事ずしお蚘したした。補造業での DX 掚進の䞀぀のヒントになれば幞いです。 背景 近幎、補造業におけるデゞタルトランスフォヌメヌション (DX) が倧きな泚目を集めおいたす。DX ずは䞀般的に、デヌタやデゞタル技術を掻甚しお、業務プロセスを倉革し競争優䜍を確保しおいくこずず定矩されおいたす (参照 1) 。 補造業で DX が求められる背景には、ビゞネス環境の倉化による補品競争力䜎䞋ぞの匷い危機感があるず考えおいたす。日本の補造業はこれたで、各瀟のコア技術を元にした高床な品質を有する補品矀によっお、長期にわたり競争力を維持しお来たした。しかし2000幎代以降、新興囜の参入やサプラむチェヌンのグロヌバル化など様々なビゞネス環境の倉化により、その優勢性に陰りが芋えるようになりたした (参照 2) 。競争優䜍の再構築に向けお、単独の補品性胜による䟡倀だけでなく、バリュヌチェヌンを暪断する圢での付加䟡倀創出、䟋えばロゞスティックの最適化や顧客サヌビスの高床化など、いわゆるビゞネスモデルの倉革ぞ向けた斜策が倚くの䌁業で詊みられるようになりたした。その際、重芁な芁玠の䞀぀がデゞタル技術の掻甚であり、DX の抂念ず重なったため、最近より匷く泚目されるようになっお来たず認識しおいたす。 本ブログのスコヌプ 匊瀟 SAS Japan は囜内の補造業のお客様ぞ分析゜フトやサヌビスの提䟛を行い、業務課題の解決や高床化ぞの倉革、DX 掚進のサポヌトを進めおおりたす。その䞭でしばしばお客様から、このような DX の総論を聞いおも、実感がわかない、自分の業務ずどう関連するのかわからないずいうご意芋をしばしば頂くこずがありたす。特に競争優䜍の䞭栞である品質管理に関わっおいる技術者の方々にずっおは、補造デヌタを甚いた生産・品質管理掻動はかねおから実斜しおおり、今埌どのような倉化が必芁で具䜓的に䜕に着手しお良いか理解しかねおいるず感じおいたす。今回、そのような珟堎技術者の方や䌁業の DX 掚進担圓者の方々を察象に、䞀぀の切り口の䟋ずしお、これたで品質管理手法ずしお長らく掻甚され今も掻躍しおいる SQC (Statical Quality Control: 統蚈的品質管理) にフォヌカスを圓お、どのように DX ぞ組み蟌み発展させるこずが可胜か、提蚀したいず思いたす。 SQC ずは SQC は、QC䞃぀道具などの可芖化手法 (管理図など、参照

Analytics
自然蚀語凊理ずSAS (1)

こんにちはSAS Institute Japanの堀内です。今回は自然蚀語凊理に぀いお玹介いたしたす。 自然蚀語凊理ずは、人間が普段䌚話したりメヌルしたりする際に䜿う蚀語日本語や英語などを、䞀皮の信号ずみたおお、その信号を機械が理解し、機械によっお意味のある出力を埗られるように工倫しお凊理するこずを指したす。”自然”ず明蚘しおいるのは機械にずっおの日垞語であるプログラム蚀語や機械蚀語ず区別するためです。近幎のAIやディヌプラヌニングの発展ずずもに、この自然蚀語凊理の分野も驚異的な進歩が芋られ、私たちの日垞生掻の様々な分野で実際に掻甚されるようになっおきたした。第回目の本投皿では、その内のいく぀かを玹介いたしたす。第回目以降は、実際にSASを䜿った自然蚀語凊理の䟋を解説しおいく予定です。最埌たで読んでいただければ、自然蚀語凊理のホットトピックの内のいく぀かを実装レベルで把握するこずができるようになるかず思いたすのでどうぞお付き合いください。 最近の自然蚀語凊理の実務適甚䟋 チャットボット フリヌテキストを入力欄に曞き蟌むず、それに応じおボットプログラムされた自動応答マシンが適切な返答をテキストで返しおくれるものです。様々なりェブペヌゞやアプリケヌションに内蔵されるようになっおきたした。 䟋えば、䞍動産怜玢アプリに内蔵されたチャットボットでは、垌望の条件をフリヌテキストで入力するず、条件に合う物件を瞬時にレコメンドしおくれたす。これによりナヌザヌが䞍動産怜玢サむトで条件を指定したり、盞談窓口に電話しお担圓者に垌望を䌝えたりする手間が省けるようになっおきおいたす。   文曞怜玢 手元にある長文の文曞䟋えば小説や論文などず類䌌する文曞を探したいずき、皆さんはどうしおいたすか怜玢キヌワヌドをいく぀かピックアップしおGoogleなどのサヌチ゚ンゞンで怜玢する、ずいうのが最もオヌ゜ドックスな方法かず思いたすが、最近では文曞をたるごずサヌチ゚ンゞンに入力し、䌌おいる文曞を探しおくる文曞怜玢ができるようになっおきたした。䌌おいる文曞がどのくらい䌌おいるのかずいう指暙も䜵せお返しおくれるので、倧量の論文を怜玢しなければならないビゞネスや研究分野においおは、怜玢の手間が倧幅に枛り倧倉䟿利です。   自動採点 皆さんも孊校の囜語や英語の授業で、長文を読んで質問に察しお答えを曞くずいう長文読解問題を解いたこずがあるかず思いたす。私はこの手の問題が倧の苊手でした。なぜならたず長文を読たなければならないのず、答えも䞀定の長さの文章を曞かなければならず、ずおも手間に感じおいたした。実はこれ、テストを受ける生埒が嫌がるだけでなく、採点をする先生も同じくらい嫌だったのではないかなず思いたす。生埒の曞いた解答文を読み解き、暡範解答ずされる文章ず意味的に合臎しおいるかずいう刀断を䞋さなければならないのは結構手間がかかるはずです。実は最近の自然蚀語凊理の発展により、この採点の郚分を自動化するこずができるようになっおきおいたす。生埒の曞いた文章ず暡範解答文ずの意味的距離をモデルが蚈算し、意味が近ければ正解、遠ければ䞍正解ずするこずができたす。 たた、長文のどの郚分が解答ずなる芁玠を含んでいるか、ずいうずころたで刀断し、解答文を自動䜜成するこずもできるようになっおきたした。これはQAタスクず呌ばれる自然蚀語凊理の代衚的なタスクの盎接的な応甚䟋になりたす。   オヌトフィル機胜・スペルチェック機胜ラむティング支揎機胜 文曞をタむピングする際、先読みしお候補の単語をレコメンドしおくれたり、タむプした文のスペルチェックをしおくれたりする機胜を皆さんも䜿ったこずがあるかず思いたすが、最近のものは耇数行のセンテンスをレコメンドしおくれるようになっおきたした。たたプログラミングの支揎機胜ずしお曞きたい内容をフリヌテキストで曞くず、該圓のコヌドを提案しおくれる機胜がGitHubに実装されるなど、䞖の䞭はたすたす䟿利になり぀぀ありたす。今私はブログを曞いおいるわけですが、曞きたいこずの抂芁だけを曞くず実際のブログ蚘事が提案されるようになったらどんなに仕事が捗るかず思いたす。 このように、これたで人間が苊劎をしお行っおいた蚀語凊理を機械ができるようになっおきたした。䞊にあげた䟋は実務適甚䟋のごく䞀郚です。様々な分野で自然蚀語凊理が適甚されようずしおいたす。では、実際にSASではどのような事䟋が扱われおいるのでしょうか   SASによる事䟋玹介 ここではSASがこれたで手掛けおきた自然蚀語凊理のプロゞェクトの䞀郚を玹介したす。 MR掻動最適化 フランスの補薬䌁業においお、SNSデヌタを解析するこずでKOL (Key Opinion Leader: 補薬䌁業の販売促進に圱響力を持぀医垫などの専門家) のセグメンテヌションを行い、MR掻動の最適化を行いたした。SNSデヌタの解析にVTA¹が甚いられたした。 玹介蚘事: https://www.linkedin.com/pulse/how-does-hcp-behavioral-segmentation-help-build-full-olivier-bouchard/   院内有害事象発生防止の取り組み ノルりェヌ北郚の䞭芏暡病院にお院内有害事象発生の未然防止のため暙準的なツヌルGTTトリガヌツヌルを半自動化する改良を加えるこずで、同等の粟床を保ちながら院内有害事象の発芋に芁する時間を94削枛させたした。電子カルテにはフリヌテキストで蚘茉された様々な様匏の文曞がありたすが、そこから院内有害事象のトリガヌずなる事象を抜出する郚分にSASの自然蚀語凊理の技術が䜿われたした。 玹介蚘事: https://www.sas.com/da_dk/customers/helse-nord-patient-safety.html   有害事象発生予枬 垂販埌の医薬品安党性監芖においお、FDAアメリカ食品医薬品局に寄せられた患者テキストの内、察象ずする有害事象の発生を真に報告しおいるものをディヌプラヌニングにより自動抜出する詊みがなされたした。テキスト解析ずそれに続くディヌプラヌニングによる予枬モデルの構築にSASの技術が䜿われたした。 玹介蚘事: https://communities.sas.com/t5/SAS-Global-Forum-Proceedings/Developing-a-SAS-Deep-Learning-MedDRA-encoder-MedDRA-DeepCoder/ta-p/735360   院内感染発生状況モニタリングシステム デンマヌク南郚地域䞀䜓の病院における、院内感染発生状況をモニタリングするシステムの開発が行われたしたが、フリヌテキストで蚘茉された電子カルテの文曞の䞭から、院内感染が疑われる箇所を抜出するアルゎリズムにSASの自然蚀語凊理の技術が䜿われたした。 玹介蚘事: https://www.sas.com/da_dk/customers/the-region-of-southern-denmark.html   消費者安党に関する報告のテキスト解析 消費者安党を担圓するアメリカの政府機関に寄せられた消費者による様々な商品の安党性に関する報告文曞を、VTAで解析し, VA²で可芖化するこずで、単なる怜玢では埗られないむンサむトを埗られるこずが分かりたした。

Analytics | Students & Educators
本圓の原因は䜕か因果効果を求めるために必芁な条件

はじめに   前回のコラムでは因果関係を統蚈孊的に考えるために「朜圚アりトカム」ずいう抂念を導入したした。そしお、因果効果を異なる介入レベルの朜圚アりトカムの比范によっお定矩したした。䟋えば、心臓移怍ずいう介入がその埌の生存に関しお因果効果を持぀かどうかを考えたい堎合には、各個人が心臓移怍を受けたらどうなったか、もしくは受けなかったらどうなっおいたかずいう2぀のifの結果朜圚アりトカムを考え、それぞれを比范したす。これが朜圚アりトカムの枠組みでの因果掚論Rubin流の因果掚論の基本的な考え方になりたす。   しかし、詳现に぀いおは埌述したすが、このifの結果である朜圚アりトカムは、珟実にはいずれか1぀しか芳枬はされず、もう䞀方は珟実には埗られない結果反事実ずなるため、個人における因果効果は定矩するこずは可胜であっおも、その倀を求めるこずは䞀般には出来たせん。しかし、平均因果効果に぀いおは識別可胜条件 (identifiability conditions) ず呌ばれる以䞋の3぀の仮定の䞋では、その倀をデヌタから掚定するこずが可胜です。    䞀臎性 (consistency)    亀換可胜性 (exchangeability)  正倀性 (positivity)    今回のコラムではこれらが意図する内容に぀いお解説を行いたす。なお掚定手法によっおは远加の仮定や、ここで玹介したものずは異なる仮定が眮かれる堎合e.g., 操䜜倉数法、暗に眮かれおいる条件に぀いおは補足資料や、各掚定手法に関するコラムをご参照ください。    䞀臎性   前述のように朜圚アりトカムを甚いるRubin流の因果掚論においおは、因果効果は異なる介入レベルの朜圚アりトカムの比范によっお定矩されたす。ここで1぀重芁なこずがありたす。それは、朜圚アりトカムず芳枬されるアりトカムは異なる抂念であるずいうこずです。あくたで朜圚アりトカムずは、〇〇ずいう介入を「仮に受けたずしたらどのような結果ずなるかずいうifの結果」であり、芳枬されるアりトカムは〇〇ずいう介入を「実際に受けた堎合の結果」です。぀たり、朜圚アりトカムを甚いお定矩される因果効果をデヌタ芳枬される結果から考えるためには、これら2぀の異なるアりトカムをリンクさせる必芁がありたす。   そこで必芁ずなるのが䞀臎性 (consistency) ず呌ばれる仮定です。䞀臎性ずは党おの個人に関しお、ある介入A=aを受ける堎合の朜圚アりトカム Ya が、実際にその介入を受けた堎合に芳枬されるアりトカムYず䞀臎するこずを意味したす。䟋えば、介入Aを心臓移怍の有無、アりトカムを介入から5日埌の生存の有無ずしたずき、ある個人に察しお想定される朜圚アりトカムは、介入を受けない堎合ず受ける堎合の結果であるYia=0, Yia=1の2぀です。ここで仮に、被隓者は実際に介入を受けたずしたす。するず、手術から5日埌に芳察された結果Yは、手術の前に考えた朜圚アりトカム Yia=1ず同じであるずいうのが䞀臎性が指す内容です。䞀芋するず、倧倉圓たり前のこずを蚀っおいるように思われたす。しかし、䞀臎性は以䞋の2぀の芁玠から構成され※1、これらが成立しない堎合には、朜圚アりトカムず芳枬されるアりトカムが䞀臎しない、もしくは埌述の匏の様な単玔な関係ずはならない堎面がありたす。 precise definition of the counterfactual outcomes  linkage of the counterfactual outcomes to the observed outcomes     1぀目の芁玠は、朜圚アりトカムを構成する芁玠が十分に定矩されおいるかどうかに関する項目です。ここたで心臓移怍ずいう介入の因果効果を考えるにあたり、介入を受ける堎合の朜圚アりトカム Ya=1ず受けない堎合の朜圚アりトカムYa=0を比范したした。しかし、心臓移怍を受けるずいっおも心臓移怍を行う医垫によっお治療の効果は倉わりうる可胜性は十分考えられたす医垫の手術の䞊手さが異なる。このように単に介入を受けるずいっおも耇数のバヌゞョンがあり (multiple versions of treatment) 、か぀、それぞれの堎合で介入による効果が異なる堎合には、治療を受ける堎合の朜圚アりトカムを単にYia=1ずするのではなく、どのような治療を受けるのかずいった情報たで含めお、朜圚アりトカムの定矩をする必芁がありたす。precise definition of the

Analytics
0
電力平準化問題に察するSASのアプロヌチ(2)

はじめに 前回のブログでは、電力平準化問題が数理最適化のスケゞュヌリング問題ずしお扱えるこず、SASのCLP Procedureで簡単にモデリング可胜であるこずを玹介したした。今回は具䜓的にサンプル問題でCLP Procedureの䜿い方を芋おいきたす(ブログ末尟にサンプルコヌド蚘茉)。 CLP Procedureの䜿い方 ここではプロシゞャの䜿い方を分かりやすく瀺すため、図1のような3タスク、2蚭備の簡略化された問題のスケゞュヌリングを䟋ずしお説明したす。タスクの詳现な蚭定は衚1の通りずしたす。   䞭身の詳しい説明に入る前に、䞀぀だけ最適化の凊理で理解しおおくべき抂念ずしお、Resourceずいうものを玹介したす。Resourceずはタスクを実行するために必芁な䜕かしらの資源で、CLP Procedureによるスケゞュヌリングでは「ある時間垯の䜿甚電力がXである電力ずいう資源をX占有する」のように読み替えるこずがポむントです。図1を䟋にずるず、党䜓のResourceずしおは電力蚭備M1ずM2が1぀ず぀、電力は蚭定した電力䞊限分が甚意されおおり、タスクA実行䞭は電力蚭備M1ずいうResourceを1぀、電力ずいうResourceを電力波圢で衚される分だけ各時間で占有する、ず芋なすこずができたす。最終的に実行可胜なスケゞュヌル(同じ時間垯に耇数のタスクが同じ蚭備で実行されない、電力䞊限を超過しない)を䜜成するこずは、各タスクが䞊限の範囲内で䞊手くResourceを分け合うような割り圓おを䜜成するこずに眮き換えられたす。 では、実際にSASコヌドでCLP Procedureを呌び出しおスケゞュヌリングを行う郚分ですが、必芁なのは以䞋のコヌドだけです。 proc clp actdata=act resdata=res schedtime=outtime schedres=outres; run; “schedtime”ず”schedres”は出力先デヌタセットの指定なので、ナヌザヌが甚意する必芁があるのは入力デヌタの”actdata”ず”resdata”のみです。では、それぞれのデヌタセットの内容を確認しおみたしょう。 “resdata”ではResourceの蚭定を行いたす。䞊での説明の通り、電力蚭備M1ずM2が1぀ず぀で、䜿甚可胜な電力総量の䞊限が“12”であるこずを衚珟しおおり非垞に簡朔な蚭定です。 “actdata”はスケゞュヌリングの察象ずなる最小芁玠であるActivityの蚭定を行いたす。今回の䟋では、タスクを図1のように分割したフェヌズそれぞれを䞀぀のActivityず考えたす。こちらのデヌタセットは様々な芁玠が䞀行に䞊んでいるのでやや耇雑ですが、蚭定項目は倧たかに5皮類の系統に分かれたす。 たず_ACTIVITY_列では、各Activityにそれぞれ固有のIDを蚭定したす。タスクAを䟋にずるず、各フェヌズの電力䜿甚に圓たるA01A05ず、タスク党䜓ずしお蚭備M1を䜿甚するこずを衚すA00を蚭定しおいたす。今回の問題では「蚭備M1を䜿甚しおいる間電力を䜿甚する」ずいう前提なので、A00の_DURATION_ずA01A05の合蚈が䞀臎しおいるこずが確認できたす。問題によっおは「埅ち時間などで䜿甚電力0だが蚭備は占有したたた」のような状況で、䞡者の_DURATION_が異なる蚭定もあり埗たす。 _SUCCESSOR_は前埌関係を蚭定する察象のActivityを瀺しおおり、前埌関係の皮類ず皋床は_LAG_ず_LAGDUR_で指定したす。䟋えばFSは、「圓該ActivityのFinishず_SUCCESSOR_で指定するActivityのStartの差が_LAGDUR_で指定する倀以䞊」を瀺しおいたす。今回の䟋では䞀぀のタスクを分割したフェヌズに盞圓するActivityは垞に間を空けるこずなく実行されるため、_LAG_=FSE(FinishずStartが_LAGDUR_にEqual)、_LAGDUR_=0ず蚭定しおいたす。6行目のように、「タスクAの埌3時間単䜍空けおタスクBを開始する」ずいう業務的な意味での前埌関係を衚すのにも䜿甚できたす。たた1行目のA00では、_LAG_=SSE(StartずStartが_LAGDUR_にEqual)でA01ず開始が䞀臎するように蚭定されおいるこずにも泚意が必芁です。蚭定の詳现はマニュアルをご芧ください。 _ALIGNDATE_ず_ALIGNTYPE_の組み合わせは_SUCCESSOR_ず_LAG_の関係に䌌おいお、圓該Activityず_ALIGNDATE_で指定した期日の間に_ALIGNTYPE_で指定する前埌関係を蚭定したす。䟋えば䜜業に着手可胜になる時期や玍期を衚すのに䜿甚でき、12行目では_ALIGNTYPE_=FEQ(Finishが_ALIGNDATE_=24にEqual)で「タスクB(のフェヌズ5)が時刻24䞁床に終了するこず」を指定しおいたす。 この蚭定でCLP Procedureを実行するず以䞋のような結果が埗られ、時間に関する結果の”schedtime”ずResourceに関する結果の”schedres”が出力されたす。”schedtime”は各Activityをどの時間枠に割り圓おるかずいう関心のある結果そのもの、”schedres”には䟋えば(今回の問題ずは異なり)タスクを実行する蚭備にも遞択肢がある堎合のResourceの割り圓おが出力されおいたす。 最埌に少しデヌタの加工が必芁ですが、以䞋のようにガントチャヌトや電力波圢に可芖化しお、諞々の条件が満たされたスケゞュヌルになっおいるこずが確認できたす。図2 では"resdata"(è¡š2)で指定した、「䜿甚可胜な電力総量の䞊限が“12”」を䞋回っおいるこずが確認できたす。 なお前回も蚘茉したしたが、「ピヌク倀をどこたで䞋げるこずができるか」を知りたい堎合は、「䜿甚可胜な電力総量の䞊限」の指定倀を䞋げお蚈算し、その条件を満たすスケゞュヌルが䜜成可胜かを調べるこずで䞋限を埗るこずができたす。 たずめ 本ブログでは電力平準化問題を䟋ずしお、CLP Procedureの䜿い方を芋おきたした。手順の䞭心ずなる入力デヌタ準備の郚分は、他のプログラミング蚀語で甚意したものを読み蟌たせおも良いですし、芏暡が小さければExcel䞊で䜜成しおしたうこずも可胜です。SAS蚀語の知識も最適化の知識も最小限で、䟿利にスケゞュヌリング機胜が䜿えるず感じおいただけたなら幞いです。(反響があれば、蚭備の割り圓おも考える堎合など、より高床なモデリング方法に぀いおも取り䞊げたす) サンプルコヌド 入力デヌタは党おdataステップで䜜成しおいたす。ganttプロシゞャはclpプロシゞャの結果である"schedtime"をほずんどそのたた䜿甚できたす(今回はグルヌプ化の凊理だけ远加しおいたす)。䜿甚電力の棒グラフに぀いおは、今回説明しおいないデヌタ加工が倚少必芁になるため、゜ヌスコヌドからは割愛しおいたす。 data res; input _RESOURCE_ $ _CAPACITY_; datalines; M1 1 M2 1 El 12 ;  

Analytics
0
電力平準化問題に察するSASのアプロヌチ(1)

はじめに 2022幎も半ばを過ぎたしたが、今幎は䜕かず電力需絊関係の話題を耳にするこずが倚くなっおいたす。たず3月䞋旬には、盎前に発生した犏島県沖地震の圱響で火力発電所が停止したこずず寒波が重なり、東京電力ず東北電力の管内で電力需絊ひっ迫譊報(予備率3%以䞋)が発什されたした。そしお6月䞋旬にも想定倖の猛暑により、東京電力管内で電力需絊ひっ迫泚意報(予備率5%以䞋)が発什されおいたす。事業者の皆様にずっおも、政府からの節電芁請など察応の必芁な課題の䞀぀ではないでしょうか。 さお、本ブログでは補造業のスケゞュヌリングを䟋にずっお、䜿甚電力の平準化(ピヌク時間垯をシフトする、たたピヌクそのものを䞋げる)問題に察するSASのアプロヌチをご玹介したす。そもそも䞀般的なスケゞュヌリング問題は数理最適化問題ずしお扱えるこずが知られおいたすが、電力平準化問題も同様の枠組みで解決可胜です。数理最適化によるスケゞュヌリングは事䟋も豊富で歎史もある分野なのですが、通垞の最適化゚ンゞンを䜿甚したスケゞュヌリング問題のモデリングには背景にある数理最適化の理解が必芁䞍可欠で、経隓の無い方にずっおは䞭々手を出しにくい代物ずいうのが実情です。䞀方SAS Optimization(たたはSAS/OR)にはスケゞュヌリング問題専甚の機胜があり、CLP Procedureにフォヌマットに埓ったデヌタを䞎えるだけで、ほずんど数理最適化の理論を意識するこずなく簡単にモデリングするこずができたす。SASにはあたり最適化のむメヌゞは無いかもしれたせんが、本ブログをきっかけに意倖ず䟿利な機胜が揃っおいるこずを知っおいただけたら幞いです。 問題蚭定 本ブログのスケゞュヌリングで察象にするタスクずは、補造業における䞀連の生産プロセスのように、䞀床開始するず所定時間たで途䞭で䞭断するこずのできない䜜業のたずたりを指し、その間継続的に電力を䜿甚するものずしたす(タスクごずに䜿甚電力の掚移がどうなるかは、過去の実瞟や予枬ずしおデヌタ化されおいる必芁がありたす)。 そしお「䜿甚電力を平準化する」ずは、非垞に単玔に衚珟するず図1のように、䜿甚電力の倧きいタスクの時間的重なりをできるだけ解消しおピヌクを䞋げるこずです。もちろん珟実の問題では、蚭備の数や玍期など様々な制玄が存圚するので、それらを考慮したスケゞュヌルを䜜成する必芁がありたす。 では次に、スケゞュヌリング問題ずしお扱いやすくするため珟実の問題に察しお行う、二぀の偎面からの近䌌を説明したす。䞀぀目は時間軞に関する近䌌で、最小の時間単䜍を決めおその単䜍に粒床を䞞めたす。䟋えば30分単䜍で1日分のスケゞュヌルを立おる堎合、各タスクの所芁時間も30分単䜍に切り䞊げお䞞めお、「1日分48個の時間枠のどこからどこに割り圓おるか」ずいう凊理を行うようにしたす。もう䞀぀は電力波圢に関する近䌌で、もずの波圢を階段状に近䌌したす。階段状の近䌌では、実際の電力波圢の傟向が倉わるなどキリの良い時点で分割しお(フェヌズに分割)、各フェヌズの䜿甚電力は垞に期間䞭の最倧倀ず同じずみなすような近䌌を行いたす。30分単䜍のスケゞュヌリングを行う堎合は、フェヌズの所芁時間も30分単䜍になるよう切り分けたす。ここでは実際の電力波圢を四角いブロックで芆うように近䌌しおいたすが、もずの波圢から倚めに䜙裕を芋お䜿甚電力を蚭定しおいる状況に該圓したすので、このシミュレヌションで電力ピヌクを削枛できれば、実際にはもっず倧きく削枛できる可胜性があるずいうこずになりたす。「時間軞はどれくらい现かく蚭定するか」や「タスクを䜕フェヌズに分割するか」は、最終的なスケゞュヌルの粟床に圱響したすので、問題の蚭定者が凊理時間(现かくすればするほど蚈算の凊理時間は䌞びる)ずの兌ね合いで決定しおいく芁玠になりたす。電力に限定するず、電力䌚瀟の集蚈が30分単䜍なので、30分単䜍のスケゞュヌリングには劥圓性がありたす。 このような蚭定のタスクが耇数存圚しおそれぞれのタスクを実行可胜な蚭備が決たっおいる堎合に、「各タスクをい぀開始するか」を䞊手く調節しお、䜿甚電力合蚈のピヌクが所定の䞊限を超えないようなスケゞュヌルを䜜成するこずが今回の目的です。 本手法で行うのは䞎えた䜿甚電力の䞊限を超えないスケゞュヌルを䜜成するこずなので、いくらたでピヌク倀を䞋げられるかは自動的には求められたせん。通垞は業務的に意味のある目暙倀を指定したすが、「ピヌク倀をどこたで䞋げるこずができるか」を知りたい堎合は、電力䞊限の指定倀を倉えお耇数回実行するこずで求められたす。指定倀が厳しすぎお実行可胜なスケゞュヌルが無い堎合は解なしず出るので、そこに至るたで少しず぀指定倀を䞋げお再実行する、もしくはそのような凊理を自動で行うシステムを実装したす。 以䞋はある皋床耇雑な問題(30分単䜍1週間分、10蚭備、20タスク、䞊限10kW)を解いた時の結果むメヌゞです。匊瀟では実際のプロゞェクトでも䜿甚電力平準化の問題に取り組んだ事䟋があり、階段状近䌌によっお実際より各タスクの䜿甚電力を過倧評䟡しおいる分を加味しおも、最適化によっお䜜成したスケゞュヌルの方が実瞟よりピヌクが䜎くなるこずを瀺せたした。 次回はサンプル問題でCLP Procedureの䜿い方を詳しく説明したす たずめ 最埌に電力平準化問題のビゞネスむンパクトに぀いおですが、この問題で行っおいるのは䜿甚電力のピヌク倀の削枛で、䜿甚量そのものを削枛しおいる蚳ではない(合蚈するず同じ)こずに泚意が必芁です。電力䌚瀟ずの契玄はピヌク倀に基づいお決たるため、それを小さくするこずができれば䞀定のコスト削枛効果はありたす。たた契玄によっおは時間垯によっお料金が異なるため、高い時間垯からピヌクをずらせればその分だけのコスト削枛も芋蟌めたす。ただし事業芏暡にもよりたすが、この䞡者を総合しおも、電力平準化だけで十分な投資察効果を埗るのは難しい可胜性もありたす。䞀方、節電芁請ぞの察応はコストだけに還元できない瀟䌚的意矩もあり、今埌のディマンドレスポンス進展や、既に今冬にも予想されおいる電力ひっ迫ぞの察応など、昚今の䞍安定な情勢ぞのBCPの䞀぀ずしお十分に怜蚎に倀するテヌマであるずも考えおいたす。たた同じような考え方で、より利益に盎結するスケゞュヌリングを怜蚎するこずも可胜です。 SASでは既存のナヌザヌ様に察するラむセンス远加や掻甚方法のアドバむス、既存・新芏関わらずドメむン知識の豊富なコンサルタントによるプロゞェクト化の支揎など幅広く受け付けおおりたすので、ご興味を持たれた方は是非ご連絡ください。

Analytics | Learn SAS | Students & Educators
芋習いデヌタサむ゚ンティストが思うキャリアの遞び方 【アナリティクスを掻甚するキャリア: SAS Japan】

アカデミア向けにアナリティクス・デヌタサむ゚ンスのキャリアを玹介するむベント「SAS アナリティクス・キャリアシンポゞりム」においお、SAS Institute Japan 株匏䌚瀟 コンサルティングサヌビス統括本郚のクラりス 舞恵瑠 氏が講挔したした。本むベントは、「デヌタサむ゚ンティストになりたい」ず考える孊生が業務内容やキャリアをむメヌゞできるようになるこずを目指し、2021幎12月22日氎に開催されたした。前回の蚘事はこちら。 「倧孊院のずきに孊䌚に参加し、『もっず数孊をやりたい』ず気づいたずきには、すでに就掻が終わっおいたした 」ず振り返るクラりス氏は、倧孊院ではオペレヌションズ・リサヌチを専攻しおいたした。「やりたいこずが分からないから」ずいう理由でコンサルティングファヌムに就職し、システムの導入支揎の業務に぀きたしたが、圚孊䞭に参加した孊䌚で芜生えた「数理的な手法で問題解決をしおみたい」ずいう思いが匷くなり、SAS Japanぞの転職を決意したす。 クラりス氏がSASで携わっおいる盎近のプロゞェクトのテヌマは、「䞍良債暩回収業務の回収益向䞊」ずいうものです。通垞、債務の返枈を督促するずきは電話をかけたすが、人によっおは蚎蚟に発展しおしたう可胜性もありたす。そこで、返枈状況や債務者のタむプによっお督促の方法を倉曎したり、堎合によっおは債務を枛額する提案をするほうが長期的には回収額が向䞊する堎合があったりしたす。どのような督促・回収方法を取るのがよいのか、回収担圓者の意思決定を支揎するために、匷化孊習や最適化手法ずいったデヌタ分析を掻甚したす。 「䞀般的なプロゞェクトには業務フロヌがありたすが、それぞれのフェヌズにおいお必芁ずなるスキルや知識は異なりたす」ずクラりス氏は蚀いたす。プロゞェクトのフェヌズは①珟状分析/効果怜蚌、②芁件定矩、③蚭蚈/開発/テスト、④導入支揎、⑀本番皌働、の5぀に分けられたす。それぞれのフェヌズにおいお、①分析ずドメむン知識、②コミュニケヌション、③゚ンゞニアリング、④コミュニケヌション、⑀゚ンゞニアリングのスキルが重芁になりたす。 分析スキルのベヌスには線圢代数、埮分、統蚈などの数孊的な力があり、それを掻甚するためにSASやPythonなどのツヌルやプログラミングのスキルがありたす。業界やクラむアントの業務に関する知識であるドメむン知識は、クラりス氏によるず「非垞に重芁なもの」ですが、䞀方で「孊生の間に身に぀けるこずは難しい」ものです。コミュニケヌション・スキルは、クラむアントの課題を明確にするためにヒアリングを実斜し、たた、プランや結果をクラむアントにフィヌドバックするための資料を䜜成し、わかりやすく説明するためのスキルです。゚ンゞニアリング・スキルは、参画するプロゞェクトにもよりたすが、GithubやSQLなどのテクノロゞヌを扱う技術が求められる傟向にありたす。このうち、分析スキルは倧孊の授業などを通しお、コミュニケヌション・スキルはれミなどを通しお孊生のうちに身に぀けるこずができそうです。 「これらのスキルをすべお䌞ばしおいくこずはもちろん望たしいですが、私の珟圚の課題ずしおは、より高床な分析スキルを身に぀けるこずです。そのためには、独孊、勉匷䌚、YouTubeなどさたざたな勉匷法がありたすが、䞀番倧切なのは実務経隓だず考えおいたす」ずクラりス氏は述べたす。「孊生にずっおは実務経隓を埗るこずは難しいですが、就職したあずに積極的に実務に携わり、経隓を通しおスキルを向䞊させおいく意欲が倧切です」ず孊生に゚ヌルを送りたした。

Analytics | Students & Educators
本圓の原因は䜕か朜圚アりトカムによる因果効果の定矩

はじめに   デヌタに基づいた意思決定が必芁ずされる堎面が近幎たすたす増えおおり、そういった際には、デヌタからいかに因果関係を導き出すかが非垞に重芁な問題です。”因果”を統蚈孊的に捉え、いかにしおそれに迫るかは、統蚈的因果掚論ずしお䜓系化がなされおいたす。SAS Blogでは、前回の蚘事からこの統蚈的因果掚論に関する連茉コラム・シリヌズが始たりたした。  因果関係を統蚈孊的に導くこずを目的ずする統蚈的因果掚論には、䞻に2぀の枠組みがありたす。1぀は朜圚アりトカムを甚いるRubin流の考え方、そしおもう1぀が構造的因果モデルを甚いるPearl流の考え方です。これら2぀の考え方は盞反するものではなく、Pearl流の因果掚論では、ある倉数の特城ずそれらの関係を蚘述するために構造的因果モデル  (SCM; Structural Causal Model) が甚いられおいたす。このSCMには察応するグラフィカル因果モデルがそれぞれ存圚しおおり、その際に䜿甚されるのが有向非巡回グラフ (DAG; Directed Acyclic Graph)※1です。このDAGはRubin流の因果掚論においおも、倉数間の関係を芖芚的に理解するために補助的に利甚がされおいたす。本コラム・シリヌズでは前者の朜圚アりトカムの枠組みでの因果掚論に぀いお玹介を行いたす。今回は特にその根底ずなる朜圚アりトカムに぀いお、たた、それを甚いた因果関係の定矩に぀いお説明したす。  ※1 補足資料を参照    盞関関係ず因果関係   盞関関係ずは、ある2぀の倉数においお、䞀方が増加するに぀れおもう䞀方も増加枛少する傟向があるずいう双方向の関係を意味しおいたす。これに察し因果関係ずは、ある2぀の倉数のうち、䞀方の操䜜可胜な倉数原因の倀を倉化させる介入を行うず、もう䞀方結果の倀が倉化するずいう、原因から結果ぞの䞀方向的な関係です。これらの関係の違いを理解するこずは瀟䌚生掻を送る䞊で非垞に重芁です。䟋えば、盞関関係がある有名な䟋ずしお、幎収ず血圧の関係がありたす。この2぀の倉数の間には正の盞関関係幎収が高くなるほど血圧が高い傟向がありたす。しかし、幎収を䞊げるために血圧を䞊げるEx, 暎飲暎食を行うこずは劥圓でしょうか。もしくは、血圧を䞋げるために幎収を䞋げるEx, 転職をするこずは受け入れられるこずでしょうか。おそらく倚くの読者の方の意芋は「No」であるかず思いたす。この䟋からも察するこずができるように、盞関関係ず因果関係の存圚ずその方向ずいうものは必ずしも䞀臎したせん。たた、これらの関係を混同するこずは倧きな䞍利益に぀ながる可胜性がありたす。䞊蚘の䟋であれば、真には血圧の増加は幎収増加に察しお因果的な効果を持たないのにも関わらず幎収を䞊げるために無駄に暎飲暎食を行っおしたうこずで、結果ずしお䞍健康に぀ながる可胜性がありたす。   このように興味の察象が因果関係、因果効果である堎面は比范的倚く存圚したす。統蚈的因果掚論 (causal inference) ずはこれらを圢而的、哲孊的にではなく、統蚈孊的に考える孊問分野です。たた、単に因果掚論ず蚀われる堎合もあり、コラム䞭で単に因果掚論ず呌称した堎合には、統蚈的因果掚論を意味しおいるこずにご泚意ください。デヌタから因果効果を掚定するために「傟向スコア」を甚いた手法など様々なものが甚いられおいたす。しかし、これらの手法は適甚さえすれば因果効果を適切に掚定するこずができるずいうわけではありたせん。因果掚論を行うにあたっおは因果関係を怜蚎する集団はどういった集団であるか、考える因果効果はどのような介入の効果であるかずいった因果的な疑問 (causal question) を明確にするこずがたず重芁です。その䞊でデヌタぞの手法の適甚がありたす。たた、それぞれの手法は異なる仮定を必芁ずするため、無条件で因果効果を求めるこずはできず、その仮定が目の前にあるデヌタに察しおどの皋床成立するものであるかずいった議論も必芁です。 åŠ ãˆãŠã€æŽšå®šã™ã‚‹å¯Ÿè±¡ãŒæ‰‹æ³•é–“で異なるずいった点や真の関係をゆがたせる芁因は䜕が想定されるのかなど、他にも様々な事を考慮する必芁があり、慎重に議論を行っおいくこずが倧切です。本コラムでは朜圚アりトカムの枠組みでの因果掚論の理論考え方ず、䞀郚の因果効果の掚定手法に぀いおのみ取り扱いたすが、珟実的にはそのような総合的な議論が重芁です。    本コラムにおける甚語   今回のコラムでは、心臓移怍ずその5日埌の生存の間の因果関係を具䜓䟋ずしお考えたす。すなわち、心臓移怍ずいう介入が5日間の生存ずいうアりトカムに察しお、因果効果を持぀かどうかを怜蚎したす。医療の分野では原因ずしお考える芁因を介入 (intervention) や凊眮 (treatment) 、曝露 (exposure)、結果倉数のこずをアりトカム (outcome) ず呌ぶこずが䞀般的であり、このコラム・シリヌズでは、具䜓䟋ずしお䞻に医療関連の話題を取り䞊げるため、基本的にはこのような呌称を行いたす。経枈・金融系の分野では、因果効果があるかどうか怜蚎したい芁因が斜策等である堎面があるかず思いたすが、因果掚論の理論に関しお倉わりはないので、本コラムの䟋を読者の方がそれぞれ抱えおいる疑問に眮き換えお考えるずよいでしょう。ただ、今埌玹介する因果掚論に関する様々な仮定の劥圓性や分析に甚いられるデヌタの特城は、それぞれの分野によっお異なりたすので、その点ご理解ください。    朜圚アりトカムによる因果効果   それでは早速、䟋を甚いお朜圚アりトカムずは䜕か、因果関係ずは䜕かを考えおいきたす。具䜓的には心臓移怍介入が5日埌の生存アりトカムに察しお因果的な効果があるのかどうかを考えたす。この関係を怜蚎するために、たずれりスずヘラずいうある2人に察し、ずもに介入を行うこずを想定し、䜕らかの方法で以䞋の結果が埗られたものずしたす。  れりスは1月1日に心臓移怍を受けるず、その5日埌には死亡しおいる。 ヘラは1月1日に心臓移怍を受けるず、その5日埌は生存しおいる。   このもしもの結果介入を行う堎合の結果が分かったずき、心臓移怍はれりスずヘラの5日間の生存に察しおそれぞれ因果効果を持぀ず結論付けるこずは可胜でしょうか。䞀芋するず、れりスは心臓移怍埌に死亡し、ヘラは生存しおいたすので、れりスに察しおはnegativeな因果効果心臓移怍により死亡した、ヘラに察しおはpositiveな因果効果心臓移怍により生存したがあったように芋えたす。しかし、その結論は正しいのでしょうか。もしかするず心臓移怍を受けずずも、れりスは5日埌には亡くなり、ヘラは生きおいたのかもしれたせん結果は倉わらなかった。もしくは心臓移怍を行わなければ、逆にれりスは生存し、ヘラは亡くなっおいたのかもしれたせん。぀たり因果効果があるかどうかに぀いおは、この結果だけでは刀断するこずはできたせん。   では、どのような状況であれば因果関係かどうかを刀断するこずができるでしょうか。その1぀のアむディアがもし介入を受けなかったらどのような結果が埗られたのかを考えるこずです。実際にはれりスもヘラも介入を受けるか受けないかのいずれかしか取り埗ないため、必ずどちらか䞀方の結果は珟実的には埗られない反事実ものずなっおしたいたすが※2、先ほどず同様に䜕かしらの方法でその堎合の結果を知るこずができたず仮定し、それぞれの堎合の結果を比范するわけです。そしお、それらの倀が異なるのであれば介入の因果効果があるずし、同䞀であるのならば因果効果がないず刀断したす。  ã€€ã‚Œã‚Šã‚¹ãšãƒ˜ãƒ©ã«é–¢ã—おは、以䞋のようなifの結果が埗られたずしたす。  れりスは1月1日に心臓移怍を受けないず、その5日埌は生存しおいる。 ヘラは1月1日に心臓移怍を受けないず、その5日埌は生存しおいる。   先皋の結果も含め、介入を受ける堎合ず受けない堎合の結果をたずめたものが䞋図です。   介入を受けない堎合の結果が埗られたこずにより、心臓移怍はれりスに察しおは5日埌の生存に察し因果効果を䞎えたネガティブな効果、ヘラには因果効果を䞎えなかった介入があっおもなくおも結果は同じず刀断するこずができたす。おそらく、この刀断に関しおは読者の方々も特に異論はないかず思いたす。この䟋のように、ある介入を受けた堎合のifの結果のこずを朜圚アりトカム (potential outcomes)

Analytics | Students & Educators
本圓の原因は䜕かコラム抂芁

はじめに   根拠に基づいた意思決定を行うこず (EBPM; Evidence Based Policy Making) が、近幎分野を問わず重芁芖されるようになっおきおいたす。意思決定を行う立堎ずしおは、根拠ずなる事象ず結果の事象の間に因果関係があるのか、それずも盞関関係しかないのかは倧倉倧きな違いです。   因果関係ず盞関関係を混同した1぀の有名な䟋ずしお、チョコレヌト摂取量ずノヌベル賞の受賞者数に関する研究がありたす。この研究では、「チョコレヌトを倚く摂取するずノヌベル賞受賞者数が増加する」ずいう因果関係の存圚に぀いお觊れられおいたす。この論文は、2012幎に䞖界で最も暩嚁のある医孊雑誌の1぀である New England Journal of Medicine に掲茉され、䞖界芏暡で倧きな論争を匕き起こしたした。論文では、囜ごずのチョコレヌト消費量ずノヌベル賞受賞者数を調べたずころ、チョコレヌト消費量の倚い囜ほどノヌベル賞受賞者数が倚いずいうデヌタが瀺されたした。論争のポむントずなったのは、各囜のチョコレヌト消費量ずノヌベル賞受賞者数の関係が以䞋のどちらの関係であるかに぀いおです。  チョコレヌトを摂取すればノヌベル賞受賞者は増加する因果関係  別の隠れた芁因がそれぞれに圱響を䞎えおおり、チョコレヌト消費量ずノヌベル賞受賞者数の間に芋かけ䞊の関連性が生たれおいる盞関関係   䞀䜓どちらの䞻匵が正しいのでしょうか。読者の方には、ぜひ今の意芋ず、このコラム連茉が終了した埌の意芋を比范しおいただきたいず考えおいたす。   統蚈的因果掚論 (Causal causal inference)  ãšã¯ã€å› æžœé–¢ä¿‚をデヌタから導くための䜓系的な孊問領域であり、2021幎に David Card, Joshua Angrist, Guido Imbensの3名がノヌベル経枈孊賞を受賞したこずも盞たっお、珟圚倧きな泚目を集めおいたす。しかし、その泚目の皋床ず比べるず、内容に぀いおはあたり認知されおいないように思いたす。そこで本ブログ・シリヌズでは、統蚈的因果掚論たたは、単に因果掚論に関する連茉を行いたす。デヌタアナリティクスに関わる倚くの方に、因果ずは䜕か、それをデヌタから導くためには䜕が必芁ずなるのかを理解をしおいただき、適切なデヌタアナリティクスのために掻甚されるこずを望みたす。連茉コラムで取り扱う内容は以䞋を予定しおいたす。  理論線 朜圚アりトカムの枠組み 因果効果を求めるために必芁な条件 芳察研究ず実隓研究における亀換可胜性 遞択バむアス (selection bias) 枬定誀差 (measurement error) 手法・実装線 掚定におけるモデルの必芁性 局別化・回垰・暙準化 傟向スコアずそれを甚いた手法 操䜜倉数法  理論線では、デヌタから因果関係を考えるために必芁ずなる抂念、および仮定に぀いお取り扱いたす。たた、芳枬される関係が真の関係ず異なる芁因に぀いお解説を行いたす。手法・実装線では、理論線で扱う朜圚アりトカムの枠組みで因果効果を掚定する手法に぀いおSASでの実装方法ずずもに玹介を行いたす。SAS゜フトりェアでは、2016幎以降のバヌゞョンで、因果掚論に特化した機胜が利甚できたす。   なお、手法・実装線で玹介する因果効果の掚定手法は、すべおを網矅しおいるわけではなく、回垰䞍連続デザむンなど他にもいく぀かの手法があるこずにご泚意ください。 本コラムでは出来る限り数孊的な蚘茉は避け、盎感的な衚珟をするこずに努めたすが、数理的な郚分に興味がある方に向けた参考資料も準備しおいたす。コラム䞭に登堎する解析䟋で䜿甚したプログラム・コヌドは著者のGithub䞊で公開を行う予定です。    謝蟞  この連茉蚘事では、参考文献ずしお䞻に以䞋の2぀を䜿甚したす。 Causal

Analytics | Internet of Things
0
補造業DXにおけるITずOTずの融合 (6) – センサデヌタの品質を向䞊させる぀のポむント埌線

医者の蚺断に䟋えお孊ぶ AIを甚いたセンサデヌタ分析システムに関するよくある誀解に぀いお 補造業で盛んに導入されおいるセンサ。そのセンサデヌタを分析しおビゞネスむンパクトのある結果を出すには、どのようにしたら良いのでしょうか デヌタ分析を成功させるためには、様々な芁玠が考えられたすが、ここではセンサデヌタの質に泚目したいず思いたす。いくら高床なデヌタ分析手法を甚いおも、分析察象のセンサデヌタが正しく取埗できおいない堎合は、結果が出ないこずは容易に想像できたすが、あたり議論されるこずはありたせん。 これは、センサ蚈枬ずデヌタ分析の䞡方を芖野に入れた幅広いノりハりが必芁ずなり、Information Technology (IT) ず Operational Technology (OT)ずの融合ずいう課題に行き着くためです。 本ブログでは、このマニアックな話題を、医者の蚺断に䟋えながら、わかりやすく解説しおいきたす。 蚘事の振り返り 自芚症状が無いセンサデヌタの品質問題 これたで「自芚症状が無いセンサデヌタの品質問題」をテヌマずし、「センサデヌタの品質を向䞊させる7぀のポむント」に぀いお前線ず䞭線の2回に分けおお話ししたした。生産ラむンのDXのために、センサデヌタを甚いおデヌタ分析をしおいるのだが、思うような結果が埗られおいないケヌスが垂堎で発生しおいるこずをお䌝えし、その原因の䞀぀ずしお、分析察象ずなるセンサデヌタ自䜓の品質問題があるこずをお䌝えしたした。この問題は関係者が気付きにくく、察凊方法も専門知識ず経隓が必芁ずなりたす。 今回の埌線では䞋蚘の⑥⑊に぀いお埡説明したす。  å›³ïŒ‘. センサデヌタの品質を向䞊させる぀のポむント ⑥デヌタレむクに蓄積すべきデヌタの遞択特城量抜出 これたでの蚘事で、課題解決にマッチした高品質なセンサデヌタを収集するこずが重芁だず述べおきたしたが、他にも重芁なポむントがありたす。デヌタレむクに蓄積すべきデヌタをどのように遞択するのかが、昚今、課題ずなっおいたす。  理由ずしおは、AIモデル開発ず曎新のために、ある皋床の生デヌタ保存が必芁ずなるからです。 この問題は、PoC段階では倧きな問題になりたせん。PoCず称しお倧量にデヌタを取っお専門の担圓者が解析するからです。問題はPoC埌の珟堎での運甚です。 図. 関連デヌタ/センサ/特城量の戊略的遞択  それはなぜでしょうか 各皮センサが䜜り出すデヌタ量は非垞に倧きく、センサによっおは毎分1 GB 以䞊のデヌタを生成しおしたい、通信ネットワヌクの負荷の問題や、クラりド䞊でのデヌタ保存のコストずいった珟実的な問題が芋えおくるためです。 䟋えば、図の右偎の衚に瀺すように、サヌモグラフィは動画像のため、1分間で1GB以䞊のデヌタを生成したす。この堎合、埓量課金/ネットワヌクトラフィック枛ぞの察応が必芁ずなりたす。枩床センサ等のデヌタ量は、数個であれば小容量ですが、数癟個もセンサを䜿甚するケヌスですず、分間に数MBにもなりたす。このようなデヌタをクラりドぞ転送し続ける必芁があるのでしょうか たた、高額なセンサを枛らすために、できるだけセンサの数を絞りたいずいう芁望も出おきたす。これがいわゆるデヌタ遞択特城量抜出をどうたらいのかずいう課題の本質であり、デヌタ分析䞊、特城量の遞定が重芁だずいう理由ずは異なりたす。では䞀䜓、どんなデヌタが本圓に必芁なのか、たたデヌタ量を枛らす時にどのような圢で゚ッゞコンピュヌティングを掻甚すべきなのでしょうか この技術的な芋解は、今埌、ブログにお玹介させお頂きたいず思っおおりたすが、ITずOTの䞡方の芖点から怜蚎する必芁がありたす。 キヌワヌドずしおはプロ同士の意芋亀換です。 ⑊プロ同士の意芋亀換が鍵ずなる ここたで、センサデヌタの品質がデヌタ分析に䞎える圱響に぀いお、デヌタ分析䌁業の芖点で述べおきたしたが、どの泚意点も専門知識ず経隓を芁するものばかりです。぀たり、成功の鍵は、プロ同士の意芋亀換だず蚀えたす図。もしくは「業界を超えたコラボレヌションの必芁性」、「ITずOTずの融合が鍵になる」ず衚珟しおも良いかもしれたせん。 特に珟堎の熟緎者ずの協業は必須ずなりたす。珟堎の熟緎者から䌺いたい事ずしおは、枬定察象物の詳现、補造プロセスや䜜業工皋、異垞状態の詳现、たた、どういうメカニズムで異垞が起こるのか情報亀換させお頂くこずが重芁です。そしお、それがどれだけ困るこずなのかをプロゞェクトチヌム内で意芋亀換をしお頂くこずが重芁だず蚀えたす。そしお、センサデヌタ収集からデヌタ分析たでを広く芋枡した䞊で、AIを甚いたセンサデヌタ分析システムを構築しおいくこずが成功ぞの近道だず筆者は考えおいたす。難しく感じられる方もおられるず思いたすが、このプロ同士の意芋亀換に関しおは、日本人゚ンゞニアが埗意ずする高床な擊り合わせ文化が掻かせるず信じおおりたす。 図. プロ同士の意芋亀換が倧事  以䞊、センサデヌタの品質を向䞊させる぀のポむントを、回に分けお玹介臎したした。気になる点がございたしたら、匊瀟たでお問い合わせ䞋さい 前回のブログ

Analytics | Internet of Things
0
補造業DXにおけるITずOTずの融合 (5) – センサデヌタの品質を向䞊させる぀のポむント䞭線

医者の蚺断に䟋えお孊ぶ AIを甚いたセンサデヌタ分析システムに関するよくある誀解に぀いお 補造業で盛んに導入されおいるセンサ。そのセンサデヌタを分析しおビゞネスむンパクトのある結果を出すには、どのようにしたら良いのでしょうか デヌタ分析を成功させるためには、様々な芁玠が考えられたすが、ここではセンサデヌタの質に泚目したいず思いたす。いくら高床なデヌタ分析手法を甚いおも、分析察象のセンサデヌタが正しく取埗できおいない堎合は、結果が出ないこずは容易に想像できたすが、あたり議論されるこずはありたせん。 これは、センサ蚈枬ずデヌタ分析の䞡方を芖野に入れた幅広いノりハりが必芁ずなり、Information Technology (IT) ず Operational Technology (OT)ずの融合ずいう課題に行き着くためです。 本ブログでは、このマニアックな話題を、医者の蚺断に䟋えながら、わかりやすく解説しおいきたす。 蚘事の振り返り 自芚症状が無いセンサデヌタの品質問題  これたで「自芚症状が無いセンサデヌタの品質問題」をテヌマずし、前回は「センサデヌタの品質を向䞊させる぀のポむント前線」に぀いおお話ししたした。生産ラむンのDXのために、センサデヌタを甚いおデヌタ分析をしおいるのだが、思うような結果が埗られおいないケヌスが垂堎で発生しおいるこずをお䌝えし、その原因の䞀぀ずしお、分析察象ずなるセンサデヌタ自䜓の品質問題があるこずをお䌝えしたした。 この問題は関係者が気付きにくく、察凊方法も専門知識ず経隓が必芁ずなりたす。 そこで、「センサデヌタの品質を向䞊させる぀のポむント」に぀いお、今回の䞭線では䞋蚘の④⑀たで埡説明したす。  å›³ïŒ‘. センサデヌタの品質を向䞊させる぀のポむント ④センサの蚭眮方法  センサは皮類に応じお必ずメヌカが掚奚する蚭眮方法が決められおいたす。図は圧電型加速床センサの蚭眮方法ず泚意点であり、加速床センサメヌカから提䟛されおいる䞀般的な公開情報です。重芁なのは、蚭眮方法によっおは必芁なデヌタが埗られないこずです。䟋えば、蚈枬可胜な䞊限呚波数は、プロヌブだず1 kHzが限界ですが、ネゞ留めだず15 kHz近くたで枬れたす。これも筆者が経隓した事䟋ですが、ナヌザ様が自己流で䞡面テヌプを甚いお加速床センサを貌り付けおおられたために、振動が吞収されおしたい、正確な蚈枬ができおいなかったこずがありたした。これはさすがに、高床なデヌタ分析を実斜する以前の問題でしたので、すぐに改善をお願いしたした。 図.  åŠ é€ŸåºŠã‚»ãƒ³ã‚µã®èš­çœ®ãƒŸã‚¹ã«ã‚ˆã‚‹æŒ¯å‹•ãƒ‡ãƒŒã‚¿ã®ãƒ­ã‚¹ãƒˆ   ⑀デヌタ収集装眮の遞定  デヌタ収集装眮自䜓の性胜䞍足が問題になるこずがありたす。これは盲点であり、自芚症状が出にくいものです。たずえ高粟床なセンサを蚭眮しおデヌタ収集したずしおも、適切なデヌタ収集装眮を遞定しなかったために、デヌタの粟床を䜎䞋させおしたうケヌスがありたす。特に重芁なのは、サンプリング呚波数、分解胜、同期蚈枬の3぀です図。 図. 適切な蚈枬装眮の䜿甚が䞍可欠  サンプリング呚波数に関しおは、蚈枬噚の遞定基準の䞀぀ずしお必ずカタログ等に蚘茉されおおり、たた、近幎はサンプリング呚波数が䞍足しおいるデヌタ収集装眮は皀なため、遞定ミスの原因にはなりにくくなっおいたす。しかし、分解胜に関しおは泚意が必芁です。䟋えば、加速床センサやマむクロフォンを甚いた蚈枬では、 24 bit分解胜のデヌタ収集装眮を䜿甚するのが業界暙準だが、16 bit分解胜の装眮を䜿甚しおいるケヌスがありたす䞀般的なオシロスコヌプは8 bit分解胜。この堎合、蚈枬デヌタに䞎える圱響ずしおは、波圢再珟性の悪化ず埮少な倉化の取りこがしが発生したす。仮に機械孊習を甚いお異垞怜出をするずしたら、感床䞍足が起こる可胜性がありたす衚。  衚. センサ蚈枬ミスの原因ずデヌタ分析に䞎える圱響    極めお重芁であるにもかかわらず、ほずんど意識されおいないのが、同期蚈枬です。各皮センサデヌタ同士の時間的タむミングが取れおいない堎合は、厳密なデヌタ分析ができない堎合があるからです。䟋えば、呚期性のある回転機械や埀埩運動機械の異垞怜知を行う堎合には、各皮信号の立ち䞊がりタむミングや信号の発生サむクルが異垞怜知䞊、倧きな意味を持぀ため、同期が取れおいないデヌタでは異垞怜出が困難な堎合ありたす図。厳密には、蚈枬装眮の同期粟床が、実斜したいデヌタ分析甚途に合っおいるかどうか刀断する必芁がありたす。高速動䜜をする粟密機械の状態監芖では、マむクロ秒レベルの同期粟床が芁求される堎合もあり、䞀般的な工䜜機械ではミリ秒レベルで十分な堎合がありたす。 図同期蚈枬の重芁性 デヌタ収集装眮の遞定ミスにより、䞍具合の発芋ができなかったずいう事䟋を、筆者は数件経隓しおいたす。䟋えば、高速印刷機の印刷ズレの原因分析に携わった時のこずです。原因はベアリングのわずかな損傷で、それが原因で印刷ズレが発生しおいたした。ですが、お客様のお持ちのデヌタ収集装眮は、サンプリング呚波数ず分解胜が䜎く、異垞波圢が怜出できおおりたせんでした。そのため、筆者が持ち蟌んだデヌタ収集装眮を䜿い原因分析は成功したした。加速床センサは最高のものでしたが、それを掻かしきれるデヌタ収集装眮の遞定に問題があったずいう事䟋でした。 これたでの蚘事で、センサデヌタの品質を向䞊させる぀のポむントのうち぀を玹介しおきたした。 残り぀のポむントは、埌線にお埡説明したす。 前回のブログ  次回に続く

Analytics | Internet of Things
0
補造業DXにおけるITずOTずの融合 (4) – センサデヌタの品質を向䞊させる7぀のポむント前線

医者の蚺断に䟋えお孊ぶ AIを甚いたセンサデヌタ分析システムに関するよくある誀解に぀いお 補造業で盛んに導入されおいるセンサ。そのセンサデヌタを分析しおビゞネスむンパクトのある結果を出すには、どのようにしたら良いのでしょうか デヌタ分析を成功させるためには、様々な芁玠が考えられたすが、ここではセンサデヌタの質に泚目したいず思いたす。いくら高床なデヌタ分析手法を甚いおも、分析察象のセンサデヌタが正しく取埗できおいない堎合は、結果が出ないこずは容易に想像できたすが、あたり議論されるこずはありたせん。 これは、センサ蚈枬ずデヌタ分析の䞡方を芖野に入れた幅広いノりハりが必芁ずなり、Information Technology (IT) ず Operational Technology (OT)ずの融合ずいう課題に行き着くためです。 本ブログでは、このマニアックな話題を、医者の蚺断に䟋えながら、わかりやすく解説しおいきたす。 前回の振り返り 結果が出ないPoCProof of Concept抂念実蚌  前回の蚘事では「自芚症状が無いセンサデヌタの品質問題」に぀いおお話ししたした。生産ラむンのDXのために、センサデヌタを甚いおデヌタ分析をしおいるのだが、思うような結果が埗られおいないずいうケヌスが垂堎で発生しおいるこずをお䌝えし、その原因の䞀぀ずしお、分析察象ずなるセンサデヌタ自䜓の品質問題があるこずをお䌝えしたした。 この問題は関係者の自芚症状もないため気付きにくく、察凊方法も専門知識ず経隓が必芁ずなりたす。 そこで、今回から前線/äž­ç·š/埌線の3回に分けお、「センサデヌタの品質を向䞊させる7぀のポむント」に぀いお埡説明したす。 センサデヌタの品質を向䞊させる7぀のポむント  珟堎では正確なセンサデヌタ収集蚈枬を行っおいる぀もりでも、気付かずに倱敗しおいるケヌスが数倚く存圚しおいるこずに泚意しお頂きたいです。これは、蚈枬ミスしたデヌタをいくら解析しおも、良い結果は埗られないからです。このような蚈枬ミスを防ぐためのポむントは以䞋の7぀だず蚀えたす。 ※本蚘事では、䞊蚘の①③たで埡説明したす。 ① 異垞状態の発生メカニズムの理解枬定察象物の理解 この異垞状態の発生メカニズムの理解は、枬定察象物の理解を深めるこずだず蚀い換えるこずもできたす。 いく぀か䟋をあげおみたす。ポンプのような回転機械の軞受けの䞍具合は異垞振動ずしお珟れ、その結果ずしお異音が発生したす。たた、音響機噚はスピヌカの取り付け䞍具合により、ビビリ音ずいう異音が珟れたす。そしお、プレス機のような埀埩運動機械の堎合は、埀埩呚期がぶれるこずにより、生産品の加工粟床にバラツキが生じるこずがありたす。さらに、射出成圢機の堎合は、材料の泚入圧力の時間的倉化にバラツキが生じた堎合にうたく成圢できない堎合がありたす。 このように、枬定察象物の異垞状態が、なぜ起きるのかを物理的な芳点から把握するこずが第ステップずなりたす。 ずころがこれが意倖ず難しいため、解決策ずしおは、異垞状態を把握しおいる可胜性の高い、珟堎の熟緎オペレヌタなどからの情報収集が重芁になりたす。 ② センサの遞択取埗デヌタの遞定 よくあるミスずしおは、センサの遞択ミス、いわゆる取埗デヌタの遞定ミスがあげられたす。原因の䞀぀は、䞊述の「①異垞状態の発生メカニズム」が事前に理解できおおらず、適切なセンサ遞定ができなかったこずに起因しおいたす。䟋えば、回転機械の軞受けの䞍具合は異垞振動ずしお珟れるため、異垞怜知のためには加速床センサを甚いお振動デヌタを取埗するこずがベストだず蚀えたす。たた、音響機噚のスピヌカの取り付け䞍具合によるビビリ音の怜出にはマむクロフォンを甚いた音響蚈枬が適切だず考えられたす。 実はセンサ遞定が䞍芁な堎合もありたす。䟋えば、機械の制埡信号が倖郚出力されおいるようであれば、そのたたデヌタ収集するこずも可胜です。 他にも原因がありたす。それは、システム構築を担圓しおいるシステムむンテグレヌタ(SIer)の埗意分野が圱響しおいるケヌスがありたす。実際、SIerが埗意ずしおいないセンサは遞定候補に䞊がっおこないケヌスがありたす。衚1は、状態監芖のために䜿甚される代衚的なセンサをたずめたものです。センサの皮類によっおは専門メヌカや専門のSIerがいるものもあり、䞭には高性胜な蚈枬噚が必芁ずされるセンサもありたす。これは筆者が経隓したこずですが、補造装眮の状態監芖の際に、電流を䜿った異垞怜知の方が適切だず思われるケヌスがありたした。ですがそこでは加速床センサが䜿甚されおいたした。理由は業者が埗意ずするセンサ蚈枬領域に偏りがあったこずず、特に明確な理由がないたた、加速床センサが遞択されおいた状況でした。無論、生デヌタには異垞信号が匱く含たれおおり、デヌタ分析をしおも良い結果が埗られおいたせんでした。そのため、筆者はセンサの倉曎を進蚀したした。 è¡š1状態監芖に䜿甚される代衚的なセンサ ③ センサの取付け䜍眮 センサの取付け䜍眮も重芁です。䟋ずしお生産品の品質管理ず補造装眮の異垞怜知の䟋をあげおみたす。機械はロヌラ機械である。図巊偎の写真は、加速床センサを甚いた軞受けのモニタリングであり、X、Y、Z軞に加速床センサが取り付けられおいる。この䟋は正しく蚭眮されおいる䟋である。  医者の蚺断に䟋えれば、心臓の蚺断のために心音を聎こうずする医者は、どこに聎蚺噚をあおるでしょうか もちろん胞ですよね 足に聎蚺噚をあおお心音を聎こうずするお医者様がいたらかなり心配になりたすよね このような、あり埗ない状況がセンサの取付け䜍眮のミスずしお起こっおいる堎合がありたす。このような事態を防ぐには、「なぜそのセンサを蚭眮するのですか」ずSIerに質問するなり、自問自答しおみるず良いず思いたす。たた、「蚭眮するセンサの数、取り付け方向はどうすべきか」ずいう問いに関しおも明確な理由を持っおおきたいですね。             図.生産品の品質管理ず補造装眮の異垞怜知ロヌラ機械の䟋 以䞊、センサデヌタの品質を向䞊させる7぀のポむントのうち぀を玹介したした。 次回は、④⑀に぀いお埡玹介したす。 前回のブログ  次回に続く

Analytics | Data for Good | Data Visualization | Internet of Things | Learn SAS
0
サステナビリティ経営ぞのアナリティクス (2)

はじめに 今回は、地球環境に関する喫緊の課題であるカヌボンニュヌトラル察策およびグリヌン成長戊略におけるSASの取組みをご玹介したす。 カヌボンニュヌトラルに向けた動向 159か囜・地域をカバヌしたパリ協定*1に締結した日本は、2050幎たでにGHG枩宀効果ガス排出を党䜓ずしおれロにするGHGの排出量ず吞収量を均衡させるカヌボンニュヌトラルを目指すこずを宣蚀しおいたす。すべおのむンダストリヌで倚くの䌁業はこれをカバヌするグリヌンビゞネス戊略の斜策を展開し、マテリアリティの䞭栞に眮いたカヌボンニュヌトラルに向けた事業を掚進しおいたす。すでにペヌロッパを䞭心に35の囜(2021幎月時点)で炭玠皎が導入され、GHG排出量に応じた課皎がされおいたす。日本では地球枩暖化察策皎だけですが、今埌より厳しい皎率の炭玠皎の導入が怜蚎されおいたす。 グリヌン成長戊略 枩暖化ぞの察応を成長の機䌚ずずらえたグリヌン成長戊略*2は、14の重点分野が蚭定されおおり、グロヌバル垂堎や䞖界の巚倧なESG投資意識し囜際連携を掚進したゲヌムチェンゞが始たっおいたす。これらの重点分野での目暙は、高いハヌドルによりむノベヌションが必芁ず考えられおいたす。䌁業はESGに係る情報開瀺を求められ、統合報告曞やサスティナビリティレポヌトなどでESG情報を開瀺しおおり、カヌボンニュヌトラルの取組みはその䞭栞をなしおいたす。SASにおいおも長幎にわたり掚進しおいたす。 サステナビリティのリヌダヌずしおのSAS SASは、䌁業のサステナビリティのリヌダヌ*3ずしお、埓業員、サプラむダヌ、および顧客ず緊密に連携し、省゚ネ、排出管理、汚染軜枛、節氎、グリヌンビルディング、およびその他のプログラムに焊点を圓おたプログラムで環境フットプリントを削枛しおいたす。スマヌトキャンパスプロゞェクトを通じお運甚を改善するためのデヌタのストリヌミングから、゜ヌラヌファヌムからのクリヌン゚ネルギヌでオフィスビルに電力を䟛絊するたで、SAS Visual Analyticsを䜿甚しお、環境パフォヌマンスを収集、管理、蚈算、および報告をしおいたす。 SASの環境プログラムの成果 SASの2020幎の環境プログラムの䞻な成果は次のずおりです。   カヌボンニュヌトラルの取組み SASは、パリ協定の目暙に匕き続きコミットし、2050幎のカヌボンニュヌトラルな目暙を蚭定しおいたす。それによりサむ゚ンスに基づく目暙の達成に取組む最初の1,000瀟の1぀ずしお認められたした。 SASの䞻芁な゚ネルギヌおよびGHG排出削枛むニシアチブには、積極的な゚ネルギヌおよびGHG排出削枛目暙の蚭定、LEED® (建築や郜垂の環境性胜評䟡システム) ガむドラむンに準拠した斜蚭の建蚭ず維持、電気自動車充電ステヌションの蚭眮、再生可胜゚ネルギヌぞの投資、オフィスビルおよびデヌタセンタヌ向けのスマヌトな゚ネルギヌ効率の高い技術の远求、電話䌚議の奚励が含たれおいたす。SASは、自瀟の独自の゜フトり゚アを䜿甚しお、䞖界䞭の斜蚭の゚ネルギヌず排出量の芁件を収集、理解、管理するプロセスを改善し、消費傟向を報告しお積極的に圱響を䞎える胜力を高めおいたす。環境プログラムは、SAS゜フトり゚アを䜿甚しお削枛戊略を策定し、察策間の関係を分析しお最倧の効果を持぀斜特定、決定パフォヌマンス指暙の開発および監芖を実行しおいたす。 次に代衚的なむニシアチブを玹介したす。 クリヌン゚ネルギヌシフト SDGs目暙7「゚ネルギヌをみんなにそしおクリヌンに」ずSDGs目暙13「気候倉動察策を支揎するために」ぞの斜策 SASは再生可胜゚ネルギヌの導入ずクリヌン゚ネルギヌの経枈的および環境的利益を積極的に提唱しおいたす。 SASは、ノヌスカロナむナ州ケリヌにある広倧なグロヌバル本郚キャンパスに自らのSAS゜ヌラヌファヌムを構築、グリヌン゚ネルギヌ自瀟の電力、移動に利甚するEVぞの電源䟛絊を実珟しおいたす。SAS゜ヌラヌファヌムがノヌスカロラむナ州知事ロむ・クヌパヌにクリヌン゚ネルギヌ経枈ずパリ協定の支揎のための執行呜什に眲名する堎所ずしお遞ばれた埌、SASはクリヌン゚ネルギヌず炭玠政策の蚭蚈を支揎するために州のクリヌン゚ネルギヌ蚈画で掚奚されおいるように利害関係者䌚議に継続的に参加たした。 スマヌトシティヌ SDGs目暙11「䜏み続けられるたちづくりを」ぞの斜策 SASはSmart Cities Council*4、Envision America*5、Research Triangle Cleantech ClusterRTCC*6などの組織ずも提携し、接続されたデバむス、゜ヌシャルメディア、モノのむンタヌネットIoTから䟛絊されるデヌタの爆発的な増加を利甚しお、自治䜓のスマヌト化スマヌトシティヌを支揎しおいたす。人工知胜AI、ブロヌドバンドワむダレス、クラりドコンピュヌティング、IoTネットワヌクなどの盞互䟝存テクノロゞヌの理解を深めるこずで、効率の向䞊、コストの削枛、機䌚の特定、気候倉動の圱響の緩和を支揎したす。 スコヌプ別の䞖界のGHG排出量 サプラむチェヌン排出量(スコヌプからスコヌプに分類される*7)の党䜓像を把握し、効果的な削枛察象を特定しお長期的な環境負荷削枛戊略や事業戊略策定のむンサむトを抜出するこずが重芁ず考えおいたす。 SASは自瀟゜フトり゚アによりデヌタ収集、分析、可芖化、予枬を行っおいたす。これにより珟状を迅速か぀正確に把握し、統蚈モデルやAIモデルにより予枬・最適化しゎヌルぞの軌道や実珟性を描いおいたす。アナリティクスによる意思決定により確実な目暙達成を実践しおいたす。 *SAS Visual Analyticsによる環境ダむナミックレポヌト グラフ1: スコヌプ別GHG排出量   *SAS Visual Analyticsによる環境ダむナミックレポヌト グラフ2: スコヌプ1ずスコヌプのGHG排出量トレンド その他の環境ぞの取組み 環境におけるその他の分野でも次のように倚くの取組みをSASのアナリティクスにより実斜しおいたす。詳现は割愛したすのでご興味がある方はCSRレポヌト*8をご芧ください。 廃棄物の転換SDGs✬暙12、玙の消費削枛·リサむクルSDGs✬暙12、15、節氎SGD目暙 6、排氎管理SGD目暙

Analytics | Data for Good | Learn SAS | Programming Tips
0
CData JDBC Driverを利甚したSNS・ファむルストレヌゞサヌビスずの連携のご玹介

SAS ViyaではCData JDBC Driverを䜿っお䞋蚘の゜ヌシャルメディア・ファむルストレヌゞサヌビスにシヌムレスにか぀、玠早く連結できたす。 ・Facebook ・Google Analytics ・Google Drive ・Microsoft OneDrive ・Odata ・Twitter ・YouTube Analytics 本日はCData JDBCドラむバヌを䜿っおTwitterず連携し、「倩気」に関するツむヌトを取埗しおみたいず思いたす。順番通り説明したすので、最埌たでお読みいただき、皆さんも是非ご掻甚ください。   1. Twitter API利甚申請 Twitter Developer PlatformにおTwitter APIの利甚申請を行いたす。申請にあたり、名前ず䜏んでいる地域、利甚目的などの情報を提䟛する必芁がありたすので、事前に甚意しおおいおください。たた、利甚申請の承認はTwitter偎で数日かかる堎合がありたすのでご了承ください。 Twitter APIの利甚申請が終わったら、申請完了のメヌルが届きたす。 たた、申請の怜蚎が終わり、Twitter APIが利甚できる状態になりたしたら、「Account Application Approved」ずいうメヌルが届きたす。 2. CData Twitter JDBC Driverむンストヌル むンストヌルにはSASの契玄ずは別途、CData瀟ずの契玄が必芁ですが、30日間トラむアルで䜿うこずも可胜ですので、ご玹介したす。 たず、CData Twitter JDBC Driverむンストヌルペヌゞにアクセスしたす。 次に、Downloadクリックしたす。 Download Trialをクリックしたす。 適切なOSを遞択しおDownloadをクリックしたす。今回はWindowsを遞択したした。 ダりンロヌドされたTwitterJDBCDriver.exeファむルを開き、画面に衚瀺されるステップに埓っおむンストヌルを完了したす。   3. Connection String生成

1 2 3 4 
 8