Japanese

SAS Administrators
SAS Japan 0
Apache Log4jのCVE-2021-44228脆弱性に関するアップデート

Log4jの脆弱性に関する最近のニュースは、SASのお客様の多くにとって依然として最大の懸念事項です。ここでは、SASによる最新の活動と発見事項を皆様と共有したいと思います。 SASのお客様へ: SASソフトウェア環境およびSAS Cloudホスティング環境のセキュリティと完全性は常に当社の最優先事項です。SASのチームは、Log4j脆弱性に関する報道が出た後の早い時期(2021年12月中旬)に迅速に対応しました。オンプレミス環境のお客様のためには、影響を受けるSAS製品に関する情報はもとより、推奨されるアクションもご案内しました。SAS Viya 2021.2.2には、アップデートされたバージョンのLog4jが含まれています。加えて、当社は「loguccino」という無償ツールをリリースしました。お客様はこれを使うことで、ご利用中のSAS 9.4およびSAS Viya 3.x環境内にある脆弱なlog4jファイル群を検出し、パッチを適用することができます。 SAS Cloudホスティング環境のお客様のためには、「こうした脆弱性が悪用される可能性のある、この環境の複数の側面」を即座に強固にしました。具体的には、ネットワークベースのポリシーの厳格化や監視の増強などです。当社では「これらの公表された脆弱性に特化した形での、SASソフトウェアに関連した攻撃」のエビデンスは一切検知しておりません。 さらなる調査の結果、当社では「Log4j脆弱性自体は深刻であるものの、SASがホスティングされているシステム内におけるLog4jのコンフィグレーションおよび利用法では、エクスポージャーは極めて限定的」と判断しました。いかなる未認証ユーザー(=既存のアクセス権限を持たないユーザー)も、リモートコード実行脆弱性(RCE脆弱性)をトリガーすることはできません。これらの発見事項と既に実施済みの予防措置とを踏まえ、当社では「SAS Cloud内のお客様のSASアプリケーションとデータは安全性が維持されている」という確信を感じています。 さらなる詳細については、本件に関するSAS Security Bulletin(セキュリティ速報)をご覧ください。 ご利用中のSAS環境の生産性・安全性の維持に関する皆様の継続的なパートナーシップに感謝いたします。また、SASのお客様でいてくださり、ありがとうございます! セキュリティ速報のハイライト 上記の速報のアップデートに関する通知を受け取るには、SAS Support Communitiesのトピック「Updates on log4j Remote Code Execution Vulnerability (CVE-2021-44228)」をサブスクライブするか、このRSSフィードをフォローしてください。 SASでは、お客様のために “監査済みの自動化されたアプローチ” を提供する取り組みの一貫として、「loguccino」という脆弱性パッチスクリプトを開発済みです。このloguccinoは「logpresso」に似たツールですが、SASソフトウェア向けにカスタマイズされています。このツールはSAS 9.4およびSAS Viya 3環境を修復するために特別に設計されており、脆弱なLog4j JARファイルを再帰的に検索し、JndiLookupクラスを取り除いた上で、この脆弱性を含まない状態でJARを再パッケージ化します。 上記の速報には、SASがアップデート済みバージョンのLog4jを自社ソフトウェア内にデリバリーするにあたっての計画とタイムラインも記載されています。 SAS Viya 2020.1、SAS Viya 3.5、SAS Viya 3.4プラットフォームおよびSAS 9のSAS Logonプロセス内でのLog4jの利用に関してSASが実施した継続的および継続中の調査では、「CVE-2021-44228に関するコミュニティの理解を踏まえると、未認証のRCEエクスプロイトは現時点では不可能である」という結論に達しています。 大手の脆弱性スキャニング・ベンダー(Qualys、Rapid7、Tenable)はすべて、「この脆弱性に関連した最も一般的な攻撃ベクトル群をチェックするための、アップデートされたシグニチャ群」をリリース済みです。 最後に念のため繰り返しますが、お客様はいつでも当社のSupportサイトで最新のセキュリティ速報(英語)をご覧いただけます。 この記事は、英語版のオリジナルをもとにSAS Institute Japanが翻訳および編集したものです。

SAS Events | Students & Educators
0
#SAShackathonに参加してみよう~好奇心を形に~

データを使って新たな知見を見つけたいと思ったことはありませんか?実社会の問題を解決したいと思ったことはありませんか?そんなあなたにぴったりのイベントがあります! 昨年引き続きSASでは、SAS Hackathonというハッカソンイベントを開催します。過去のSASハッカソンについてはこちらをご参照ください。このイベントは開発者、学生、スタートアップ企業、SASの顧客・テクノロジーパートナーの皆様を対象としており、世界中から参加者を募集しています。 参加者は以下の分野の中から興味のある分野を選択し、テーマの設定、そのビジネス課題・社会問題の解決をチームで目指していただきます。チームは最低2人から最大10人までで、経験豊富なデータサイエンティストから初級者、パートナーやSASの専門家などなど幅広い方が、Microsoft AzureでSASとオープンソースを使用し世界規模でつながることができます。 また本イベントでは各チームにSAS Viyaを実行するクラウド環境や、メンタープログラムも用意されており、それぞれのチームにガイダンスやサポートが提供されます。SASコミュニティのHacker's Hubもご参考にどうぞ。   イベントスケジュール SASハッカソンのイベントスケジュールは以下のようになっています。 2021年12月1日〜2022年2月15日 登録期間 2022年1月26日 キックオフイベント 2022年1月5日~3月31日 デジタルラーニングポータルへのアクセスの有効化 2022年3月1日~3月31日 ハッカソン環境へのアクセス 2022年4月1日~4月7日 ビデオの録画とアップロード 2021年5月 ファイナリスト発表 2021年9月 受賞者イベント   ガイドライン SAS Hackathonは、開発者、学生、スタートアップ企業、SASの顧客、およびテクノロジーパートナーを対象としています。チームは、組織内の人々、組織とテクノロジパートナー、またはグループへの参加を検討している個人で構成できます。 チームが取り組む実際の課題(ビジネスまたは人道上の問題)の説明が必要です。 テクノロジーパートナーは、顧客や学生とチームを組むことができます。 スタートアップ企業は、顧客や学生とチームを組むことができます。 参加者である皆様の抱える問題をハッカソンで取り組うことが可能です。テクノロジーパートナーと協力する顧客は、一緒に新しい市場につながるパートナーシップに向けて取り組むこともできます。 学生と開発者はチームを形成できません。ただし、顧客、パートナー、またはスタートアップチームに参加すれば、参加できます。 ※参加をしたいがチームが見つかっていない学生や開発者は、次の登録手順の4において「Looking for a Team」を選択してください   登録手順 SAS Profileを作成します(既に持っている場合は2へ) SASハッカソンのイベントページにアクセス 画面上部中央にある「Register Now」をクリック 以下の3つのタイプから合うものを選んでクリック Team Leader 参加するチームが決定しておりチームリーダーである人 Team

Students & Educators
【冬休みに勉強しよう】アナリティクスの学習(2) Viya for Learners

前回の投稿 【冬休みに勉強しよう】アナリティクスの学習(1) Skill Builder for Students では、学生向けのリソース・ハブである Skill Builder for Students に登録し、e-Learningでの学習についてご紹介しました。取り上げた学習コースでは、SAS Visual Analytics をツールとして用いていましたが、このソフトウェアは SAS Viya と呼ばれるアナリティクス・プラットフォームで提供されます。 SAS Viya は次のような特徴を持っています。 アナリティクスによる課題解決に必要な「データの管理と準備」「分析による発見とモデル構築」「分析結果の実装」を一つのプラットフォームで提供 機械学習、ディープラーニング、テキスト解析、画像解析、予測、最適化などAI機能を網羅 グラフィカルな操作、SAS言語、Python、Rなどによるプログラミング、REST APIによる機能提供を実装し、アナリティクスへのアクセスをオープンにする これらの特徴は、企業や組織でアナリティクスを用いて価値を発揮するために必要なものでありますが、学生がデータ分析を学ぶ場面では必ずしも重要なものではないかもしれません。しかし、GUIやSAS言語、オープンソース言語など、それぞれの学生が得意とするスキル、今後のキャリアに役立つ技術を磨くプラットフォームとしては有用です。SAS Viya は商用またはアカデミア向けのライセンス提供がありますが、教育目的には無償の SAS Viya for Learners がSaaS形式で提供されています。 SAS Viya for Learners は、SAS Skill Builder for Students と同様に、大学ドメインのメールアドレスを登録したSASプロファイルをお持ちであれば、無料で登録・利用することができます。クラウドでの提供ですので、ソフトウェアをインストールする必要はなく、Webブラウザからアクセスするだけで利用できます。GUI操作での可視化(SAS Visual Analytics)や、機械学習モデル作成ツール(SAS Model Studio)、SASプログラミングについては、SAS Skill Builder for

Learn SAS | Students & Educators
【冬休みに勉強しよう】アナリティクスの学習(1) Skill Builder for Students

学生の皆さんは今日から冬休みでしょうか。「卒論でそれどころじゃないよ!」という方もいるかもしれませんが、この期間に「何か新しい勉強を始めてみようかな」と思われる方も多いのではないでしょうか。 データサイエンティストが「21世紀で最もセクシーな仕事」と言われてから10年近くが経とうとしています。しかし、社会におけるデータの活用はまだまだ発展途上であり、そのための人材は依然として高い需要があります。「データサイエンティスト」はそのなかでも、多くの高度な知識と技能を持った人材ですが、デジタル・トランスフォーメーション(DX)と呼ばれる業務改革が進む中、高度人材だけでなく、より広範囲の人たちがデータを活用した仕事に従事することが求められています。数理科学とテクノロジーを駆使するデータサイエンティストでなくても、アナリティクスに関わり、自分なりの知識とスキルを発揮することができます。 SAS Skill Builder for Students は、SASソフトウェアと統計解析・機械学習を中心に、「データリテラシー」や「ビジュアライゼーション」といったより基礎的なの知識やスキルを無料で学習できます。また、認定資格取得の案内や、アナリティクスを活用したキャリアについての情報も提供しており、アナリティクスの初学者からデータサイエンティストのキャリアを構築しようとする学生まで、多くの方に活用いただけます。この機会にぜひ登録してください。 登録方法は次の4ステップ SAS Skill Builder for Students にアクセス SASプロファイルをお持ちでない学生は「SAS プロファイルを新規に登録」から登録 ※ 登録するメールアドレスは大学ドメイン(.ac.jpなど)のものを入力してください。 登録したSASプロファイルのメールアドレスを SAS Skill Builder for Students のログイン画面で入力 My Trainingの画面でLicense Agreementを読み、同意のチェックボックスにチェックを入れて「Submit」 登録・ログインに成功するとこちらのようなホーム画面が表示されます。 「Learn SAS」「Get SAS Certified」「Career Resources」のタブがあり、それぞれe-Learningによる学習、認定資格の案内、キャリア構築のためのリソースが提供されています。 ここでは「ビジュアライゼーション」のe-Learningをご紹介します。SAS Visual AnalyticsというGUI操作による可視化ツールを利用して、データから示唆を得る方法を学習するトレーニングです。数学やプログラミングが苦手な方でも学習できます。 「Learn SAS」タブ→「Start Learning」→「Visual Analytics and Visual Statistics」→「SAS Visual Analytics 1 for SAS

Analytics | Data for Good
0
パブリックデータを使った子宮頸がんを取り巻く日本の状況の可視化

2021年11月、国が一時停止している子宮頸がんを防ぐHPV(ヒトパピローマウイルス)ワクチンの積極的な接種の勧奨の再開が厚生労働省の専門家による検討部会によって正式に承認されました。このHPVワクチンは世界保健機関(WHO)がその接種を推進しており、日本をはじめとして多くの先進国では公的接種とされています。この記事はData for Good活動の一環として、パブリックデータを用いて問題を可視化することで、子宮頸がんに対する認知や関心をより持っていただき、今後のHPVワクチンの普及につなげることを目的としています。   子宮頸がん 子宮頸がんのほとんどはヒトパピローマウイルス(HPV)というウイルスの感染が原因となり子宮の頸部に発生するがんの一種です。感染の経路は主に性的接触によるものであり、成人女性の大部分はHPVに感染するとされています。HPVに感染してもその多くは自然に消失しますが、一部は頸部の細胞が異常な変化を起こした子宮頸部異形成というがんの前段階(前がん病変)になります。そしてさらにその一部が数年から10年ほどで悪性腫瘍へと進展し、子宮頸がんを発症します。この子宮頸部異形成(前がん病変)の早期段階では自覚症状はほぼなく、病変を発見するためには子宮頸がん検診を受けることが必要ですが、自覚症状があまりないために検診を受けた段階で既に進行がかなり進んでしまっているケースもあります。 国立がん研究センターがん情報サービスは国立がん研究センターが運営している公式サイトであり、日本国内のがんに関する統計情報ががん種別に公開されています。今回はその統計情報の中から、子宮頸がんに該当するデータ(がん種:子宮頸部)を抜き出し、無料で利用可能なSAS OnDemand for Academicsを利用して可視化を行いました。日本での死亡者数は2019年度時点で年間約3,000名、罹患者数は2018年時点で約11,000名ほどとなっており、下図のように増加の一途をたどっています。 出典:国立がん研究センターがん情報サービス「がん統計」(人口動態統計) より作成 ま子宮頸がんの罹患者数は2009年~2018年(最新)まで10年連続で1万人を超えており、罹患者数は30歳頃から増え始め現在は45-49歳が最も罹患が多い年代層となっています。また罹患する年齢層が若年化していることも危険視されています。子宮頸がんに対して我々ができることは以下の二つです。 子宮頸がん検診を受けること(発見) HPVワクチンを接種すること(予防) 私たちにとって重要なことは、2年に1度の受診が推奨されている子宮頸がん検診によって異形成(前がん病変)を早期に発見すること。そして検診と同様に重要ことが、HPVワクチンを接種し対応するHPVの感染を防ぎ、子宮頸がんとなるリスクを下げることです。   HPVワクチン 子宮頸がんの原因となるHPV(ヒトパピローマウイルス)は現在100種類以上の存在が知られており、そのうちのいくつかは子宮頸がんを引き起こしやすいハイリスク型に分類されます。HPVワクチンにも様々なタイプがありますが、日本では定期接種の対象となっているのは2価(サーバリックス)と4価(ガーダシル)のワクチンで、接種することでおおよそ50~70%程の感染を防ぎ子宮頸がんになるリスクを減らすことが可能です。また2021年2月24日からは9価ワクチンも日本での取り扱いが開始されましたが定期接種の対象ではないため自費での接種となっています。     「接種の積極的な勧奨」について HPVワクチンは下図のようにいくつかの事業、法案の後押しもあり、その対象となる年齢の女性へ接種の積極的な勧奨が行われていました。しかし公費での定期接種開始後に副反応の報告が相次ぎ、副反応と接種との因果関係や、その頻度、海外での詳しい実態調査が必要とされ、厚生労働省は約半年間をめどに「接種の積極的な勧奨」の一時中止という決定を2013年6月に下しました。当初は半年間がめどとされていたものの、一時停止はその後も続き、ワクチンの有効性が様々な研究により示され2021年11月に接種の積極的な勧奨の再開が正式に決定されるまで約8年の月日がかかりました。 専門家らの研究結果によると、接種の積極的な勧奨が一時停止されるまではおおよそ70%であった定期接種の対象年齢での接種率もこの一時停止により現在は1%未満にまで落ち込んでしまっています。論文のデータをもとに出生年ごとのワクチン接種率を可視化したものが下図です。 Nakagawa S, Ueda Y, Yagi A, Ikeda S, Hiramatsu K, Kimura T. Corrected human papillomavirus vaccination rates for each birth fiscal year in Japan. Cancer Sci. 2020;111(6):2156-2162. doi:10.1111/cas.14406 より作成

Analytics | SAS Events | Students & Educators
0
SAS Global Forum2021で世界を覗こう

SAS Global Forumオンデマンド配信の紹介 SAS Global Forumは、年に一度開催される世界最大級のアナリティクス・カンファレンスです。南北アメリカ、アジア太平洋地域、EMEAの3つの地域ごとにイベントは分かれており、アジア太平洋地域は5/19(水)~5/20(木)に開催されました。イベントの内容は2021年6月25日(金)までこちらより、オンデマンドで視聴可能です。 Forumでは、様々な分野のトップ企業、スピーカーの刺激的な講演を聞くだけでなく、トレーニングや技術セッションといった学習機会も提供されます。また優れたデータアナリティクスの成績・教育が認められた学生や教育者に対しては表彰が行われました。ここでは一人の受賞者のセッションを紹介します。 Do Americans trust scientific experts? このセッションはタイトルにもあるように、医者・環境学者・栄養士など“科学に関連する専門家”に対するアメリカ人の不信について取り扱っています。この話題は幅広く活用が期待でき、多くの人々に関連する事柄であるという背景があり、今回の講演のテーマとして設定されています。 使用されたデータは、科学者に対する人々の全体的な意見や個人の科学にまつわる知識などを調査して収集されています。収集したデータを用いて、記述統計による考察やディシジョンツリーをはじめとしたモデルによる分類の結果から、次のようなフィードバックを共有しています。 各専門家に対する肯定的/否定的な意見の割合は、医者が最も肯定的な割合が高く、その中でも人々と対面する機会が多い開業医に対する肯定的な意見が多い。 人々の政治的傾向に基づいて専門家への信頼度に差が出ている 科学知識が前提にある人の方が専門家への信頼を示している スピーカーはこの結果をもとに、ワクチン接種の促進が可能になるのではないかという活用例を話しています。それは市民に専門への信頼に関する質問に答えてもらい、信頼の低い地域の人々に対してワクチン情報について教育・説得することでワクチン接種を増やすという仕組みです。 またスピーカーは私たちと同じ大学の学生で、コロナ禍に抱える問題も絡ませたセッションになっており、私たちにとても身近な内容になっています。 繰り返しになりますが、SAS Global Forum2021はより優れたキャリアにつなげる大きなチャンスであり、各セッションの様子はオンデマンドで視聴可能です。ぜひ自らの成長のために登録、ご覧ください。

Analytics | Data for Good | SAS Culture
0
米国ノースカロライナ州から学ぶ行政におけるデジタルフォーメーション

◆ はじめに 行政のデジタルトランスフォーメーション(以下DX)は、デジタル化が進み、非対面でのコミュニケーションが日常化するなど、従来の生活形態が変化するにつれて、政府や行政も市民サービスの変革をする必要性が高まっています。その動きとして日本でもデジタル庁を新たに設置し、データ管理やITシステムなどを総括することになります。しかし行政のDXは、システムのデジタル化による行政手続きの効率化だけに焦点が当たり、大規模なシステムを構築しがちですが、本来行政のDXとは、データとそのデータを分析した結果得られた洞察によって、より良い市民サービスにつなげることから考えることが必要だと考えます。本稿では、SAS社の本社がある米国ノースカロライナ州(以下NC州)で行われている行政のDX事例について紹介します。NC州では、データ分析を活用して、様々な政策やサービスを新たに開発し、市民サービスに新たな価値を提供しています。この事例を通して、行政のDX成功のためのポイントについて見ていきたいと思います。   ◆ 行政におけるDXのポイント ポイント1.小さいことから始めよう 行政のDXで一足飛びに100%満足できる成果まで至る事例はあまりありません。また、すべてが理想的に準備されるまで待つ必要もありません。NC州は2007年からGDAC(Government Data Analytics Center)と呼ばれるデータの管理や分析を行う部署の運営を始めました。最初から大きなプロジェクトを行ったわけではなく、まずは各機関米国ノースカロライナ州から学ぶ行政におけるデジタルフォーメーションのデータを収集し、データ管理とモニタリングから始めました。初めの3年間は、データ基盤を構築し、大きなプロジェクトに最初に取り組んだのは2010年の犯罪分野です。GDACはSAS社と共同で「CJLEADS」というプロジェクトを開始しました。CJLEADS(Criminal Justice Law Enforcement Automated Data Services)は、犯罪データの統合管理のシステムです。CJLEADS導入前は、様々な機関のシステムやプロセスを経由して犯罪記録を閲覧したり、更新したりしましたが、現在では各機関がCJLEADSを介して犯罪歴を統合的に管理しています。これにより、NC州は、年間1,200万ドルを節約することができ、犯罪データの紛失や欠落を防ぎ、より安全な社会を作ることができました。その後、犯罪分野だけでなく、様々なプロジェクトに取り組み、行政のDXを進めています。これらのシステムやプロジェクトを最初から完全に構築することは簡単ではありません。NC州のCJLEADSも、最初はデータの収集、統合したデータを活用したレポーティングやモニタリング、そして複雑な課題解決、とステップを踏んでいます。このように、ビジョンは大きく掲げつつ、小さな成果を重ねて発展させることがポイントではないでしょうか。   ポイント2.現場にいるビジネス専門家の協力を得る 行政のDXの目的は、市民サービスの向上です。どうすればデジタル技術を活用したより良いサービスが生まれるのでしょうか。ここでは、例えば、一般的な自然災害である「洪水」を例として挙げてみましょう。世界的に洪水は年間数千万人の命を奪い、経済的な損失も大きくなります。それに対し、NC州は高度なデータ分析力とIT技術力を持つ企業との業務提携を通じて洪水問題を解決しています。 図1.SASとMicrosoftは様々な分野で顧客の課題を解決するために2020年6月に戦略パートナーシップを締結 NC州では、SAS社のデータ分析技術とMicrosoft社のIT技術を用いて洪水による災害を予測し、地域社会に知らせるシステムを構築しました。気象データ、橋の水位、降雨量など、様々な指標をはかり、IoTと機械学習を活用し、洪水による災害を予測・警告する仕組みを構築しました。この取り組みは、2020年11月には米国で毎年行われる政府革新賞(Government Innovation Award)で、公共部門の革新事業賞を受賞しました。NC州の洪水予防システムは企業との協力で公共データを活用し、市民の安全を確立することができたと評価されています。 図2.米国ノースカロライナ州とSASが共同で行ったDX事例 図2にはNC州とSAS社が協力して行った行政での様々な分野のDX事例の一部を記載しています。状況別、時期別、プロジェクト別など多様な課題が存在する行政のDXでは、当該課題を解決できる能力を備えた民間機関や民間企業などの経験と技術が貢献できるのではないでしょうか。   ポイント3.本来の目的に集中する 上記のポイントを成功させるためには、最終的にすべての参加者が「より良い市民サービスの提供」というDXの本来の目的を常に意識する必要があります。行政のデジタル化では、「オンライン行政サービス」、「電子政府の設置」などのシステム化対応に追われ、DXが本来生み出せるはずの「市民サービスの革新的な向上」という目的を見失いがちです。今回例に挙げたNC州ではDXの取り組みそのものを継続的に推進し、市民中心のサービスを提供するためにデジタルガバナンスを構築しました。そのガバナンスの透明性を高めるために毎年「We Are NC Gov」というカンファレンスを開催し、現在のDXの状況や今後の計画について議論しています。また、一般向けに州のDXの取り組みについて理解してもらえるよう、YouTubeへ説明動画をアップロードしています。外部からフィードバックをもらうことで、さらにより良い市民サービスの提供を目指しています。デジタル技術は、それ自体で意味のあるものではなく、その技術を活用して、市民サービスの革新を創出することではないでしょうか。 図3.NC州の情報技術部が2020年6月、YouTubeに公開した動画の一部を日本語に翻訳。GADCのデータ解析センター長が部門の事業について発表した。 ◆ おわりに 米国NC州とSAS社が共同で取り組んでいる行政のDX事例を通じて、行政におけるDXの成功のポイントについて考察してきました。ご紹介した3つのポイントが、革新的な市民サービスの向上へと向かうための一つの道標となるのではないでしょうか。日本におきましても、SASは戦略パートナーシップに基づいてMicrosoft社とスマートシティを推進して参りますので、詳細情報をご希望の方は是非ご相談ください。*お問い合わせ先: JPNSASInfo@sas.com  

Analytics
SAS Japan 0
OSSによる時系列予測をSASで強化・拡張する(3/3)

この記事はSAS Institute Japanが翻訳および編集したもので、もともとはMike Gillilandによって執筆されました。オリジナルはこちらです(英語)。 またこれは、ゲストブロガーのジェシカ・カーティス(Jessica Curtis)とアンドレア・ムーア(Andrea Moore)による3部構成記事の第3部です(未読の方はこちら:第1部、第2部)。 SASがそれを実現する方法 オープンソースの時系列予測モデルをSAS Visual Forecastingに統合する方法には2つのメインステップがあり、どちらのステップもオープンソース・モデルのメリットと利用価値を増大させます。 基礎:オープンソース予測モデルをプログラム的実行で拡張する 資産の共有:オープンソース予測モデルをカスタム・モデリング・ノードとして利用する ステップ1 - 基礎:オープンソース予測モデルをプログラム的実行で拡張する オープンソースの時系列予測モデルをSASに統合するための基礎は、コードベースのアプローチを通じてプロセスを(手作業ではなく)プログラム的に実行することです。あなたは既にTSMODELプロシジャとEXTLANGパッケージのパワーについてお読みです。 TSMODELプロシジャ内部には、オープンソース・モデルを実行するためのオプションがいくつもあります。まず、自社/自組織のオープンソース戦略を加速および業務運用化するためのインフラとしてSASを活用し、オープンソース・モデルだけを実行することができます。また、これをもう一歩進め、オープンソース・モデルをSASのモデルと一緒に実行することができます。この場合、SASは時系列レベルでSASとオープンソースにまたがって最適なモデルを自動的に選択します。さらに、SASおよびオープンソースのモデルを組み合わせることも可能であり、この場合は、SASとオープンソースの組み合わせが個々の時系列に最適かどうかをSASが判断することになります。このアプローチにより、オープンソース・モデルの構築に投じてきた全ての努力を活かしながら、SASのアルゴリズム群も追加で取り込むことで、両方の世界の “いいとこ取り” を実現できるようになります。どのモデリング手法が最適かをあなたが事前に知る必要はなく、SASがあなたのためにその力仕事を代行します。SASは個々の時系列に関して、オープンソースとSASのどちらのモデルを選ぶべきか、あるいは両方を組み合わせるべきかを判断します。選択の機会が無限にある取り組みにおいて、これでその選択機会が一つ減ったことになります(お分かりですよね? あなたの時間は既に節約されつつあります!)。 図2は、TSMODELプロシジャとEXTLANGパッケージの実際の様子を示しています。これは、R言語のauto.arima関数をSASで実行している例です。EXTLANGパッケージを使うと、オープンソース・コードを読み込む方法の柔軟性が高まります。SASの内部で(図2のように)明示的にオープンソース・コードを記述することも、あるいは、指定したファイルからオープンソース・コードを読み込むこともできます。 この基礎のステップにより、オープンソースおよびSASの時系列予測モデルがともにプログラム的に実行されるようになります。予測結果は、幅広いビジネスユーザー層による利用のために、川下側の計画システムや実行システムへと簡単な方法で供給することができます。また、この基礎となるプログラム的アプローチを土台として、追加のメリットを得ることも可能です。具体的には「SAS Visual Forecastingのユーザー・インターフェイスの内部で、TSMODELのコードを取り出し、それをカスタム・モデリング・ノードの中へラッピングする」という方法を使います。 ステップ2 - 資産の共有:オープンソース予測モデルをカスタム・モデリング・ノードとして利用する SAS Visual Forecasting のグラフィカルなユーザ・インターフェースは「様々なカスタムノードを作成し、それらをモデル・パイプライン内での利用のためにExchangeにロードできる機能」により、コラボレーションを強化します。カスタムノードはEXTLANGの機能を活用して、あらゆるR/Python予測モデルを実行することができます。様々な技法を使いたい場合には、多数のカスタムノードを作成することができます。その手間をかける見返りは多重的です。これらのノードは、どのような時系列予測プロジェクトにも適用可能であり、また、コラボレーションを強化するためにチーム内で共有することも可能です。いったん作成すれば、様々なパイプラインの中で、あるいは様々なデータ入力に対しても再利用することができます。図3をご覧ください。 作成したカスタム・モデリング・ノードは、あらゆるパイプラインに追加することができ、パイプライン内でSASの予測技法と独自のオープンソース・ノード(群)を組み合わせたり競わせたりすることができます。あなたのパイプラインが「複数のオープンソース/SASアルゴリズムによるトーナメント」を実行すると、SASはあなたの仕様指定にベストフィットするモデルを特定するための評価を実行します。モデル比較ノードを使うと、「複数のオープンソース/SAS技法を管理しながら、最良のモデリング戦略を評価するためにそれらを比較する作業」のための、迅速で透明性の高い方法が実現します。図4をご覧ください。 SAS Visual Forecasting のグラフィカルなユーザ・インターフェースを使うことで、「ワークロードの分散処理」や「オープンソースとSASにまたがるモデル選択」など、プログラム的アプローチの全ての利用価値が手に入ります。しかし、それだけではありません。このアプローチには「生産性と透明性の向上」、「オーバーライド(手動調整)機能や例外管理機能も備えた、ガバナンスの効いたワークフロー」、「ビジュアライゼーション機能との統合」という追加のメリットもあります。これらのビジュアライゼーション機能はUIに組み込まれており、ユーザーは追加の労力なしで、時系列予測モデルをより的確に理解および評価できるようになります。その使い勝手は対話操作性と協働作業性に優れており、プログラマー以外の幅広いユーザー層が利用できます。 プログラム的アプローチを利用するか、Visual Forecasting のグラフィカルなユーザ・インターフェースの中でカスタム・モデリング・ノードを作成するかを問わず、SASは小規模なプロジェクトから全社規模のソリューションへの転換を図る取り組みに適した、拡張性と弾力性の高い時系列予測環境を実現します。 まとめ 要約すると、SAS Visual Forecastingはオープンソースによる時系列予測戦略の可能性を広げます。TSMODELはSAS Visual Forecastingの基底をなしているプロシジャであり、EXTLANGパッケージはオープンソース言語との統合を可能にします。TSMODELとEXTLANGの組み合わせによって “マジック” が生まれます。SASはオープンソース・スクリプトを分散処理します。SASは複数の入力データを同時並行で読み込みます。SASはオープンソース・コードの実行を分散処理します。SASは複数の出力データセットを同時並行で書き出します。分散処理、拡張性、弾力性 ──  要チェックです!

Analytics
SAS Japan 0
OSSによる時系列予測をSASで強化・拡張する(2/3)

この記事はSAS Institute Japanが翻訳および編集したもので、もともとはMike Gillilandによって執筆されました。オリジナルはこちらです(英語)。 またこれは、ゲストブロガーのジェシカ・カーティス(Jessica Curtis)とアンドレア・ムーア(Andrea Moore)による3部構成記事の第2部です(第1部はこちら)。 SASがオープンソースにもたらす価値 何よりもまず、SASは時系列予測用の入力データを分散処理します。SASは時系列予測のためにデータをインテリジェントに分割する方法を理解しており、例えば、時系列グループが様々なワーカーノードにまたがって分割されることはありません。その上で、SASはオープンソースのスクリプト群そのものを複数のワーカーノードにまたがって分散させ、オープンソース・コードの実行を分散処理します。より具体的に言うと、EXTLANGパッケージはPythonまたはRのコードを呼び出す際、個々のPython/Rインタプリタを複数のワーカーノードのそれぞれに振り向けます。その結果、複数の時系列は同時並行で処理されます。このことがスケーラビリティと効率性の観点から何を意味するかを考えてみてください。これにより、あなたは自社/自組織の時系列予測能力を「一つの時系列予測課題の解決」から「組織全体の多種多様な時系列予測課題の解決」へと広げることができるようになります。しかも、より迅速かつ大規模に解決することができます。 例えば、あなたの勤務先がグローバル小売企業だと想像してみてください。あなたのビジョンは、単一の一貫した時系列予測プラットフォームで会社全体の多種多様な時系列予測課題を解決することです。膨大な数のSKUの品揃えの需要予測から、サプライチェーン全体に展開すべき適切な在庫量の判断、各店舗における労働の最適化に至るまで、あらゆる取り組みにおけるあなたの目標は、アナリティクスに基づく正確な意思決定を推進することです。今日、あなたはちょうど、「財務計画の意思決定のための集計レベルの時系列予測」をR言語で開発するプロジェクトで、最初の作業パスを終えたところだとしましょう。R言語による時系列予測アプローチは多くの点で成功しているように見えますが、あなたは店舗の労働に関する意思決定をサポートするために、これらの時系列予測機能を拡張し、より高粒度なレベルでの時系列予測を開発することを目指しています。時系列予測担当アナリストのチームは小規模であるため、あなたには、多種多様な時系列予測ユースケースに対応するために効率的に処理規模を拡大・拡張できる自動化されたプロセスが必要不可欠です。 集計レベルでの財務計画のために、あなたは1,000個の時系列処理を実行しています。店舗別および部門別の店舗労働計画の場合、この数はあっという間に10万個へと膨れ上がります。SKU/店舗レベルのサプライチェーン計画では、時系列は数百万個に及びます。これは間違いなく、大規模な時系列予測課題だと思われます。「分散処理に対応したスケーラブルな時系列予測ソリューションのパワーによってのみ克服可能な課題」ということです。ようこそ、SAS Visual Forecasting の領域へ。 どのような大規模な時系列予測課題でも、成功のカギを握るのは自動化です。そしてそれこそ、SASが行うことです。SASは統計的予測プロセスおよびオープンソース・モデルの実行を自動化することにより、お客様のビジネスにおける時系列予測プロセスの効率化を推進します。TSMODELプロシジャとEXTLANGパッケージのパワーにより、SASはオープンソース・モデルの実行時間を加速することで、時系列予測プロセスの効率化を更に推進します。これにより、あなたのチームは「時系列予測モデルを一度に一つずつ作成する負担」が軽減し、真の例外ベースのプロセスへと移行することができます。解放された時間で、事業計画の取り組みや、予測対象を新しい領域に広げる取り組みに注力できるようになります。端的に言うと、少ないリソースで多くのことが行えるようになる、ということです。 いったんモデルを作成した後は、SASが自動的に複数の出力用データセットを生成します。これは単なる時系列予測を超えた機能です。これには「モデルの仕様」、「当てはめ統計量」、「パラメータ推定値」を格納している多種多様なデータセットも含まれています。次に、これらの出力用データセットは ── あなたのご想像通り ── 分散処理にかけられます。このリッチな出力用データはデータサイエンス・チームとビジネス・チームの両方に対し、「重要な需要推進要因」や「モデルの詳細」に関する多くの洞察をもたらします。統計的予測を信用していないビジネス部門の人々と交わしたことのある様々な議論を思い出してください。その点、SASが自動的に作成する出力用データセットは「モデルがなぜ、何を行うのか」を “見える化” するために役立ち、その結果としてビジネス部門側との議論の質が高まり、モデルの採用率が改善されます。 また、SAS Visual Forecasting は、内蔵されているベストプラクティスにより、オープンソース・モデル群の強化も行います。特許取得済みのデータ診断機能やモデル構築プロセスから、リコンサイル(調整)機能付きの自動階層型予測機能、さらには、統合型の時系列セグメンテーション機能に至るまで、SAS Visual Forecastingは単なるアルゴリズムを超えたレベルで、様々なベストプラクティスに基づくエンドツーエンドの時系列予測プロセスを提供します。 自動化機能、加速機能、強化機能は全て、お客様の組織のニーズに合わせた規模調整に対応可能です。組織全体の多種多様な時系列予測ユースケースに応じて処理規模を拡大(または縮小)することができます。製品階層やロケーション階層の最下位レベルの粒度まで掘り下げる大量かつ複雑な処理にも対応できる高度なスケーラビリティにより、任意のレベルで時系列予測を実行し、結果を生成することができます。「最初に上位レベルの時系列予測を作成/調整し、それを手作業で下位レベルに落とし込む(按分する)手法」に頼る必要はもうありません。SASは、ビジネス上の意思決定が行われるのと同じレベルで、高品質な時系列予測を自動的に生成します。 (第3部に続く)      

Analytics
SAS Japan 0
OSSによる時系列予測をSASで強化・拡張する(1/3)

この記事はSAS Institute Japanが翻訳および編集したもので、もともとはMike Gillilandによって執筆されました。オリジナルはこちらです(英語)。 ゲストブロガーのジェシカ・カーティス(Jessica Curtis)とアンドレア・ムーア(Andrea Moore)による3部構成記事の第1部にようこそ。 時系列予測はユビキタスな存在 時系列予測は、事実上あらゆる業種にわたり、ビジネスにおける多種多様な意思決定の中核を支えています。それはあなたの勤務先が、「膨大なSKUの品揃えの計画」や「配送センターや店舗の労働計画の改善」に取り組む小売企業であるか、需要計画プロセスの刷新に取り組んでいる消費財企業であるかを問いません。あるいは、デジタル広告/在庫計画/価格設定のために時系列予測を活用しているメディア企業や、最適なリソース配分のためにネットワーク利用率を予測している通信企業など、挙げればきりがありません。より優れた予測を得ることのインパクトは、あらゆる企業・組織における “ビジネス上の意思決定” に広範囲かつ抜本的な向上効果をもたらします。 44年以上にわたり、SASは世界各地の数千社の企業のために大規模な時系列予測プロセスを改善し続けています。SASはその間、統計的予測の精度向上と時系列予測作成プロセスの効率化を通じて最終利益の押し上げに貢献する強固な時系列予測ソフトウェアを開発および強化し続けてきました。これは決して大げさな表現ではありません。実際、当社は何冊も書籍を出しています。 SASの最新の時系列予測テクノロジーを搭載したSAS Visual Forecasting は、全社規模の様々な時系列予測課題を迅速かつ自動的に解決するための唯一無二の機能を提供します。SAS Visual Forecastingは、最新鋭の各種アルゴリズム ── 機械学習、時系列、アンサンブル ── だけでなく、過去データの診断、複雑な階層にまたがる自動予測、予測の例外管理に関する内蔵型ベストプラクティスも搭載しています。SAS Visual Forecastingの中核にある信条の一つは、「オープンソースのモデルを実行し、それらを大規模にデプロイ(業務実装)するための、オープン・エコシステムを提供する」ということです。 現在、オープンソース・ソフトウェア(OSS)は時系列予測モデルを開発するために広く使われています。多くの企業・組織がオープンソース戦略に取り組み始めており、PythonやRを活用して時系列予測を作成していますが、組織全体の多種多様な時系列予測ユースケースに対応するべく規模を拡張しようとしたときに様々な難題に直面しています。オープンソースの時系列予測モデルを「SASのソリューション」(以下、単に「SAS」)で実行することには複数のメリットがあり、既存のオープンソース戦略に立脚しながら俊敏かつ効率的な方法を確立することができます。もはや、SASとオープンソースのいずれかを選択する必要はなく、両者は真の相補的な関係にあります。 オープンソースで開始する 多くの企業・組織は、頑健な時系列予測を作成することに苦戦しているほか、様々な時系列予測ユースケースのために規模を拡張しようとしたときに難題に直面しています。個々の時系列予測課題には、データが徐々に増加し、複雑性も増大していくという問題が伴います。 例えば、あなたの勤務先が通信企業で、あなたは追加のインフラ(例:携帯電話網のセル)投資を行うべき場所に関する意思決定をガイドするために、データ帯域幅の需要を予測する必要があるとします。新規インフラ投資を計画するためには、帯域幅需要が時の経過とともにどのように変化するかを理解する必要があります。そこであなたは、市場における総需要が徐々に増加する様子を推計するために、オープンソースの時系列予測ソリューションを構築します。そこから得られる予測は、ネットワークをどれほど拡大するべきかに関する年間計画の基礎となります。そしてあなたは、計画プロセスへのアナリティクス活用について高く評価されたとしましょう。次のサイクルでは、計画のための単独の総合的な予測ではなく、「追加データの取り込みを伴う分析」と「通信インフラの個々の構成要素に関する予測の作成」を依頼されることになりました。 図1は今回の要請が「市場だけでなく、個々の都市/中継局/ノード/構内も対象とした予測」であることを示しています。この分析には、大量のデータと多数の時系列を用いて数千あるいは数百万もの時系列予測を生成する作業に対応できる処理規模の拡張性が必要不可欠です。上位レベルの値を下位レベルの値へと配分するのではなく、高粒度レベルの個々のネットワーク・コンポーネントに関する統計的予測を集計していくことが、予測精度の向上へとつながるからです。こうした予測精度の向上が実現すれば、資本計画プロセスは更に洗練されたものとなり、リソースは最も必要性の高い場所にピンポイントで、適切なタイミングで配分されるようになります。 これはネットワーク計画に固有の話ではなく、同じテーマの議論が全ての業種で繰り返されています。ここで必要とされているのはパラダイム・シフトです。あなたはもはや、個々の時系列予測を手作業でチューニングすることはできません。数量が大きすぎるからです。 必要なのは、「あらゆるタイプのユーザー(例:プログラマーと非プログラマー)が “モデルの構築” や “高品質な時系列予測の生成” において生産的になること」および「分散環境でデータを高速に処理すること」を可能にするソリューションです。そうしたソリューションでは様々なプロセスの自動化が、高精度な時系列予測の生成を促進します。 ここまで来ると、予測モデルを構築するだけの話ではなくなります。それよりも遥かに大規模な取り組みになります。また、時系列予測の結果を事業計画プロセスに統合することも必要になります。そのためには、多くのユーザーが結果を確認・操作したり、必要に応じて処理を追加したりできるようなソリューションが必要です。また、結果を共有できる機能や、ビジネスユーザーが業務プロセスの中で結果を利用できる機能も重要です。 多くの企業が難題に直面している理由は、これまでの努力を無駄にしたくないと考えたり、継続性を懸念したりしている一方で、自社の現在のオープンソース・アプローチが既に限界に達していると気付いているからです。 SASのソリューションはオープンソースを強化・拡張する 全社的/全組織的な時系列予測の取り組みにおいてオープンソース・アプローチが限界に達したとしたら、それこそSASが本領を発揮する状況です。オープンソースの時系列予測モデルを構築するために投じてきた膨大な作業の全てを失いたくないと思うのは当然のことです。実際問題、それらを失う必要はありません。SASのアプローチでは、オープンソースのモデル群をSAS Visual Forecastingに取り込んだ上で、それらの利用価値を拡張します。 SAS Visual Forecastingによるオープンソース統合の基礎となっているのは、TSMODELプロシジャとEXTLANGパッケージです。TSMODELは、SAS Visual Forecastingの基底をなしているプロシジャです。EXTLANGパッケージは、外部言語(例:PythonやRなど)のシームレスな統合を可能にします。 TSMODELとEXTLANGは「オープンソースによる時系列予測戦略」を改善します。SASはこれらの技法を通じて、オープンソースのモデルを実行するための「分散処理に対応した拡張性・弾力性の高い方法」を提供します。データの準備から、モデルの開発、モデルのデプロイに至るまで、アナリティクス・ライフサイクルの全てのステップにおいて、SASはオープンソースの時系列予測モデルを強化します。SASはPythonやRで作成されたモデルに対してオープンなだけでなく、分析ワークロードを自動的に分散処理することでオープンソースを拡張します。ちょっと立ち止まって掘り下げましょう。言い換えると、SASが「オープンソースのモデルを改善する」というのは、ひとつには、「その実行を高速化する」ということです。また、それ以外にも、SASが備える数々の “実証済みの利用価値の高い機能性” も手に入ります。もし興味をそそられたのなら、どうぞ読み進めてください。 (第2部に続く)

1 7 8 9 10 11 24