While SAS program development is usually done in an interactive SAS environment (SAS Enterprise Guide, SAS Display Manager, SAS Studio, etc.), when it comes to running SAS programs in a production or operations environment, it is routinely done in batch mode. Why run SAS programs in batch mode? First and
Search Results: Visual Analytics (1744)
100년만의 최악의 허리케인, 푸에르토리코를 덮치다 지난 9월 20일, 북대서양과 카리브해 사이에 있는 미국 자치령 푸에르토리코(Puerto Rico)에 초강력 허리케인 마리아(Maria)가 상륙했습니다. 마리아는 시속 185마일(295㎞) 이상의 최고 단계인 5등급 허리케인으로 100년만의 최악의 피해를 남겼습니다. 더욱이 일명 괴물 허리케인이라고 불린 5등급 허리케인 어마(Irma)에 이어 단 2주만에 불어 닥친 재해로 340만 주민들은 엄청난 충격에
There are so many reasons why SAS programmers love SAS -- as a matter of fact, I wrote a blog on it back in 2012. I now realize that I could've written a whole series, not just a single post. And with the recent publishing of my first book, Big Data
SAS Viya is an exciting addition to the SAS Platform, allowing you to conduct analysis faster than ever before and providing you the flexibility to utilize open source technologies and generate insights from data in any computing environment. The blog post “Top 12 Advantages of SAS Viya” does a great
この記事はSAS Institute Japanが翻訳および編集したもので、もともとはHui Liによって執筆されました。元記事はこちらです(英語)。 この記事では、関心対象の課題に適した機械学習アルゴリズムを特定・適用する方法を知りたいと考えている初級~中級レベルのデータ・サイエンティストや分析担当者を主な対象者としたガイド資料を紹介し、関連の基本知識をまとめます。 幅広い機械学習アルゴリズムに直面した初心者が問いかける典型的な疑問は、「どのアルゴリズムを使えばよいのか?」です。この疑問への答えは、以下を含む数多くの要因に左右されます。 データの規模、品質、性質 利用できる計算時間 タスクの緊急性 データの利用目的(そのデータで何をしたいのか?) 経験豊富なデータ・サイエンティストでも、どのアルゴリズムが最も優れたパフォーマンスを示すかは、複数の異なるアルゴリズムを試してみなければ判断できません。本稿の目的は、特定の状況にのみ有効なアプローチを紹介することではなく、「最初に試すべきアルゴリズム」を何らかの明確な要因にもとづいて判断する方法についてガイダンスを示すことです。 機械学習アルゴリズム選択チートシート この機械学習アルゴリズム選択チートシートは、幅広い機械学習アルゴリズムの中から特定の課題に最適なアルゴリズムを見つけ出すために役立ちます。以下では、このシートの使い方と主要な基礎知識をひと通り説明します。 なお、このチートシートは初心者レベルのデータ・サイエンティストや分析担当者を対象としているため、推奨されるアルゴリズムの妥当性に関する議論は省いてあります。 このシートで推奨されているアルゴリズムは、複数のデータ・サイエンティストと機械学習の専門家・開発者から得られたフィードバックやヒントを取りまとめた結果です。推奨アルゴリズムについて合意に至っていない事項もいくつか残っており、そうした事項については、共通認識に光を当てながら相違点のすり合わせを図っているところです。 利用可能な手法をより包括的に網羅できるように、手元のライブラリが拡充され次第、新たなアルゴリズムを追加していく予定です。 チートシートの使い方 このシートは一般的なフローチャートであり、パス(楕円形)とアルゴリズム(長方形)が配置されています。各パスでYES/NO、または高速性/正確性を選びながら最終的に到達したものが推奨アルゴリズムとなります。いくつか例を挙げましょう。 次元削減を実行したいものの、トピック・モデリングを行う必要がない場合は、主成分分析を使うことになります。 次元削減が不要で、応答があり、数値を予測する場合で、高速性を重視するときには、デシジョン・ツリー(決定木)または線形回帰を使います。 次元削減が不要で、応答がない場合で、階層構造の結果が必要なときには、階層的クラスタリングを使います。 場合によっては、複数の分岐に当てはまることもあれば、どの分岐にも完璧には当てはまらないこともあるでしょう。なお、利用上の重要な注意点として、このシートは、あくまでも基本的な推奨アルゴリズムに到達できることを意図しているため、推奨されたアルゴリズムが必ずしも最適なアルゴリズムでない場合もあります。多くのデータ・サイエンティストが、「最適なアルゴリズムを見つける最も確実な方法は、候補のアルゴリズムを全て試してみることだ」と指摘しています。 機械学習アルゴリズムのタイプ このセクションでは、機械学習の最も一般的なタイプを取り上げ、概要を示します。これらのカテゴリーについて十分な知識があり、具体的なアルゴリズムの話題に進みたい場合は、このセクションを飛ばし、2つ先のセクション「各種アルゴリズムの概要と用途」に進んでいただいてかまいません。 教師あり学習 教師あり学習アルゴリズムは、実例のセット(入力データと出力結果)を基に予測を行います。例えば、過去の販売データを用いて将来の価格を推定することができます。教師あり学習では、ラベル付きのトレーニング用データからなる入力変数と、それに対応する望ましい出力変数があります。アルゴリズムはトレーニング用データを分析し、入力を出力にマッピングする関数を学習します。この関数は、トレーニング用データにおける入力/出力の関係を一般化することによって推定されます。この関数に新しい未知の入力データを与えると、それに対応する出力が算出され、その出力が未知の状況における結果の予測値となります。 分類:データを用いてカテゴリー変数を予測する場合、教師あり学習は「分類」と呼ばれます。これは例えば、画像にラベルや標識(例:犬または猫)を割り当てるようなケースです。ラベルが2つしかない場合は「2値(バイナリ)分類」、3つ以上のラベルがある場合は「マルチクラス分類」と呼ばれます。 回帰:連続値を予測する場合、その教師あり学習は「回帰問題」となります。 予測:過去と現在のデータを基に将来を予測するプロセスであり、最も一般的な用途は傾向分析です。具体例として一般的なのは、当年度および過去数年の販売実績を基に次年度の販売額を推定することです。 半教師あり学習 教師あり学習を行う上での課題は、ラベル付きデータの準備に多大な費用と時間がかかりかねないことです。ラベル付きデータが限られている場合には、ラベルなしの実例データを用いて教師あり学習を強化することができます。これを行う場合は、機械にとって完全な「教師あり」ではなくなるため、「半教師あり」と呼ばれます。半教師あり学習では、ラベルなしの実例データと少量のラベル付きデータを使用することで、学習精度の向上を図ります。 教師なし学習 教師なし学習を実行する場合、機械にはラベルなしのデータのみが与えられます。学習の目的は、クラスタリング構造、低次元の多様体、スパース(疎)ツリーおよびグラフなど、データの基底をなす固有パターンを発見することです。 クラスタリング:あるグループ(=クラスター)内の実例データ群が、その他のグループ内の実例データ群との間と比べ、(所定の基準に関して)高い類似性を示すような形で、実例データセットをグループ化します。この手法は、データセット全体を複数のグループにセグメント化する目的でよく使われます。グラスタリングの実行後に各グループ内で分析を実行すると、固有パターンを容易に発見できることが多々あります。 次元削減:検討の対象とする変数の数を減らします。多くの用途では、生データに極めて多次元の特徴が含まれており、一部の特徴は目的のタスクに対して冗長または無関係です。次元削減は、データに潜む真の関係性を発見するために役立ちます。 強化学習 強化学習は、環境からのフィードバックを基に「エージェント」(課題解決の主体者。例:ゲームのプレイヤー)の行動を分析および最適化します。機械は、取るべきアクションの選択肢を事前に教えられるのではなく、どのようなアクションが最大の報酬(例:ゲームのスコア)を生み出すかを発見するために、さまざまなシナリオを試行します。他の手法には見られない強化学習ならではの特徴は「試行錯誤」と「遅延報酬」です。 アルゴリズム選択時の考慮事項 アルゴリズムを選択する際は、正確性、トレーニング時間、使いやすさという3つの側面を常に考慮する必要があります。多くのユーザーは正確性を第一に考えますが、初心者は自分が最もよく知っているアルゴリズムに意識が向きがちです。 データセットが与えられたとき最初に考える必要があるのは、どのような結果になるにせよ、何らかの結果を得る方法です。初心者は、導入しやすく結果が素早く得られるアルゴリズムを選ぶ傾向がありますが、分析プロセスの最初の段階ではそれで問題ありません。まずは、何らかの結果を得て、データの概要を把握することを優先します。その後、データに対する理解を深め、結果をさらに改善することを目指し、より高度なアルゴリズムを試すことに時間を費やせばよいのです。 ただしこの段階でも、最高の正確性を示した手法が必ずしもその課題に最適なアルゴリズムであるとは限りません。通常、アルゴリズムから本来の最高パフォーマンスを引き出すためには、慎重なチューニングと広範囲のトレーニングが必要になるからです。 各種アルゴリズムの概要と用途 個別のアルゴリズムについて知識を深めることは、得られる結果と使い方を理解するために役立ちます。以下では、チートシートに掲載されている中でも最も基本的なアルゴリズムの詳細と、それらを使用すべき状況に関するヒントをまとめます。 線形回帰とロジスティック回帰 線形回帰は、連続従属変数 (y) と1つ以上の予測変数 (X) との関係をモデリングするためのアプローチです。この場合、(y) と
노벨상의 유래 매년 10월 초, 전 세계의 이목이 스웨덴과 노르웨이로 쏠립니다. 바로 세계에서 가장 권위 있는 시상식 '노벨상(The Nobel Prize)'이 열리기 때문인데요. 노벨상은 다이너마이트를 발명해 거대 재벌이 된 스웨덴 화학자 알프레드 노벨(Alfred Nobel)의 유언에 따라 그가 남긴 재산으로 노벨 재단을 설립하며 시작됐습니다. 최초의 노벨상은 1901년 물리학, 화학, 생리학 및 의학, 세계
그래비티(2013), 인터스텔라(2014), 마션(2015), 컨택트(2016), 패신저스(2017)까지, 여러분은 이중 몇 편의 영화를 보았나요? 최근 우주에 대한 공상과학(SF) 영화가 한해도 빼놓지 않고 박스 오피스를 기록해왔습니다. 컴퓨터 그래픽(CG) 기술 발전의 공이 크겠지만, 1969년 아폴로 11호의 인류 최초 달 착륙을 시작으로 혁신을 거듭해온 항공•우주 과학 기술 역시 큰 영향을 미쳤을 텐데요. 과학 기술의 진보와 함께
In meinem vorherigen Blog bin ich darauf eingegangen, was künstliche Intelligenz (KI) bereits kann – und dass der Hype längst noch nicht in der operativen Realität bei Unternehmen angekommen ist. Letzteres ist eine Erkenntnis der aktuellen SAS Studie „The Enterprise AI Promise: Path to Value“. Was die Umfrage darüber hinaus
Something Stupid – eines der berühmtesten musikalischen Duette von Frank Sinatra und seiner Tochter Nancy kennt wahrscheinlich jeder. Ein anderes Duett hat sich in den letzten Jahren im Datenanalyse-Umfeld zusammengetan – Business Intelligence und Advanced Analytics. Ob das „something stupid“ oder doch eine ganz smarte Idee ist, wird in diesem
Need to grant one or more users access to part of your secure SAS configuration directory? You can do it without opening up your SAS configuration directory to everyone. Most SAS 9.4 Platform deployments on Unix have been done using the SAS Installer account known as sas. The sas account
‘호모 나랜스(Homo Narrans)’라는 단어를 들어보셨나요? ‘이야기하는 사람’을 뜻하는 라틴어로 1999년 미국의 영문학자 존 닐(John Niels)이 동일 제목의 저서를 통해 처음 소개했습니다. 그는 인간은 태생적으로 이야기하려는 본능을 가지며, 이야기를 주고받지 않고서는 살아갈 수 없고, 이야기를 통해 사회를 이해한다고 설명했는데요. 이야기는 기억에 남으며, 사람과 감정적으로 연결되고, 행동을 고취시킵니다. ‘이야기하다’라는 뜻의 ‘스토리텔링(Storytelling)’은 지속적이며
There are many compelling reasons existing SAS users might want to start integrating SAS Viya into their SAS9 programs and applications. For me, it comes down to ease-of-use, speed, and faster time-to-value. With the ability to traverse the (necessarily iterative) analytics lifecycle faster than before, we are now able to generate
In a SAS Viya 3.2 environment two types of content can be created: SAS Visual Analytics Reports and Data Plans. For administrators, who may want to manage that content within a folder structure, there are some things to keep in mind. In the current release, both types of content can be
Every year in early October, the eyes of the world turn to Sweden and Norway, where the Nobel Prize winners are announced to the world. The Nobel Prize is considered the world's most prestigious award. Since 1901, the Prize has been presented to individuals and organizations that have made significant
Modelle im Risikomanagement sind essenziell. Sie helfen uns dabei, das Risiko eines Unterfangens auf Basis weniger Einflussgrößen vorherzusagen. Die Kunst der Modellierung besteht nun darin, die wichtigsten Faktoren zu bestimmen und einen komplexen Zusammenhang vereinfacht so abzubilden, dass die Aussagekraft relevant ist. Das heißt, modellbasierte Prognosen sollen möglichst nahe an
Blogparade startet: Vor Kurzem wurde ja bereits der analytisch beste Ort der Welt gefunden und gekürt. Dazu hat SAS aus fast 150.000 Orten in rund 200 Ländern jede Menge Daten gesammelt und mit modernsten Machine-Learning-Verfahren ausgewertet. Rund 100 sogenannte Prädiktoren, also mögliche Einflussgrößen auf „paradiesische“ Verhältnisse, spuckten West Perth aus
12 hours: That’s how quickly you can die from sepsis. Oh – you’ve never heard of sepsis? Not surprising. More Americans have heard of Ebola, a nearly non-existent condition in the U.S., than sepsis – a condition that affects more than 1.6 million Americans every year. Sepsis is the body’s
Whether you are a SAS code creator, a blogger, a technical writer, an editor-in-chief, an executive, a secretary, a developer or programmer in any programming language or simply someone who uses computer or hand-held device for writing, you need to read this blog post – your life is about to
La lucha contra el VIH no es sinónimo de reportes interactivos o cuadros de mando, probablemente tampoco se ligue a servicios de comida para pacientes con cáncer o servicios de asistencia médica. CrescentCare ha hecho esfuerzos importantes para mejorar los servicios de salud, una pieza elemental en este esfuerzo es
No haber nacido en la era de la conectividad ha dejado de ser una excusa válida. Tendencias como las del Big Data, Analytics, Cloud o Mobile están redefiniendo los negocios en la actualidad y poco importa si se trata de un líder de la vieja guardia o si tiene la
Hopefully if you're viewing the eclipse today, you'll be using one of the safe methods that won't harm your eyes! ... But if you're somewhat of a trickster, here's an optical illusion you can send your friends after the eclipse, that might make them wonder (just for a second) if
In this blog post I am going to cover the example of importing data into SAS Viya using Cloud Analytic Services (CAS) actions via REST API. For example, you may want to import data into a CASLib via REST API. This means you can perform an import of data outside
En los últimos años la analítica se ha convertido en el driver para cambiar al mundo y una muestra de ello son Colpatria en Colombia, Club Premier en México y VTR en Chile que muestran resultados importantes en transformación digital gracias al mejor aprovechamiento de sus datos. En frentes como el
The Cloud Analytic Server (CAS for short) is SAS’ latest high-performance, scalable, in-memory analytic data server. In this post, I’d like to discuss the CAS physical data model, i.e.what features CAS offers for data storage, and how to use them to maximize performance in CAS (and consequently SAS Visual Analytics
SAS Viyaでは購入前に使い勝手を試していただくため、無償使用版を提供しています。 https://www.sas.com/ja_jp/software/viya.html#preview もう試していただいた方もいらっしゃるかもしれませんが、SAS StudioやJupyter Notebook、Visual AnalyticsからSAS Viyaを操作して、データマイニングや機械学習を便利に試していただくことが可能です。 この無償使用環境では動作確認済みのデモプログラムを提供していますので、機械学習やプログラミングに不慣れでも迷うことはありません。 しかし機械学習を実業務で使い始めようとすると、どのプロシージャやメソッドを使えば良いのか、わからなくなることが多々あります。 SAS Viyaでは機械学習ユーザに不足ないよう、多種多様なプロシージャを提供していますが、プロシージャが増えるとどの場面でどれを使うんだっけ?と迷ってしまいます。 そこで、SAS Viyaのチートシートを作ってみました。 このチートシートを使えば、用途にあわせて必要なプロシージャを選択していくことができます。 SAS Viyaが提供するプロシージャから重要なものを掲載しています。 SAS ViyaはSAS PROCとActionsetという2種類のプログラミング仕様があります。 チートシートもPROC用とActionset用で2種類作りました。 PDF版は以下にありますので、ぜひご参照ください。 viya_cheat_sheet_20170721_jp
Wo können Sie Ihr Können mit dem von anderen Experten vergleichen? Und in der Data Science Community über den Tellerrand blicken? Oder einfach ungezwungen programmieren - wie zu Studienzeiten - weil es Spaß macht? Zum Beispiel bei einem Hackathon. Mit Fabian Buchert, selbst Data Scientist, sprach ich über seine Erfahrungen beim
Wollten Sie schon immer mal an einem Ort leben, wo es kostenlosen öffentlichen Nahverkehr gibt, die höchste Dichte an Self-Made-Millionären herrscht, wo jedem Einwohner umgerechnet ca. fünf Golfplätze an Grünflächen zur Verfügung stehen oder es 84.274,6 km Fußgängerwege gibt? Willkommen in West Perth! Zumindest analytisch gesehen ist der kleine Stadtteil
For colleges and universities, awarding financial aid today requires sophisticated analysis. When higher education leaders ask, “How can we use financial aid to help meet our institutional goals?” they need to consider many scenarios to balance strategic enrollment goals, student need, and institutional finances in order to optimize yield and
최근 금융, 통신, 자동차, 공공, 리테일, 교육 등 모든 산업을 관통하고 있는 한 단어가 있습니다. 바로 4차 산업혁명인데요. 빅데이터, 사물인터넷(IoT), 인공지능(머신러닝), 로봇 등 첨단 ICT 기술의 융합으로 완성되는 4차 산업혁명은 미래 산업의 필수 성장 동력으로 자리잡았습니다. 그 중에서도 특히 제조업은 이른바 ‘인더스트리 4.0’의 촉발과 함께 그 새로운 혁명의 시작을 알렸는데요.
In this blog post I’d like to explore how to create a custom group in SAS Viya to restrict access to functionality. To illustrate my points, we will create a report developers custom group and ensure that only users of that group can create reports and analysis in SAS Visual Analytics.