All Posts

Data with a geographic component begs to be mapped. That capability is now available to all SAS users. A new mapping procedure in the fifth maintenance release of 9.4 (SAS 9.4M5) allows any user to easily plot data on a map. Unlike previous mapping applications with SAS, the SGMAP procedure

블록체인, 전 세계를 뒤흔들다 최근 전 세계를 분 단위로 뒤흔들며 폭발적인 관심을 끌고 있는 화젯거리가 있습니다. 바로 비트코인(bitcoin)을 필두로 급팽창 중인 가상 화폐(virtual currency) 시장입니다. 이달 초 미국에서는 비트코인을 구매하기 위해 모기지(주택담보대출)를 빌리는 등 극단적인 투기 양상까지 나타나며 논란을 일으키기도 했는데요. 그 가운데 산업별 전문가들은 가상 화폐의 기반 기술인 블록체인(blockchain)에 주목하고 있습니다. ‘제 2의

Die Abbildung einer möglichen zukünftigen Situation ist eine Kernaufgabe des Risiko-Managements. Dazu werden unterschiedlich komplexe Modelle mit möglichen Szenarien durchgerechnet. Hierbei erhält man pro Szenario und Vorhersage-Zeitpunkt ein Ergebnis. Bei mehrperiodischen Vorhersagen (z. B. bei Kredit-Portfolien oder Lebensversicherungen) gibt es pro Szenario einen Ergebnis-Pfad. Im Folgenden zeige ich, wie man mit

I was recently reading the Wikipedia page about the U.S. presidents. There was a table with a lot of interesting data, but I thought it would be much easier to get a handle on the information if there was also a timeline graph. So, of course, I set out to

Meetup ist ein Online-Social-Networking-Service mit einem kleinen Unterschied zu Facebook, Instagram, LinkedIn & Co. Das Format ist dazu gedacht, Face-to-Face-Treffen zu interessanten Themen zu organisieren. Die Offline-Welt ist also ein elementarer Bestandteil. Selbstorganisiert und thematisch vielfältig Gruppen gibt es zu fast jedem Thema: Bücherclubs, Socialising, R-Nutzer, Unternehmer oder künstliche Intelligenz

SAS Data Preparation 2.1 is now available and it includes the ability to perform data quality transformations on your data using the definitions from the SAS Quality Knowledge Base (QKB). The SAS Quality Knowledge Base is a collection of files which store data and logic that define data quality operations

Jim Harris says a data-driven business can make decisions faster, using better data, with more transparency about results.

Liebe und Mathematik: Auf den ersten Blick gibt es wohl keine zwei Welten, die weiter voneinander entfernt sind. Hannah Fry hat auf der Analytics Experience in Amsterdam das Gegenteil bewiesen: Mathematik kann das Geheimnis einer glücklichen Partnerschaft aufdecken und sogar eine Scheidung vorhersagen. Im Gespräch geht die Dozentin für „Mathematics

It’s that time of year again! Time for colds and runny noses and sniffles and sneezing. With an 11 month old in daycare, I am very aware that it is cold and flu season. Luckily there are plenty of things that can be done to help prevent colds and other

SAS Viyaがリニューアルされまして、ついにディープラーニングが登場しました! SAS ViyaのディープラーニングではオーソドックスなDeep Neural Network(DNN)から、画像認識で使われるConvolutional Neural Network(CNN、畳込みニューラルネットワーク)、連続値や自然言語処理で使われるRecurrent Neural Network(RNN、再帰的ニューラルネットワーク)まで利用可能になります。 ディープラーニングを使うことのメリットは、従来の機械学習やニューラルネットワークが苦手としている画像や文章を認識し、高い精度で分類や推論することが可能になります。 高い精度というのは、ディープラーニングのモデルによっては人間の目よりも正確に画像を分類することができるということです。 例えばコモンドールという犬種がありますが、この犬はモップのような毛並みをしていて、人間ではモップと見間違えることがあります。 これは犬? それともモップ? こういう人間だと見分けにくい画像に対しても、ディープラーニングであれば、人間よりも正確に犬かモップかを見分けることができるようになります。 というわけで、今回はSAS Viyaのディープラーニングを使って画像分類をしてみたいと思います。 ディープラーニングの仕組み 画像分類のディープラーニングではCNNを使います。 CNNは画像の特徴を探し出す特徴抽出層と特徴から画像を分類する判定層で構成されています。 特徴抽出層は主に畳込み層とプーリング層で構成されています。 畳込み層で入力画像に対し、ピクセルの特徴(横線の有無とか斜め線とか)を探し出し、プーリング層で重要なピクセルを残す、という役割分担です。 判定層は、特徴抽出層が見つけた特徴をもとに、画像の種類を分類します。 例えば犬と猫の分類であれば、特徴抽出層が入力画像から、面長で大きな鼻の特徴を見つけだし、犬と分類します。 または、丸っこい顔立ちと立った耳の特徴を見つけだし、猫と分類します。 SAS Viyaで画像を扱う SAS ViyaディープラーニングでCifar10をネタに画像分類をしてみたいと思います。 Cifar10は無償で公開されている画像分類のデータセットで、10種類の色付き画像60,000枚で構成されています。 各画像サイズは32×32で、色はRGBです。 10種類というのは飛行機(airplane)、自動車(automobile)、鳥(bird)、猫(cat)、鹿(deer)、犬(dog)、蛙(frog)、馬(horse)、船(ship)、トラック(truck)で、それぞれ6,000枚ずつ用意されています。 画像は総数60,000枚のうち、50,000枚がトレーニング用、10,000枚がテスト用です。 画像データは以下から入手することができます。 https://www.cs.toronto.edu/~kriz/cifar.html さて、Cifar10を使って画像分類をしてみます。言語はPython3を使います。 SAS Viyaで画像分類をする場合、まずは入手したデータをCASにアップロードする必要があります。 CASはCloud Analytics Servicesの略称で、インメモリの分散分析基盤であり、SAS Viyaの脳みそにあたる部分です。 SAS Viyaの分析は、ディープラーニング含めてすべてCASで処理されます。 CASではImage型のデータを扱うことができます。 Image型とは読んで字のごとくで、画像を画像フォーマットそのままのバイナリで扱えるということです。

No cabe duda que la tecnología Blockchain está llamada a ser una de las grandes revoluciones en el mundo en los próximos años. Se ha llegado a afirmar que hará por las transacciones lo que internet ha hecho por la información y las comunicaciones; va a cambiar definitivamente la forma

The SAS language is large. Even after 20+ years of using SAS, there are many features that I have never used. Recently it became necessary for me to learn about DICTIONARY tables in PROC SQL (and the associated SASHELP views) because I needed to programmatically obtain the text for the

PROC FREQ is one of the most popular procedures in the SAS language. It is mostly used to describe frequency distribution of a variable or combination of variables in contingency tables. However, PROC FREQ has much more functionality than that. For an overview of all that it can do, see

Donald Trump is pretty spry and energetic for an old guy - he's currently 71 years old, and seems to have more energy than I do (and I'm about 20 years his junior). But is he the oldest US president? Well, as with many questions ... it depends. Follow along

Driving to work today I was thinking about the "funk" that has descended upon me over the last few weeks. Shorter days and less light? Dry skin and a stuffy nose? Old and cranky? Maybe all of those are true, but as I reflect, I realize it happens every year