Machine Learning

Get the latest machine learning algorithms and techniques

Analytics | Machine Learning
Thomas Keil 0
Künstliche Intelligenz braucht Interpretierbarkeit, Nachvollziehbarkeit und Kommunikation

Wahrscheinlich schreibt Richard David Precht gerade an einem Buch über künstliche Intelligenz – und es wäre wirklich nicht schlecht, wenn sich möglichst viele Menschen so genau wie möglich über dieses Thema informieren könnten, ohne selbst Spezialist sein zu müssen. Denn, das ist 2017 bereits klar geworden, künstliche Intelligenz betrifft uns

Advanced Analytics | Internet of Things | Machine Learning
SAS Korea 0
2018년과 미래를 관통할 2가지 기술 트렌드

자율주행차, 커넥티드 기기, 디지털 트랜스포메이션, 사물인터넷(IoT), 머신러닝, 인공지능(AI), 자동화 등 2017년 한 해를 주도해온 기술 트렌드는 2018년은 물론 그 미래에까지도 계속될 것입니다. 실질적인 차이는 이 기술들의 결합에서 찾을 수 있는데요. 한 예로, 인공지능과 사물인터넷은 그 자체로 트랜스포메이션의 성격(transformative)을 지닙니다. 사물인공지능(artificial intelligence of things)으로 구현될 연결되고 자동화된 세상의 디지털 트랜스포메이션을 상상해보세요. 2018년에는 지능(intelligence)과

Analytics | Machine Learning
Thomas Keil 0
Künstliche Intelligenz 2018: Welcome to the Analytics Economy!

Jahreswechsel bieten sich für Bestandsaufnahmen an. Mit ein wenig Abstand betrachtet fällt mir auf, dass die Spezialisten-Themen „Analytics“, „Big Data“ und vor allem „künstliche Intelligenz“ (KI) längst im publizistischen Mainstream angekommen sind. Täglich erscheinen in allen möglichen Publikumszeitschriften neue Artikel, die zwischen Euphorie und Pessimismus jede Facette anbieten. Grund genug,

Advanced Analytics | Artificial Intelligence | Machine Learning
SAS Korea 0
머신러닝 해석력 시리즈 1탄: 인공지능(AI)과 머신러닝을 신뢰하기 위한 필수 조건, 해석력!

음악 추천부터 대출 심사, 직원 평가, 암 진단까지 현대 사회는 인공지능(AI)과 머신러닝 기반의 애플리케이션에 둘러싸여 있습니다. 기계가 사람을 대신해 내린 의사결정에 점점 더 많은 영향을 받고 있는데요. 일상적인 것부터 사람의 목숨이 걸린 중대한 의사결정에 이르기까지 우리는 머신러닝 모델에 수많은 질문을 던집니다. 이때 질문에 대한 답변은 ‘예측 모델’이 결정합니다. 생소하고 어려운 개념인데요. 데이터

Advanced Analytics | Analytics | Artificial Intelligence | Data Management | Machine Learning
Charlie Chase 0
Why do we rely on judgment when analytics outperforms it?

Wherever there is uncertainty there has got to be judgment, and wherever there is judgment there is an opportunity for human fallibility. Donald Redelmeirer, physician-researcher Recently, I read a fascinating book titled The Undoing Project: A Friendship That Changed Our Mind by Michael Lewis (W.W. Norton & Company, 2017). Lewis

Fraud & Security Intelligence | Machine Learning
SAS Korea 0
미국 금융소비자보호국, 텍스트 분석과 머신러닝으로 불공정 행위에 대응하다

금융소비자보호국, 불공정 행위로부터 소비자 보호 버락 오바마 미국 전 대통령은 2008년 글로벌 금융 위기 이후 소비자 보호를 강화하고, 금융 업계를 규제함으로써 사태 재발을 막기 위해 다양한 노력을 기울였습니다. 그 중 하나가 바로 2011년 월스트리트에 대한 연방 감독 기구로 출범한 미국 금융소비자보호국(CFPB; Consumer Financial Protection Bureau)인데요. 금융소비자보호국은 소비자를 불공정 행위, 사기, 권력

Data Management | Internet of Things | Machine Learning
Helmut Plinke 0
Was kommt eigentlich 2018 … in Sachen Datenmanagement?

Welche Veränderungen bringt 2018 im Datenmanagement? Ich habe Experten nach ihrer Meinung zu den Technologietrends 2018 gefragt und sie mit meinen eigenen Erwartungen verglichen. Herauskristallisiert haben sich fünf große Trends, die uns meiner Ansicht nach dieses Jahr im Datenmanagement begleiten: 1. Datenbewegung wird wichtiger Cloud-Anbieter haben bereits gezeigt, wie einfach es

Analytics | Fraud & Security Intelligence | Machine Learning
SAS Korea 0
유럽 보험 업계, 인공지능(AI)으로 혁신을 꾀하다

일본의 한 보험 회사가 올해부터 보험 계약 절차와 정보 조회 등 사무 작업의 90%를 인공지능(AI)으로 대체, 전사 업무 부담을 20% 가량 경감할 것으로 발표하며 이목을 모았습니다. 국내에서도 이처럼 보험과 IT 기술을 융합한 인슈어테크(Insure + Tech) 서비스가 속속들이 출시되며 보험 업계의 비즈니스 모델이 빠른 속도로 다각화되고 있는데요. 오늘은 보험 선진국으로 평가 받는 유럽의

Advanced Analytics | Artificial Intelligence | Machine Learning
Jos van Dongen 0
Dutch Data Science, part 4: Rijkswaterstaat RWS

The fourth edition of the series brings me to Rijkswaterstaat, the Dutch government agency responsible for the main connecting infrastructure in the Netherlands (roads, bridges, waterways and water systems). I talked with Bas van Essen who’s responsible for RWS Datalab, the big data lab within Rijkswaterstaat (RWS). Company Overview RWS

Artificial Intelligence | Machine Learning
Makoto Unemi (畝見 真) 0
SAS Viyaを「無償」で「実データ」で「体感」してみよう!

2017年12月にSAS Viyaの最新版3.3がリリースされました。 これに伴い、皆様には、大幅に拡張されたSAS Viyaの機能を存分に体感いただくために今版から、皆様がお持ちの「実データ」でSAS Viyaベースのすべての製品を自由に触っていただけるようになりました。 ぜひ、ご利用ください! 利用手順に関しては、以下のブログをご覧ください。 SAS Viyaを体感してみよう! ~SAS Viya無償試用版利用ガイド~

Advanced Analytics | Artificial Intelligence | Machine Learning
Ilknur Kaynar Kabul 0
Interpretability is crucial for trusting AI and machine learning

We have updated our software for improved interpretability since this post was written. For the latest on this topic, read our new series on model-agnostic interpretability.  As machine learning takes its place in many recent advances in science and technology, the interpretability of machine learning models grows in importance. We

Machine Learning | Programming Tips
Makoto Unemi (畝見 真) 0
SAS Viyaにディープラーニングが登場! さっそく画像分類してみた。

SAS Viyaがリニューアルされまして、ついにディープラーニングが登場しました! SAS ViyaのディープラーニングではオーソドックスなDeep Neural Network(DNN)から、画像認識で使われるConvolutional Neural Network(CNN、畳込みニューラルネットワーク)、連続値や自然言語処理で使われるRecurrent Neural Network(RNN、再帰的ニューラルネットワーク)まで利用可能になります。 ディープラーニングを使うことのメリットは、従来の機械学習やニューラルネットワークが苦手としている画像や文章を認識し、高い精度で分類や推論することが可能になります。 高い精度というのは、ディープラーニングのモデルによっては人間の目よりも正確に画像を分類することができるということです。 例えばコモンドールという犬種がありますが、この犬はモップのような毛並みをしていて、人間ではモップと見間違えることがあります。 これは犬? それともモップ? こういう人間だと見分けにくい画像に対しても、ディープラーニングであれば、人間よりも正確に犬かモップかを見分けることができるようになります。 というわけで、今回はSAS Viyaのディープラーニングを使って画像分類をしてみたいと思います。 ディープラーニングの仕組み 画像分類のディープラーニングではCNNを使います。 CNNは画像の特徴を探し出す特徴抽出層と特徴から画像を分類する判定層で構成されています。   特徴抽出層は主に畳込み層とプーリング層で構成されています。 畳込み層で入力画像に対し、ピクセルの特徴(横線の有無とか斜め線とか)を探し出し、プーリング層で重要なピクセルを残す、という役割分担です。 判定層は、特徴抽出層が見つけた特徴をもとに、画像の種類を分類します。 例えば犬と猫の分類であれば、特徴抽出層が入力画像から、面長で大きな鼻の特徴を見つけだし、犬と分類します。   または、丸っこい顔立ちと立った耳の特徴を見つけだし、猫と分類します。   SAS Viyaで画像を扱う SAS ViyaディープラーニングでCifar10をネタに画像分類をしてみたいと思います。 Cifar10は無償で公開されている画像分類のデータセットで、10種類の色付き画像60,000枚で構成されています。 各画像サイズは32×32で、色はRGBです。 10種類というのは飛行機(airplane)、自動車(automobile)、鳥(bird)、猫(cat)、鹿(deer)、犬(dog)、蛙(frog)、馬(horse)、船(ship)、トラック(truck)で、それぞれ6,000枚ずつ用意されています。 画像は総数60,000枚のうち、50,000枚がトレーニング用、10,000枚がテスト用です。   画像データは以下から入手することができます。 https://www.cs.toronto.edu/~kriz/cifar.html さて、Cifar10を使って画像分類をしてみます。言語はPython3を使います。 SAS Viyaで画像分類をする場合、まずは入手したデータをCASにアップロードする必要があります。 CASはCloud Analytics Servicesの略称で、インメモリの分散分析基盤であり、SAS Viyaの脳みそにあたる部分です。 SAS Viyaの分析は、ディープラーニング含めてすべてCASで処理されます。 CASではImage型のデータを扱うことができます。 Image型とは読んで字のごとくで、画像を画像フォーマットそのままのバイナリで扱えるということです。

Analytics | Data for Good | Machine Learning | SAS Events
Steve Bennett 0
How federal civilian agencies can improve outcomes with analytics

From national parks and healthcare to taxes and nutrition, federal civilian agencies feature an incredibly large and diverse set of missions. These agencies oversee almost every aspect of American life with an endless sea of projects, programs and general oversight. But, as Deloitte Consulting’s Mark Urbanczyk said during a recent

Artificial Intelligence | Fraud & Security Intelligence | Machine Learning
Patricia Spinner 0
Danger, danger Will Robinson: Modernizing risk mitigation systems with AI

How do you define artificial intelligence? Would you define it differently if it was your job to prevent fraud and financial crimes, where the risks are constantly shifting? In a recent meeting with banking executives responsible for fraud and financial crimes risk mitigation, Wayne Thompson, Manager of Data Science Technologies

Machine Learning
SAS Japan 0
機械学習アルゴリズム選択ガイド

この記事はSAS Institute Japanが翻訳および編集したもので、もともとはHui Liによって執筆されました。元記事はこちらです(英語)。 この記事では、関心対象の課題に適した機械学習アルゴリズムを特定・適用する方法を知りたいと考えている初級~中級レベルのデータ・サイエンティストや分析担当者を主な対象者としたガイド資料を紹介し、関連の基本知識をまとめます。 幅広い機械学習アルゴリズムに直面した初心者が問いかける典型的な疑問は、「どのアルゴリズムを使えばよいのか?」です。この疑問への答えは、以下を含む数多くの要因に左右されます。 データの規模、品質、性質 利用できる計算時間 タスクの緊急性 データの利用目的(そのデータで何をしたいのか?) 経験豊富なデータ・サイエンティストでも、どのアルゴリズムが最も優れたパフォーマンスを示すかは、複数の異なるアルゴリズムを試してみなければ判断できません。本稿の目的は、特定の状況にのみ有効なアプローチを紹介することではなく、「最初に試すべきアルゴリズム」を何らかの明確な要因にもとづいて判断する方法についてガイダンスを示すことです。 機械学習アルゴリズム選択チートシート この機械学習アルゴリズム選択チートシートは、幅広い機械学習アルゴリズムの中から特定の課題に最適なアルゴリズムを見つけ出すために役立ちます。以下では、このシートの使い方と主要な基礎知識をひと通り説明します。 なお、このチートシートは初心者レベルのデータ・サイエンティストや分析担当者を対象としているため、推奨されるアルゴリズムの妥当性に関する議論は省いてあります。 このシートで推奨されているアルゴリズムは、複数のデータ・サイエンティストと機械学習の専門家・開発者から得られたフィードバックやヒントを取りまとめた結果です。推奨アルゴリズムについて合意に至っていない事項もいくつか残っており、そうした事項については、共通認識に光を当てながら相違点のすり合わせを図っているところです。 利用可能な手法をより包括的に網羅できるように、手元のライブラリが拡充され次第、新たなアルゴリズムを追加していく予定です。 チートシートの使い方 このシートは一般的なフローチャートであり、パス(楕円形)とアルゴリズム(長方形)が配置されています。各パスでYES/NO、または高速性/正確性を選びながら最終的に到達したものが推奨アルゴリズムとなります。いくつか例を挙げましょう。 次元削減を実行したいものの、トピック・モデリングを行う必要がない場合は、主成分分析を使うことになります。 次元削減が不要で、応答があり、数値を予測する場合で、高速性を重視するときには、デシジョン・ツリー(決定木)または線形回帰を使います。 次元削減が不要で、応答がない場合で、階層構造の結果が必要なときには、階層的クラスタリングを使います。 場合によっては、複数の分岐に当てはまることもあれば、どの分岐にも完璧には当てはまらないこともあるでしょう。なお、利用上の重要な注意点として、このシートは、あくまでも基本的な推奨アルゴリズムに到達できることを意図しているため、推奨されたアルゴリズムが必ずしも最適なアルゴリズムでない場合もあります。多くのデータ・サイエンティストが、「最適なアルゴリズムを見つける最も確実な方法は、候補のアルゴリズムを全て試してみることだ」と指摘しています。 機械学習アルゴリズムのタイプ このセクションでは、機械学習の最も一般的なタイプを取り上げ、概要を示します。これらのカテゴリーについて十分な知識があり、具体的なアルゴリズムの話題に進みたい場合は、このセクションを飛ばし、2つ先のセクション「各種アルゴリズムの概要と用途」に進んでいただいてかまいません。 教師あり学習 教師あり学習アルゴリズムは、実例のセット(入力データと出力結果)を基に予測を行います。例えば、過去の販売データを用いて将来の価格を推定することができます。教師あり学習では、ラベル付きのトレーニング用データからなる入力変数と、それに対応する望ましい出力変数があります。アルゴリズムはトレーニング用データを分析し、入力を出力にマッピングする関数を学習します。この関数は、トレーニング用データにおける入力/出力の関係を一般化することによって推定されます。この関数に新しい未知の入力データを与えると、それに対応する出力が算出され、その出力が未知の状況における結果の予測値となります。 分類:データを用いてカテゴリー変数を予測する場合、教師あり学習は「分類」と呼ばれます。これは例えば、画像にラベルや標識(例:犬または猫)を割り当てるようなケースです。ラベルが2つしかない場合は「2値(バイナリ)分類」、3つ以上のラベルがある場合は「マルチクラス分類」と呼ばれます。 回帰:連続値を予測する場合、その教師あり学習は「回帰問題」となります。 予測:過去と現在のデータを基に将来を予測するプロセスであり、最も一般的な用途は傾向分析です。具体例として一般的なのは、当年度および過去数年の販売実績を基に次年度の販売額を推定することです。 半教師あり学習 教師あり学習を行う上での課題は、ラベル付きデータの準備に多大な費用と時間がかかりかねないことです。ラベル付きデータが限られている場合には、ラベルなしの実例データを用いて教師あり学習を強化することができます。これを行う場合は、機械にとって完全な「教師あり」ではなくなるため、「半教師あり」と呼ばれます。半教師あり学習では、ラベルなしの実例データと少量のラベル付きデータを使用することで、学習精度の向上を図ります。 教師なし学習 教師なし学習を実行する場合、機械にはラベルなしのデータのみが与えられます。学習の目的は、クラスタリング構造、低次元の多様体、スパース(疎)ツリーおよびグラフなど、データの基底をなす固有パターンを発見することです。 クラスタリング:あるグループ(=クラスター)内の実例データ群が、その他のグループ内の実例データ群との間と比べ、(所定の基準に関して)高い類似性を示すような形で、実例データセットをグループ化します。この手法は、データセット全体を複数のグループにセグメント化する目的でよく使われます。グラスタリングの実行後に各グループ内で分析を実行すると、固有パターンを容易に発見できることが多々あります。 次元削減:検討の対象とする変数の数を減らします。多くの用途では、生データに極めて多次元の特徴が含まれており、一部の特徴は目的のタスクに対して冗長または無関係です。次元削減は、データに潜む真の関係性を発見するために役立ちます。 強化学習 強化学習は、環境からのフィードバックを基に「エージェント」(課題解決の主体者。例:ゲームのプレイヤー)の行動を分析および最適化します。機械は、取るべきアクションの選択肢を事前に教えられるのではなく、どのようなアクションが最大の報酬(例:ゲームのスコア)を生み出すかを発見するために、さまざまなシナリオを試行します。他の手法には見られない強化学習ならではの特徴は「試行錯誤」と「遅延報酬」です。 アルゴリズム選択時の考慮事項 アルゴリズムを選択する際は、正確性、トレーニング時間、使いやすさという3つの側面を常に考慮する必要があります。多くのユーザーは正確性を第一に考えますが、初心者は自分が最もよく知っているアルゴリズムに意識が向きがちです。 データセットが与えられたとき最初に考える必要があるのは、どのような結果になるにせよ、何らかの結果を得る方法です。初心者は、導入しやすく結果が素早く得られるアルゴリズムを選ぶ傾向がありますが、分析プロセスの最初の段階ではそれで問題ありません。まずは、何らかの結果を得て、データの概要を把握することを優先します。その後、データに対する理解を深め、結果をさらに改善することを目指し、より高度なアルゴリズムを試すことに時間を費やせばよいのです。 ただしこの段階でも、最高の正確性を示した手法が必ずしもその課題に最適なアルゴリズムであるとは限りません。通常、アルゴリズムから本来の最高パフォーマンスを引き出すためには、慎重なチューニングと広範囲のトレーニングが必要になるからです。 各種アルゴリズムの概要と用途 個別のアルゴリズムについて知識を深めることは、得られる結果と使い方を理解するために役立ちます。以下では、チートシートに掲載されている中でも最も基本的なアルゴリズムの詳細と、それらを使用すべき状況に関するヒントをまとめます。 線形回帰とロジスティック回帰 線形回帰は、連続従属変数 (y) と1つ以上の予測変数 (X) との関係をモデリングするためのアプローチです。この場合、(y) と

Analytics | Machine Learning
Thomas Bodenmüller-Dodek 0
Blogparade (#paradisefound) zum Projekt Paradise Found: Haben Sie Ihr Paradies gefunden?

Kultur- und Freizeitattraktionen, gutes Gastronomieangebot, Sicherheit und Infrastruktur, viel Grün – oder doch ganz einfach niedrige Lebenshaltungskosten? Für jeden definiert sich ein lebenswerter Ort ganz unterschiedlich. Statt Bauchgefühl hier Daten objektiv entscheiden zu lassen – das ist der Ansatz des Projektes „Paradise Found“, bei dem SAS Daten aus fast 150.000

Analytics | Artificial Intelligence | Fraud & Security Intelligence | Machine Learning
Jen Dunham 0
Considering fraud-fighting with machine learning and artificial intelligence?

Any look back at analytics in 2017 makes it clear that machine learning and artificial intelligence appear to be the ‘next big things’ that can solve just about any problem, from writing new hit songs to curing disease. Not one to buy into the hype, I became curious as to

Fraud & Security Intelligence | Machine Learning
Min-Gi Cho 0
금융 사기 탐지를 위한 머신러닝 핵심 요소

현대 기업에게 금융 사기, 이상 거래 탐지는 분명 어려운 도전과제입니다. 실제 사기 거래 발생률은 낮고 기업 활동의 극히 일부분에 해당되지만, 문제는 적절한 툴과 시스템을 갖추지 않는다면 엄청난 금전적 손실을 야기하는 범죄로 빠르게 이어질 수 있다는 것입니다. 더군다나 금융 사기 범죄자들은 계속해서 새로운 사기 수법을 고안해내고 점차 정교해지고 있는데요. 한가지 좋은

Analytics | Artificial Intelligence | Machine Learning
Christian Engel 0
Künstliche Intelligenz (KI) in der Bankbranche: Herausforderungen und Möglichkeiten (Teil 2)

Bankkunden werden auch immer anspruchsvoller. Im Zeitalter von Google, Apple, Facebook und Amazon haben wir uns daran gewöhnt, personalisierte Angebote auf Basis der von uns freiwillig zur Verfügung gestellten Daten zu erhalten. Hier ist sie wieder, unsere Chatbot-Idee aus meinem 1. Beitrag zu KI in der Bankbranche, und es gibt

1 11 12 13 14 15 18

Back to Top