Get the latest machine learning algorithms and techniques
SAS' Sophia Rowland breaks down the roles of each team member in a long-term machine learning project and how they can better combine their efforts to increase efficiency and efficacy
Get the latest machine learning algorithms and techniques
SAS' Sophia Rowland breaks down the roles of each team member in a long-term machine learning project and how they can better combine their efforts to increase efficiency and efficacy
It seems like every day, there’s a new study or report about how AI, GenAI and machine learning will transform industries. For Georgia-Pacific, this isn’t forward-looking speculation. It’s our reality. When we look at the innovation investments Georgia-Pacific has in play, we’re predicting a nine-figure return. We see $100 million
Como a IA está sendo usada no combate à fraude e, ao mesmo tempo, para orquestrar fraudes cada vez mais sofisticadas No início deste ano, um fato ocorrido em uma multinacional de Hong Kong mandou um recado importante para profissionais de combate à fraude. Em um incidente sem precedentes, a
El lavado de dinero se continúa posicionando como una de las principales problemáticas ilegales, por su asociación con actividades ilícitas y crímenes financieros. Un reporte de Global Financial Integraty, titulado “Crímenes Financieros en América Latina y el Caribe: entendiendo los desafíos de los países y diseñando respuestas técnicas efectivas”, estimó
La Inteligencia Artificial Generativa y la Inteligencia Artificial Predictiva son cada vez más utilizadas en el sector asegurador para predecir tendencias, demandas y optimizar operaciones. Sin embargo, de acuerdo con un estudio elaborado por Ernest and Young, el 50 % de los ejecutivos y responsables de áreas de tecnología no
Como a abordagem centralizada está transformando processos de avaliação e decisão nas empresas A importância de ter uma fonte central de informação para gerar insights valiosos dentro de uma organização é bem conhecida por líderes de tecnologia. Mas o que antes era considerado desejável, hoje se tornou essencial. Empresas na
개발자와 모델러는 데이터를 찾고 검증하거나 부서간에 협업할 때, 그리고 작업 결과를 엔터프라이즈 플랫폼에서 운영할 때 여러 문제에 직면합니다. 데이터 분석 및 머신 러닝 모델에 셀프 서비스 방식의 온디맨드 컴퓨팅 환경을 사용하면 생산성과 성능을 높이는 동시에 IT 지원과 비용을 최소화할 수 있습니다. 지난 7월 출시된 SAS Viya Workbench(바이야 워크벤치)는 클라우드 환경의
We often hear about cyberattacks, hackers, ransomware, and other nefarious deeds in the news, but not all data breaches are caused by third parties.
As part of this year's IEEE Visual Analytics Science and Technology (VAST) Challenge, a group of SAS data scientists puit SAS Viya and related machine learning tools to the ultimate test - to identify individuals in a complex fishing network. Excitedly, the team received the Honorable Mention Award for Breadth of Investigation!
What sets the SAS Model Card apart from previous model cards is the use of descriptive visuals, to make model cards accessible to all personas involved in the analytics process, including data scientists, data engineers, MLOPs engineers, managers, executives, risk managers, business analytics, end-users, and any other stakeholder with access to the SAS Viya environment.
When using LLMs, managing toxicity, bias, and bad actors is critical for trustworthy outcomes. Let’s explore what organizations should be thinking about when addressing these important areas.
Learn how an intern integrated SAS Viya® and open-source code (Python) into a Machine Learning project to combine their strengths within the context of predictive modeling, and to show off the variety of ways this integration can be accomplished.
An article published in Nature has the intriguing title, "AI models collapse when trained on recursively generated data." (Shumailov, et al., 2024). The article is quite readable, but I also recommend a less technical overview of the result: "AI models fed AI-generated data quickly spew nonsense" (Gibney, 2024). The Gibney
Se integrada à estratégia da companhia, tecnologia pode e deve ajudar empresas de todos os setores a serem muito mais produtivas, mas é preciso separar o hype da realidade A inteligência artificial generativa tem capturado a atenção de líderes desde que ferramentas como o ChatGPT entraram em cena no final
A recent article came out with an updated list of necessary components for MLOps and LLMOps. And while this list may seem long, reading through the capabilities and components, I realized that SAS Viya already covers most of the required functionality. Organizations can have a hodgepodge of tools that they
Adding linguistic techniques in SAS NLP with LLMs not only help address quality issues in text data, but since they can incorporate subject matter expertise, they give organizations a tremendous amount of control over their corpora.
SAS Decision Builder is a decision intelligence solution, which means that it uses machine learning and automation to augment human decision-making for better and faster insights that drive tactical and strategic business decisions. It’s a cousin to business intelligence and the next step after data engineering and model training, completing the analytics lifecycle to help achieve business goals.
As announced and demonstrated at SAS Innovate 2024, SAS plans to include a generative AI assistant called SAS Viya Copilot in the forthcoming SAS Viya Workbench. You can submit a text prompt (by putting it in a comment string) and the Copilot will generate SAS code for you. My colleagues
Neste ano, mais uma vez o SAS participará do evento FEBRABAN TECH, que acontece de 25 a 27 de junho, em São Paulo, no Transamérica Expo Center. Levaremos ao evento as últimas novidades de dados e IA para o setor financeiro, com uma novidade: dez palestras no estande sobre os
The new SAS Certified Specialist: Statistics for Machine Learning credential is designed to help you showcase your expertise and commitment to staying ahead in the industry.
Una encuesta mundial de profesionales antifraude realizada por la ACFE y SAS revela un increíble entusiasmo por la IA generativa, pero estudios de referencia anteriores sugieren una realidad más difícil. La IA generativa ha cautivado la imaginación del público, y su poder y promesa parecen estar a punto de afectar
Well, there's another plot twist in the Google third-party cookie deprecation saga. After years of banter and shifting deadlines, Google has decided to abandon its plans to phase out third-party cookies from Chrome. What does this mean for marketers? Even though third-party cookies aren't being removed, Google is planning to
A relação entre a prevenção de fraudes e a experiência do cliente é indiscutivelmente estreita no mundo financeiro moderno. A análise de tendências atuais revela a importância da preservação dos dados como um fator crucial para organizações, impactando a confiança que clientes tem em empresas, a retenção deles - e,
While large language models (LLMs) have become synonymous with advanced AI capabilities, their integration into various business and technological domains is often accompanied by significant costs. These costs arise from the extensive computational resources required for training and running these models. However, traditional natural language processing (NLP) techniques offer a
See why we think the use of AI assistants will take off in 2024.
Organizations with a passion for quality, reliability, efficiency and safety are using real-time insights generated from AI-powered predictive maintenance programs to anticipate and avoid potential issues while mitigating negative impact. A shift from reactive maintenance, or handling issues in real-time, is not just a technological evolution; it's a strategic decision.
Developing an accurate understanding of statistics will help you build robust machine learning models that are optimized for a given business problem. SAS launched a new course that provides a comprehensive overview of the fundamentals of statistics that you'll need to start your data science journey. This course is also a prerequisite to many courses in the SAS data science curriculum.
自己組織化とは、自然界において個体が全体を見渡すことなく個々の自律的なふるまいをした結果、秩序だった全体を作り出すこと 2010年から存在した解決アイディアがついに実現可能に 今から遡ること十数年前の2010年頃、支援をしていた大手製造業の会社ではすでにデータ分析スキルの社員間でのばらつきと組織全体のスキルの向上、データ分析作業の生産性の向上、人材のモビリティへの耐性としてのデータ分析業務の標準化が課題となっていました。 当時ご相談をいただいた私を含むSASの提案チームは、SASが提供するアナリティクス•ライフサイクル•プラットフォームを活用することで、その問題を支援できることがすぐにわかりました。つまり、ビジネス課題から始まり、利用データ、データ探索による洞察、データ加工プロセス、予測モデリングプロセス、モデル、そしてそれをアプリケーションに組み込むディシジョンプロセスという、一連のアナリティクス•ライフサイクルにまたがるすべての作業を電子的に記録し、全体のプロセスそのものをモデリングし、利活用することで、自己組織的にナレッジが蓄積され、且つ活用されるということです。 しかし、当時のSASだけではない周辺のIT環境、すなわちPCやアプリケーションアーキテクチャなどのインフラ、データの所在、セキュリティ管理などがサイロ化していること、またSAS以外のModelOps環境もシステムごとにアーキテクチャがバラバラすぎたこと、また、お客様社内のデータリテラシーそのものもまだ課題が多かったため、SASを中心としても、実現にはあまりにも周辺の開発コストがかかりすぎたために、提案を断念しました。 時代は変わり昨今、クラウド技術の採用およびそれに伴うビジネスプロセスの変革と標準化が急速に進んでいます。それに歩調を合わせるように、SASの製品も、上記の当時から市場をリードしてきたMLOpsフレームワークをDecisionOpsへと昇華させ、クラウド技術を最大活用すべく、クラウドネイティブなアーキテクチャおよび、プラットフォームとしての一貫性と俊敏性を高めてきました。そしてついに最新版のSAS Viyaでは、アナリティクスライフサイクル全体にわたり、データからデータ分析プロセス全体の作業を電子的に記録し、管理し、活用することが可能となりました。 自己組織的にナレッジを蓄積活用するデータ分析資産のガバナンス 昨今のデータマネージメントの取り組みの課題 詳しくはこちらのブログをご参照いただきたいのですが、多くのケースで過去と同じ過ちを繰り返しています。要約すると、データ分析文化を醸成したい、セルフサービス化を広めたいという目的に対しては、ある1時点のスナップショットでの完成を目的としたデータカタログやDWH/DMのデータモデル設計は問題の解決にはならないということです。必ず5年後にまた別の担当者やプロジェクトが「これではデータ分析しようにもどのデータを使えばわからない、問題だ、整備しよう」となります。 では解決策はなんでしょうか。 静的な情報を管理したり整備するのではなく、日々変わりゆく、どんどん蓄積され、評価され、改善、進化し続ける、データ分析業務に関わるすべての情報を記録統制することです。つまり、以下の三つのポイントを実現することです。各ポイントの詳細は後段でご紹介しています。 ポイント①あらゆるデータ分析資産(ナレッジ)を管理 ポイント②データ品質管理の自動化・省力化とガバナンス ポイント③社内ソーシャルの力による自己組織的情報の蓄積 まずは、それぞれが何を意味しているかを説明する前に、これらを実現するとどのような世界になるのかをユーザーの声によって示してみたいと思います。 個々の自由にデータ分析をしているユーザーによる行動を記録することで、全体を見渡している誰かがヒアリングや調査をして情報を管理することなく、データ分析がどのように行われているかを管理・共有・再利用が可能となるのです。 誰が、どのような目的で、どのデータを、どのように使用したのか、そしてその結果はどうだったのか? このアプリケーションの出した判定結果の説明をする必要がある。このモデルは誰が作ったのか?どのような学習データを使用したのか?どのようなモデリングプロセスだったのか? よく使用されるデータはどれか? そのデータはどのように使用すれば良いのか?注意事項はなにか? データ分析に長けた人は誰か?誰が助けになってくれそうか? 企業全体のデータ品質はどのようになっているか? データ品質と利用パターンのバランスは適切か?誤った使い方をしているユーザーはいないか? など従来、社内勉強会を開催したり、詳しい人を探し出してノウハウを聞いたり、正しくないことも多い仕様書をひっくり返してみたり、そのようにして時間と労力をかけて得られていたデータ分析を自律的に行う際に重要となる社内ナレッジが、自己組織的に形成されるということです。 「情報資産カタログ」とは~一般的な「データカタログ」との違い このような世界を実現する機能をSASでは、「情報資産カタログ」と呼んでいます。データ分析プロセス全体を管理・検索・関連付け・レポートできるようにするテクノロジーです。一般的に言われる、また多くの失敗の原因になる、「データカタログ」と対比するとその大きな違いが見えてきます。 こちらのブログでも述べましたが、データ分析者がセルフサービスでデータ分析を実践したり、初学者がなるべく自分自身で情報収集して、まずは標準的なデータ分析作業をマスターしたりするためには、既存ナレッジを活用する必要があります。一方で、そのようなナレッジは従来一部の優秀なデータ分析者に聞かないとわからなかったり、あるいはITシステム部門に質問して回答までに長い時間を要してビジネス機会を逸してしまう、という結果を招いていました。 既存ナレッジとは、どのようなデータを、どのような意図で、どのような目的で、どのように使い、どのようなアウトプットを得たかという一連の「考え方とやり方」であり、これは管理者が一時的にデータ分析者にヒアリングして「データカタログ」を整備して終わり、というものではなく、日々データ分析者たちの中で自律的に情報が作られていくものです。 ポイント①あらゆるデータ分析資産(ナレッジ)を管理 SAS Viyaでは、上述のアナリティクスライフサイクル各ステップのオブジェクトがすべて一元的に記録・管理されます。日々、新しく作られるレポート、データ加工プロセス、作成されるデータマートの情報が、自動的に管理され検索対象になっていきます。このようにアナリティクス・ライフサイクルの各ステップをすべて管理することで、データ、そのデータを使用しているレポート、そのデータを使用しているデータ加工フロー、その出力データ、さらにはそれを学習データとして使用している予測モデリングプロセスと作成されたモデル、これらを関連付けて見ることが可能となります。それにより例えば、ある目的に使用するデータを探している場合、参考にする業務名やプロジェクト名で検索をすることで、関連するレポートや、データ加工プロセスにたどり着き、そこから使用データやそのデータの使い方にたどり着くという効率的な情報の探し方が可能となります。 もちろん、この機能は昔からあるインパクト・アナリシス機能として、ITシステム部門が、データへの変更の影響調査ツールとして使用することも可能です。 ポイント②データ品質管理の自動化・省力化とガバナンス データ分析を組織的に行う際に気にすべきポイントの一つは、その正確性です。正しいマスターデータを使用しているか、適切な品質のデータを使用しているかは、最終的なアクションや意思決定の精度すなわち収益に影響します。また、結果に対する説明責任を果たすうえでもアクションに使用したデータの品質は属人的ではなく、組織的に管理されている必要があります。またデータ品質を組織的に管理することにより、データ分析の最初に行っていた品質確認という作業が省力化できます。また、属人的に行っていた品質確認作業も標準化されるため、組織全体のデータ分析作業の品質が向上します。 あるお客様では、DWHに格納するデータのETL処理において施すべき処理が実施されていないというミスがあるものの、データの数やETL処理があまりにも多いためそのミスを発見することが困難であるという状況にありました。網羅的な品質管理および品質レポートによってそのようなミスの発見が容易になります。 ポイント③社内ソーシャルの力による自己組織的情報の蓄積 前述のポイント①により基本的にはデータ分析者個人個人の自律的な活動が自動的に記録され、自己組織的に組織全体のナレッジとて蓄積され共有・再利用可能な状態が作られます。これは、データ分析者個人個人が特に意識しなくても自動的に実現できます。それに加えて、さらに意識的にこのプラットフォームを利用することで、蓄積されるナレッジに深みが増します。 例えば、あるビジネス課題をデータ分析で解決使用する場合のスタートは、「問い」です。上述のアナリティクス・ライフサイクルの一番左のスタートにあるものです。その際には、仮説設定をするためや仮説を検証する目的で、様々な角度から「データ探索」を行います。この初期のデータ探索プロセスは、その後のデータ加工やモデリングの根拠になっているため、ナレッジとしてまた説明責任の材料としてはとても重要になります。必ずしも最終的に使用したデータと同じデータを使うとも限らないので、自動的には他のデータ分析資産とは関連づきません。そのような探索プロセスも下記の図のように、同じプロジェクトフォルダに保存しておくことで、関連オブジェクトとして活用することが可能となります。また、プロアクティブに自信が使用したデータやレポートにコメントや評価を付与することで、より価値の高いナレッジへと育つことになります。 昨今企業内SNSなどで、オフィスツールの使い方などノウハウを共有をされている企業・組織もあるかと思います。それを全社規模のアナリティクス・プラットフォームで行うことで、データ分析に関わるナレッジをユーザー同士で培っていくイメージです。 まとめ 「このデータはこの目的に使えますか?」「あ、それはこの情報がないので使えないんですよ。こちらのデータを私は使ってますよ」データ分析者の間でよく交わされる会話です。この問いにいかに迅速に答えられるかが、データ分析の効率性と正確性を高めます。「情報資産カタログ」はまさにこの問いに答えるための機能なのです。
As millions of people party and eat their way through the season of overindulgence, they should feel confident that indigestion and a few extra pounds should be the only downsides to their feasting. Thanks to countless hours of work behind the scenes by food inspectors and public health officials, diners
En el último año se ha observado la llegada de nuevos inversores extranjeros a México, sobre todo por la parte de la industria manufacturera, que ha traído consigo crecimiento económico para el país. De acuerdo con datos de la Asociación para la Tecnología de Manufactura (AMT, por sus siglas en