SAS Visual Text Analytics can easily analyze similar words and phrases coming from various cultural heritage-related documents to construct a heritage wordbook that cultural workers can use to identify what relevant conservation technique to use on a structure/artifact.
Tag: SAS Visual Text Analytics
SAS' Julia Florou-Moreno shows you how to use generative AI to build a digital assistant that interacts with a model using natural language conversation.
SAS' Ali Dixon and Mary Osborne reveal why a BERT-based classifier is now part of our natural language processing capabilities of SAS Viya.
To find exact duplicates, matching all string pairs is the simplest approach, but it is not a very efficient or sufficient technique. Using the MD5 or SHA-1 hash algorithms can get us a correct outcome with a faster speed, yet near-duplicates would still not be on the radar. Text similarity is useful for finding files that look alike. There are various approaches to this and each of them has its own way to define documents that are considered duplicates. Furthermore, the definition of duplicate documents has implications for the type of processing and the results produced. Below are some of the options. Using SAS Visual Text Analytics, you can customize and accomplish this task during your corpus analysis journey either with Python SWAT package or with PROC SQL in SAS.
Word embeddings are the learned representations of words within a set of documents. Each word or term is represented as a real-valued vector within a vector space. Terms or words that reside closer to each other within that vector space are expected to share similar meanings. Thus, embeddings try to capture the meaning of each word or term through its relationships with the other words in the corpus.
In Part I of this blog post, I provided an overview of the approach my team and I took tackling the problem of classifying diverse, messy documents at scale. I shared the details of how we chose to preprocess the data and how we created features from documents of interest
Unstructured text data is ubiquitous in both business and government and extracting value from it at scale is a common challenge. Organizations that have been around for a while often have vast paper archives. Digitizing these archives does not necessarily make them usable for search and analysis, since documents are
모든 비즈니스 영역으로 확대되는 텍스트 분석 그동안 소셜 미디어 분석에 국한되었던 텍스트 분석은 이제, 콜센터, 마케팅, 품질 영역으로 확장은 물론 최근 들어 전통적인 수작업 영역(발주처 요구사항 분석, AI기반 안전사고 예방 등)까지 확대하고 있습니다. 텍스트 분석을 하기 위해서는 텍스트와 함께, AI 기반의 NLP 머신러닝 엔진이 필수입니다. 이 엔진 내에서 문맥 기반의
With the release of SAS Viya 2020.1.4, text categories and concept models can now be deployed into production with just a few clicks and used to score data in-batch and via API! You can also now use these models in decision flows.
SAS Conversation Designer is available with every offering that also includes SAS Visual Analytics. Users can easily access Visual Text Analytics capabilities from SAS Conversation Designer with minimum additional configuration.
지난 텍스트 분석 시리즈 2편에서는 보험사의 데이터를 이용하여 예측 모델을 개발하고, 모델의 성능을 개선하여 고객 행동에 대한 예측도를 높이는 방법을 살펴봤습니다. 이번에는 영화 리뷰 데이터를 사용하여 분류 규칙을 개발하는 과정을 SAS Visual Text Analytics를 중심으로 알아보겠습니다. SAS Visual Text Analytics(이하, VTA)는 대용량의 비정형 데이터로부터 쉽게 인사이트를 추출할 수 있도록 설계된
지난 10월 21일부터 23일까지 이탈리아 밀라노에서 열린 'SAS 애널리틱스 익스피리언스 2019(SAS Analytics Experience 2019)'에서는 SAS의 머신러닝, 컴퓨터 비전, 자연어처리 등 AI 기술을 기반으로 기업들이 어떻게 실제(real) 가치를 실현할 수 있는지 보여주는 다양한 사례들이 소개되었습니다. 특히 행사 둘째 날에는 짐 굿나잇 SAS CEO, 올리버 샤벤버거 SAS 수석부회장 겸 최고운영책임자(COO) & 최고기술책임자(CTO)의
인공지능 활용 엔터프라이즈 분석 가능한 ‘SAS 플랫폼’ 최신 오퍼링 출시 SAS 코리아, 최신 머신러닝·자연어처리 등 인공지능(AI) 활용 분석 기능 강화 머신러닝·자연어처리로 비정형 데이터 가치 극대화 및 전 과정 시각화하는 엔드투엔드 비주얼 환경 제공 웹 인터페이스로 전체 분석 라이프사이클을 통합하고, 초보자부터 전문가까지 전사 협업 지원 미국적십자사·시스코·뮌헨재보험 등 도입… 분석 인사이트로 비즈니스