전 세계 모든 산업의 변화를 주도하고 있는 주인공은 단연 AI(Artificial Intelligence, 인공지능)입니다. 운송, 금융, 엔터테인먼트, 헬스케어, 공공서비스, 에너지, 통신, 교육 등 모든 분야에서 AI는 비즈니스와 일상을 혁신하며 새로운 미래를 열고 있지요. SAS도 2019년 향후 3년간 AI 분야에 총 10억 달러 투자 계획을 발표한 바 있습니다.
AI는 데이터라는 경험을 통해 배우고, 이 경험을 새로운 데이터에 적용하고 예측하여, 사람의 개입없이 자동으로 특정 작업을 수행합니다. 여기서 핵심 키워드는 데이터를 통해 AI가 스스로 배우는 ‘학습(learning)’과, 특정 작업을 자동으로 수행하는 ‘자동화(automation)’입니다.
SAS의 AI 기술, 산업을 넘어 사회 문제 해결
SAS는 오래 전부터 다양한 영역에 AI기술을 적용해오고 있습니다. 볼보트럭 노스아메리카(Volvo Trucks North America)는 SAS AI 솔루션을 도입해 10만 대 이상의 볼보트럭의 수송 업무를 효과적으로 개선했습니다. IoT 데이터 스트리밍을 분석해 원격 진단, 엔진 사전 관리 진단 및 모니터링 등을 통해 보다 효과적으로 유지 보수 관련 의사결정을 내립니다. 또한 네덜란드 암스테르담대학교 의료 센터(AUMC)는 SAS 분석 솔루션을 활용해 대장암 환자의 치료를 위한 AI 의료 영상 프로젝트를 진행, 종양학이나 암 치료 전담 팀이 보다 정확한 진단을 내려 환자 생존율을 높일 수 있도록 힘쓰고 있습니다.
스포츠 및 엔터테인먼트 업계에서도 AI를 활용해 팬들에게 새로운 경험을 제공하고 고객 만족도를 높이고 있습니다. 미국 프로농구(NBA) 올랜도 매직(Orlando Magic)은 전 세계 팬들에게 개인 맞춤형 디지털 경험을 제공하고 선수와 경기에 대한 전략적 의사결정을 내려 구단이 최상의 성적을 낼 수 있도록 SAS AI 기술을 활용하고 있습니다. SAS® 바이야(SAS® Viya)의 인메모리 분석 엔진은 올랜도 매직의 모바일 앱과 티켓팅, 할인권, 상품 구매 내역 등 13개 소스에서 수집한 대량의 과거 데이터를 모델링하고, 개인별로 구매 가능성이 높은 제품과 서비스를 예측합니다. 예측 결과를 기반으로 수백만 명의 팬에게 푸시 알림, 웹사이트 배너, 이메일 등 다양한 채널을 통해 맞춤형 제안을 자동으로 전송합니다.
뿐만 아니라 올랜도 매직은 SAS 바이야 기반의 SAS® 비주얼 데이터 마이닝과 머신러닝(SAS® Visual Data Mining and Machine Learning)을 통해 선수들의 경쟁력을 극대화하고 경기에 대한 전략적 결정을 내리고 있습니다. SAS 솔루션은 18개 이상의 데이터 소스에서 20년 간 축적한 10만 명의 선수의 데이터를 빠른 속도로 분석해 이를 바탕으로 올랜도 매직은 선수 영입, 라인업 교체, 훈련 체계 등에 대한 실질적인 인사이트를 확보합니다.
SAS에서는 ‘데이터 포 굿(Data for Good)’ 캠페인의 일환으로 AI 기술을 다양한 사회 문제 해결에도 적용하고 있습니다. SAS는 동물 보호 비영리 단체인 ‘와일드트랙(WildTrack)’과 협업하여 FIT(Footprint Identification Technique, 발자국 식별 기법)을 개발했습니다. SAS AI 기술을 기반으로 치타를 비롯한 동물 15종에 대한 FIT 알고리즘을 개발했으며, 90% 이상의 정확도로 멸종 위기 동물을 구별합니다. 이 외에도 국제응용시스템분석연구소(IIASA)와 함께 삼림 보호를 위한 크라우드소싱 AI 프로젝트를 진행하고, 최근에는 클리브랜드 클리닉(Cleveland Clinic)과 협업하여 코로나19 환자 발생 예측 모형을 만들어 정책에 활용하고 있습니다.
AI를 만드는 AI, AutoML
AI 기술이 산업 전반에 빠르게 확산되면서 모두가 이 기술로 인한 장밋빛 미래를 강조하지만, 대부분의 기업들은 AI의 가치를 실제 비즈니스에 적용하는 데 어려움을 겪고 있습니다. 비즈니스를 잘 아는 일반 사용자에게는 AI 알고리즘과 분석이 어렵고, 오픈소스 코딩에 능숙한 데이터 사이언티스트는 비즈니스 지식이 부족해 협업이 쉽지 않습니다. 이 같은 간극을 줄이기 위해 대두된 기술이 머신 러닝을 자동화하는 AutoML(Automated Machine Learning)입니다.
AI 기술의 핵심은 학습과 자동화를 통한 의사결정입니다. 그리고 이를 가능하게 하는 방법 중 하나가 머신러닝(Machine Learning, 기계 학습)입니다. 머신러닝은 과거부터 누적된 데이터를 기반으로 수학적 알고리즘을 만들어 컴퓨터가 스스로 생각하게 만드는 AI 기술로, 이 머신러닝을 자동화한 기술이 AutoML입니다. 인공지능을 만드는 인공지능인 셈입니다.
AutoML은 최근 몇 년, AI와 관련한 모든 이슈의 중심에 있습니다. 시장분석기관인 가트너(Gartner)보고서 <Gartner Hype Cycle for Artificial Intelligence, 2019>에 따르면 AutoML은 지금 AI 기술 트랜드 정점에 자리하고 있습니다.
과거에 AutoML은 알고리즘을 기반으로 좀더 좋은 모델을 찾기 위해 학습에 큰 영향을 주는 하이퍼파라미터를 튜닝하는 ‘하이퍼파라미터 최적화(Hyperparameter Optimization)’ 정도에 머물렀습니다. 이후 학습을 통해 유의미한 피처(feature, 특징)를 추출해서 사용하는 ‘피처 러닝(Feature Learning)’, 학습을 통해 모델링을 위한 최적의 아키텍처를 설계하는 ‘아키텍처 서치(Architecture Search)’로 발전해왔습니다. 변화를 겪기는 했지만 지금까지의 AutoML은 다분히 모델링에 초점을 두고 있습니다.
SAS는 AutoML을 보다 확장된 개념으로 바라봅니다. ▶데이터 수집, 클렌징, 품질 측정, 전 처리 등을 수행하는 데이터(Data) ▶시각적 탐색, 피처 엔지니어링, 모델링을 포함한 분석(Discovery) ▶최종 선택된 최적의 모델을 운영시스템에 적용 및 모니터링하는 적용(Deployment)에 이르는, 분석 라이프 사이클 전반으로 AutoML을 확대하여 적용합니다. 이것이 바로, SAS의 AutoML 서비스인 ‘SAS AI-Enhanced Analytics’입니다.
비즈니스 가치 실현을 위한 SAS AI-Enhanced Analytics
SAS가 AutoML을 데이터(Data)-분석(Discovery)-적용(Deployment)의 분석 라이프사이클 전반으로 확대하는 이유는 비즈니스 가치를 극대화하기 위함입니다. 우리가 접하는 많은 AutoML 솔루션은 분석 라이프사이클에서 Discovery 영역, 그 중에서도 모델링에 집중되어 있습니다. 그런데 우리가 AutoML을 통해 최종적으로 얻고자 하는 것은 모델링이 아닌, 비즈니스 가치 실현입니다. 모델을 배포하고 적용하는 Deployment가 중요한 이유입니다.
분석과 지속적인 비즈니스 가치 실현에 중점을 둔 SAS AI-Enhanced Analytics는 데이터를 준비하고 배포하는 모든 과정이 SAS AI 플랫폼에서 이뤄집니다. SAS AI 플랫폼은 가트너가 발표한 <2020 매직 쿼드런트 : 데이터 사이언스 및 머신러닝 플랫폼> 리더로 선정된 바 있습니다. 가트너는 데이터 전문가뿐만 아니라 일반 분석가, 비즈니스 사용자까지 모든 사용자의 니즈를 충족시키는 편리한 기능과 최고의 운영 모델, 관리 플랫폼을 긍정적으로 평가했습니다.
SAS AI 플랫폼은 코딩을 선호하는 데이터 사이언티스트가 오픈소스 환경에서도 사용할 수 있는 프로그램 환경을 제공하며, 코딩이 부담되는 일반 분석가도 GUI 방식으로 모델링하도록 지원하고, 분석의 니즈는 있지만 전문 지식이 없는 일반 비즈니스 사용자도 사용할 수 있도록 AutoML 기능을 제공합니다.
다음 AutoML 시리즈에서는 분석 라이프사이클 전반을 지원하는 SAS AutoML 주요 기능을 살펴볼 예정입니다.
마이크로사이트를 통해 SAS AutoML에 대해 더 자세히 알아보세요!