SAS AutoML이 주도하는 분석 인사이트

0

AutoML은 최근 몇 년간 가장 빠르게 진화하는 AI기술중 하나입니다. AutoML은 시티즌 데이터 사이언티스트는 물론 데이터 사이언티스트도 더 빨리 더 많은 모델을 구축하고, 모델의 정확도를 개선하여 보다 생산적인 과제에 집중할 수 있게 합니다. 이를 통해 기업은 조직 전반에 업무 효율성과 전문성을 강화할 수 있습니다.

SAS AutoML 플랫폼의 핵심은 분석 라이프사이클 프로세스 자동화에 있습니다. 데이터 기반의 의사결정이 비즈니스 타이밍에 맞게 이루어지려면 AI가 특정 영역이 아닌, Data-Discovery-Deployment에 이르는 분석 라이프사이클 전반으로 확대되어야 합니다. SAS AutoML 플랫폼은 데이터 준비, 분석, 적용에 이르는 분석 라이프사이클 전 과정에 AutoML 기능을 제공하며, SAS에서는 이를 SAS AI-Enhanced Analytics라고 칭합니다. SAS AI-Enhanced Analytics를 통해 기업은 분석의 적용 범위를 확대하고, 더 많은 업무 시나리오에 분석을 적용하고, 분석 결과를 더욱 신속하게 비즈니스에 적용할 수 있습니다.

“SAS AI-Enhanced Analytics는 기존 시장의 AutoML 개념을 크게 확장하여 분석 프로세스 전반에 도움을 주는 다양한 머신러닝 자동화 기술을 지원하며, 데이터 사이언티스트와 일반 사용자 모두에게 분석 인사이트를 제공합니다.”

SAS AI-Enhanced Analytics 주요 기능

  • 오토 프로파일링(Auto Profiling)

데이터를 분석할 때는 데이터의 속성을 이해해야 합니다. 이를 위해 분석가는 일일이 수동으로 통계량이나 분포를 확인합니다. 하지만 오토 프로파일링을 활용하면 데이터의 전반적인 특성은 물론, 각 변수의 데이터 값에 대한 세부적인 패턴 정보를 알 수 있습니다. 각각의 변수가 갖고 있는 분포의 값, 도입값, 결측, 최대값, 최소값, 평균 등의 기본적인 통계량을 제시하므로 데이터에 대한 기본 내용을 이해하고, 변환에 필요한 인사이트를 얻을 수 있습니다.

  • 자동 비주얼 인사이트(Automated Explanation)

분석은 데이터를 분석하고, 머신러닝 알고리즘을 활용하여 모델을 생성하고, 알고자 하는 비즈니스에 관한 예측 패턴을 발견하는 과정입니다. 분석에 대한 인사이트를 얻기 위해서는 다양한 시각적 기법을 이용하게 되는데, 여기에는 많은 시간이 소요됩니다. SAS의 자동 비주얼 인사이트는 알고 싶은 현상에 대한 변수를 선택하고, ‘설명’을 클릭하면 데이터를 자동으로 분석하여 시각적으로 보여줍니다.

  • 오토 피처 엔지니어링(Auto Feature Engineering)

시각적 분석을 마치면 본격적인 머신러닝 모델링에 돌입합니다. 이때 모델의 정확도를 높이는 방법 중 하나가 피처 즉, 변수를 많이 생성하여 정보 영역을 풍부하게 하는 것입니다. 이를 자동화하는 것이 오토 피처 엔지니어링이며, SAS에서는 이를 위해 피처 머신 노드와 피처 추출 모드 기능을 제공합니다.

피처 머신 노드(Feature Machine Node)는 자동으로 개별 피처의 품질을 평가하고, 모델의 정확도를 높이도록 변환하여 새로운 피처를 생성하는 기능입니다. 데이터의 높은 카디날리티, 높은 첨도, 높은 왜도, 결측값, 이상점 등을 고려하여 더 좋은 성능을 낼 수 있는 방향으로 피처를 생성합니다. 피처 하나당 하나의 피처가 아닌, 여러 개의 피처를 자동으로 풍부하게 생성하므로 사용자가 취사 선택하여 분석에 활용할 수 있습니다.

피처 머신 노드가 단별량 변수에 대해 피처를 생성하는 반면, 피처 추출 노드(Feature Extraction Node)는 다변량적 접근 방법입니다. 주성분 분석(PCA), 특이값 분해(SVD), 로버스트 PCA(RPCA), Autoencorder 등의 머신러닝 알고리즘을 사용하여 많은 변수 영역의 또다른 특징을 뽑아냅니다.

  • 오토 튜닝(Auto Tuning)

모델의 정확도를 높이기 위해서는 다양한 피처 생성 이외에도 각각의 알고리즘이 갖고 있는 하이퍼파라미터를 튜닝하는 방법도 있습니다. 과거에는 학습률, 배치 크기 등 학습에 영향을 주는 하이퍼파라미터들을 분석가가 일일이 Trial & Error 방식으로 진행했습니다. 하지만 오토 튜닝 기능을 사용하면 Trial 영역을 설정하는 것만으로도 모든 조합을 자동으로 테스트하여 가장 좋은 조합을 추천합니다.

이때 관건은 좋은 모델을 빠르게 찾아내는 것입니다. SAS Auto ML은 그리드와 랜덤 서치는 물론, 라틴 하이퍼큐브, 베이지안, Genetic 알고리즘을 적용하여 최소의 시간으로 하이퍼파라미터를 테스트하여 최적의 조합을 찾아줍니다.

  • 오토 파이프라인(Pipeline Automation)

SAS Auto ML은 모델 개발 프로세스를 자동으로 제공합니다. 사용자가 파이프라인에 대한 자동 생성을 체크하고, 자동화 소요 시간 등을 선택하면, AI가 데이터의 속성을 자동으로 분석하여 최적의 구조로 분석하기 위한 파이프라인을 만들어줍니다. 사전에 정의된 템플릿을 사용하여 타깃 유형, 분석 수준, 자동 조율 포함 여부 등을 선택하는 것만으로도 분석 경험이 부족한 사용자도 쉽고 빠르게 우수한 성능의 모델을 구축할 수 있습니다.

  • 모델 해석력(Model Interpretability)

머신러닝 모델은 정확도를 획기적으로 높게 만들 수 있다는 장점이 있습니다. 하지만 모델에 대한 설명력은 부족합니다. SAS는 더 빠르고 쉽게 모델을 이해할 수 있도록 부분 의존성 도표(PDP), 개별 조건부 기대치(ICE), LIME, SHAP Value 등 다양한 모델 해석 기능을 시각적 화면과 함께 제공합니다. 모델 전체의 특성뿐만 아니라 개별 관측치에 대한 특성까지 파악할 수 있으므로 업무에 쉽게 활용할 수 있습니다.

  • 손쉬운 배포(Deployment)

모델 적용을 위한 배포도 쉽습니다. 여러 개의 파이프라인을 만들고 최적의 모델은 선택한 다음, ‘모델 게시’ 버튼을 누르면 DB/하둡, 배치, 온라인, 실시간 등 원하는 운영 환경에 원클릭으로 배포할 수 있습니다. 이처럼 그 어떤 운영 환경에도 모델을 배포할 수 있는 이유는, 복잡한 머신러닝 결과를 압축된 바이너리 파일 형태(Astore)로 생성하고 모델옵스 방법론을 적용하여 모델에서 만든 기능을 운영 단으로 바로 넘기기 때문입니다.

  • 모니터링 및 셀프러닝(Monitoring & Self-Learning)

아무리 최적화된 모델도 시간이 지나면 성능이 떨어지기 마련입니다. 이를 해결하기 위해 SAS는 모델 성능을 지속적으로 모니터링하는 기능을 제공합니다. 정확도가 어느 정도 떨어졌는지를 모니터링하고, 일정 수준 밑으로 떨어지면 셀프 러닝 프레임워크가 작동합니다. 모델의 성능을 유지하도록 함으로써 비즈니스 가치를 극대화하는 것입니다.

  • 개방성

SAS AutoML은 R, 파이썬 등 오픈소스 사용자의 언어로 SAS AutoML을 사용할 수 있도록 SAS에서 SWAT 라이브러리를 제공합니다. 이를 통해 오픈소스 사용자도 앞서 소개한 모든 자동화 기능을 오픈소스의 언어로 사용할 수 있습니다. SAS AI의 도움을 받아 뛰어난 데이터 사이언티스트로 상향 평준화될 수 있는 것입니다.

기업의 비즈니스 가치 실현

분석이나 AI는 비즈니스 가치를 실현하기 위한 수단입니다. SAS AutoML은 기업이 중요한 비즈니스 가치를 실현할 수 있도록 3가지 관점에서 비즈니스를 지원합니다.

▶첫째, 분석의 가속화. 분석에 드는 시간을 획기적으로 줄여 분석의 가치를 좀더 빨리 누릴 수 있습니다. ▶둘째, 운영의 가속화. 좋은 모델을 운영 시스템에 효율적으로 적용하고, 분석의 가치가 떨어지지 않도록 셀프 러닝을 통해 스마트한 상태를 유지하거나 시스템을 더욱 스마트하게 만들 수 있도록 지원합니다. ▶셋째, 분석의 대중화. AI 플랫폼을 활용하여 전문가는 물론, 현업에서 일하는 사용자도 자신의 업무를 효율화할 수 있습니다.

이처럼 분석과 운영에 속도를 더하고 누구나 손쉽게 분석을 할 때, 기업은 비로소 비즈니스 가치를 극대화할 수 있으며, 지속가능한 비즈니스 혁신을 이룰 수 있습니다.

Tags AI AutoML
Share

About Author

Byoung-Jeong Choi

Director, Advanced Analytics

Related Posts

Leave A Reply

Back to Top