엔터프라이즈 합성 데이터 생성 솔루션, ‘SAS 데이터 메이커’ 공식 출시

0

혁신적인 합성 데이터 생성 솔루션으로 데이터 부족 문제 해결, AI 역량 강화

마이크로소프트 마켓플레이스에서 우선 공급

 

민감한 개인정보를 노출하지 않으면서 안전하게 합성 데이터를 생성할 수 있게 해주는 ‘SAS 데이터 메이커’가 출시되었습니다. 현재 마이크로소프트 마켓플레이스에서 제공되는 ‘SAS 데이터 메이커’는 실제 데이터의 통계적, 관계적, 시간적 특성을 그대로 재현하는 합성 데이터를 생성하며, 데이터 계보(lineage), 감사 로그, 입증 가능한 개인정보 보호 조치를 통해 규제 준수를 지원합니다. 또한, 개방형 확장 아키텍처와 데이터 인터페이스를 통해 기존 데이터 생태계에 빠르게 배포하고 통합할 수 있으며, 하나의 도구에서 데이터 증강 및 생성 알고리즘을 제공합니다.

정확하게 생성되고 엄격하게 검증된 합성 데이터는 신뢰할 수 있는 AI 모델을 위한 필수 요소입니다. 그러나 개인정보 보호 우려, 법적 제한, 데이터 확보 및 주석에 소요되는 높은 비용으로 인해 방대한 실제 데이터를 확보하는 것은 점점 더 어려워지고 있습니다. 이러한 시점에 출시된 SAS 데이터 메이커는 위와 같은 과제를 해결할 뿐만 아니라 AI 개발의 속도와 품질을 향상시키는 데 크게 기여할 것으로 기대됩니다.

 

SAS 합성 데이터의 주요 특장점을 소개합니다.

  • 엔터프라이즈급 신뢰성과 기능: SAS는 은행, 헬스케어, 정부 등 합성 데이터가 요구되는 규제 산업 부문에 대해 수십 년간 쌓아온 신뢰성과 전문성을 갖추고 있습니다. 또한 SAS 데이터 메이커는 멀티테이블 소스 데이터, 시계열 데이터, 차등 개인정보 보호(Differential Privacy) 기능을 제공해, 엔터프라이즈 수준의 합성 데이터 요구사항을 지원합니다
  • 노코드 인터페이스: SAS 데이터 메이커는 비즈니스 사용자를 위한 직관적인 그래픽 사용자 인터페이스(GUI)를 제공하여 비 전문가도 합성 데이터를 활용할 수 있게 함으로써 보다 광범위한 엔터프라이즈 운영을 가능하게 합니다.
  • 내장된 데이터 품질 및 평가 도구: SAS 데이터 메이커의 내장 도구는 다양한 생성 방법을 지원하며, 시각적 지표를 사용해 합성 데이터의 품질을 평가하여 실제 데이터 세트에 대한 통계적 정확성을 보장합니다. 경쟁 제품 중 상당수는 확실한 검증 기능이 부족하거나, GUI 기반 품질 검증 없이 API를 통한 프로그래밍 방식 접근만을 제공합니다.
  • 프라이버시 강화 기술(PETs): SAS 데이터 메이커의 PET 기능을 통해 사용자는 기존 워크플로를 변경하지 않고 합성 데이터를 실제 데이터처럼 활용할 수 있으며, 파이프라인에서 실제 데이터와 합성 데이터를 매끄럽게 교체할 수 있습니다. 다른 많은 PET는 워크플로의 대폭적인 변경과 새로운 도구 및 프로세스에 대한 상당한 투자를 요구합니다.

2024년 11월, SAS는 합성 데이터 기술의 선구자이자 리더인 Hazy(헤이지)의 주요 소프트웨어 자산을 인수했습니다. Hazy 기술이 SAS 데이터 메이커에 통합됨으로써 이제 기업에서는 향상된 합성 데이터 생성 기능을 통해 데이터를 안전하고 효과적으로 활용할 수 있게 되었습니다. SAS의 합성 데이터 기술로 그동안 접근할 수 없었던 시나리오를 실험하고 모델링할 수 있게 되었다는 점에서 놀라운 전환점이 될 것으로 기대합니다.

SAS 데이터 메이커 구동 화면(예시)

 

데이터 및 AI 투자에서 빠른 가치 실현
SAS 데이터 메이커의 일반 시장 출시 이전에 프라이빗 프리뷰 기간을 가졌습니다. 이 기간 동안 헬스케어, 금융 서비스, 정부 등 다양한 산업의 고객들이 복잡한 데이터 시나리오를 시뮬레이션하고, 학습 데이터의 격차를 메우며, 견고한 모델 개발 작업을 실시하면서 제품의 역량을 검증했습니다. 이러한 초기 사용자의 피드백을 최종 제품에 반영함으로써 데이터 과학자, 분석가, 개발자의 실제 요구 사항에 부응할 수 있도록 했습니다.

  • 합성 데이터 생성을 통해 영국의 한 금융 서비스 기업은 신용 점수 모델의 학습 시 데이터 격차를 해소할 수 있었습니다. 그 결과, 머신러닝 작업이 촉진되어 모델 정확도가 28% 향상되었으며, 잠재적인 손실 감소에 기여했습니다.
  • 미국의 한 헬스케어 제공업체는 SAS 데이터 메이커를 통해 환자 행동과 치료 결과를 시뮬레이션하고, 치료 계획을 테스트하며, 최적의 치료 경로를 선택할 수 있게 되었습니다. 이 솔루션은 고객 개인정보보호와 관련된 위험을 줄이고, 데이터 기반 연구를 통해 환자에게 실제적인 도움을 제공했습니다.
  • 유럽의 한 통신사는 데이터 접근 시간을 수 주에서 몇 분으로 단축하여, 보다 최신의 고객 이탈 예측 모델을 구현하고 고객 유지율을 개선하는 데 도움을 받았습니다.

 

SAS 데이터 메이커는 현재 마이크로소프트 마켓플레이스에서 제공되며, 향후 추가 클라우드 제공업체 지원과 SAS® Viya®로의 통합이 계획되어 있습니다.

신뢰할 수 있는 AI 구축을 위한 ‘SAS 데이터 메이커’를 직접 경험해 보고 싶으신 분들은 SAS 코리아 영업대표를 통해 신청해 주시거나 bang-bon.goo@sas.com 으로 문의 주시기 바랍니다.

Share

About Author

Hyeshin Hwang

Marketing, SAS Korea

Leave A Reply