인공지능(AI)과 머신러닝이 최근 화두로 떠오르며 이를 둘러싼 여러 오해가 생기고 있습니다. 특히 사기 분야에 대해서는 더 많은 오해를 하고 있는데요. 인공지능과 머신러닝이 정교한 기술과 방대한 양의 데이터를 사용해 도움을 주고 있다는 사실, 알고 계신가요?
인공지능과 머신러닝은 기술은 우리의 일상적인 업무에서 생각해보지 못했던 질문을 던집니다. 이러한 질문들은 보편적으로 알려져 있지 않은 사실이기 때문에 오히려 예상치 못한 새로운 답변을 찾아내기도 합니다. 인공지능과 머신러닝 기술은 마치 건초더미 속에서 바늘을 찾아내는 것과 같이 방대한 양의 데이터를 필터링해서 원하는 데이터를 검색할 수 있는 능력이 있기 때문인데요. 사람이라면 복잡하고 정교한 작업을 효율적으로 하기 쉽지 않겠죠.
앞서 언급한 것처럼 인공지능과 머신러닝은 수없이 많은 데이터를 하나하나 검사하고 확인 할 수 있을 뿐만 아니라 이 외에도 더 많은 업무를 처리할 수 있도록 훈련할 수 있습니다. 이를 통해 존재하는지도 몰랐던 데이터 패턴을 찾아낼 수 있습니다.
보험 사기 방지를 돕는 인공지능과 머신러닝 기술
데이터 분석가(Analyst)나 사기담당 조사관은 그들이 데이터에서 찾고자 하는 질문, 즉 악의적인 사기 유형을 파악할 수 있습니다. 미국의 사례를 예로, 사망자의 보험 청구 건이 시스템 상으로 지불되었는지 확인할 때를 살펴보겠습니다. 데이터 분석가와 조사관이 보험자의 사망 날짜를 기준으로 보험 청구 시스템이 즉시 업데이트되지 않는다는 사실을 확인하게 되면 시스템은 정상적으로 돌아가는 것처럼 보이지만 실제로는 사망일자 이후에 발생하는 청구액을 지불 할 것임을 알게 될 것입니다.
이러한 문제는 수정된 데이터가 청구 건에 대해 지불이 된 이후 도착하는 규칙 기반 지급 엔진의 고유성 때문에 발생합니다. 최악의 경우, 사기범은 모든 청구 건에 대해서 지불한 뒤 잘못 처리된 건을 확인하는 ‘페이앤드체이스(Pay-and-Chase)’ 모델의 약점을 악용한 뒤 모델이 이를 잡아내기 전 사라지기도 하는데요. 하지만 다행인 점은 이런 보험급 지급은 정부가 승인한 무이자 대출로 감안되어 몇 년 후에 보험 회사가 보험금을 상환합니다.
인공지능과 머신러닝은 잠재적 의미가 있는 데이터의 패턴을 인식해 사람이 생각해보지 못한 질문을 제안하기도 하는데요. 사망일자 이후 제공된 서비스에 대해 지속적으로 보험사의 패턴을 발견하거나, 청구 시스템에 환자의 사망 날짜가 제대로 입력되어 있는 경우에도 보험사가 사망 후 제공한 서비스에 대해 청구한 내역 등을 알아낼 수 있습니다.
인공지능으로 규칙 기반 편집 이상의 것을 얻다
이러한 데이터 분석 알고리즘을 통해 높은 비율의 클레임이 반복적으로 거부되는 보험사의 패턴 역시 파악할 수 있는데요. 하지만 발견하더라도 보험사는 정정된 보험금을 절대 다시 청구하지 않습니다. 왜 보험사들은 정확한 금액으로 다시 청구하지 않는 걸까요?
이는 사기범이 악용할 수 있는 코드를 확인하기 위해 규칙 기반 보험금 지급 엔진을 낚시용으로 사용하기 위해서인데요. 보험사는 해당 코드로 계속 비용을 청구하게 되면서 사기범과의 전쟁에서 우위를 가져갈 수 있게 됩니다.
한 가지 예로 40mg의 정상 용량이 들어있는 주사 약품에 대한 청구 시 보험사가 1개의 약품에 대한 청구를 40개로 청구했다고 가정해보세요. 만약 보험 청구 시스템에 자동화된 규칙이 깔려있지 않을 경우, 시스템은 40배에 해당하는 금액을 보험사에게 환급할 것입니다. 사기를 저지른 보험사는 발각되면 청구 시스템이 지불했기 때문에 문제가 있는 줄 몰랐다고 변명할 것입니다.
이처럼 인공지능과 머신러닝 알고리즘은 사기 범죄를 쉽게 찾아 추적하고, 누가 저질렀는지 확인하는 데 도움을 줍니다. 덕분에 담당 조사관은 제 때 올바른 조치를 취하고 규칙 편집을 수정해 재정적 손실을 줄일 수 있습니다. 초과 지급된 의료 보험비를 회수하는 것은 살인 사건 수사처럼 수사에 빨리 착수할수록 더 좋은 결과를 가져옵니다.
실제로 저소득층 의료 보장 제도인 메디케이드 프로그램(Medicaid Program)은 이런 시스템 오류를 수년간 방치한 대가로 메디케어 메디케이드 서비스 센터(CMS; Centers for Medicare & Medicaid Services)에 수백만 달러를 상환한 바 있는데요. 선불 분석은 이러한 범죄를 방지하고 오류를 더 빨리 탐지해 손실과 큰 금액의 불필요한 상환을 방지합니다.
인공지능과 머신러닝, 적응형 학습을 통해 사기를 방지하다
머신러닝 알고리즘은 적응형 학습(Adaptive Learning)을 거쳐 더 많은 장점을 활용할 수 있는데요. 적응형 학습은 더 복잡하지만 스팸 메일 필터와 비슷하다고 할 수 있습니다. 수십 년 전에 이메일이 발명되면서 많은 스팸 메일을 받는 일 또한 많아졌죠. 사용자가 스팸 메일이라는 것을 식별할 수 있게 되면서 스팸 필터링 소프트웨어에 내장된 머신러닝 알고리즘도 스팸 메일을 학습하기 시작했는데요. 소프트웨어는 사용자가 스팸 메일을 검토하고 확인할 수 있도록 스팸 폴더로 분류했습니다. 스팸 메일함에 쌓이는 메일이 많아질수록 필터링 성능도 향상됐는데요.
오늘날의 머신러닝 적응형 학습은 전보다 더 많은 것을 처리할 수 있는 역량을 가지고 있습니다. 알고리즘은 머신러닝을 통해 잠재적 사기를 탐지하도록 훈련될 수 있으며, 청구서, 보험사 또는 보험사 일원을 기반으로 리스크 점수도 매길 수 있습니다. 검토된 다양한 데이터 조각은 스코어링에 영향을 미치도록 가중치를 부여할 수 있고, 분석 소프트웨어는 다양한 조합으로 스코어링 가중치를 조정하는 수천 개의 모델을 실행해 가장 정확한 조합을 식별합니다.
알고리즘 모델은 SAS 사기 방지 솔루션(SAS Fraud Solutions)을 통해 적응형 학습을 거칠 수 있습니다. 이러한 사기 경고는 생산 과정에서 사기일 가능성이 있거나 추후 검토를 요하거나 사기가 아니라는 등에 대한 최종 결정을 내리는 데 도움을 줍니다. 이 과정에서 머신러닝은 매우 강력한 효과를 발휘해 새로운 정보를 기반으로 학습하고 조정하는데요. 머신러닝은 새로운 정보가 더 나은 모델을 식별하는지 확인하기 위해 스코어링 모델(Scoring Model)을 수천 번이고 재작동시킬 수 있습니다. 이런 확인 절차를 거쳐 새로운 모델이 구현될 수 있는데요. 이 과정은 스코어링이 시간이 지남에 따라 점점 더 개선되는 품질 피드백 루프와 유사합니다.
SAS의 사기방지 솔루션
SAS의 사기방지 솔루션은 포레스터(Forrester) 등 시장 조사 기관을 비롯해 업계에서 가장 뛰어난 기술을 지원하는 솔루션으로 높게 평가 받은 바 있으며, 국내 다양한 대형 보험사에도 도입되고 있습니다.
대표적인 국내 사례로는 현대해상이 있는데요. 현대해상은 지난 2010년 'SAS 보험 사기방지 시스템(SAS Fraud Detection System)’을 도입, 국내 손해보험사 최초로 보험사기인지시스템(IFDS; Insurance Fraud Detection System)을 구축한 현대해상이 발 빠른 대응에 나섰습니다. 보험금 지급 후에도 사기를 추가 적발, 대응하는 것을 목표로 사후 분석 시스템을 강화한 것이죠!
또한 SAS코리아와 현대해상 보험조사부(Special Investigation Unit, SIU)는 2017년 6월부터 6개월간 IFDS를 성공적으로 고도화하고, 보험사기 리스크 관리 체계를 한층 강화했습니다. 현대해상은 2016년도 손해보험협회 주관 ‘보험범죄방지 유공자 시상식’에서 업계 1위 실적을 달성하는 등 차별화된 사기방지 성과와 경쟁력을 인정받아 왔는데요. IFDS 고도화를 통해 현대해상의 자동차, 장기·일반보험 손해율을 개선하는 것은 물론 더욱 건전한 보험 환경을 조성할 것으로 기대가 모아지고 있습니다.
SAS 역시 앞으로도 머신러닝과 같은 고급 분석 기술을 통해 미래 보험 사기를 예측하고 한발 앞서 대응할 수 있도록 최선을 다해 나가겠습니다.