미국의 최고 권위의 과학자인 버니바 부시(Vannevar Bush)가 기계가 생각하고 학습하는 미래를 예측한 것이 1945년이었습니다. 당시까지만 해도 과학적 공상으로만 보였던 것이 이제는 Google 검색 결과 같이 평범한 사물까지도 머신러닝의 산물이 되고 있습니다. 넷플릭스(Netflix)는 머신러닝을 사용하여 개인 맞춤형 영화 추천 서비스를 제공하고 있습니다. eHarmony는 머신러닝을 통해 사랑까지 수량화하여 예측합니다. 은행들은 사이버 감시를 비롯해 사기 및 악용 여부를 모니터링하는 데까지 머신러닝을 활용하고 있습니다.
오늘날 우리의 삶에 미치는 머신러닝의 영향력은 하루하루 커지고 있지만 동시에 머신러닝의 의미와 가능성, 그리고 관심을 가져야 하는 이유에 대해서는 혼란만 가중되고 있습니다. Geneia의 최고 운영 책임자(COO)인 헤더 라브와(Heather Lavoie)는 이렇게 설명합니다. “쉽게 말해서 머신러닝은 데이터를 통한 학습 알고리즘을 개발하여 연구하는 기술을 의미합니다. 알고리즘은 입력 값을 기준으로 모델을 개발한 후 명시적으로 프로그래밍된 명령어를 따르기보다는 이 모델을 통해 예측하거나, 의사결정을 내리는 방식으로 작동합니다.”
패턴 분석을 통한 인명 구조
헬스케어 기술 및 컨설팅 기업인 Geneia는 빅 데이터와 머신러닝을 함께 사용함으로써 헬스케어 기업이 보다 낮은 비용으로 환자를 치료하도록 돕고 있습니다.
라브와는 “Geneia는 임상 데이터, 실험 데이터, 생리 데이터, 보험 통계 데이터, 소비자 데이터 등 여러 가지 다른 소스에서 데이터를 수집합니다. 그 결과 Theon이라고 하는 데이터 통합 플랫폼을 개발하여 머신러닝 기법을 적용할 수 있게 되었습니다.”라고 설명합니다.
Geneia는 머신러닝을 사용하여 값을 서로 비교한 후 누락된 값을 발견할 뿐만 아니라 주성분 분석을 실시하여 데이터 패턴, 즉 추이와 인과관계를 알려주는 군집 형태를 살펴볼 수 있습니다. 라브와는 “머신러닝을 통해 이전에는 미쳐 발견하지 못했던 데이터 패턴을 찾아낼 수 있습니다.
또한 웨어러블 의료 기기와 센서로 훨씬 더 많은 정보를 수집할 수 있게 되었습니다. 대기 정보, 습도, 냉장고를 개방하거나 화장실을 사용한 횟수 등 우리는 개인에 대한 이해뿐만 아니라 모집단의 동향에 대해서도 더욱 정확하게 파악할 수 있게 되었습니다.”라고 말했습니다.
Geneia는 머신러닝을 이 모든 데이터에 적용한 뒤로 데이터 정확도가 높아지면서 과거 임상 평가나 실험 값에 비해 조기에 예측하여 신속히 개입할 수 있게 되었습니다. 특히 이러한 현상은 변화를 더욱 빠르게 나타내는 연속형 데이터 세트에서 더욱 두드러졌습니다.
라브와는 “예를 들어 울혈성 심부전을 앓고 계신 할머니가 집에서 회복 중이신 경우에는 웨어러블 의료 기기가 체중이나 맥박 산소 수치, 또는 호흡률의 변화를 빠르게 감지할 수 있습니다. 이렇게 수집되는 데이터는 모두 Theon 애플리케이션에 입력되어 건강 상태가 더 악화되기 전에 미리 감지하고 알려줄 수 있습니다.”라고 설명했습니다.
라브와도 지적하지만 노령 인구층을 위한 헬스케어 서비스 제공업체가 충분하지 않기 때문에 이전과는 다른 방법으로 환자를 진료할 수 있는 새로운 방법이 절실합니다.
“머신러닝이 적용된 웨어러블 의료 기기는 사람들의 건강을 증진하여 수명을 늘릴 뿐만 아니라 환자가 집과 같이 가장 편한 곳에서 가족과 함께 요양할 수 있도록 하는 데 커다란 기여를 할 것입니다.”
머신러닝의 미래
규모에 상관없이 모든 산업군에 종사하는 기업들에서 머신러닝을 사용하는 사례가 점차 늘어나면서 앞으로 머신러닝은 “비즈니스 경쟁에서 빠지지 않는 필수 기법”이 될 것이라고 라브와는 덧붙였습니다.
아무리 훈련이 잘 된 모델이라도 제약 조건을 무시할 수는 없을 것입니다. 그러나 라브와는 머신러닝을 적용하여 이전까지 서로 무관한 데이터 세트(환경, 사회 경제, 생체 측정, 금융, 유전체, 농업 등)가 통합되는 미래를 꿈꾸고 있습니다. 그렇게 되면 버니바 부시조차 예측하지 못한 획기적인 발전을 이루게 될 것입니다.