‘이미지 인식(Image recognition)’, 머신러닝과 인공지능(AI)을 포함한 기술 산업 전반을 뜨겁게 달구고 있는 주요 이슈입니다. 특히 컴퓨터 비전, 즉 영상 처리 기술은 무인 자동차, 얼굴 인식, 의료 결과 예측 등 수많은 혁신 기술들을 현실화하는 핵심 요소인데요.
그 가운데 크고 작은 많은 기업들은 이미지 인식과 관련된 다양한 기반 기술과 프로세스의 가능성을 실현하기 위해 산업별 사용 사례를 익히고 있습니다. 숙련된 데이터 사이언티스트들은 예측 모델링에서 이미지 인식으로 넘어가기 위해 필수적인 패러다임 전환의 기로에 서있는데요. 오늘은 이러한 새로운 개념과 도전 과제 그리고 도전 과제를 해결하기 위한 방법을 소개하고자 합니다.
이미지 처리는 이미지 인식이 아닙니다
이미지 처리는 첫째, 분석을 위한 이미지 파일 준비와 둘째, 분석할 변수를 선택하거나 원하는 품질을 얻기 위한 알고리즘의 후속 적합(subsequent fitting)의 2단계 과정을 의미합니다. 적절하고 안정적인 예측 모델을 구축하기 위해서는 데이터 준비가 매우 중요한데요. 연속형 변수를 공통 척도로 표준화하는 작업, 결측 값 대치, 변수 선택 등의 데이터 작업 역시 각각의 알고리즘에 있어 중요합니다. 이미지 인식 역시 마찬가지입니다. 이미지 처리 단계는 이어지는 이미지 인식 단계의 실행 가능성에 직접적으로 영향을 미칩니다.
자동차 보험 회사가 자동차 사고 현장의 스마트폰 사진을 분석해 고객 자동차의 충돌을 사전 평가한다고 가정해봅시다. 이때 영상 처리 과정은 단순히 실제 이미지 파일을 바이너리(binaries) 또는 평면 특성 표(flat characteristic tables)로 변환하는 것 이상을 포함합니다. 예측 값을 가진 이미지와 그렇지 않은 이미지를 구별하는 특정한 속성이 있을 수 있기 때문인데요.
반드시 필요한 이미지 처리 단계를 결정하기 위해 다음과 같은 질문을 던질 수 있습니다.
- 색상이 중요한가?
- 이미지 파일이 3D를 지원하는 다수의 레이어를 포함하는가?
- 이미지의 특정 영역을 생략할 수 있는가?
- 목표 이벤트(이 경우 전손 처리 또는 보험금 청구 여부 결정)을 구별하는 것은 단순히 이미지 대상의 가장자리(edge)인가?
- 카메라 앵글의 차이를 고려하기 위해 훈련용 데이터 세트가 필요한가?
- 초기 훈련용 이미지의 일부 또는 전체를 약간 변형함으로써 훈련용 데이터 세트를 풍성하게 만드는 것이 의미 있는가?
이 질문들은 개별적으로 적용될 이미지 처리 작업으로 매핑할 수 있습니다. 또 이러한 여러 작업을 조합해 모델 훈련용 이미지 세트를 준비할 수 있는데요. 후속 모델링 작업에 따라 이미지 프로세싱을 사용해 신호를 증폭(또는 반대로 노이즈를 감소)시키는 것이 좋습니다.
이미지 처리 작업의 다양한 옵션과 서로 다른 이미지 처리 작업의 중요성을 탐색하고 이해하는 것이 중요합니다. 분석가는 이미지 인식 알고리즘과 연계해 입증된 가치 접근 방식으로 실패 후 빠른 실험과 신속한 배포를 허용하는 환경에서 다양한 접근 방식을 시도할 수 있는 권한을 부여 받아야 합니다.
정적인 이미지가 동적인 이미지보다 훨씬 더 강력할 수 있습니다
특정 비즈니스 컨텍스트는 다른 비즈니스 컨텍스트보다 정적이기 때문에 일부 이미지 사용 사례는 다른 것보다 복잡합니다. 하이 테크 또는 일반 제조 환경을 예로 들면, 생산 라인 시설에서 사진을 찍을 경우 조명과 프레임이 일정하기 때문에 매우 일관된 각도의 이미지를 얻을 수 있습니다. 그 후 이 이미지를 사용해 생산 프로세스의 미묘한 변화를 감지할 수 있죠! 이러한 변화는 생산 프로세스 단계의 결함을 보여 주는 지표가 될 수 있습니다.
또 다른 예로 범죄자와 범죄 행위를 포착하기 위한 공공 감시 카메라를 들 수 있습니다. 일반적으로 군중을 촬영할 때 감시 카메라의 앵글과 프레임은 제어할 수 있지만 조명과 피사체는 매우 유동적입니다.
다시 자동차 보험 회사의 사례로 돌아가서 100명의 고객에게 동일한 자동차 사고를 촬영해 달라고 하면 어떻게 될까요? 예외 없이 100개의 서로 다른 이미지가 생성될 것입니다. 이렇듯 이미지 세트를 분석할 때 일반적으로 이미지 세트가 정적일수록 개별 이미지의 차이점을 더 쉽게 확인할 수 있습니다. 그리고 흥미로운 패턴을 더욱 수월하게 인식할 수 있죠. 이 사례에서 보험 회사는 고객에게 교통 사고 피해에 대한 일관된 프레임을 제공함으로써 동일한 비교 기준을 사용할 수 있는 앱을 제공하는 것이 합리적일 수 있습니다.
전통적인 알고리즘과 딥(deep) 알고리즘
분류 작업을 위해서는 가장 단순한 모델을 선택하는 것이 현명합니다. 모델이 단순할수록 더욱 안정적이며, 비즈니스 이해관계자들에게 설명하기도 훨씬 쉽기 때문인데요. 그렇지만 일반적으로 이미지 인식은 이미지 정보의 복잡성 때문에 훨씬 복잡한 모델을 필요로 합니다. 때문에 CNN (convolutional neural network)과 같은 딥러닝 알고리즘은 실제 이미지 인식 분류 작업의 대부분에 꼭 필요합니다.
CNN을 조금이라도 접해봤다면 이 알고리즘이 이미지 인식 문제와 관련해 가장 성공적이라는 사실을 알 수 있을 것입니다. 고도로 복잡한 신경망 환경에서 개별 뉴런의 수용 영역 사이에는 사람의 시각 피질처럼 어느 정도의 중첩이 있는데요. 오늘날 현대 컴퓨팅의 성능 덕분에 이러한 복잡한 아키텍처는 그 어느 때보다 사람 수준의 시각 인식 역량에 근접하게 됐습니다. 동시에 잠재적으로 어느 정도의 유해한 편향(bias)과 오류를 제거할 가능성도 갖게 됐습니다.
정리하자면 다양한 이미지 인식 도전 과제를 해결하기 위해 서로 다른 CNN 아키텍처를 탐색하고 이해하는 것이 점점 더 중요해지고 있습니다. 분석가는 입증된 가치 접근 방식으로 실패 후 빠른 실험과 신속하게 배포가 허용되는 환경에서 다양한 구성을 비교 및 대조할 수 있는 권한을 부여 받아야 합니다.
혁신과 결과
앞서 설명한 것처럼 오늘날 이미지 인식은 새로운 도전 과제를 제시합니다. 그렇지만 정형 데이터가 텍스트 데이터와 그 외 다른 형태의 비정형 데이터까지 포함할 수 있도록 데이터 마이닝을 개선하기 시작한 과거로부터 교훈을 얻을 수 있습니다. 시중에 이미지 인식 실험과 프로세스에 대한 주목할 만한 많은 저서들이 있는데요. 이 저서들을 읽고 기술 발전의 흐름을 따라가는 것이 중요합니다. 그리고 무엇보다 기업이 전도유망한 기술과 접근법을 활용해 가치를 실현하기 위해서는 분석 운영 경험이 중요합니다.
의심할 여지없이 이미지 인식은 데이터 과학의 새로운 지평을 열고 있는 흥미로운 기술이며, 다양한 비즈니스 프로세스를 개선할 것입니다. 최신 이미지 처리 및 인식 기술과 강력한 분석 운영 환경을 성공적으로 결합한 기업이 가장 먼저 그 혜택을 경험할 것입니다.
SAS 웹사이트에서 SAS Visual Data Mining(SAS 비주얼 데이터 마이닝)과 머신러닝에 대한 자세한 내용을 확인해보세요.