그래비티(2013), 인터스텔라(2014), 마션(2015), 컨택트(2016), 패신저스(2017)까지, 여러분은 이중 몇 편의 영화를 보았나요? 최근 우주에 대한 공상과학(SF) 영화가 한해도 빼놓지 않고 박스 오피스를 기록해왔습니다. 컴퓨터 그래픽(CG) 기술 발전의 공이 크겠지만, 1969년 아폴로 11호의 인류 최초 달 착륙을 시작으로 혁신을 거듭해온 항공•우주 과학 기술 역시 큰 영향을 미쳤을 텐데요.
과학 기술의 진보와 함께 인류는 우주에 대한 본능적인 궁금증을 과학적 상상력과 우주 탐사라는 새로운 도전으로 승화시켰습니다. 오늘은 그 중에서도 지구와 가장 밀접한 관계를 갖는 태양계의 비밀을 밝힐 수 있도록 새로운 가능성을 열어준 빅데이터 분석 기술을 소개해드리고자 합니다.
분석 기술의 진보, 우주에 대한 심오한 질문에 답하다
- 지구로부터 1백만 마일 떨어진 궤도를 선회하는 위성을 통해 무엇을 배울 수 있을까요?
- 지구를 등지고 있는 태양의 측면에서는 어떤 일들이 벌어지고 있을까요?
- 태양과 행성이 존재하는 포자구, 태양권은 다른 성간 공간과 어떻게 상호작용할까요?
모두 천체 물리학자와 천문학자들이 우주의 신비를 탐구할 때 직면하게 되는 질문들인데요. 그 중 하나는 태양의 코로나(corona), 즉 대기의 가장 바깥쪽 층이 섭씨 5,600도로 태양의 표면보다 300배 이상 더 뜨거운 이유를 설명합니다. 과학자들은 자기장에 갇힌 에너지가 이 과열의 원인이며, 코로나 루프(coronal loops)가 지금 이 순간에도 진행되고 있는 태양 연구의 핵심 열쇠가 될 것으로 추측하는데요.
코로나 루프는 태양 표면 위에서 역동적으로 빛나고 있는 둥근 아치형 구조입니다. 고온의 플라즈마(plasma)로부터 발광해 1백만도를 훨씬 웃도는 온도에까지 도달하는데요. 전화한 플라즈마는 강력한 자기장의 곡선을 따라 흐릅니다. 이 빛나는 자성 아치는 태양 흑점과 밀접하게 관련돼 있는데요. 태양 흑점은 태양의 대기 밖으로부터 상당한 양의 X선과 자외선을 흡수하고 지구 대기 상층부로 방출합니다.
천체 물리학자 커뮤니티는 이 강력한 아치가 형성될 때 자기 재결합(magnetic reconnection)이 발생할 것으로 추측합니다. 자기 재결합은 자기 에너지가 운동 에너지, 열 에너지, 입자 가속으로 변환되는 물리적 과정인데요.
미국 나사(NASA) 고다드 우주 비행 센터(Goddard Space Flight Center)의 컨설턴트이자 미시간 대학교(University of Michigan)의 대기•해양•우주 과학 연구원인 라스 달도르프(Lars Daldorff)와 스웨덴 비즈니스 인텔리전스 및 데이터 웨어하우스 기업 인포트렉(Infotrek)의 컨설턴트인 시아바시 모하메디(Siavoush Mohammadi)는 바로 이 물리적 과정을 탐구하고 있습니다.
두 연구원은 탐색 과정에서 정보에 대한 과학적 프로세스를 늦추고, 인사이트와 지식으로 변환하는 역량을 저해하는 커다란 걸림돌인 데이터 충돌(the crush of data)을 해결하기 위해 힘을 합쳤습니다.
물리학자들이 대형 슈퍼 컴퓨터를 이용해 태양에 대한 모의 실험을 진행할 때 막대한 양의 데이터가 생성됩니다. 그렇지만 이 데이터 더미 속에서 특정한 시간과 공간에서만 발생하는 흥미로운 현상에 대한 단서를 발견하는 것은 마치 건초 더미에서 바늘을 찾는 것과 같습니다. 분명 위대한 과학적 발견은 데이터 속 어딘가에 있지만 그 위치는 알 수 없죠. 따라서 연구원들은 단서가 있을 법한 곳에 대한 합리적인 추측을 기반으로 데이터를 작은 크기로 쪼갭니다.
문제는 운 좋게도 첫 추측만으로 흥미로운 현상을 발견하더라도 그것이 데이터 속 유일한 인사이트인지는 확신할 수 없다는 것인데요. 이에 따라 태양에 대한 모의 실험으로부터 데이터를 수집하고, 데이터로부터 인사이트를 도출하는 작업 사이의 시간이 매우 길어질 수 있습니다.
달도르프 연구원은 나사에서 진행한 플라즈마 모의 실험으로부터 수집한 방대한 태양 연구 프로젝트 데이터를 탐색, 분류, 표시하는 데 활용할 상용 분석 솔루션을 고려할 때 다음과 같은 질문을 던졌습니다.
- 만약 커다란 건초 더미에서 단 한번에 바늘을 찾을 수 있다면 어떨까요?
- 바늘을 찾은 후 중요한 사항만을 완벽하게 분석하기 위해 핵심 데이터만을 추출할 수 있다면 어떨까요?
일반 비즈니스에서 고객 인텔리전스(CI)를 도출하기 위해 널리 쓰이는 자동 탐색적 데이터 분석(automatic explorative analysis of data)은 과학자들이 우주를 이해하는 데 새로운 공헌을 했습니다. 빅데이터 분석 기술의 진보 덕분에 과학자들은 이제 데이터 하위 집합을 반복적으로 분석하는 대신 빅데이터에서 핵심 포인트를 신속하게 찾아낸 후 관련성이 높은 항목을 집중해서 연구할 수 있게 됐죠!
두 연구원은 인메모리(in-memory)에서 작동하는 빅데이터 탐색, 상호작용 탐색, 리포팅 툴로서 ‘SAS 비주얼 애널리틱스(SAS Visual Analytics)’를 사용하고 있습니다. SAS 비주얼 애널리틱스를 활용한 다양한 분석 방법은 수많은 산업군에서 표준화되어 데이터 분석에 이용되고 있는데요. 핵심 포인트를 식별하고 적절한 데이터 관계를 찾은 후 분석, 시각화, 리포팅하는 방법은 비즈니스 데이터에든 과학적 데이터에든 동일하게 적용됩니다.
달도르프와 모하메디 연구원은 2015년 시애틀에서 개최된 합동 통계 회의(Joint Statistical Meetings)에서 “이 연구 결과가 나사의 태양 자기 루프 연구에 도움이 되는 동시에 다른 데이터 집약적인 분야에서 탐색적 데이터 분석의 효율성을 보여줄 수 있기를 바란다. 놀라운 가능성을 가진 이 새로운 애플리케이션은 학계, 비즈니스, 과학 등 다양한 분야에서 연구원들이 빅데이터로부터 더욱 빠르게 인사이트와 연구 결과를 도출할 수 있도록 돕는다.”고 말했습니다.
산업을 막론하고 누구나 쉽게 데이터 과학자처럼 비즈니스를 분석하고 빅데이터를 시각화할 수 있는 SAS 비주얼 애널리틱스를 무료로 이용하고, 그 효과를 직접 체험해보세요! SAS 비주얼 애널리틱스는 강력한 시각적 탐색과 고급 분석 기법을 통해 빅데이터로부터 고도의 인사이트를 도출합니다. 또 셀프 서비스 인터페이스 상의 다양한 컨트롤 기능은 현대적인 데이터 시각화 자료를 지원합니다.
간단한 신청만으로 ‘SAS 비주얼 애널리틱스’를 14일간 무료로 사용하세요!