다양한 분야의 애플리케이션에서 시계열 데이터 분석이 필수화되면서 시계열 데이터(time series data)의 시각화 역시 부각되고 있다.
데이터의 접근과 팀 간 공유가 용이할수록 그 데이터의 가치는 커진다. 하나의 시계열 그래프 또는 대시보드는 특정 매개변수에 대한 시간 경과에 따른 변화를 시각적 단면으로 보여줌으로써 여러 개의 보고서에 상응하는 가치를 제공할 수 있다.
시계열 데이터의 시각화는 데이터가 비유동적인지 유동적인지에 관계없이, 그리고 변수 간 상관관계가 있는지 여부에 관계없이 패턴과 그 패턴에 반하는 이상점을 판별하는 데 도움이 된다. 예를 들어 시계열 선 그래프(시간 도표라고도 함)는 시간을 기준으로 한 값을 보여준다. x-y 그래프와 비슷하지만 x 축에 시간만 표시된다. 데이터에 대한 더 많은 맥락을 제공하는 더 복잡한 형식을 취하는 시계열 그래프도 있다.
시계열 데이터는 다양한 시각화 유형에 걸쳐 대시보드에서 쿼리 및 그래프 작성이 가능하다. 어느 시각화 유형을 사용할지는 당면한 사용례에 가장 적합한 유형이 무엇인지에 따라 결정된다. 시계열 그래프는 데이터의 행동과 패턴을 시각적으로 강조 표시한다. 이를 통해 트렌드, 계절성, 상관관계와 같은 패턴을 손쉽게 식별할 수 있다.
시계열 데이터를 그래프로 표시하기 위한 도구와 각 도구의 시각화 기능에 대해 살펴보자.
시계열 그래프 작성 도구에는 처음 시작할 때 도움이 되도록 사전 구성된 대시보드가 함께 제공되는 경우가 많다. 대시보드 엔진이 내장된 시계열 플랫폼인 인플럭스DB(InfluxDB)와 그라파나(Grafana)는 시계열 데이터를 시각화하고 관찰된 데이터에서 의미를 찾고 손쉽게 해석할 수 있게 해주는 다양한 유형의 시계열 플롯을 제공하기 위한 용도로 많이 사용된다(참고로 필자는 인플럭스데이터(InfluxData)에 종사한다).
그라파나는 인플럭스DB와 통합되므로 두 플랫폼을 함께 사용해 다양한 데이터 소스의 데이터를 시각화하고 센서, 시스템 및 네트워크 모니터링을 구현하는 경우가 많다.
내장된 인플럭스DB UI는 인플럭스DB 클라우드(InfluxDB Cloud) 또는 인플럭스DB OSS를 사용한 시계열 데이터 작업 측면에서 완전한 패키지다. 이 UI는 사용자가 인플럭스DB에 데이터를 쓰기 위한 노코드(no code) 도구, 시각적 스크립팅 및 쿼리 도구, 데이터 변환 기능, 알림 생성 도구를 포함한 모든 요소를 제공한다. 또한 인플럭스DB UI는 맞춤형 대시보드를 구축하기 위한 강력한 툴도 제공한다. 예를 들면 다음과 같다.
인플럭스DB UI를 통해 사용할 수 있는 시각화 유형에는 밴드 차트, 게이지 차트, 선 및 막대 그래프, 싱글-스탯(single-stats) 그래프, 히트맵, 히스토그램, 모자이크, 산점도, 표 등이 포함된다.
그라파나를 사용한 시계열 데이터 시각화
그라파나 대시보드를 설정하고 이를 다양한 데이터 소스와 통합하는 과정은 간단하다. 그라파나에는 인플럭스DB를 위한 풍부한 기능의 데이터 소스 플러그인이 함께 제공된다. 이 플러그인은 맞춤형 쿼리 편집기를 포함하며 주석 및 쿼리 템플릿을 지원한다.
그라파나는 그래프 작성 기능이 풍부하고 대시보드 제작과 편집에서 높은 수준의 맞춤 구성이 가능하다. 포함된 기능은 다음과 같다.
플러그인을 사용해 외부 데이터 소스에서 데이터를 가져오고 그라파나가 인식하는 형식으로 데이터를 반환할 수 있다. 다양한 데이터 소스가 그라파나와 통합되어 그라파나 대시보드를 생성하고 사용자가 시계열 분석의 시각화를 통해 통찰력을 끌어낼 수 있도록 한다.
데이터 시각화 솔루션의 힘은 솔루션 내에 함께 제공되는 분석 기능에 따라 좌우된다. 시계열 데이터 과학자와 분석가에게는 데이터를 원하는 방식으로 변형할 수 있는 유연성이 필요하다. 이들은 유의미한 데이터 시각화에 앞서 데이터를 준비하기 위해 시계열 데이터에 통계, 동적 통계, 금융 모멘텀, 수학 및 지리시간 함수를 손쉽게 적용할 수 있어야 한다. 인플럭스DB 사용자는 인플럭스데이터의 함수형 쿼리 및 스크립팅 언어인 플럭스(Flux)를 사용해 앞선 모든 작업을 수행할 수 있다.
플럭스를 사용하면 강력한 지리시간 시각화를 생성할 수 있다. 또한 플럭스는 사용자가 이상 탐지를 위한 맞춤형 함수를 직접 작성할 수 있게 해준다. 이상 탐지를 위한 플럭스 사용에 관한 이 블로그 글에는 강력한 데이터 시각화 도구에 보완 분석 도구가 필요한 이유가 잘 나와 있다. 이 데이터의 시계열과 같은 모음에서 비정상적인 계열을 찾기는 거의 불가능하다.
그러나 맞춤형 이상 탐지 알고리즘인 중앙값 절대 편차 플럭스 함수(median absolute deviation Flux function)는 사용자가 이 데이터 집합에서 나타나는 이상점을 찾아 시각화할 수 있게 해준다. editor@itworld.co.kr
https://www.itworld.co.kr/news/199454#csidxf116e6c38a10a56b6a6719c8e118e03