2020년이 벌써 1/3 정도 지나가고 있지만, 2020년 빅데이터 트렌드에 관한 글: These are the Big Data Trends 2020을 정리해 보았습니다.

빅데이터는 Wide Data가 되고 있다

  • 클라우드의 보급으로 인해 회사에서 로컬 IT 인프라 구축의 한계가 사라지고 있음
  • 이에 따라 데이터가 쪼개지고(fragmented), 넓게 분산되고(distributed), 여러 형태로(incorrectly formatted) 저장되어 있음
  • 실제로 다양한 data type으로 데이터를 저장할 수 있는 데이터베이스의 수는 최근 5년간 160개에서 340개 정도로 증가함

데이터의 Shazaming

  • Shazam은 노래를 인식하여 그 노래에 대한 정보를 제공해 주는 서비스
  • 이런 Shazaming이 다른 영역으로도 확장되고 있음 -> 데이터 관련 솔루션
  • 알고리즘이 데이터의 패턴과 이상을 감지하여 고급 분석을 가능하게 해 줄 것
  • 데이터 솔루션이 탐색 - 대시보드 제공 - 시각화 를 넘어 음성 인식, 동작 인식 센서와 같은 입력 기능도 제공해 줄 것

여러 산업에서의 활용

  1. 기후 변화, 우주 연구
    • 빅데이터 솔루션은 기후변화 연구에 결정적인 기여를 할 수도 있음
    • 빅뱅 때부터 현재까지 상상도 할 수 없을 정도로 큰 대규모의 input이 주어질 것. 이를 통해 기상학, 지구과학, 입자물리 연구 기관 등에서 활용
    • 지진, 엘 니뇨 등 자연 재해를 연구하는 기관에서는 RPA(robotic process automation), AI, 머신러닝을 활용한 기상 예측에 점점 더 의존하게 됨
  2. 석유 산업
    • 빅데이터 분석과 전례 없는 컴퓨팅 파워의 수혜자 중 하나
    • 지진 센서(seismic sensors)에서 생성된 데이터를 통해 석유 매장량을 파악하고 비용을 효율적으로 관리할 수 있음