2020년이 벌써 1/3 정도 지나가고 있지만, 2020년 빅데이터 트렌드에 관한 글: These are the Big Data Trends 2020을 정리해 보았습니다.
빅데이터는 Wide Data가 되고 있다
- 클라우드의 보급으로 인해 회사에서 로컬 IT 인프라 구축의 한계가 사라지고 있음
- 이에 따라 데이터가 쪼개지고(fragmented), 넓게 분산되고(distributed), 여러 형태로(incorrectly formatted) 저장되어 있음
- 실제로 다양한 data type으로 데이터를 저장할 수 있는 데이터베이스의 수는 최근 5년간 160개에서 340개 정도로 증가함
데이터의 Shazaming
Shazam
은 노래를 인식하여 그 노래에 대한 정보를 제공해 주는 서비스- 이런 Shazaming이 다른 영역으로도 확장되고 있음 -> 데이터 관련 솔루션
- 알고리즘이 데이터의 패턴과 이상을 감지하여 고급 분석을 가능하게 해 줄 것
- 데이터 솔루션이 탐색 - 대시보드 제공 - 시각화 를 넘어 음성 인식, 동작 인식 센서와 같은 입력 기능도 제공해 줄 것
여러 산업에서의 활용
- 기후 변화, 우주 연구
- 빅데이터 솔루션은 기후변화 연구에 결정적인 기여를 할 수도 있음
- 빅뱅 때부터 현재까지 상상도 할 수 없을 정도로 큰 대규모의 input이 주어질 것. 이를 통해 기상학, 지구과학, 입자물리 연구 기관 등에서 활용
- 지진, 엘 니뇨 등 자연 재해를 연구하는 기관에서는 RPA(robotic process automation), AI, 머신러닝을 활용한 기상 예측에 점점 더 의존하게 됨
- 석유 산업
- 빅데이터 분석과 전례 없는 컴퓨팅 파워의 수혜자 중 하나
- 지진 센서(seismic sensors)에서 생성된 데이터를 통해 석유 매장량을 파악하고 비용을 효율적으로 관리할 수 있음