AWS에서 EMR(Elastic Map Reduce, 클라우드 컴퓨팅)을 통해 Zeppelin을 사용할 경우 실제 컴퓨팅 시간과 관계 없이 서버를 켜 놓은 시간에 비례하여 과금되기 때문에, 요금 폭탄을 맞기 십상이다.
Medium에서 데이터 모델링 관련 글: The rise of SQL-based data modeling and DataOps 을 정리한 내용입니다.
데이터 엔지니어링 입문용 슬라이드인 강대명님의 데이터 엔지니어링 101 자료를 정리해 보았습니다.
2019년 10월 19일 (토) 광화문 MS 사옥에서 진행된 데이터야놀자에서 듣고 메모한 내용을 적어 보았습니다.
Jupyter Lab을 브라우저가 아닌 Desktop App으로 사용하는 방법을 소개한다.