프로젝트 단위 공부/[부스트코스] DataLit : 데이터 다루기
Ch2-1. 하둡
빅데이터 '빅데이터'라는 용어는 실제 데이터를 의미하지 않는다. 너무 거대하거나 복잡한 데이터셋을 분석하고, 체계적으로 정보를 뽑아 내거나 다루기 위한 분야이다. 빅데이터에 관한 4V는 다음과 같고, 꼭 알고 있어야 하는 내용이다. 규모(Volume) : 고객에 대한 종합적인 시각과 더 많은 과거 데이터를 갖고 있으면, 더 많은 통찰을 이끌어낼 수 있다. 속도(Velocity) : 정보를 빠르게 처리할수록 쿼리, 보고서, 대시 보드를 통해 알고 싶은 대답을 유연하게 얻을 수 있다. 다양성(Variaty) : 고객 관계 관리 시스템, 소셜 미디어, 콜 센터 로그 등을 통해서 다양한 고객 데이터가 있을수록 고객에 대해 더 다양한 시각을 키울 수 있다. 정확성(Veracity) : 고객 데이터는 정확한 결정을..