서문 좋은 데이터와 통찰력 있는 스토리텔링은 직관적이다. 데이터 스토리텔링은 분석적 발견을 효과적으로 전달하기 위한 투자이다. 데이터가 영향력 있는 이야기를 위한 핵심이라는 것을 알고 있지만, 어떻게 전달할지 이해하는 사람은 많지 않다. 데이터 + 스토리텔링 + 디자인 = 데이터 스토리텔링 데이터 - 데이터를 얻는 방법 공개 데이터 미국인구조사국 유럽 연합 개방형 데이터 포털 Datacatalog.org NHS 보건 및 사회 복지 정보 센터 아마존 웹 서비스 공공 데이터셋 구글 파이낸스 픽토차트 데이터베이스 비공개 데이터 페이스북 인사이트 메일침프 애널리틱스 구글 애널리틱스 스토리텔링 - 버즈스모의 다섯 가지 핵심 이야기 트렌트 파악하기 트렌드는 어떤 것이 변화하거나 발전하는 보편적인 방향을 가리키는 지..
데이터 스토리텔링 모든 산업은 데이터 기반 의사 결정으로부터 이득을 얻을 수 있다. 하지만 원시 형태의 데이터에서 의사 결정에 도움이 될만한 형태로 바꾸는 것은 쉬운 작업이 아니다. 최종 의사 결정을 하는 사람이 기술적 배경 지식이 없는 경우가 종종 있는데, 이때 데이터 스토리텔링의 가치를 확인할 수 있다. 과학적 분석과의 결합 양질의 데이터를 보급하는 사람으로써, 과학적인 보고와 전통적인 스토리텔링의 장점을 최대한 많이 가져와 정확하면서도 이해하기 쉬운 사실을 전달하는 것이 목표이다. 과학의 장점 재현성 : 과학자는 실험을 어떻게 진행했는지 설명하여 사람들이 결과를 검증할 수 있도록 한다. 출처 : 출처가 잘 표기되어 있는 자료는 가치를 이해하는데 도움이 된다. 가정 : 과학적 질문의 기본 단위는 가설..
데이터사이언스 발표 가이드 '데이터 발표'는 사람들이 연구를 구성 및 요약, 소통하는 방법으로 차트, 그래프, 히스토그램, 분산 차트, 다이어그램과 같이 다양한 도구를 이용한다. 데이터를 표현하는 방법은 데이터의 양, 복잡도, 청중에 따라 달라질 수 있다. 정보의 종류 어떤 데이터를 다루는지가 어떻게 표현하고 싶은지보다 중요하다. 만약 데이터가 문자열이라면 히스토그램으로는 나타내기 힘들다. 따라서 올바른 시각화 방법을 주의해서 고르는 것이 중요하다. 흔히 기술자들은 의사결정자가 이야기를 잘 들어주지 않는다고 생각한다. 정보를 설명하는데 있어 적합한 방법을 선택하지 않으면 사업가들과 데이터에 대해 명확히 소통할 수 없다. 데이터의 양 무언가를 설명할 때는 단순해야 한다. 큰 숫자를 활용하게 되면 정보를 이..
과제 안내 과제는 시각화 도구를 사용해 선택한 데이터셋에 대한 특정한 질문들을 만들고 대답하는 것이다. 모든 질문의 시작부터 끝까지 과제 수행 과정이 문서화되어야 한다. 이 과제의 목표는 탐색적인 데이터 분석을 수행하기 위해 시각화를 사용하는 과정을 더 잘 이해하는 것이다. 1) 관심 있는 데이터셋 선정 가장 관심 있는 분야의 데이터셋을 고른다. 2) 대답하고 싶은 초기 질문 선정 예를 들어, 녹는점과 원자 번호 사이에 관계가 있나요?, 별의 밝은 정도와 색깔이 서로 연관이 있나요? 등 3) 질문에 답하기 위한 데이터 적합성 평가 데이터의 원시 값을 먼저 보는 것은 도움이 되며, 데이터가 질문에 답하기에 적합한지 확인한다. 적합하지 않다면, 위의 과정을 다시 시작하는 것이 좋다. 시각적으로 분석하기 전에..