서문
- 좋은 데이터와 통찰력 있는 스토리텔링은 직관적이다.
- 데이터 스토리텔링은 분석적 발견을 효과적으로 전달하기 위한 투자이다.
- 데이터가 영향력 있는 이야기를 위한 핵심이라는 것을 알고 있지만, 어떻게 전달할지 이해하는 사람은 많지 않다.
- 데이터 + 스토리텔링 + 디자인 = 데이터 스토리텔링
데이터 - 데이터를 얻는 방법
공개 데이터
- 미국인구조사국
- 유럽 연합 개방형 데이터 포털
- Datacatalog.org
- NHS 보건 및 사회 복지 정보 센터
- 아마존 웹 서비스 공공 데이터셋
- 구글 파이낸스
- 픽토차트 데이터베이스
비공개 데이터
- 페이스북 인사이트
- 메일침프 애널리틱스
- 구글 애널리틱스
스토리텔링 - 버즈스모의 다섯 가지 핵심 이야기
트렌트 파악하기
트렌드는 어떤 것이 변화하거나 발전하는 보편적인 방향을 가리키는 지표이다. 아래의 트위터 그래프와 같이 단조로운 트렌드에서도 이야기를 전할 수 있다. "트위터가 왜 활성 사용자 수를 늘리는 것을 실패했는가"와 같은 이야기가 될 수 있을 것이다.
랭킹 이용하기
랭킹은 리스트에 있는 항목 간의 관계에 대해 알려준다. 예를 들어 "밴쿠버가 가장 살기 좋은 도시 리스트에서 2위를 차지하는 가운데, 비엔나는 계속해서 1위를 차지하고 있는가?", "미국에서 다른 곳에 비해 범죄율이 높은 특정 지역이 있는가?"가 있을 것이다.
비교하기
비교는 양극단에 있거나 매우 비슷한 두 대상을 나란히 하여 이야기를 전달한다. 트위터를 예로 들어서, 페이스북의 급격한 성장과 비교할 수 있다.
반직관적인 데이터 찾기
사람들이 진실이라고 알고 있는 지식에 반대되는 데이터는 굉장한 이야기가 된다. 예를 들어 팝 타르트의 판매량이 허리케인 이전보다 7배 증가하였다. 자연 재해를 예상한 사람들이 위안을 주는 음식을 찾은 것으로 보인다.
데이터 포인트 간 관계 언급하기
데이터 포인트 간의 관계는 여러 변수 간의 연관성 또는 상관관계를 보여줌으로써 이야기를 전달한다. 예를 들어 비트코인 채굴 회사가 캐나다로 유입되면서 지역 주민의 에너지 비용 인상으로 이어지고 있다.
디자인 - 차트와 그래프
도트 매트릭스 차트
- 데이터 항목에 따른 분포와 비율을 빠르게 전달하고 싶을 때 사용한다.
- 패턴을 찾고 있다면 데이터셋 간 비교를 위해 사용한다.
선 그래프
- 하나 이상의 그룹에서 같은 기간 동안의 변화를 비교하기 위해 사용한다.
막대 그래프
- 시간에 따른 데이터의 큰 변화를 보여주기 위해 사용한다.
면적 차트
- 하나 이상의 그룹에서 시간에 다른 변화를 추적하기 위해 사용한다.
데이터 프리젠테이션에 필요한 디자인 요소
- 비율 : 그래프의 길이나 면적의 비율은 데이터 관계와 일치해야 한다.
- 색상 : 기관이나 고객의 브랜드 색상을 이용하면 좋고, 덜 중요한 데이터는 지우거나 회색처리 한다.
- 타이포그래피 : 글자가 클수록 중요도가 높고, 텍스트는 수평이어야 한다.
해야할 것과 하지 말아야할 것
- 아이콘을 활용해 이해력을 증진시키고, 너무 많은 라벨을 없앤다.
- 값을 비교하기 쉽도록 데이털르 시각화한다.
- 한 레이아웃에서 6색 이상을 사용하지 않는다.
- 3차원 차트를 사용하지 않는다.
참고 링크
DataLit : 데이터 다루기
'프로젝트 단위 공부 > [부스트코스] DataLit : 데이터 다루기' 카테고리의 다른 글
DataLit : 데이터 다루기 마무리 (0) | 2024.03.25 |
---|---|
Ch3-과제. 데이터 사이언스 (2) | 2024.03.24 |
Ch3-3. 데이터 스토리텔링 파트 1 (0) | 2024.03.17 |
Ch3-1. 데이터 사이언스 발표 가이드 (0) | 2024.03.16 |
Ch2-과제. 파이스파크 (0) | 2024.03.15 |