DataLit : 데이터 다루기 마무리
·
프로젝트 단위 공부/[부스트코스] DataLit : 데이터 다루기
강의평(★★★☆☆)어휘나 맞춤법이 영어를 한국어로 번역해 작성한 것 같은 느낌이라 어색한 부분이 있음대부분 영상이 아닌 글과 사진을 통해 진행되며, 해당 주제의 요약본을 보는 듯한 느낌강의의 난이도는 "입문"이지만, 데이터에 무지한 사람이 본다면 이해하기가 힘들 것 같음모든 내용을 이해한다기보다는 "이런 것들을 공부해야 하는구나!"처럼 가볍게 접근하면 좋을 것 같음내용이 어렵고 따분하다 보니 중간에 멈추고 싶다는 생각이 많이 듦느낀 점파이썬을 활용한 데이터 전처리를 시작으로 확률통계, 하둡, 스파크, 쿠버네티스, 데이터 분석 등 데이터에 대한 거의 모든 내용을 담고 있는 강의였다. 강의평에 적었듯이 요약본에 가까운 느낌이었기에 공부를 하는데 크게 재미를 느끼지 못했고, 어렵다는 느낌만 크게 받았다. 그래..
Ch3-과제. 데이터 사이언스
·
프로젝트 단위 공부/[부스트코스] DataLit : 데이터 다루기
과제 개요데이터 탐색과 정리데이터 시각화와 스토리텔링기계 학습 모델 구축교차 검증과 개선 (특징 공학과 하이퍼파라미터 최적화)엔드-투-엔드 아키텍처와 실제 기계 학습 연구 배포최종 과제구글 코랩, 주피터, 제플린, 또는 d3.js를 이용깃허브 저장소에 저장단계 1. 관심 있는 분야와 데이터셋 선택나는 축구에 관심이 많기에 축구 데이터를 한 번 분석해보고자 한다. Kaggle의 "FIFA 23 Players Dataset" 데이터를 활용할 것이다. 약 18000명의 축구선수에 대한 데이터로 89개의 컬럼으로 이뤄져 있다. Fifa 23 Players DatasetOfficial Fifa 23 Player Statswww.kaggle.com단계 2-1. 데이터 탐색 및 데이터셋 정제판다스의 profiling..
Ch3-4. 데이터 스토리텔링 파트 2
·
프로젝트 단위 공부/[부스트코스] DataLit : 데이터 다루기
서문좋은 데이터와 통찰력 있는 스토리텔링은 직관적이다.데이터 스토리텔링은 분석적 발견을 효과적으로 전달하기 위한 투자이다.데이터가 영향력 있는 이야기를 위한 핵심이라는 것을 알고 있지만, 어떻게 전달할지 이해하는 사람은 많지 않다.데이터 + 스토리텔링 + 디자인 = 데이터 스토리텔링데이터 - 데이터를 얻는 방법공개 데이터미국인구조사국유럽 연합 개방형 데이터 포털Datacatalog.orgNHS 보건 및 사회 복지 정보 센터아마존 웹 서비스 공공 데이터셋구글 파이낸스픽토차트 데이터베이스비공개 데이터페이스북 인사이트메일침프 애널리틱스구글 애널리틱스스토리텔링 - 버즈스모의 다섯 가지 핵심 이야기트렌트 파악하기트렌드는 어떤 것이 변화하거나 발전하는 보편적인 방향을 가리키는 지표이다. 아래의 트위터 그래프와 같이..
Ch3-3. 데이터 스토리텔링 파트 1
·
프로젝트 단위 공부/[부스트코스] DataLit : 데이터 다루기
데이터 스토리텔링모든 산업은 데이터 기반 의사 결정으로부터 이득을 얻을 수 있다. 하지만 원시 형태의 데이터에서 의사 결정에 도움이 될만한 형태로 바꾸는 것은 쉬운 작업이 아니다. 최종 의사 결정을 하는 사람이 기술적 배경 지식이 없는 경우가 종종 있는데, 이때 데이터 스토리텔링의 가치를 확인할 수 있다.과학적 분석과의 결합양질의 데이터를 보급하는 사람으로써, 과학적인 보고와 전통적인 스토리텔링의 장점을 최대한 많이 가져와 정확하면서도 이해하기 쉬운 사실을 전달하는 것이 목표이다.과학의 장점재현성 : 과학자는 실험을 어떻게 진행했는지 설명하여 사람들이 결과를 검증할 수 있도록 한다.출처 : 출처가 잘 표기되어 있는 자료는 가치를 이해하는데 도움이 된다.가정 : 과학적 질문의 기본 단위는 가설이며, 이를 ..