[TIL - 2일 차] 데이터 엔지니어링 : 자료구조/알고리즘 풀기 (2)
·
[프로그래머스] 데이터 엔지니어링 데브코스 3기/TIL(Today I Learn)
연결 리스트(Linked Lists) (1)추상적 자료구조(Abstract Data Structures)내부 구현은 숨겨져 있는 상태로 사용하는 자료구조데이터 : 정수, 문자열, 레코드 등연산 : 삽입, 삭제, 순회, 정렬, 탐색 등기본적 연결리스트앞에 있는 노드가 뒤에 있는 노드를 가리키도록 되어있는 자료구조 형태노드 : Data(문자열, 레코드, 또 다른 연결 리스트 등), Link (next)가 담김Head : 연결 리스트의 가장 앞의 노드를 가리키는 포인터Tail : 연결 리스트의 가장 마지막 노드를 가리키는 포인터자료구조 정의노드 클래스class Node: def __init__(self, item): self.data = item self.next = None연결..
DataLit : 데이터 다루기 마무리
·
프로젝트 단위 공부/[부스트코스] DataLit : 데이터 다루기
강의평(★★★☆☆)어휘나 맞춤법이 영어를 한국어로 번역해 작성한 것 같은 느낌이라 어색한 부분이 있음대부분 영상이 아닌 글과 사진을 통해 진행되며, 해당 주제의 요약본을 보는 듯한 느낌강의의 난이도는 "입문"이지만, 데이터에 무지한 사람이 본다면 이해하기가 힘들 것 같음모든 내용을 이해한다기보다는 "이런 것들을 공부해야 하는구나!"처럼 가볍게 접근하면 좋을 것 같음내용이 어렵고 따분하다 보니 중간에 멈추고 싶다는 생각이 많이 듦느낀 점파이썬을 활용한 데이터 전처리를 시작으로 확률통계, 하둡, 스파크, 쿠버네티스, 데이터 분석 등 데이터에 대한 거의 모든 내용을 담고 있는 강의였다. 강의평에 적었듯이 요약본에 가까운 느낌이었기에 공부를 하는데 크게 재미를 느끼지 못했고, 어렵다는 느낌만 크게 받았다. 그래..
[TIL - 1일 차] 데이터 엔지니어링 : 자료구조/알고리즘 풀기 (1)
·
[프로그래머스] 데이터 엔지니어링 데브코스 3기/TIL(Today I Learn)
안녕, 자료구조 & 알고리즘!자료구조문자열, 리스트, 사전, 순서쌍(튜플), 집합 등의 자료형이 존재하는데 "자료구조"는 왜 알아야 하는가?리스트와 max 함수를 활용해서 최댓값을 찾아내는데, 원소의 개수에 비례하여 실행시간이 증가무작위의 숫자가 주어졌을 때, 최댓값을 빠르게 얻을 수 있도록 하는 특정 자료구조가 존재어떤 문제를 해결할 것인가에 따라 적절한 자료구조가 달라짐알고리즘사전적 정의 : 어떤 문제를 해결하기 위한 절차, 방법, 명령어들의 집합프로그래밍 : 주어진 문제의 해결을 위한 자료구조와 연산 방법에 대한 선택해결하고자 하는 문제에 따라 최적의 해결 방법이 달라지며, 방법을 선택하기 위해 자료구조 이해가 필요선형배열(Linear Array)배열 : 원소들을 순서대로 늘어놓은 것(ex. 2 7..
Ch3-과제. 데이터 사이언스
·
프로젝트 단위 공부/[부스트코스] DataLit : 데이터 다루기
과제 개요데이터 탐색과 정리데이터 시각화와 스토리텔링기계 학습 모델 구축교차 검증과 개선 (특징 공학과 하이퍼파라미터 최적화)엔드-투-엔드 아키텍처와 실제 기계 학습 연구 배포최종 과제구글 코랩, 주피터, 제플린, 또는 d3.js를 이용깃허브 저장소에 저장단계 1. 관심 있는 분야와 데이터셋 선택나는 축구에 관심이 많기에 축구 데이터를 한 번 분석해보고자 한다. Kaggle의 "FIFA 23 Players Dataset" 데이터를 활용할 것이다. 약 18000명의 축구선수에 대한 데이터로 89개의 컬럼으로 이뤄져 있다. Fifa 23 Players DatasetOfficial Fifa 23 Player Statswww.kaggle.com단계 2-1. 데이터 탐색 및 데이터셋 정제판다스의 profiling..