RMSE

[프로그래머스] 데이터 엔지니어링 데브코스 3기/숙제

[숙제 - 79일 차] 타이베이 주택 가격 예측 모델 만들기 with Spark ML

타이베이 주택 가격 예측 모델 만들기Colab Spark 환경 설정라이브러리 설치PySpark와 py4j 패키지 설치!pip install pyspark==3.3.1 py4j==0.10.9.5Spark Session 생성Local Standalone Spark 사용from pyspark.sql import SparkSessionspark = SparkSession \ .builder \ .appName("Taipei Housing Price Prediction") \ .getOrCreate()모델 빌딩데이터 가져오기S3에 저장된 Taipei_sindan_housing.csv를 가져옴!wget https://~/Taipei_sindan_housing.csv데이터 읽기csv 파일을 읽은 뒤 ..

프로젝트 단위 공부/[부스트코스] DataLit : 데이터 다루기

Ch3-과제. 데이터 사이언스

과제 개요 데이터 탐색과 정리 데이터 시각화와 스토리텔링 기계 학습 모델 구축 교차 검증과 개선 (특징 공학과 하이퍼파라미터 최적화) 엔드-투-엔드 아키텍처와 실제 기계 학습 연구 배포 최종 과제 구글 코랩, 주피터, 제플린, 또는 d3.js를 이용 깃허브 저장소에 저장 단계 1. 관심 있는 분야와 데이터셋 선택 나는 축구에 관심이 많기에 축구 데이터를 한 번 분석해보고자 한다. Kaggle의 "FIFA 23 Players Dataset" 데이터를 활용할 것이다. 약 18000명의 축구선수에 대한 데이터로 89개의 컬럼으로 이뤄져 있다. Fifa 23 Players Dataset Official Fifa 23 Player Stats www.kaggle.com 단계 2-1. 데이터 탐색 및 데이터셋 정제 ..

기억에 남는 블로그 닉네임
'RMSE' 태그의 글 목록