[TIL - 72일 차] 음식 배달에 걸리는 시간 예측하기 (1)오늘 강의는 "선형대수 기초"이지만, 이미 대학교에서 강의를 수강하기도 했고 수식이 많아 모두 정리하기에 무리가 있어 학습은 영상으로만 진행하였다. 대신에 머신러닝 과제인 "음식 배달에sanseo.tistory.com이전에 문제 이해와 데이터 전처리, 하이퍼 파라미터 튜닝 코드까지 작성해 보았다. 그러나 학습 시간이 생각보다 오래 걸려 KFold를 사용하지 않은 방법으로 사용해보려고 한다. 또한 테스트 데이터의 예측과 under_prediction의 비율도 확인해 보자.음식 배달에 걸리는 시간 예측하기진행 과정하이퍼 파라미터 튜닝KFold (교차 검증) 부분을 삭제하고 train_test_split 사용실행 결과최소 rmse : 729.44..
오늘 강의는 "선형대수 기초"이지만, 이미 대학교에서 강의를 수강하기도 했고 수식이 많아 모두 정리하기에 무리가 있어 학습은 영상으로만 진행하였다. 대신에 머신러닝 과제인 "음식 배달에 걸리는 시간 예측하기"를 진행한 내용을 TIL에 적어보려고 한다.음식 배달에 걸리는 시간 예측하기문제 이해실습 문제 소개목표 : 음식 배달에 걸리는 시간 예측하기이유 : 배달 시간을 정확히 예측하는 것은 사용자의 경험에 많은 영향을 미침사용자의 경험 under-prediction : 예측된 배달 시간보다 실제 배달 시간이 더 걸린 경우over-prediction : 예측된 배달 시간보다 실제 배달 시간이 덜 걸린 경우under-prediction이 over-prediction보다 두 배로 사용자의 경험에 안 좋은 영향을..
과제 개요 데이터 탐색과 정리 데이터 시각화와 스토리텔링 기계 학습 모델 구축 교차 검증과 개선 (특징 공학과 하이퍼파라미터 최적화) 엔드-투-엔드 아키텍처와 실제 기계 학습 연구 배포 최종 과제 구글 코랩, 주피터, 제플린, 또는 d3.js를 이용 깃허브 저장소에 저장 단계 1. 관심 있는 분야와 데이터셋 선택 나는 축구에 관심이 많기에 축구 데이터를 한 번 분석해보고자 한다. Kaggle의 "FIFA 23 Players Dataset" 데이터를 활용할 것이다. 약 18000명의 축구선수에 대한 데이터로 89개의 컬럼으로 이뤄져 있다. Fifa 23 Players Dataset Official Fifa 23 Player Stats www.kaggle.com 단계 2-1. 데이터 탐색 및 데이터셋 정제 ..