데브코스

[프로그래머스] 데이터 엔지니어링 데브코스 3기/숙제

[숙제 - 24일 차] 데브코스 SQL 숙제

숙제TableFieldssession_timestampsessionId (string), ts (timestamp)user_session_channeluserid (integer), sessionid (string), channel (string)session_transactionsessionid (string), refunded (boolean), amount (integer)channelchannelname (string)사용자 별로 처음 채널과 마지막 채널 알아내기ROW_NUMBER vs FIRST_VALUE / LAST_VALUE아래의 코드는 userid가 251인 사용자의 channel을 확인할 수 있다.SELECT ts, channelFROM raw_data.user_session_channe..

[프로그래머스] 데이터 엔지니어링 데브코스 3기/숙제

[숙제 - 23일 차] 데브코스 SQL 숙제

숙제채널별 월별 매출액 테이블 만들기TableFieldssession_timestampsessionId (string), ts (timestamp)user_session_channeluserid (integer), sessionid (string), channel (string)session_transactionsessionid (string), refunded (boolean), amount (integer)channelchannelname (string)adhoc 밑에 CTAS로 본인이름을 포함한 테이블로 만들기session_timestamp, user_session_channel, session_transaction 사용아래와 같은 필드로 구성monthchanneluniqueUsers (총 방문 사..

[프로그래머스] 데이터 엔지니어링 데브코스 3기/TIL(Today I Learn)

[TIL - 24일 차] 데이터 웨어하우스와 SQL과 데이터 분석 (4)

JOIN 소개JOIN이란?두 개 이상의 테이블을 공통 필드를 가지고 merge하는 데 사용된다. 이는 스타 스키마로 구성된 테이블로 분산돼 있던 정보를 통합하는 데 사용된다. 6개의 JOIN 방법이 존재하지만, 대부분은 LEFT JOIN과 INNER JOIN으로 충분하다.JOIN 문법JOIN 방식에 따라 ____에는 INNER, FULL, LEFT, RIGHT, CROSS가 들어갈 수 있다.SELECT A.*, B.*FROM raw_data.table1 A____ JOIN raw_data.table2 B ON A.key1 = B.key1 and A.key2 = B.key2WHERE A.ts >= '2019-01-01';JOIN 시 고려할 점중복 레코드가 없고, Primary Key Uniqueness가 ..

[프로그래머스] 데이터 엔지니어링 데브코스 3기/TIL(Today I Learn)

[TIL - 23일 차] 데이터 웨어하우스와 SQL과 데이터 분석 (3)

GROUP BYGROUP BY 절 & Aggregate함수GROUP BY를 활용하여 테이블의 레코드를 그룹핑하여 그룹별로 다양한 정보를 계산할 수 있다. 계산 과정은 두 단계로 이루어지며, 다음과 같다.그룹핑할 필드를 GROUP BY로 결정(하나 이상의 필드가 될 수 있음)그룹별로 계산을 위한 Aggregate 함수 사용(COUNT, SUM, AVG, MIN, MAX, LISTAGG, ...)예제 (1)아래의 SQL 구문은 월별 세션 수를 카운트한다. timestamp의 형식은 "yyyy-mm-dd ~"이므로 LEFT(ts, 7)은 "yyyy-mm"이 되며, mon으로 그룹핑하여 월별 세션 수의 개수를 계산한다.SELECT LEFT(ts, 7) AS mon, COUNT(1) AS session_cou..

기억에 남는 블로그 닉네임
'데브코스' 태그의 글 목록 (15 Page)