숙제TableFieldssession_timestampsessionId (string), ts (timestamp)user_session_channeluserid (integer), sessionid (string), channel (string)session_transactionsessionid (string), refunded (boolean), amount (integer)channelchannelname (string)사용자 별로 처음 채널과 마지막 채널 알아내기ROW_NUMBER vs FIRST_VALUE / LAST_VALUE아래의 코드는 userid가 251인 사용자의 channel을 확인할 수 있다.SELECT ts, channelFROM raw_data.user_session_channe..
JOIN 소개JOIN이란?두 개 이상의 테이블을 공통 필드를 가지고 merge하는 데 사용된다. 이는 스타 스키마로 구성된 테이블로 분산돼 있던 정보를 통합하는 데 사용된다. 6개의 JOIN 방법이 존재하지만, 대부분은 LEFT JOIN과 INNER JOIN으로 충분하다.JOIN 문법JOIN 방식에 따라 ____에는 INNER, FULL, LEFT, RIGHT, CROSS가 들어갈 수 있다.SELECT A.*, B.*FROM raw_data.table1 A____ JOIN raw_data.table2 B ON A.key1 = B.key1 and A.key2 = B.key2WHERE A.ts >= '2019-01-01';JOIN 시 고려할 점중복 레코드가 없고, Primary Key Uniqueness가 ..
GROUP BYGROUP BY 절 & Aggregate함수GROUP BY를 활용하여 테이블의 레코드를 그룹핑하여 그룹별로 다양한 정보를 계산할 수 있다. 계산 과정은 두 단계로 이루어지며, 다음과 같다.그룹핑할 필드를 GROUP BY로 결정(하나 이상의 필드가 될 수 있음)그룹별로 계산을 위한 Aggregate 함수 사용(COUNT, SUM, AVG, MIN, MAX, LISTAGG, ...)예제 (1)아래의 SQL 구문은 월별 세션 수를 카운트한다. timestamp의 형식은 "yyyy-mm-dd ~"이므로 LEFT(ts, 7)은 "yyyy-mm"이 되며, mon으로 그룹핑하여 월별 세션 수의 개수를 계산한다.SELECT LEFT(ts, 7) AS mon, COUNT(1) AS session_cou..