분류 전체보기93 postgreSQL select weather.id Idfrom Weather join Weather w -- on DATEDIFF(weather.recordDate, w.recordDate) = 1 --mysqlon weather.recordDate - w.recordDate = 1and weather.temperature>w.temperature select s.machine_id,round( cast( avg(e.timestamp - s.timestamp) as decimal), 3) processing_timefrom Activity s join Activity eon s.activity_type='start' and e.activity_type='end'and s.. 2024. 11. 30. 내일배움캠프 솔직 후기 작년 12월, 나는 내일배움캠프(내배캠)에서 제공하는 데이터 분석가 부트캠프 과정을 시작하게 되었다.대학을 졸업한 후, 나는 워킹홀리데이를 통해 외국에서 1년을 보냈는데, 이 기간 동안 진로에 대한 많은 고민을 하게 되었다.다양한 선택지 중에서 데이터 분석 쪽에 흥미를 느꼈고, 본격적으로 진로 전환을 위해 부트캠프를 알아보기 시작했다. 요즘 인공지능(AI)과 관련된 기술이 큰 주목을 받으면서 딥러닝과 머신러닝을 다루는 부트캠프는 흔했지만,순수하게 데이터 분석가를 양성하는 과정은 내배캠이 유일했다. 처음에는 1기 수강생이 되는 것에 대한 불안이 컸다.프로그램의 안정성에 대해 확신이 서지 않았기 때문에 여러 차례 문의를 드렸고, 충분한 상담을 거쳐 내일배움캠프 수강을 결심했다. 수료 후 내배캠에 대한 후.. 2024. 11. 4. 13단원 1. 치오마가 그 전 며칠 동안 공부를 했다면, 큰 시험 전날을 쉬면서 보내는 것이 공부하면서 보내는 것보다 시험점수가 더 높게 나온다는 가설을 세웠습니다.치오마는 80명의 학생을 임의로 실험군과 대조군으로 나누었습니다. 실험군은 시험 전날 하루를 휴식으로 보냈고, 대조군은 온종일 공부를 했습니다.이 실험에서 실험군의 평균 점수는 대조군의 평균 점수보다 4점이 높다는 결과가 나왔습니다. 결과가 임의의 확률에 의해 설명될 수 있는지 확인하기 위해서, 과학자들은 1000개의 재 임의화한 데이터(평균 간 차를 1점에서 반올림하여)의 결과를 정리해 다음과 같은 표를 만들었습니다. 시뮬레이션에 따르면, 실험군의 평균이 대조군의 평균보다 4점 이상일 확률은 얼마일까요? => 12.6% 실험군의 평균이 대조군의 평.. 2024. 8. 12. 0731 확률변수절대빈도수 / 표본공간의 크기 = 상대도수기댓값: 각각 대응되는 확률과 곱한 것을 합이산확률 변수에서 표준편차는 평균으로부터 결과값이 얼마나 다른지sqrt( Sigma( ( 결과값 - 평균 )^2 * 확률 ) )독립 확률 변수들의 합의 분산 = 변수들의 분산의 합표준편차: sqrt( Sigma( 표준편차^2 ) )이항확률 계산이항확률변수의 평균과 표준편차기하학적 확률누적 기하학적 확률표본비율이 정규적인 경우표본 분포가 정규분포에 가까우려면 적어도 10개의 성공과 10개의 실패가 예상되어야 함기댓값이 10 이상이어야 함모집단의 크기가 표본의 크기에 비해 매우 커서 표본 당 10개 이하의 실패가 예상된다면, 왼쪽으로 치우침모집단의 크기가 표본의 크기에 비해 매우 커서 표본 당 10개 이하의 성공이 예.. 2024. 7. 31. union, union all SELECT product_id, FIRST_VALUE(new_price) OVER(PARTITION BY product_id ORDER BY change_date DESC) AS priceFROM ProductsWHERE change_date - 8월 16일 까지는 최근 가격- 8월 16일 안으로 갱신된 가격이 없으면 10달러- 중복 제거를 위해 union SELECT product_id, new_price AS priceFROM ProductsWHERE (product_id, change_date) IN (SELECT product_id,MAX(change_date) FROM Products .. 2024. 7. 26. lead with cte as(select id, num,lead(id,1) over() id1,lead(num,1) over() num1,lead(id,2) over() id2,lead(num,2) over() num2from logsorder by id)select distinct num 'ConsecutiveNums'from ctewhere num=num1 and num=num2 and id+1=id1 and id+2=id2 2024. 7. 26. 0722 적어도 X할 확률 = 모두 X하지 않을 확률 2024. 7. 23. 필터링 후 리턴 없을 때 null 출력하기 SELECT num FROM MyNumbers GROUP BY num HAVING COUNT(num) = 1 ORDER BY num DESC LIMIT 1위와 같은 방법으로는 having으로 필터링 후 도출되는 값이 없을 때, null이 아닌 빈 테이블이 출력됨 이럴 때, 테이블을 감싼 후 select로 다시 출력하면 빈테이블이 null 값으로 출력됨SELECT (SELECT num FROM MyNumbers GROUP BY num HAVING COUNT(num) = 1 ORDER BY num DESC LIMIT 1) AS num 가장 빠른 결과With cte AS(SELECT numFROM MyNumbers GROUP BY numHAVING COUNT(num)=1)SELECT MAX(num) as .. 2024. 7. 22. 누계 거리 순 select ROUTE,concat(round(sum(D_BETWEEN_DIST),1),'km') 'TOTAL_DISTANCE',concat(round(avg(D_BETWEEN_DIST),2), 'km') 'AVERAGE_DISTANCE'from SUBWAY_DISTANCEgroup by ROUTEorder by sum(D_BETWEEN_DIST) desc 출력할 때 문자열로 바뀌므로, 순서정렬에서 계산을 다시 해줌 2024. 7. 18. 0715 왼쪽으로 치우치면, 평균 오른쪽으로 치우치면, 평균 > 중앙값표준정규분포표는 주어진 z-score보다 낮은 값들의 비율 -> 보다 큰 값들은 1에서 빼주기! 구간 비율 구하기 2024. 7. 15. 이전 1 2 3 4 ··· 10 다음