전체 글

전체 글

    [통계101x데이터 분석] 5장 "가설검정 "

    [통계101x데이터 분석] 5장 "가설검정 "

    목차1. 가설검정2. 제1종 오류3. 제2종 오류1. 가설검정이란?분석자가 세운 가설을 검증하기 위한 방법이고 가설검정에서는 p값(p-value)이라는 수치를 계산하여 가설을 지지하는지 기각할지 판단하는 것이다. * p-value 개념은 아래 설명확증적 자료분석미리 세운 가설을 검증하는 접근법ex) “새로 송출한 광고가 상품 매출을 늘렸다”라는 가설을 세우고, 이를 검증함으로써 광고 효과 유무를 밝힐 수 있다.탐색적 자료분석가설을 미리 세우지 않고 전체 데이터를 탐색적으로 해석하는 접근법귀무가설밝히고자 하는 가설을 부정하는 명제ex) 신약 테스트에 대한 A집단(실험군)과 B집단(대조군)의 결과는 같다. 즉, 신약의 효과가 없다.대립가설밝히고 싶은 가설ex) 신약 테스트에 대한 A집단(실험군)과 B집단(대..

    [통계101x데이터 분석] 4장 "추론통계~신뢰구간"

    [통계101x데이터 분석] 4장 "추론통계~신뢰구간"

    목차1. 된장국 맛보기로 알아보는 추론통계의 모습2. 표본오차3. 큰 수의 법칙4. 신뢰구간1. 된장국 맛보기로 알아보는 추론통계의 모습된장국을 끓이는 과정에서 맛을 보는 모습을 상상해 보자.1. 우리가 알고자 하는 것은 국자로 뜬 된장국이 아니라 냄비 안에 든 된장국이다.- 정말로 알고자 하는 것은 표본 데이터가 아니라 모집단이다.2. 냄비 안의 된장국을 다 먹고 맛을 조사하기는 어렵다.- 모집단의 모든 요소를 다 조사하는 전수조사는 어렵다.3. 국자로 뜬 약간의 된장국으로 냄비 안의 된장국 맛을 '거의' 확인할 수 있다.- 작은 크기의 표본으로도 모집단을 추론할 수 있다.4. 국자로 된장국을 뜰 때는 먼저 잘 섞어야 한다.- 표본을 추출할 때는 무작위로 추출해야 한다. 결국, 된장국 냄비(모집단)에서..

    [책 : 그로스 해킹] 전환율과 AARRR에 대하여

    [책 : 그로스 해킹] 전환율과 AARRR에 대하여

    "제품은 가설의 조합으로 이뤄져야 하며, 그러한 가설을 테스트하기 위한 최소한의 기능으로 제품은 이뤄져야 한다. 기능이 많은 제품이 성공하는 것이 아니라 최소한의 기능으로 사용자에게 가치를 전달할 수 있는 제품이 성공하는 것이다.""우리가 데이터를 통해 확인하려고 하는 것은 눈앞의 지표 몇 개가 아니라 '고객'에 대한 폭넓은 이해라는 걸 잊지 말자."전환율전환율을 구하려면 목표로 하는 이벤트를 정의하고 이를 위해 거쳐야 하는 경로를 먼저 구체화해야 한다. 경로를 구체화한다는 것은 전환 퍼널을 그리는 것이다. 전환율 지표의 특징전환율은 카테고리 외에도 다양한 변수에 영향을 받는다. 똑같은 상품에 대한 전환이라도 친구 초대를 통해 들어온 사람과 디스플레이 광고를 통해 들어온 사람은 전환율에 차이가 난다.이처..

    [통계101x데이터 분석] 3장 "통계분석의 기초"

    [통계101x데이터 분석] 3장 "통계분석의 기초"

    목차1. 다양한 데이터 유형2. 대표적인 기술통계량3. 이상값4. 확률5. 정규분포1. 다양한 데이터 유형양적 변수란 숫자로 나타낼 수 있는 변수이산형: 횟수, 사람 수 같이 셀 수 있는 숫자 데이터이다. 예를 들면 주사위 눈처럼 1부터 6까지의 정수 형태로 나오는 것연속형: 키나 몸무게와 같이 이어지는 값을 의미한다.질적 변수란 숫자가 아닌 범주로 나타내는 변수설문 조사의 예/아니오, 동전의 앞/뒤, 맑음/흐름/눈/비와 같은 날씨, 식당 메뉴2. 대표적인 기술통계량대푯값이란 대략적인 분포 위치를 의미하고 대표적인 값을 정량화하기 위해 사용하는 통계량평균값중앙값최빈값 3. 이상값이상값에 대한 명확한 정의는 없지만 평균값에서 표준편차의 2배 또한 3배 이상 벗어난 숫자를 이상값으로 본다. 실제로 데이터를 ..

    [통계학101x데이터 분석] 2장 "모집단과 표본"

    [통계학101x데이터 분석] 2장 "모집단과 표본"

    목차1. 데이터 분석의 목적2. 알고자 하는 대상3. 모집단4. 표본조사1. 데이터 분석의 목적데이터 분석을 시작할 때는 "ㅇㅇ을 설명한다.", "ㅁㅁ을 예측한다." 등과 같이 구체적인 데이터 분석 목적을 정하는 것이 중요한 첫 단계다.목적 설정 예시1. 신약의 효과 유무와 효과의 크기를 알고 싶다.2. 서류합격률과 서류 제출수에 어떤 관계가 있는지 알고 싶다.3. 기온으로부터 올해 농작물 수확량을 예측하고 싶다. 2. 알고자 하는 대상데이터 분석의 목적을 정한 뒤에는 알고자 하는 대상을 명확히 하는 것이 중요하다. 예를 들어 신약의 효과를 알아내는 것이 데이터 분석의 목적이라면 알고자 하는 대상은 '고혈압이 있는 모든 사람'이 된다. 서류 제출수에 따른 서류합격률의 관계를 알아내는 것이 데이터 분석의 ..

    [통계 101x데이터 분석] 1장 "통계학이란?"

    [통계 101x데이터 분석] 1장 "통계학이란?"

    목차1. 데이터를 요약하는 것2. 대상을 설명하는 것3. 새로 얻을 데이터를 예측하는 것4. 추가로 학습한 것 (간략하게)1. 데이터를 요약하는 것아무런 처리도 없는 데이터 원자료 [1.2, 2.1, 2.1, 0.8, 2.4, 0.9, 0.7]를 보고 우리는 쉽게 판단할 수 없다. 따라서 데이터를 요약하고 정리할 방법이 필요하고 대표적인 방법이 평균값 계산이다.데이터 원자료만 봤을 때[1.2, 2.1, 2.1, 0.8, 2.4, 0.9, 0.7] 이게 뭐야?평균값 계산을 통해 봤을 때해당 데이터 원자료의 평균이 1.7이구나! 2. 대상을 설명하는 것대상이 가진 성질과 관계성을 명확히 밝히고 이를 이해하는 걸 의미한다. 우리는 일상생활에서도 관찰을 통해 관계성을 쉽게 발견할 수 있다. 붉은 사과를 먹을 땐..

    [퇴사 회고] 인생 첫 퇴사

    [퇴사 회고] 인생 첫 퇴사

    목차1. 내가 쌓아온 경험들2. 역할 관점에서 주요 업무3. 배우게 된 것들4. 감사한 것들5. 아쉬운 것들6. 앞으로 방향성 내가 쌓아온 경험들역할 관점: 퍼포먼스 마케터, 데이터 분석가, 노코드 개발자(?)성과 관점: 메타 광고 ROAS 지표 3배 상승, 실시간 대시보드로 수기 업무 100% 제거, 데이터 기반 마이페이지 수정 후 고객 문의 감소, LLM 기반 언어 모델 개발하여 신규 매출원 창출데이터 관점: 회사 내부 데이터가 제대로 관리되지 않은 상황에서 테이블 정의서와 활용 데이터를 노션에 체계적으로 정리하고 실시간 대시보드를 구축하였고, 매주 '포커스데이'를 운영하며 내부 데이터를 분석해 비즈니스의 문제점과 방향성을 도출하고 실행에 옮기기 위해 노력하였다.조직의 변화 관점: 다이어리 제품을 단..

    [MySQL] 프로그래머스 문제 풀이 (식품분류별 가장 비싼 식품의 정보 조회하기)

    [MySQL] 프로그래머스 문제 풀이 (식품분류별 가장 비싼 식품의 정보 조회하기)

    테이블에 대한 설명과 문제가 나와있습니다.얼핏 보면 쉬운 문제 같지만, 계속 틀렸다고 나와서 머리가 아팠던 문제입니다 🥺 처음 작성한 쿼리SELECT CATEGORY, MAX(PRICE) AS MAX_PRICE, PRODUCT_NAMEFROM FOOD_PRODUCTWHERE CATEGORY IN ('식용유', '과자', '국', '김치')GROUP BY CATEGORYORDER BY MAX(PRICE) DESC; 쿼리에 대한 결괏값 (오답값) 무엇이 틀렸는지 한 번 확인해 볼게요.우선, 아래는 아무런 CATEGORY만 필터링하고 다른 조건은 아무것도 주지 않은 결괏값이에요.그리고 빨간색 네모박스들만 출력되면 정답인 샘이죠. 무엇이 틀렸는지 감이 오시나요? 추출되어야 할 결괏값과 제가 짠 쿼리에 대한 결..

    [책 : 데이터 읽기의 기술] 모든 데이터는 심리학이다

    [책 : 데이터 읽기의 기술] 모든 데이터는 심리학이다

    '데이터 분석 책 추천'에 항상 언급이 되는 데이터 읽기의 기술을 e-book으로 다운 받아 읽었어요.책을 통해 데이터 바라보는 관점과 해석에 대해서 많이 배울 수 있는 시간이었습니다.그래서 데이터 읽기의 기술을 읽으며, 기록했던 것들을 정리해서 기록하려 합니다. 소비자는 언제 회사에게 돈을 쓸까?알고 (지식) → 좋아지면 (태도) → 구매한다 (행동)소비자는 제품을 알고, 제품이 좋아지면 구매한다.단순하게 말해서 어떤 제품을 알고, 좋아하게 되면, 다양한 방법으로 구매한다.매출과 연결되어 있는 ‘사람’의 구매 행동을 분석하는데 가능한 한 많은 데이터를 가지고 있는 것이 매우 중요하다.영수증에는 무슨 데이터가 담겨 있을까?영수증은 소비자와 기업의 시공간이 만나는 순간을 담아낸 집합체다.영수증에는 데이터의..

    [책 : 새빨간 거짓말, 통계] 통계로 조작하는 법

    [책 : 새빨간 거짓말, 통계] 통계로 조작하는 법

    오늘은 9 ~ 10 part 중에서 part 9에 나오는 내용 하나를 기록하려 합니다. 물가지수오늘날 물가지수는 임금인상률과 밀접한 관계를 맺게 되므로 모든 사람에게 중요한 숫자가 되었어요.그런데, 책을 통해 물가지수가 필요에 따라 얼마든지 늘렸다 줄였다 할 수 있음을 알게 되었습니다. 책에서는 가장 간단하면서 신뢰할 만한 예를 통해 설명해줍니다.작년에는 우유 한 병에 50원, 빵 하나에 20원 하던 것이금년(올해)에는 우유가 25원으로 내렸고, 빵은 40원으로 올랐다고 하자.이를 근거로 어떤 이야기를 할 수 있을까요?생활비는 올라갔을까요, 내려갔을까요? 아니면 아무런 변화도 없었을까요?작년을 기준으로 우유와 빵의 값을 100이라고 하자.그러면, 금년에는 우유가 반(50%)이 되고 빵이 되려 2배(200..