분류 전체보기

    [통계101x데이터 분석] 5장 "가설검정 "

    [통계101x데이터 분석] 5장 "가설검정 "

    목차1. 가설검정2. 제1종 오류3. 제2종 오류1. 가설검정이란?분석자가 세운 가설을 검증하기 위한 방법이고 가설검정에서는 p값(p-value)이라는 수치를 계산하여 가설을 지지하는지 기각할지 판단하는 것이다. * p-value 개념은 아래 설명확증적 자료분석미리 세운 가설을 검증하는 접근법ex) “새로 송출한 광고가 상품 매출을 늘렸다”라는 가설을 세우고, 이를 검증함으로써 광고 효과 유무를 밝힐 수 있다.탐색적 자료분석가설을 미리 세우지 않고 전체 데이터를 탐색적으로 해석하는 접근법귀무가설밝히고자 하는 가설을 부정하는 명제ex) 신약 테스트에 대한 A집단(실험군)과 B집단(대조군)의 결과는 같다. 즉, 신약의 효과가 없다.대립가설밝히고 싶은 가설ex) 신약 테스트에 대한 A집단(실험군)과 B집단(대..

    [통계101x데이터 분석] 4장 "추론통계~신뢰구간"

    [통계101x데이터 분석] 4장 "추론통계~신뢰구간"

    목차1. 된장국 맛보기로 알아보는 추론통계의 모습2. 표본오차3. 큰 수의 법칙4. 신뢰구간1. 된장국 맛보기로 알아보는 추론통계의 모습된장국을 끓이는 과정에서 맛을 보는 모습을 상상해 보자.1. 우리가 알고자 하는 것은 국자로 뜬 된장국이 아니라 냄비 안에 든 된장국이다.- 정말로 알고자 하는 것은 표본 데이터가 아니라 모집단이다.2. 냄비 안의 된장국을 다 먹고 맛을 조사하기는 어렵다.- 모집단의 모든 요소를 다 조사하는 전수조사는 어렵다.3. 국자로 뜬 약간의 된장국으로 냄비 안의 된장국 맛을 '거의' 확인할 수 있다.- 작은 크기의 표본으로도 모집단을 추론할 수 있다.4. 국자로 된장국을 뜰 때는 먼저 잘 섞어야 한다.- 표본을 추출할 때는 무작위로 추출해야 한다. 결국, 된장국 냄비(모집단)에서..

    [책 : 그로스 해킹] 전환율과 AARRR에 대하여

    [책 : 그로스 해킹] 전환율과 AARRR에 대하여

    "제품은 가설의 조합으로 이뤄져야 하며, 그러한 가설을 테스트하기 위한 최소한의 기능으로 제품은 이뤄져야 한다. 기능이 많은 제품이 성공하는 것이 아니라 최소한의 기능으로 사용자에게 가치를 전달할 수 있는 제품이 성공하는 것이다.""우리가 데이터를 통해 확인하려고 하는 것은 눈앞의 지표 몇 개가 아니라 '고객'에 대한 폭넓은 이해라는 걸 잊지 말자."전환율전환율을 구하려면 목표로 하는 이벤트를 정의하고 이를 위해 거쳐야 하는 경로를 먼저 구체화해야 한다. 경로를 구체화한다는 것은 전환 퍼널을 그리는 것이다. 전환율 지표의 특징전환율은 카테고리 외에도 다양한 변수에 영향을 받는다. 똑같은 상품에 대한 전환이라도 친구 초대를 통해 들어온 사람과 디스플레이 광고를 통해 들어온 사람은 전환율에 차이가 난다.이처..

    [통계101x데이터 분석] 3장 "통계분석의 기초"

    [통계101x데이터 분석] 3장 "통계분석의 기초"

    목차1. 다양한 데이터 유형2. 대표적인 기술통계량3. 이상값4. 확률5. 정규분포1. 다양한 데이터 유형양적 변수란 숫자로 나타낼 수 있는 변수이산형: 횟수, 사람 수 같이 셀 수 있는 숫자 데이터이다. 예를 들면 주사위 눈처럼 1부터 6까지의 정수 형태로 나오는 것연속형: 키나 몸무게와 같이 이어지는 값을 의미한다.질적 변수란 숫자가 아닌 범주로 나타내는 변수설문 조사의 예/아니오, 동전의 앞/뒤, 맑음/흐름/눈/비와 같은 날씨, 식당 메뉴2. 대표적인 기술통계량대푯값이란 대략적인 분포 위치를 의미하고 대표적인 값을 정량화하기 위해 사용하는 통계량평균값중앙값최빈값 3. 이상값이상값에 대한 명확한 정의는 없지만 평균값에서 표준편차의 2배 또한 3배 이상 벗어난 숫자를 이상값으로 본다. 실제로 데이터를 ..

    [통계학101x데이터 분석] 2장 "모집단과 표본"

    [통계학101x데이터 분석] 2장 "모집단과 표본"

    목차1. 데이터 분석의 목적2. 알고자 하는 대상3. 모집단4. 표본조사1. 데이터 분석의 목적데이터 분석을 시작할 때는 "ㅇㅇ을 설명한다.", "ㅁㅁ을 예측한다." 등과 같이 구체적인 데이터 분석 목적을 정하는 것이 중요한 첫 단계다.목적 설정 예시1. 신약의 효과 유무와 효과의 크기를 알고 싶다.2. 서류합격률과 서류 제출수에 어떤 관계가 있는지 알고 싶다.3. 기온으로부터 올해 농작물 수확량을 예측하고 싶다. 2. 알고자 하는 대상데이터 분석의 목적을 정한 뒤에는 알고자 하는 대상을 명확히 하는 것이 중요하다. 예를 들어 신약의 효과를 알아내는 것이 데이터 분석의 목적이라면 알고자 하는 대상은 '고혈압이 있는 모든 사람'이 된다. 서류 제출수에 따른 서류합격률의 관계를 알아내는 것이 데이터 분석의 ..

    [통계 101x데이터 분석] 1장 "통계학이란?"

    [통계 101x데이터 분석] 1장 "통계학이란?"

    목차1. 데이터를 요약하는 것2. 대상을 설명하는 것3. 새로 얻을 데이터를 예측하는 것4. 추가로 학습한 것 (간략하게)1. 데이터를 요약하는 것아무런 처리도 없는 데이터 원자료 [1.2, 2.1, 2.1, 0.8, 2.4, 0.9, 0.7]를 보고 우리는 쉽게 판단할 수 없다. 따라서 데이터를 요약하고 정리할 방법이 필요하고 대표적인 방법이 평균값 계산이다.데이터 원자료만 봤을 때[1.2, 2.1, 2.1, 0.8, 2.4, 0.9, 0.7] 이게 뭐야?평균값 계산을 통해 봤을 때해당 데이터 원자료의 평균이 1.7이구나! 2. 대상을 설명하는 것대상이 가진 성질과 관계성을 명확히 밝히고 이를 이해하는 걸 의미한다. 우리는 일상생활에서도 관찰을 통해 관계성을 쉽게 발견할 수 있다. 붉은 사과를 먹을 땐..

    [퇴사 후 회고] 브레이크가 고장난 8T 트럭

    [퇴사 후 회고] 브레이크가 고장난 8T 트럭

    현재는 퇴사를 하게 된 지 3개월이 다 되어 가는 시점이다.시간이 너무도 빠르게 지나가는 것에 깊은 현타를 느끼며 스스로에게 질문했다.나는 무엇을 했지?사실 퇴사 직후 여유를 가질 시간도 없이 이력서와 포트폴리오를 새롭게 만들고 바로 취업시장에 다시 뛰어들었다.그리고 현재까지 총 10개의 서류합격과 최종탈락을 3번 경험한 걸 보면 아무것도 안 한 건 아니라는 생각이 든다.* 계속해서 면접에 떨어진 이유에 대해서 간단하게 적어보자면 "그냥 나 데이터 분석 잘 할 수 있으니깐 뽑아주세요!"만 외쳤다. 면접관들이 궁금했던 건 "그래서 우리 회사에서 무엇을 하고 싶은지, 어떻게 기여하고 함께 성장할 것인지"였다. 그럼에도 불구하고 내가 현타를 느꼈던 이유가 무엇일지에 대해서 곱씹는 시간을 갖게 되었다.원인은 다..

    [퇴사 회고] 인생 첫 퇴사

    [퇴사 회고] 인생 첫 퇴사

    목차1. 내가 쌓아온 경험들2. 역할 관점에서 주요 업무3. 배우게 된 것들4. 감사한 것들5. 아쉬운 것들6. 앞으로 방향성 내가 쌓아온 경험들역할 관점: 퍼포먼스 마케터, 데이터 분석가, 노코드 개발자(?)성과 관점: 메타 광고 ROAS 지표 3배 상승, 실시간 대시보드로 수기 업무 100% 제거, 데이터 기반 마이페이지 수정 후 고객 문의 감소, LLM 기반 언어 모델 개발하여 신규 매출원 창출데이터 관점: 회사 내부 데이터가 제대로 관리되지 않은 상황에서 테이블 정의서와 활용 데이터를 노션에 체계적으로 정리하고 실시간 대시보드를 구축하였고, 매주 '포커스데이'를 운영하며 내부 데이터를 분석해 비즈니스의 문제점과 방향성을 도출하고 실행에 옮기기 위해 노력하였다.조직의 변화 관점: 다이어리 제품을 단..

    [MySQL] 프로그래머스 문제 풀이 (식품분류별 가장 비싼 식품의 정보 조회하기)

    [MySQL] 프로그래머스 문제 풀이 (식품분류별 가장 비싼 식품의 정보 조회하기)

    테이블에 대한 설명과 문제가 나와있습니다.얼핏 보면 쉬운 문제 같지만, 계속 틀렸다고 나와서 머리가 아팠던 문제입니다 🥺 처음 작성한 쿼리SELECT CATEGORY, MAX(PRICE) AS MAX_PRICE, PRODUCT_NAMEFROM FOOD_PRODUCTWHERE CATEGORY IN ('식용유', '과자', '국', '김치')GROUP BY CATEGORYORDER BY MAX(PRICE) DESC; 쿼리에 대한 결괏값 (오답값) 무엇이 틀렸는지 한 번 확인해 볼게요.우선, 아래는 아무런 CATEGORY만 필터링하고 다른 조건은 아무것도 주지 않은 결괏값이에요.그리고 빨간색 네모박스들만 출력되면 정답인 샘이죠. 무엇이 틀렸는지 감이 오시나요? 추출되어야 할 결괏값과 제가 짠 쿼리에 대한 결..

    [책 : 데이터 읽기의 기술] 모든 데이터는 심리학이다

    [책 : 데이터 읽기의 기술] 모든 데이터는 심리학이다

    '데이터 분석 책 추천'에 항상 언급이 되는 데이터 읽기의 기술을 e-book으로 다운 받아 읽었어요.책을 통해 데이터 바라보는 관점과 해석에 대해서 많이 배울 수 있는 시간이었습니다.그래서 데이터 읽기의 기술을 읽으며, 기록했던 것들을 정리해서 기록하려 합니다. 소비자는 언제 회사에게 돈을 쓸까?알고 (지식) → 좋아지면 (태도) → 구매한다 (행동)소비자는 제품을 알고, 제품이 좋아지면 구매한다.단순하게 말해서 어떤 제품을 알고, 좋아하게 되면, 다양한 방법으로 구매한다.매출과 연결되어 있는 ‘사람’의 구매 행동을 분석하는데 가능한 한 많은 데이터를 가지고 있는 것이 매우 중요하다.영수증에는 무슨 데이터가 담겨 있을까?영수증은 소비자와 기업의 시공간이 만나는 순간을 담아낸 집합체다.영수증에는 데이터의..