책으로 배우는 공부
![[통계101x데이터 분석] 5장 "가설검정 "](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FdvX0i4%2FbtsPbA6H4Pf%2FAAAAAAAAAAAAAAAAAAAAAHwCJ8s7InUimQtJP0Y9j0MRHBo0sb7GKZcSumSBeQ2h%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DYcfT3D9yDf7q5%252BN%252ButaDCHSD0mw%253D)
[통계101x데이터 분석] 5장 "가설검정 "
목차1. 가설검정2. 제1종 오류3. 제2종 오류1. 가설검정이란?분석자가 세운 가설을 검증하기 위한 방법이고 가설검정에서는 p값(p-value)이라는 수치를 계산하여 가설을 지지하는지 기각할지 판단하는 것이다. * p-value 개념은 아래 설명확증적 자료분석미리 세운 가설을 검증하는 접근법ex) “새로 송출한 광고가 상품 매출을 늘렸다”라는 가설을 세우고, 이를 검증함으로써 광고 효과 유무를 밝힐 수 있다.탐색적 자료분석가설을 미리 세우지 않고 전체 데이터를 탐색적으로 해석하는 접근법귀무가설밝히고자 하는 가설을 부정하는 명제ex) 신약 테스트에 대한 A집단(실험군)과 B집단(대조군)의 결과는 같다. 즉, 신약의 효과가 없다.대립가설밝히고 싶은 가설ex) 신약 테스트에 대한 A집단(실험군)과 B집단(대..
![[통계101x데이터 분석] 4장 "추론통계~신뢰구간"](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FbmbU7j%2FbtsOZdRkmpj%2FAAAAAAAAAAAAAAAAAAAAAIOJSsUaSEYXsmYwI4n6R186i8N8cdE2QmKys1_o99lS%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3Dj8ANpHWGuKkA4FlT5aytH5RpJMI%253D)
[통계101x데이터 분석] 4장 "추론통계~신뢰구간"
목차1. 된장국 맛보기로 알아보는 추론통계의 모습2. 표본오차3. 큰 수의 법칙4. 신뢰구간1. 된장국 맛보기로 알아보는 추론통계의 모습된장국을 끓이는 과정에서 맛을 보는 모습을 상상해 보자.1. 우리가 알고자 하는 것은 국자로 뜬 된장국이 아니라 냄비 안에 든 된장국이다.- 정말로 알고자 하는 것은 표본 데이터가 아니라 모집단이다.2. 냄비 안의 된장국을 다 먹고 맛을 조사하기는 어렵다.- 모집단의 모든 요소를 다 조사하는 전수조사는 어렵다.3. 국자로 뜬 약간의 된장국으로 냄비 안의 된장국 맛을 '거의' 확인할 수 있다.- 작은 크기의 표본으로도 모집단을 추론할 수 있다.4. 국자로 된장국을 뜰 때는 먼저 잘 섞어야 한다.- 표본을 추출할 때는 무작위로 추출해야 한다. 결국, 된장국 냄비(모집단)에서..
![[책 : 그로스 해킹] 전환율과 AARRR에 대하여](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FopovJ%2FbtsO0Ih8m3h%2FAAAAAAAAAAAAAAAAAAAAADQubdTySeaH05Q3YJ1mC6a9EaOSeAO_HtJHij6QXTIs%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3D%252FQatRMfqRKx%252FRRaRYQ5F6Pa1zGQ%253D)
[책 : 그로스 해킹] 전환율과 AARRR에 대하여
"제품은 가설의 조합으로 이뤄져야 하며, 그러한 가설을 테스트하기 위한 최소한의 기능으로 제품은 이뤄져야 한다. 기능이 많은 제품이 성공하는 것이 아니라 최소한의 기능으로 사용자에게 가치를 전달할 수 있는 제품이 성공하는 것이다.""우리가 데이터를 통해 확인하려고 하는 것은 눈앞의 지표 몇 개가 아니라 '고객'에 대한 폭넓은 이해라는 걸 잊지 말자."전환율전환율을 구하려면 목표로 하는 이벤트를 정의하고 이를 위해 거쳐야 하는 경로를 먼저 구체화해야 한다. 경로를 구체화한다는 것은 전환 퍼널을 그리는 것이다. 전환율 지표의 특징전환율은 카테고리 외에도 다양한 변수에 영향을 받는다. 똑같은 상품에 대한 전환이라도 친구 초대를 통해 들어온 사람과 디스플레이 광고를 통해 들어온 사람은 전환율에 차이가 난다.이처..
![[통계101x데이터 분석] 3장 "통계분석의 기초"](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FcCASjV%2FbtsOWOcCqVk%2FAAAAAAAAAAAAAAAAAAAAAGx0gA3eyLuzV3VO0KuH5GYlYmnWgiIMzS6GNOmBUP1Z%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DYQfw9KPTgTjYWqJDicjaIsSf3NY%253D)
[통계101x데이터 분석] 3장 "통계분석의 기초"
목차1. 다양한 데이터 유형2. 대표적인 기술통계량3. 이상값4. 확률5. 정규분포1. 다양한 데이터 유형양적 변수란 숫자로 나타낼 수 있는 변수이산형: 횟수, 사람 수 같이 셀 수 있는 숫자 데이터이다. 예를 들면 주사위 눈처럼 1부터 6까지의 정수 형태로 나오는 것연속형: 키나 몸무게와 같이 이어지는 값을 의미한다.질적 변수란 숫자가 아닌 범주로 나타내는 변수설문 조사의 예/아니오, 동전의 앞/뒤, 맑음/흐름/눈/비와 같은 날씨, 식당 메뉴2. 대표적인 기술통계량대푯값이란 대략적인 분포 위치를 의미하고 대표적인 값을 정량화하기 위해 사용하는 통계량평균값중앙값최빈값 3. 이상값이상값에 대한 명확한 정의는 없지만 평균값에서 표준편차의 2배 또한 3배 이상 벗어난 숫자를 이상값으로 본다. 실제로 데이터를 ..
![[통계학101x데이터 분석] 2장 "모집단과 표본"](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2Fb8AclX%2FbtsOXFmg3V9%2FAAAAAAAAAAAAAAAAAAAAAOnWTT5ZmE3gMzqVYi4gNsJn155SmNZUU4vcROwXUvtx%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DN2oyWNFnNbY5kF3FTb6cIvYXlTs%253D)
[통계학101x데이터 분석] 2장 "모집단과 표본"
목차1. 데이터 분석의 목적2. 알고자 하는 대상3. 모집단4. 표본조사1. 데이터 분석의 목적데이터 분석을 시작할 때는 "ㅇㅇ을 설명한다.", "ㅁㅁ을 예측한다." 등과 같이 구체적인 데이터 분석 목적을 정하는 것이 중요한 첫 단계다.목적 설정 예시1. 신약의 효과 유무와 효과의 크기를 알고 싶다.2. 서류합격률과 서류 제출수에 어떤 관계가 있는지 알고 싶다.3. 기온으로부터 올해 농작물 수확량을 예측하고 싶다. 2. 알고자 하는 대상데이터 분석의 목적을 정한 뒤에는 알고자 하는 대상을 명확히 하는 것이 중요하다. 예를 들어 신약의 효과를 알아내는 것이 데이터 분석의 목적이라면 알고자 하는 대상은 '고혈압이 있는 모든 사람'이 된다. 서류 제출수에 따른 서류합격률의 관계를 알아내는 것이 데이터 분석의 ..
![[통계 101x데이터 분석] 1장 "통계학이란?"](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FwthaP%2FbtsOXhrZg2U%2FAAAAAAAAAAAAAAAAAAAAAGh7u8eTFotiLJ2OKqDYOfLjBnxZCZ7mErQnWFDeh42P%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DekcOOO1pbE7Six3iwKSdlEaY3ko%253D)
[통계 101x데이터 분석] 1장 "통계학이란?"
목차1. 데이터를 요약하는 것2. 대상을 설명하는 것3. 새로 얻을 데이터를 예측하는 것4. 추가로 학습한 것 (간략하게)1. 데이터를 요약하는 것아무런 처리도 없는 데이터 원자료 [1.2, 2.1, 2.1, 0.8, 2.4, 0.9, 0.7]를 보고 우리는 쉽게 판단할 수 없다. 따라서 데이터를 요약하고 정리할 방법이 필요하고 대표적인 방법이 평균값 계산이다.데이터 원자료만 봤을 때[1.2, 2.1, 2.1, 0.8, 2.4, 0.9, 0.7] 이게 뭐야?평균값 계산을 통해 봤을 때해당 데이터 원자료의 평균이 1.7이구나! 2. 대상을 설명하는 것대상이 가진 성질과 관계성을 명확히 밝히고 이를 이해하는 걸 의미한다. 우리는 일상생활에서도 관찰을 통해 관계성을 쉽게 발견할 수 있다. 붉은 사과를 먹을 땐..
![[책 : 데이터 읽기의 기술] 모든 데이터는 심리학이다](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2Fdx94bK%2FbtsHDH4GDQY%2FAAAAAAAAAAAAAAAAAAAAAAEyH_YMcQEjmjvldwLkCgycj0kV7-4SYC7dWk3Ba74w%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3D6BtqoQZd9sEwt7evMHGxcJqCyNQ%253D)
[책 : 데이터 읽기의 기술] 모든 데이터는 심리학이다
'데이터 분석 책 추천'에 항상 언급이 되는 데이터 읽기의 기술을 e-book으로 다운 받아 읽었어요.책을 통해 데이터 바라보는 관점과 해석에 대해서 많이 배울 수 있는 시간이었습니다.그래서 데이터 읽기의 기술을 읽으며, 기록했던 것들을 정리해서 기록하려 합니다. 소비자는 언제 회사에게 돈을 쓸까?알고 (지식) → 좋아지면 (태도) → 구매한다 (행동)소비자는 제품을 알고, 제품이 좋아지면 구매한다.단순하게 말해서 어떤 제품을 알고, 좋아하게 되면, 다양한 방법으로 구매한다.매출과 연결되어 있는 ‘사람’의 구매 행동을 분석하는데 가능한 한 많은 데이터를 가지고 있는 것이 매우 중요하다.영수증에는 무슨 데이터가 담겨 있을까?영수증은 소비자와 기업의 시공간이 만나는 순간을 담아낸 집합체다.영수증에는 데이터의..
![[책 : 새빨간 거짓말, 통계] 통계로 조작하는 법](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FEK7gz%2FbtsG4fOkZEF%2FAAAAAAAAAAAAAAAAAAAAADr06ybQSkA3Oo8HJsWpI61KnyWZeoCZ6CWMRgSyzxiM%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3Djl%252BFMrUHI1l9daqu2%252FWJcOqWqjY%253D)
[책 : 새빨간 거짓말, 통계] 통계로 조작하는 법
오늘은 9 ~ 10 part 중에서 part 9에 나오는 내용 하나를 기록하려 합니다. 물가지수오늘날 물가지수는 임금인상률과 밀접한 관계를 맺게 되므로 모든 사람에게 중요한 숫자가 되었어요.그런데, 책을 통해 물가지수가 필요에 따라 얼마든지 늘렸다 줄였다 할 수 있음을 알게 되었습니다. 책에서는 가장 간단하면서 신뢰할 만한 예를 통해 설명해줍니다.작년에는 우유 한 병에 50원, 빵 하나에 20원 하던 것이금년(올해)에는 우유가 25원으로 내렸고, 빵은 40원으로 올랐다고 하자.이를 근거로 어떤 이야기를 할 수 있을까요?생활비는 올라갔을까요, 내려갔을까요? 아니면 아무런 변화도 없었을까요?작년을 기준으로 우유와 빵의 값을 100이라고 하자.그러면, 금년에는 우유가 반(50%)이 되고 빵이 되려 2배(200..
![[책 : 새빨간 거짓말, 통계] 통계도 논리다](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FpslWT%2FbtsGVLfqjiv%2FAAAAAAAAAAAAAAAAAAAAABggZxlitCt40Yhi4Z55vnM1cmn-1VzspGeTc0tag0_d%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DetlMDNQAcGbAEGabgvWR6JdF82c%253D)
[책 : 새빨간 거짓말, 통계] 통계도 논리다
지난 포스팅에선 1 ~ 3 part 부분을 읽고 기록했어요.https://wnwa.tistory.com/60 [책 : 새빨간 거짓말, 통계] 무지하면 당신도 속는다.이번에 데이터리안에서 진행하는 데벨챌(데이터넥스트레벨챌린지) 3기에 참여하게 됐어요. * 데벨챌이란? 데이터 분석에 도움이 될만한 책을 읽고, 기록하고 공유하는 챌린지 데벨챌에 참여하wnwa.tistory.com이번주는 4 ~ 8 part 부분을 읽고 'part 8'에 나오는 이야기를 기록해보려 해요. 제 3의 요인과 상관관계서울의 한 장로교 목사의 수입과 대구에 파는 맥주 가격 사이에는 높은 상관관계가 성립한다. 위와 같은 말을 들으면 어떤 생각이 드시나요?책에서는 목사와 맥주 사이에는 제 3의 요인이 존재한다고 해요.모든 물가나 가격 수준..
![[책 : 새빨간 거짓말, 통계] 무지하면 당신도 속는다.](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FtPOPg%2FbtsGpS9lAss%2FAAAAAAAAAAAAAAAAAAAAAKY3oj2nUs9uTBnXt060p2MgzwUB8f06uneQRD8LCqTm%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DirZWUHb0kWKakGe9MESYN1tss9A%253D)
[책 : 새빨간 거짓말, 통계] 무지하면 당신도 속는다.
이번에 데이터리안에서 진행하는 데벨챌(데이터넥스트레벨챌린지) 3기에 참여하게 됐어요.* 데벨챌이란? 데이터 분석에 도움이 될만한 책을 읽고, 기록하고 공유하는 챌린지 데벨챌에 참여하게 된 이유는 '함께'에 있습니다.항상 책을 혼자 읽고 기록만 했는데, 사람들과 함께 책을 읽고 생각을 공유할 수 있다니 너무 매력적으로 다가와서 바로 신청했답니다.이번 챌린지에서 선정된 책은 '새빨간 거짓말, 통계'입니다. 총 10 part로 구성되어 있고, 3주 간 나누어 읽고 기록하여 공유하면 돼요.오늘은 1 ~ 3 part 부분에서 가장 기억에 남는 부분을 기록하려 해요. 당신도 속을 수 있다 ! 책에는 뉴스나 마케팅에서 통계를 바탕으로 사람들을 속이는 이야기가 나옵니다.그런데 아이러니한 것은 '속이지만, 거짓말은 하지..