책으로 배우는 공부/통계 학습
![[통계101x데이터 분석] 4장 "추론통계~신뢰구간"](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FbmbU7j%2FbtsOZdRkmpj%2FAAAAAAAAAAAAAAAAAAAAAIOJSsUaSEYXsmYwI4n6R186i8N8cdE2QmKys1_o99lS%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3Dj8ANpHWGuKkA4FlT5aytH5RpJMI%253D)
[통계101x데이터 분석] 4장 "추론통계~신뢰구간"
목차1. 된장국 맛보기로 알아보는 추론통계의 모습2. 표본오차3. 큰 수의 법칙4. 신뢰구간1. 된장국 맛보기로 알아보는 추론통계의 모습된장국을 끓이는 과정에서 맛을 보는 모습을 상상해 보자.1. 우리가 알고자 하는 것은 국자로 뜬 된장국이 아니라 냄비 안에 든 된장국이다.- 정말로 알고자 하는 것은 표본 데이터가 아니라 모집단이다.2. 냄비 안의 된장국을 다 먹고 맛을 조사하기는 어렵다.- 모집단의 모든 요소를 다 조사하는 전수조사는 어렵다.3. 국자로 뜬 약간의 된장국으로 냄비 안의 된장국 맛을 '거의' 확인할 수 있다.- 작은 크기의 표본으로도 모집단을 추론할 수 있다.4. 국자로 된장국을 뜰 때는 먼저 잘 섞어야 한다.- 표본을 추출할 때는 무작위로 추출해야 한다. 결국, 된장국 냄비(모집단)에서..
![[통계101x데이터 분석] 3장 "통계분석의 기초"](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FcCASjV%2FbtsOWOcCqVk%2FAAAAAAAAAAAAAAAAAAAAAGx0gA3eyLuzV3VO0KuH5GYlYmnWgiIMzS6GNOmBUP1Z%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DYQfw9KPTgTjYWqJDicjaIsSf3NY%253D)
[통계101x데이터 분석] 3장 "통계분석의 기초"
목차1. 다양한 데이터 유형2. 대표적인 기술통계량3. 이상값4. 확률5. 정규분포1. 다양한 데이터 유형양적 변수란 숫자로 나타낼 수 있는 변수이산형: 횟수, 사람 수 같이 셀 수 있는 숫자 데이터이다. 예를 들면 주사위 눈처럼 1부터 6까지의 정수 형태로 나오는 것연속형: 키나 몸무게와 같이 이어지는 값을 의미한다.질적 변수란 숫자가 아닌 범주로 나타내는 변수설문 조사의 예/아니오, 동전의 앞/뒤, 맑음/흐름/눈/비와 같은 날씨, 식당 메뉴2. 대표적인 기술통계량대푯값이란 대략적인 분포 위치를 의미하고 대표적인 값을 정량화하기 위해 사용하는 통계량평균값중앙값최빈값 3. 이상값이상값에 대한 명확한 정의는 없지만 평균값에서 표준편차의 2배 또한 3배 이상 벗어난 숫자를 이상값으로 본다. 실제로 데이터를 ..
![[통계학101x데이터 분석] 2장 "모집단과 표본"](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2Fb8AclX%2FbtsOXFmg3V9%2FAAAAAAAAAAAAAAAAAAAAAOnWTT5ZmE3gMzqVYi4gNsJn155SmNZUU4vcROwXUvtx%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DN2oyWNFnNbY5kF3FTb6cIvYXlTs%253D)
[통계학101x데이터 분석] 2장 "모집단과 표본"
목차1. 데이터 분석의 목적2. 알고자 하는 대상3. 모집단4. 표본조사1. 데이터 분석의 목적데이터 분석을 시작할 때는 "ㅇㅇ을 설명한다.", "ㅁㅁ을 예측한다." 등과 같이 구체적인 데이터 분석 목적을 정하는 것이 중요한 첫 단계다.목적 설정 예시1. 신약의 효과 유무와 효과의 크기를 알고 싶다.2. 서류합격률과 서류 제출수에 어떤 관계가 있는지 알고 싶다.3. 기온으로부터 올해 농작물 수확량을 예측하고 싶다. 2. 알고자 하는 대상데이터 분석의 목적을 정한 뒤에는 알고자 하는 대상을 명확히 하는 것이 중요하다. 예를 들어 신약의 효과를 알아내는 것이 데이터 분석의 목적이라면 알고자 하는 대상은 '고혈압이 있는 모든 사람'이 된다. 서류 제출수에 따른 서류합격률의 관계를 알아내는 것이 데이터 분석의 ..
![[통계 101x데이터 분석] 1장 "통계학이란?"](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FwthaP%2FbtsOXhrZg2U%2FAAAAAAAAAAAAAAAAAAAAAGh7u8eTFotiLJ2OKqDYOfLjBnxZCZ7mErQnWFDeh42P%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DekcOOO1pbE7Six3iwKSdlEaY3ko%253D)
[통계 101x데이터 분석] 1장 "통계학이란?"
목차1. 데이터를 요약하는 것2. 대상을 설명하는 것3. 새로 얻을 데이터를 예측하는 것4. 추가로 학습한 것 (간략하게)1. 데이터를 요약하는 것아무런 처리도 없는 데이터 원자료 [1.2, 2.1, 2.1, 0.8, 2.4, 0.9, 0.7]를 보고 우리는 쉽게 판단할 수 없다. 따라서 데이터를 요약하고 정리할 방법이 필요하고 대표적인 방법이 평균값 계산이다.데이터 원자료만 봤을 때[1.2, 2.1, 2.1, 0.8, 2.4, 0.9, 0.7] 이게 뭐야?평균값 계산을 통해 봤을 때해당 데이터 원자료의 평균이 1.7이구나! 2. 대상을 설명하는 것대상이 가진 성질과 관계성을 명확히 밝히고 이를 이해하는 걸 의미한다. 우리는 일상생활에서도 관찰을 통해 관계성을 쉽게 발견할 수 있다. 붉은 사과를 먹을 땐..