분류 전체보기

    [책 : 데이터 읽기의 기술] 모든 데이터는 심리학이다

    [책 : 데이터 읽기의 기술] 모든 데이터는 심리학이다

    '데이터 분석 책 추천'에 항상 언급이 되는 데이터 읽기의 기술을 e-book으로 다운 받아 읽었어요.책을 통해 데이터 바라보는 관점과 해석에 대해서 많이 배울 수 있는 시간이었습니다.그래서 데이터 읽기의 기술을 읽으며, 기록했던 것들을 정리해서 기록하려 합니다. 소비자는 언제 회사에게 돈을 쓸까?알고 (지식) → 좋아지면 (태도) → 구매한다 (행동)소비자는 제품을 알고, 제품이 좋아지면 구매한다.단순하게 말해서 어떤 제품을 알고, 좋아하게 되면, 다양한 방법으로 구매한다.매출과 연결되어 있는 ‘사람’의 구매 행동을 분석하는데 가능한 한 많은 데이터를 가지고 있는 것이 매우 중요하다.영수증에는 무슨 데이터가 담겨 있을까?영수증은 소비자와 기업의 시공간이 만나는 순간을 담아낸 집합체다.영수증에는 데이터의..

    [책 : 새빨간 거짓말, 통계] 통계로 조작하는 법

    [책 : 새빨간 거짓말, 통계] 통계로 조작하는 법

    오늘은 9 ~ 10 part 중에서 part 9에 나오는 내용 하나를 기록하려 합니다. 물가지수오늘날 물가지수는 임금인상률과 밀접한 관계를 맺게 되므로 모든 사람에게 중요한 숫자가 되었어요.그런데, 책을 통해 물가지수가 필요에 따라 얼마든지 늘렸다 줄였다 할 수 있음을 알게 되었습니다. 책에서는 가장 간단하면서 신뢰할 만한 예를 통해 설명해줍니다.작년에는 우유 한 병에 50원, 빵 하나에 20원 하던 것이금년(올해)에는 우유가 25원으로 내렸고, 빵은 40원으로 올랐다고 하자.이를 근거로 어떤 이야기를 할 수 있을까요?생활비는 올라갔을까요, 내려갔을까요? 아니면 아무런 변화도 없었을까요?작년을 기준으로 우유와 빵의 값을 100이라고 하자.그러면, 금년에는 우유가 반(50%)이 되고 빵이 되려 2배(200..

    [책 : 새빨간 거짓말, 통계] 통계도 논리다

    [책 : 새빨간 거짓말, 통계] 통계도 논리다

    지난 포스팅에선 1 ~ 3 part 부분을 읽고 기록했어요.https://wnwa.tistory.com/60 [책 : 새빨간 거짓말, 통계] 무지하면 당신도 속는다.이번에 데이터리안에서 진행하는 데벨챌(데이터넥스트레벨챌린지) 3기에 참여하게 됐어요. * 데벨챌이란? 데이터 분석에 도움이 될만한 책을 읽고, 기록하고 공유하는 챌린지 데벨챌에 참여하wnwa.tistory.com이번주는 4 ~ 8 part 부분을 읽고 'part 8'에 나오는 이야기를 기록해보려 해요. 제 3의 요인과 상관관계서울의 한 장로교 목사의 수입과 대구에 파는 맥주 가격 사이에는 높은 상관관계가 성립한다. 위와 같은 말을 들으면 어떤 생각이 드시나요?책에서는 목사와 맥주 사이에는 제 3의 요인이 존재한다..

    [책 : 새빨간 거짓말, 통계] 무지하면 당신도 속는다.

    [책 : 새빨간 거짓말, 통계] 무지하면 당신도 속는다.

    이번에 데이터리안에서 진행하는 데벨챌(데이터넥스트레벨챌린지) 3기에 참여하게 됐어요. * 데벨챌이란? 데이터 분석에 도움이 될만한 책을 읽고, 기록하고 공유하는 챌린지 데벨챌에 참여하게 된 이유는 '함께'에 있습니다. 항상 책을 혼자 읽고 기록만 했는데, 사람들과 함께 책을 읽고 생각을 공유할 수 있다니 너무 매력적으로 다가와서 바로 신청했답니다. 이번 챌린지에서 선정된 책은 '새빨간 거짓말, 통계'입니다. 총 10 part로 구성되어 있고, 3주 간 나누어 읽고 기록하여 공유하면 돼요. 오늘은 1 ~ 3 part 부분에서 가장 기억에 남는 부분을 기록하려 해요. 당신도 속을 수 있다 ! 책에는 뉴스나 마케팅에서 통계를 바탕으로 사람들을 속이는 이야기가 나옵니다. 그런데 아이러니한 것은 '속이지만, 거짓..

    [MySQL] 프로그래머스 문제 풀이 (feat. GROUP_CONCAT, INTERSECT 활용)

    [MySQL] 프로그래머스 문제 풀이 (feat. GROUP_CONCAT, INTERSECT 활용)

    테이블에 대한 설명과 문제가 나와있습니다. 문제를 풀면서 'GROUP_CONCAT'과 'INTERSECT'를 공부해 볼게요. 첫 번째, 'GROUP_CONCAT' 활용 과정 SELECT CART_ID, NAME FROM CART_PRODUCTS; 우선 전체적인 테이블 결과를 보기 위해 기본 쿼리를 작성하면, 아래처럼 기본 형태가 나오게 돼요. 이제 여기서 장바구니 (CART_ID)에 'MILK'와 'YOGURT'를 동시에 담은 사람을 출력하면 됩니다. 그래서 첫 번째로 든 접근 방법은 NAME을 GROUP_CONCAT해서 묶어주는 거예요. GROUP_CONCAT에 대한 자세한 설명은 아래 링크를 통해 알 수 있어요. https://wnwa.tistory.com/34 [MySQL] 조건에 맞는 값들을 묶어..

    [책 : 그로스 해킹] 그놈의 '지표'가 뭔데?

    호기심을 가지고 지표를 관찰 하는 일을 좋아하시는 분 프로덕트 목적에 적절한 지표 수립 지표 변화 모니터링을 통해 위험 감지 & 분석을 통한 문제점 도출 .. 데이터 분석가, 비즈니스 분석가, CRM 마케터 직무의 모집 공고를 보면 '지표'란 말이 많이 보입니다. '지표'란 단어의 빈도만 봐도 중요성을 가늠할 수 있어요. 오늘은 '그로스 해킹' 책 내용을 바탕으로 지표에 관한 내용을 정리하고 기록하려 해요. 지표란? 기본적으로 데이터 분석이나 비즈니스 측면에서 지표란 성과를 측정하고 평가하기 위한 측정 항목이라 정의해요. 그리고, 제가 책을 읽고 내린 지표에 대한 정의는 다음과 같아요. '지표 = 변수' Y = X + 1 에서 X란 변수에 따라 Y의 값이 달라지는 것은 다들 알고 계실 거예요. 제가 지표..

    [경험] 제 2회 유통데이터 활용 경진대회 회고

    [경험] 제 2회 유통데이터 활용 경진대회 회고

    이번 여름 방학 때 홀로 제2회 유통데이터 활용 경진대회에 참여하게 되었어요. 비록 본선 진출은 못 했지만, 공모전을 통해 배운 점들이 있어요. 오늘 글은 공모전을 통해 배운 것들을 기록하려 해요. 아래 링크를 보면 공모전에 대한 자세한 내용을 기록해 뒀어요. https://wnwa.tistory.com/56 [경험] 제 2회 유통데이터 활용 경진대회 후기 대회 설명 - 참여 부분은 '데이터 모델링 부문'과 '비즈니스 아이디어 부문'으로 두 가지 - 데이터 모델링 부문의 주제 'Big data / AI 등의 IT 기술을 활용한 중소 유통물류 수요공급 예측' - 비즈니스 wnwa.tistory.com 혼자 추측하고 판단하기 첫 번째, 중소 유통물류산업의 유통물류 과정 개선 아이디어 두 번째, 마트를 운영하..

    [경험] 제 2회 유통데이터 활용 경진대회 후기

    [경험] 제 2회 유통데이터 활용 경진대회 후기

    대회 설명 - 참여 부분은 '데이터 모델링 부문'과 '비즈니스 아이디어 부문'으로 두 가지 - 데이터 모델링 부문의 주제 'Big data / AI 등의 IT 기술을 활용한 중소 유통물류 수요공급 예측' - 비즈니스 아이디어 부문의 주제 '중소유통물류산업에 도움이 될 수 있는 아이디어' - 2000만 건이 넘는 데이터 우선 제공 (가장 큰 메리트) 저는 비즈니스 아이디어 부문을 참여했어요. 해당 대회에서는 '분석 주제와 목적에 맞게 기획 / 새로운 관점 제시 / 분석결과에 대한 논리성 / 산업활용 가능성' 이렇게 네 가지를 중요하게 본답니다. 도메인 지식 쌓기 저는 유통물류 산업에 대한 도메인 지식이 거의 없었기 때문에 데이터를 활용하기에 앞서 유통물류 산업에 대한 전반적인 지식을 습득하는 것이 우선이었..

    [MySQL] 프로그래머스 문제 풀이 (식품분류별 가장 비싼 식품의 정보 조회하기)

    [MySQL] 프로그래머스 문제 풀이 (식품분류별 가장 비싼 식품의 정보 조회하기)

    테이블에 대한 설명과 문제가 나와있습니다. 얼핏 보면 쉬운 문제 같지만, 계속 틀렸다고 나와서 머리가 아팠던 문제입니다 🥺 처음 작성한 쿼리 SELECT CATEGORY, MAX(PRICE) AS MAX_PRICE, PRODUCT_NAME FROM FOOD_PRODUCT WHERE CATEGORY IN ('식용유', '과자', '국', '김치') GROUP BY CATEGORY ORDER BY MAX(PRICE) DESC; 쿼리에 대한 결괏값 (오답값) 무엇이 틀렸는지 한 번 확인해 볼게요. 우선, 아래는 아무런 CATEGORY만 필터링하고 다른 조건은 아무것도 주지 않은 결괏값이에요. 그리고 빨간색 네모박스들만 출력되면 정답인 샘이죠. 무엇이 틀렸는지 감이 오시나요? 추출되어야 할 결괏값과 제가 짠 쿼..

    [MySQL] HackerRank Pivot Table 문제 (CASE문, SET, 서브쿼리 활용)

    [MySQL] HackerRank Pivot Table 문제 (CASE문, SET, 서브쿼리 활용)

    문제 출처 https://www.hackerrank.com/challenges/occupations/problem?isFullScreen=true&h_r=next-challenge&h_v=zen Occupations | HackerRank Pivot the Occupation column so the Name of each person in OCCUPATIONS is displayed underneath their respective Occupation. www.hackerrank.com 문제 설명 OCCUPATIONS 테이블은 Name, Occupation 두 column으로 이루어진 테이블이에요. 문제는 Occupation 칼럼에 있는 4가지 직업 (Doctor, Professor, Singer, A..