전체 글
-
알기 쉬운 통계학 (4) - 기술통계와 추리통계카테고리 없음 2022. 2. 27. 21:55
기술통계와 추리통계는 보통 통계학 교과서에 보시면 앞 부분에 나오는 개념들인데요. 정확히 어떤 걸 뜻하는지 여기서 알아보도록 하겠습니다. 기술통계는 영어로 descriptive statistics라고 하는데요. 영어로 describe가 묘사하다라는 의미죠. 그래서 우리 앞에 놓인 데이터들을 요약해서 대표적인 숫자로 (여기에는 평균, 분산 등이 있을 수 있겠죠) 나타내고 어떤 특성을 가지는지 (평균이 높은지, 많이 퍼져 있는지... 특정 수치에 뭉쳐 있는지) 등을 알아보는 것을 기술통계라고 합니다. 예를 들면 아래와 같은 파이 차트(pie-chart)가 그 중 하나라고 할 수 있겠죠. 이와 반대로 추리통계는 영어로 inferential statistics라고 하는데 inference가 '추론'이라는 뜻입니..
-
알기 쉬운 통계학 (3) - 인과관계와 상관관계 사례카테고리 없음 2022. 2. 21. 16:51
이전 글에서 인과관계와 상관관계의 간단한 개념에 대해 살펴보았습니다. 간단한 사례도 포함시켜 말씀드렸지만 여기서는 조금 더 심화된 사례를 통해 인과관계와 상관관계의 차이점에 대해 살펴보도록 하겠습니다. 먼저 아래 그래프(산포도)를 보시겠습니다. 이전 포스트와 똑같은 그래프인데 이제는 가로축과 세로축 변수가 확정되어 나왔네요. 가로축변수가 아이스크림 판매량이고 세로축 변수는 익사사고 건수입니다. 두 변수간에 양의 관계가 보이고 있네요. 그런데 두 변수간에 인과관계가 있을까요 아니면 그냥 상관관계만 있는걸까요? 인과관계가 있다고 하면 아이스크림 판매량이 늘어나면 그것이 원인이 되어서 익사사고 건수를 늘려야 합니다. 이게 말이 되는걸까요? 아이스크림 판매량이 늘어나서 익사사고 건수가 늘어나는 인과적 관계가 어..
-
알기 쉬운 통계학 (2) - 인과관계와 상관관계의 다른 점카테고리 없음 2022. 2. 9. 21:56
여러분은 다음 그래프에서 어떤 관계가 보이시나요? 가로축은 var2, 즉 변수2라고 되어 있고 세로축은 var1, 즉 변수1이라고 되어 있네요. 두 변수 간에 양의 관계가 있는 것으로 보이시나요 아니면 음의 관계가 있는 것으로 보이시나요? 아니면 아무 관계도 없는 것으로 보이시나요? 그래프에서 명백히 보이다시피 두 변수간에는 양의 관계가 있는 것으로 보입니다. 그렇다면 이렇게 표현할 수 있겠네요. "변수2가 낮은 수치이면 이에 대응하는 변수1도 낮은 수치를 가지는 경향을 보인다" 예를 들어 가로축이 '실제공부시간'이고 세로축이 '시험성적'이라고 해보겠습니다. 공부를 열심히 하면 좋은 성적이 나올 것이고 공부를 안 하면 나쁜 성적이 나올 것이기 때문에 위와 같은 그래프가 나오겠죠? 즉, 공부시간이 늘어나면..
-
알기 쉬운 통계학 (1) - 들어가며카테고리 없음 2022. 2. 6. 15:38
여러분 안녕하세요? 지금부터 이 블로그를 이용해서 '알기 쉬운 통계학' 포스팅을 시작하게 되었습니다. 전 서울시내 대학에서 사회과학 중 한 분야로 박사학위를 취득했습니다. 통계학 관련된 직접적인 백그라운드로는 미국에서 통계학 석사를 취득했구요. 박사과정 중 그리고 학위취득 이후에도 통계적 기법을 이용한 양적 방법론에 관심이 많았습니다. 서울시내 대학에서 기초통계학 강의도 2학기 진행한 바 있고 통계적방법론을 이용한 논문도 많이 출간했습니다. 저도 통계학을 공부할 때 쉽게 한 것은 아니어서 많이 고전했는데요. 여러 통계학 수업에서 시간이 모자라다보니까... 그리고 여러 다른 이유로 학생들이 잘 이해할 수 있을 정도로 설명이 잘 안되고 있는 것을 많이 경험했습니다. 이건 한국이나 외..