본문 바로가기
심리이야기 Psychology/연구방법 및 심리통계

[심리통계] 통계학의 기본 개념과 기술통계 / 표준점수와 정규분포

by here, happy 2024. 4. 6.
반응형

[모집단/표본/표집]
# 모집단(population): 연구의 대상이 되는 전체 집단, 전집
# 표본(sample): 모집단을 대표하는 추출된 대상의 군집
# 표집(sampling): 모집단으로부터 표본을 추출하는 과정

#일반화(generalization): 표본을 통해 분석한 결과를 표본 내의 해석으로 끝내지 않고 이 결과를 바탕으로 모집단의 특성에 대해 추론하여 서술하려고 하는 것.



[변수]
# 연속형 변수와 이산형 변수
> 연속성(continuity)의 여부로 나뉨

1) 연속형(continuous) 변수: 연속선 상에서 정의되는 변수로서 주어진 값의 내에서 무한대의 값을 취할 수 있는 변수. ex. 키, 몸무게, 시간 등
> 특정한 사건의 발생확률이 0이 되는 변수 (분모가 무한대이기 때문)

2) 이산형(discontinuous) 변수: 특정한 값, 즉 셀 수 있는 값을 취할 수 있는 종류의 변수 ex. 성별, 신발의 개수, 리커트 척도로 수집된 변수 등
> 비연속(discontinuous) 변수라고도 부르며, 범주형 변수, 빈도변수가 대표적인 이산형 변수임


# 질적변수와 양적변수
자료가 수리적인 양(quantity)를 나타내느냐 그렇지 않느냐에 대한 것

1) 양적변수: 양의 크기를 나타내기 위해 수량으로 표시되는 변수
> 연속변수 ex. 키, 나이, 체중 등
> 비연속변수 ex. 자동차 수, 휴일 일수

2) 질적변수: 범주형(이산형) 변수, 분류를 위해 정의되는 변수
> 서열 질적변수 ex. 학력, 한문항 likert 척도
> 비서열 질적 변수 ex. 성별, 인종

#독립변수와 종속변수, 혼입변수
변수는 인과관계에 의해 독립변수와 종속변수로 구분됨

1) 독립변수: 다른 변수에 영향을 주는 변수
2) 종속변수: 영향을 받는 변수, 독립변수에 의해 변화하는 변수
3) 혼입변수: 독립변수 이외의 변수로서 종속변수에 영향을 주는 변수로 연구에서 통제되어야 할 변수(control variable)


[측정과 척도]
#측정(measurement): 사물을 구분하기 위해 이름을 부여하거나, 사물의 속성을 구체화하기 위해 수를 부여(assignment of numbers)하는 과정

#척도(scale): 연구대상의 어떤 속성을 측정하기 위해 속성에 어떤 규칙에 따라 숫자를 부여할 수 있는 측정의 도구; 사물의 속성을 구체화하기 위한 측정의 단위


[표와 그래프]

1) 질적변수(범주형 변수)의 자료
-막대그래프
>변수가 질적변수일 때 사용
>명명척도와 서열척도를 사용하는 변수에 대해 사용가능
>원칙적으로 질적변수에 사용되지만, 양적변수이면서 범주의 개수가 많지 않을 때도 사용하는 경우가 있음

2) 양적 변수의 자료
-히스토그램
> 변수가 양적 변수일때 사용함
> 연속형이기 때문에 바 사이에 간격이 없음!

-줄기잎그림(stem-and-leaf plot)

3) 누적빈도분포표
: 자료의 누적 도수 분포 상태를 나타내는 표


4) 백분위와 백분위점수, 사분위수
# 백분위(percentile rank): 얻어진 자료를 크기의 순서로 늘어놓아 100등분 하는 값
> 점수의 상대적인 위치
> 점수가 낮을수록 백분위 또한 낮음
>누적 백분율을 분위로 표현한 것

# 백분위점수(percentile 또는 percentile score): 백분위에 상응하는 실제 점수

예) 25마일 이하에 놓이는 사례들이 80.6%
> 25마일 점수의 백분위는 80
> 백분위 점수는 25
> ‘80 백분위 점수는 25이다‘



[표준점수와 정규분포]
# 표준점수 (Standard Scores, z scores)
평균과 표준편차를 알고 있으면 점수의 상대적인 위치를 파악할 수 있다.

-z점수
> 원점수(raw scores)를 평균이 0이고, 표준편차를 1로 하는 선형변환을 하여 얻어지는 점수
>임의의 점수가 평균으로부터 표준편차 단위로 떨어져 있는 정도를 의미함
> z점수 변환은 선형 변환이므로 원점수 분포의 모양을 전혀 바꾸지 않음

#표준화점수 (z점수의 선형변환)
> 필요성
: z점수는 평균은 0이 되고, 분산은 1이 되므로 음수값이 생긴다는 단점이 있음.
따라서 피험자에게 검사 점수를 보고하거나 해석의 용이성을 목적으로 할 때, 실제로는 또 다른 척도를 가진 점수로 재변환하여 그 점수를 사용하는 것이 더 일반적임!

T점수
> z점수를 T점수로 만들면 평균은 50, 표준편차는 10인 분포로 변환할 수 있음
> T = 50 + 10z
> 표준화 점수를 구할 때, 변환된 점수의 평균과 표준편차는 이미 정해져 있음!

#정규분포(normal distribution)또는 정상분포
>통계학에서 사용되는 모든 종류의 분포 중에서 가장 중심이 되는 분포로서, 연속형 변수에 사용되는 분포
> 중앙에 많은 값들이 존재하고, 중앙으로부터 멀리 갈수록 그 빈도가 감소하며, 중앙에 대해 대칭적인 모양을 보이는 벨 모양의 곡선
> 평균과 분산이 다른 수많은 모양을 만들어낼 수 있는 수학적(이론적)인 분포임

정규분포의 표현


> 정규분포의 특성
1) 연속형 분포
2) 무한분포(unbounded)
3) 봉(최빈점)이 하나(unimodal)이며, 평균에 대해 좌우대칭
4) 평균과 분산에 의해 완전하게 정의됨
5) 모든 정규분포는 확률과 표준편차 단위 사이에 일정한 관계를 가지고 있음

#표준정규분포
> 정규분포를 표준화한 것 / 표준점수들의 분포
> 상이한 평균과 분산을 가진 정규분포들을 비교할 경우에는 점수들의 표준점수를 이용함.
> 표준정규분포의 평균은 0이 되고, 분산은 1이 됨
> 변수 X가 표준정규분포를 따를 때 다음과 같이 표현함: X ~ N(0,1)


반응형

댓글