πŸ” 데이터 뢄석/04. Data Analysis

[Python] λ“±λΆ„μ‚° κ²€μ •

xod22 2022. 3. 16. 15:28
728x90
λ“±λΆ„μ‚° κ²€μ •

 

: λ“±λΆ„μ‚° 검정은 'λΆ„μ‚°μ˜ λ™μ§ˆμ„± κ²€μ •'이라고도 ν•œλ‹€.

λŒ€μƒ μ§‘λ‹¨μ˜ 뢄산이 같은지 λ‹€λ₯Έμ§€λ₯Ό ν†΅κ³„μ μœΌλ‘œ κ²€μ •ν•˜λŠ” 방법이닀.

* 뢄산이 κ°™μ§€ μ•ŠμœΌλ©΄ anova뢄석을 μˆ˜ν–‰ν•  수 μ—†κΈ° λ•Œλ¬Έμ— μ„ ν–‰λ˜μ–΄μ•Όν•˜λŠ” 뢄석이당..!

 

H0(귀무가섀) : λͺ¨λ“  μ§‘λ‹¨μ˜ 뢄산은 차이가 μ—†λ‹€.

H1(λŒ€λ¦½κ°€μ„€) : 적어도 ν•˜λ‚˜ μ΄μƒμ˜ μ§‘λ‹¨μ˜ 뢄산에 차이가 μžˆλ‹€.

 

λ“±λΆ„μ‚° 검정을 μˆ˜ν–‰ν•˜λŠ” ν•¨μˆ˜λŠ” λ‹€μŒ 두가지가 μžˆλ‹€.

-Bartlett.test

-levene.test

 

-> 두가지 λ‹€ λΆ„μ‚°μ˜ λ™μ§ˆμ„±μ„ κ²€μ •ν•˜λŠ” λ°©λ²•μ΄μ§€λ§Œ Levene κ²€μ •κ³Ό 달리 Bartlett 검정은 ν‘œλ³Έμ΄ μ •κ·œμ„±μ„ λ§Œμ‘±ν•  λ•Œ(즉 μ •κ·œλΆ„ν¬λ₯Ό 띨 λ•Œ)μ—λ§Œ μ‚¬μš©ν•  수 μžˆλŠ” 방법이닀.

Levene 검정은 ν‘œλ³Έμ΄ μ •κ·œμ„±μ„ λ§Œμ‘±ν•˜λ“  λ§Œμ‘±ν•˜μ§€ μ•Šλ“  상관없이 μ‚¬μš©ν•  수 μžˆλ‹€.

 

μ‹€μŠ΅

 

1. νŒ¨ν‚€μ§€ μž„ν¬νŠΈ

from scipy.stats import bartlett
from scipy.stats import levene

 

2. 데이터 생성

A=[85, 86, 88, 75, 78, 94, 98, 79, 71, 80]
B=[91, 92, 93, 85, 87, 84, 82, 88, 95, 96]
C=[79, 78, 88, 94, 92, 85, 83, 85, 82, 81]

 

3. λ“±λΆ„μ‚° κ²€μ • μ§„ν–‰

print(bartlett(A,B,C))
print(levene(A,B,C))

-> p-valueκ°€ 0.05이상 이기 λ•Œλ¬Έμ— 귀무가섀을 μ§€μ§€ν•˜μ—¬ '뢄산에 차이가 μ—†λ‹€'

728x90