๋ถ์ฐ๋ถ์(ANOVA)
์ข ์๋ณ์(y)๊ฐ ์ฐ์ํ์ด๊ณ ๋ ๋ฆฝ๋ณ์(x)๊ฐ ๋ฒ์ฃผํ ๋ณ์์ธ ๊ฒฝ์ฐ, ๋ถ์ฐ๋ถ์์ ๋ฒ์ฃผ์ ๋ฐ๋ผ ๋ ๊ฐ ์ด์์ ์ง๋จ์์ ๊ทธ๋ฃน ํ๊ท ๊ฐ ์ฐจ์ด๋ฅผ ๊ทธ๋ฃน ๋ด ๋ณ๋์ ๋น๊ตํ์ฌ ์ดํด๋ณด๋ ํต๊ณ ๋ถ์ ๋ฐฉ๋ฒ์ด๋ค.
์ฆ, ๋ ๊ฐ ์ด์ ์ง๋จ๋ค์ ํ๊ท ๊ฐ ์ฐจ์ด์ ๋ํ ํต๊ณ์ ์ ์์ฑ์ ๊ฒ์ ํ๋ ๋ฐฉ๋ฒ์ด๋ค.
๋ ๋ฆฝ๋ณ์(x)์ ๊ฐ์์ ๋ฐ๋ผ ์ผ์๋ฐฐ์น ๋ถ์ฐ๋ถ์, ์ด์๋ฐฐ์น ๋ถ์ฐ๋ถ์, ๋ค์๋ฐฐ์น ๋ถ์ฐ๋ถ์์ผ๋ก ๋๋์ด์ง๋ฉฐ, ๋ถ์์๋ F-๊ฒ์ ํต๊ณ๋์ ์ด์ฉํ๋ค.
์ค์ต
1. ํจํค์ง ์ํฌํธ
from scipy.stats import f_oneway
2. ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ
from sklearn.datasets import load_iris
import pandas as pd
iris=load_iris()
iris_dataframe=pd.DataFrame(iris.data, columns=iris.feature_names)
3. ANOVA ๋ถ์
๊ท๋ฌด๊ฐ์ค(H0) : 3๊ฐ ์ด์ ๋ชจ์ง๋จ ํ๊ท ์ด ๋์ผํ๋ค
๋๋ฆฝ๊ฐ์ค(H1) : 1๊ฐ ์ด์ ํ๊ท ์ด ์๋ก ๋ค๋ฅด๋ค
f_oneway(iris_dataframe['sepal width (cm)'], iris_dataframe['sepal length (cm)'], iris_dataframe['petal width (cm)'], iris_dataframe['petal length (cm)'])
p-value๊ฐ 0์ด๋ฏ๋ก ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ๋ค. ์ฆ ํ๊ฐ ์ด์์ ํ๊ท ์ด ์๋ก ๋ค๋ฅด๋ค!
'๐ ๋ฐ์ดํฐ ๋ถ์ > 04. Data Analysis' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ํต๊ณ์ ๋ชจ๋ธ๋ง] ์๊ณ์ด ๋ถ์์ ๋ถํด (0) | 2022.03.18 |
---|---|
[ํต๊ณ์ ๋ชจ๋ธ๋ง] ์ ํํ๊ท, ๋ก์ง์คํฑํ๊ท (0) | 2022.03.18 |
[Python] ์๊ด ๊ด๊ณ ๋ถ์ (0) | 2022.03.17 |
[Python] ๋ฑ๋ถ์ฐ ๊ฒ์ (0) | 2022.03.16 |
[Python] ๊ธฐ์ดํต๊ณ : ๋ถํฌ์ ๋ฐ๋ผ ํจ์ ๊ทธ๋ฆฌ๊ธฐ (0) | 2022.03.15 |