๋ชจํ๊ท ์ ๋ํ ์ ์์ฑ ๊ฒ์ ์ผ๋ก t-test ๊ฒ์ ์ ์ค์ํ๋ค. ๋ค์๊ณผ ๊ฐ์ด ํฌ๊ฒ ์ธ๊ฐ์ง์ ๋ฐฉ๋ฒ์ด ์๋ค. 1. ๋จ์ผํ๋ณธ t-๊ฒ์ (One-sample t-test) 2. ๋
๋ฆฝํ๋ณธ t-๊ฒ์ (Independent-tw-sample t-test) 3. ๋์ํ๋ณธ t-๊ฒ์ (Paired-two-sample t-test) ๋จ์ผํ๋ณธ t-๊ฒ์ : ๊ด์ฌ์๋ ์ฐ์ํ ๋ณ์์ ํ๊ท ๊ฐ์ ํน์ ๊ธฐ์ค๊ฐ๊ณผ ๋น๊ตํ์ฌ ๊ทธ ์ฐจ์ด๊ฐ ํต๊ณ์ ์ผ๋ก ์ ์ํ๊ฐ๋ฅผ ํ๋จํ๋ ๋ฐฉ๋ฒ. p-value๊ฐ ์ ์์์ค(์ผ๋ฐ์ ์ผ๋ก 0.05)๋ณด๋ค ์์ผ๋ฉด, ๊ท๋ฌด๊ฐ์ค ๊ธฐ๊ฐ 1. ํจํค์ง ์ํฌํธ from sklearn.datasets import load_iris import pandas as pd import numpy as np from scipy.stats import tte..
2022.03.14 - [๋ฐ์ดํฐ ๋ถ์/04. Data Analysis] - [Python] EDA(ํ์์ ๋ฐ์ดํฐ๋ถ์)๋ฅผ ํตํ ๋ณ์ํ์ [Python] EDA(ํ์์ ๋ฐ์ดํฐ๋ถ์)๋ฅผ ํตํ ๋ณ์ํ์ sklearn์ ๋ด์ฅ๋์ด์๋ iris๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ ๊ธฐ๋ณธ์ ์ธ ๋ฐ์ดํฐ๋ถ์์ ํด๋ณด๋ ค๊ณ ํฉ๋๋ค! 1. ํจํค์ง ์ํฌํธ ๋ฐ ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ from sklearn.datasets import load_iris import pandas as pd import numpy as np ir.. xod22.tistory.com ์ ๋ฒ ๊ธ์ ์ด์ด์ EDA์ Visualization์ ๋ํด ๊ณต๋ถํด๋ณด๋ ค๊ณ ํฉ๋๋ค! ๋ฐ์ดํฐ ๊ฐ์ ๋ฐ๋ ์ดํด๋ณด๊ธฐ cols=iris_dataframe.columns[:4] densityplot=iris_datafra..
sklearn์ ๋ด์ฅ๋์ด์๋ iris๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ ๊ธฐ๋ณธ์ ์ธ ๋ฐ์ดํฐ๋ถ์์ ํด๋ณด๋ ค๊ณ ํฉ๋๋ค! 1. ํจํค์ง ์ํฌํธ ๋ฐ ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ from sklearn.datasets import load_iris import pandas as pd import numpy as np iris=load_iris() iris_dataframe=pd.DataFrame(iris.data, columns=iris.feature_names) # y์ปฌ๋ผ ์ถ๊ฐ iris_dataframe['group']=pd.Series([iris.target_names[k] for k in iris.target], dtype="category") iris_dataframe 2. ํต๊ณ๋ ํ์ธ ~ํ๊ท ๊ฐ~ numeric_only : int/float ์ด..