์์นํ๋ณ์ : boxplot์ ํตํ ์ด์์น์ ๊ฑฐ(familysizestr(๋ฌธ์)->๋๋ฏธ๋ณํ RandomForestClassifier RandomForest : 0.7703455129 train/test๋ก ๋๋๊ณ ๋์ด ์๋๋ผ ์ ํ๋๋ฅผ ํ์ธํ๊ณ ๋ฐ์ดํฐ๋ฅผ ํฉ์ณ์ ๋ค์ ๋ชจ๋ธ์ ํ์ต์ํค๋ ์ฑ๋ฅ์ด ๋ ์ข์์ก๋ค!!
๐ Study/ํ๋ก์ ํธ
์์นํ๋ณ์ : boxplot์ ํตํ ์ด์์น์ ๊ฑฐ(familysizestr(๋ฌธ์)->๋๋ฏธ๋ณํ ๋ณ์ ์ ๊ทํ ์งํ(MinMaxScaler)+XGBoost(XGBoostclassifier) XGBoost : 0.6819231961 ์ ๊ทํ๋๋ฌธ์ธ์ง XGB ๋ชจ๋ธ ๋๋ฌธ์ธ์ง ๊ฐ์๊ธฐ ์ฑ๋ฅ์ด ๋ฎ์์ง..๋ญ๊ฐ ๋ฌธ์ ์ธ ๊ฒ์ธ๊ฐ ๊ณ์ ์ ํ๋๋ฅผ ํ๋ณํ ๋ model.score(y_test, pred)๋ก ํ์๋๋ฐ ๊ณ์ 1๋ก ์ถ๋ ฅ์ด๋์ ๊ณผ๋ ์ ํฉ์ธ๊ฐ?ํ๊ณ ์ ํ๋๋ฅผ ์ด๋ฆผ์ก์ ์ ์์๋๋ฐ accuracy_score(y_test, pred)๋ก ์ฐ์ถ์ ํ๋ 0.7~์ธ์ ๋ฆฌ๋ก ์ถ๋ ฅ์ด ๋์๋ค. ๋ณดํต score๊ณผ ์ค์ ๊ฒฐ๊ณผ ์ ์ถ์ 0.05์ ๋ ์ฐจ์ด๊ฐ ๋๋ ๊ฒ์ผ๋ก ํ์ธ๋๋ฉฐ ์ด๋ฅผ ํตํด์ ๋ชจ๋ธ ์ฑ๋ฅ์ ํ์
ํ๊ณ ..์ด๊ฒ์ ๊ฒ ๋ง์ ธ๋ด์ผ ์ข์ ์ฑ๋ฅ์ ๋ผ ์ ์์ ๊ฒ ๊ฐ..
์์นํ๋ณ์ : boxplot์ ํตํ ์ด์์น์ ๊ฑฐ(familysize๋ณ์ ์์ฑ ํ ๊ธฐ์กด ๋ณ์ ์ญ์ VCL์ ํจ์ฑ๊ฒ์ฌ(์ ํจํ์ง ์๋ค๊ณ ์๊ฐํ๋ ๋ฌธํญ ์ญ์ ) ์๊ด๊ณ์ ๊ทธ๋ํ ํ๋ ฌ(๋ฒ์ฃผํ์ ์ ์ธํ๊ณ ) ์ํฅ์ด ์๋ค๊ณ ์๊ฐ๋๋ ์ปฌ๋ผ drop ๋ช
๋ชฉํ ๋ณ์->str(๋ฌธ์)->๋๋ฏธ๋ณํ ๋๋คํฌ๋ ์คํธ(RandomForestClassifier) +ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋ 1์ฐจ:0.713114415 2์ฐจ:0.7127885655 3์ฐจ:0.7121872187(VCL์ ์ ํจ์ฑ row์ ๊ฑฐํ ๋ฌธํญ์ญ์ ์ํจVCL6,9,12๋ง ์ญ์ !, ๋ชจ๋ธ์ ํฐ ์ํฅ์ ์ฃผ์ง ์๋ ๊ฒ์ผ๋ก ํ์
) ์ ์ฒ๋ฆฌ ์์๋ ๋ณ๊ฒฝํด๋ณด๊ณ EDA(boxpot, ์๊ด๊ณ์๊ทธ๋ํ)๋ฅผ ํตํด ์ ์ฒ๋ฆฌ๋ฅผ ์ถ๊ฐ ์งํํ๊ณ ๋๋ฆ ๋
ผ๋ฆฌ์ ์ผ๋ก ๋ชจ๋ธ์ ๊ตฌ์ฑํ๋ค๊ณ ์๊ฐํ๋๋ฐ ์ ํ๋๊ฐ ์ฒ์๋ณด๋ค ์ข๊ฒ ๋์ค์ง ์์..
์ด์์น์ ๊ฑฐ(familysize
์ด์์น ์ ๊ฑฐ(familysize) ๋ช
๋ชฉํ ๋ณ์ ๋ณํ ์ํฅ ์๋ ์ปฌ๋ผ ์ ๊ฑฐ ์ถ๊ฐ์ปฌ๋ผ ์์ฑ(TIPI, ๋งํค์๋ฒจ๋ฆฌ์ฆ ์ค์ฝ์ด) VCL ์ ํจ์ฑ ๊ฒ์ฌ(์ ํจํ์ง ์์ ๋จ์ด์ ์๋ตํ row์ญ์ ) ๋๋คํฌ๋ ์คํธ(RandomForestClassifier) 0.7504515876
https://dacon.io/competitions/official/235902/overview/description SW์ค์ฌ๋ํ ๊ณต๋ AI ๊ฒฝ์ง๋ํ โฎ์์ โฏ - DACON ๋ถ์์๊ฐํ ๋ํ ์ฝ๋ ๊ณต์ ๊ฒ์๋ฌผ์ ๋ด์ฉ ํ์ธ ํ ์ข์์(ํฌํ) ๊ฐ๋ฅํฉ๋๋ค. dacon.io