ADP ๊ณต๋ถ๋ฅผ ์ํด?๋ผ๋ ์ง๋ฌธ์ ์๊ฐ๋ณด๋ค ์์ฃผ ๋ฃ๊ฒ ๋์ด ๋๋ ADP ๊ณต๋ถ๋ฅผ ์ํ๊ณ ์๋ ๊ฒ์ผ๊น, ์ ํ๊ณ ์๋ ๊ฒ์ผ๊น์ ๋ํ ํ๊ณ ๋ฅผ ํ๊ฒ ๋์์ต๋๋ค. ADP๋ฅผ ๊ณต๋ถํ ์ฌ๋์ผ๋ก์ ์๋นํ ์ค๋ฌด์ ์ธ ์๊ฒฉ์ฆ์ด๋ผ๊ณ ๋๋ตํ ์ ์์ต๋๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ์ค๋ฌด์ ์ธ ๋ฅ๋ ฅ์ ์ธ์ ๋ฐ๊ณ ์ถ์ด ์ด ์๊ฒฉ์ฆ์ ๋ฐ๋ผ๋ณด๊ณ ์ด์ฌํ ๊ณต๋ถ๋ฅผ ํด์๋ ๊ฒ ๊ฐ์ต๋๋ค. "์๊ฒฉ์ฆ ์ทจ๋์ ์ํ ์๊ฒฉ์ฆ์ ์ง์ํ๋ค"๋ ๋ง์ ๋ง์ด ๋ค์ด์ ๊ณต๋ถ๋ฅผ ํ๋ฉด์ ์ค์ ๋ก ์ ์ฉ๋ ๋ง์ด ํด๋ณด๊ณ ๋์ค์ ์ฐธ๊ณ ๋ฅผ ํ ์ ์๋๋ก github๋ tistory์ ๊ณ์ํด์ ํ์ ์ ๋จ๊ฒจ์์ต๋๋ค. ๊ฑฐ์ 1๋
๋์ ADP ๊ณต๋ถ๋ฅผ ํ๋ฉด์ ๋๋ ๊ฒ์ ADP ๊ณต๋ถ์ ์๋ น์ ์๋ค!์
๋๋ค. ์ด์ฌํ ๋ฐ์ดํฐ๋ฅผ ๋ฏ์ด๋ณด๊ณ ๊ณต๋ถํ ๋งํผ ์ค๋ ฅ๋ ์์ด๊ณ ์๊ฒฉ์ฆ์ ํฉ๊ฒฉ์ ๊ทธ์ ์ ์ ๋ก ๋ค๋ฐ๋ผ ์ค๋ ๊ฒ์ธ ๊ฒ ๊ฐ๋ค๋ ..
๋ฌผ๋ก pandas์๋ ์์ฃผ ์ต์ํ์ง๋ง ์์ด๋ฒ๋ฆฌ๊ฑฐ๋ ํ๋ ๊ฒฝ์ฐ๋ฅผ ๋๋นํ์ฌ ๊ณ์ ๋๊ณ ์์ฃผ ๋ณด๋ ๊ฒ์ด ์ข๊ธฐ๋๋ฌธ์ ๋ธ๋ก๊ทธ์ ์ฌ๋ ค๋ก๋๋ค! ๋ณดํต cheetsheet์ ํ์ฅ์ผ๋ก ์ ๋ฆฌ๋์ด์๋๋ฐ pandas๋ ๋์ฅ์ผ๋ก ์ ๋ฆฌ๊ฐ ๋์ด์๋ค์! ์์ฃผ์์ฃผ ๋ด์ผ๊ฒ ์ต๋๋ค ใ
ใ
2022.07.13 - [ADP ์ค๊ธฐ] - [ADP] ADP 25ํ ์ค๊ธฐ์ํ ํ๊ธฐ ๋ฐ ๋ฌธ์ ๋ณต๊ธฐ [ADP] ADP 25ํ ์ค๊ธฐ์ํ ํ๊ธฐ ๋ฐ ๋ฌธ์ ๋ณต๊ธฐ ์ด๋ฒ์ ์ฒซ ADP ์ค๊ธฐ์ํ์ ์์ํ๊ณ ์๋๋ฐ์! 4์๊ฐ์ด..๊ธธ์ค ์์๋๋ฐ ์ ๋ง ์์๊ฐ์ ์ง๋๊ฐ๋๋ผ๊ตฌ์.. ์ค๊ธฐ์ํ ํ๊ธฐ๊ฐ ์๊ธฐ๋ ํ๊ณ ์๋๋ผ๋ ์ค๋๋ ํ๊ธฐ๋ผ์ ์ต๊ทผ ์ํ ๋ฐฉ์์ ๊ฐ๋จํ๊ฒ ์ ์ด xod22.tistory.com 2022.11.20 - [ADP ์ค๊ธฐ] - [ADP] ADP 26ํ ์ค๊ธฐ์ํ ํ๊ธฐ ๋ฐ ๋ฌธ์ ๋ณต๊ธฐ, ํ์ด [ADP] ADP 26ํ ์ค๊ธฐ์ํ ํ๊ธฐ ๋ฐ ๋ฌธ์ ๋ณต๊ธฐ, ํ์ด 2022.07.13 - [ADP ์ค๊ธฐ] - [ADP] ADP 25ํ ์ค๊ธฐ์ํ ํ๊ธฐ ๋ฐ ๋ฌธ์ ๋ณต๊ธฐ [ADP] ADP 25ํ ์ค๊ธฐ์ํ ํ๊ธฐ ๋ฐ ๋ฌธ์ ๋ณต๊ธฐ ์ด๋ฒ์ ์ฒซ ADP ์ค๊ธฐ์..
2022.07.13 - [ADP ์ค๊ธฐ] - [ADP] ADP 25ํ ์ค๊ธฐ์ํ ํ๊ธฐ ๋ฐ ๋ฌธ์ ๋ณต๊ธฐ [ADP] ADP 25ํ ์ค๊ธฐ์ํ ํ๊ธฐ ๋ฐ ๋ฌธ์ ๋ณต๊ธฐ ์ด๋ฒ์ ์ฒซ ADP ์ค๊ธฐ์ํ์ ์์ํ๊ณ ์๋๋ฐ์! 4์๊ฐ์ด..๊ธธ์ค ์์๋๋ฐ ์ ๋ง ์์๊ฐ์ ์ง๋๊ฐ๋๋ผ๊ตฌ์.. ์ค๊ธฐ์ํ ํ๊ธฐ๊ฐ ์๊ธฐ๋ ํ๊ณ ์๋๋ผ๋ ์ค๋๋ ํ๊ธฐ๋ผ์ ์ต๊ทผ ์ํ ๋ฐฉ์์ ๊ฐ๋จํ๊ฒ ์ ์ด xod22.tistory.com ADP 26ํ๋ ์์ํ์๋๋ฐ ๋ฆ์์ง๋ง ๊ฐ๋จํ๊ฒ ์ํ๋ณต๊ธฐํ ๊ฒ๊ณผ ํ์ดํ ๊ฒ์ ์ ์ด๋ณด๋ ค๊ณ ํฉ๋๋ค. ์ํ๋ฌธ์ ๋ณต๊ธฐ - ๋จธ์ ๋ฌ๋ 1-1. ๊ฒฐ์ธก์น ์๋ณํ์ฌ ์ ์, ์ญ์ ํ์ง ์๊ณ ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ๊ณผ ๊ฒฐ๊ณผ 1-2. ์ด์์น ์ ๊ฑฐ 1-3. ๊ตฐ์ง์์ฑ๊ณผ ์ฌ์ 2-1. ๊ตฐ์ง์ฑ๋ฅ์งํ, ๊ตฐ์ง๊ฐ ์ฐจ์ด์ ํน์ฑ๋ถ์ 2-2. ์ถ์ฒ์ํ ๊ตฌ์ฑ, ํ๊ตฐ์ง๊ณผ์ ์ถ์ฒ ์ํ์ฐจ์ด 2-3..
์์นํ๋ณ์ : boxplot์ ํตํ ์ด์์น์ ๊ฑฐ(familysizestr(๋ฌธ์)->๋๋ฏธ๋ณํ RandomForestClassifier RandomForest : 0.7703455129 train/test๋ก ๋๋๊ณ ๋์ด ์๋๋ผ ์ ํ๋๋ฅผ ํ์ธํ๊ณ ๋ฐ์ดํฐ๋ฅผ ํฉ์ณ์ ๋ค์ ๋ชจ๋ธ์ ํ์ต์ํค๋ ์ฑ๋ฅ์ด ๋ ์ข์์ก๋ค!!
์์นํ๋ณ์ : boxplot์ ํตํ ์ด์์น์ ๊ฑฐ(familysizestr(๋ฌธ์)->๋๋ฏธ๋ณํ ๋ณ์ ์ ๊ทํ ์งํ(MinMaxScaler)+XGBoost(XGBoostclassifier) XGBoost : 0.6819231961 ์ ๊ทํ๋๋ฌธ์ธ์ง XGB ๋ชจ๋ธ ๋๋ฌธ์ธ์ง ๊ฐ์๊ธฐ ์ฑ๋ฅ์ด ๋ฎ์์ง..๋ญ๊ฐ ๋ฌธ์ ์ธ ๊ฒ์ธ๊ฐ ๊ณ์ ์ ํ๋๋ฅผ ํ๋ณํ ๋ model.score(y_test, pred)๋ก ํ์๋๋ฐ ๊ณ์ 1๋ก ์ถ๋ ฅ์ด๋์ ๊ณผ๋ ์ ํฉ์ธ๊ฐ?ํ๊ณ ์ ํ๋๋ฅผ ์ด๋ฆผ์ก์ ์ ์์๋๋ฐ accuracy_score(y_test, pred)๋ก ์ฐ์ถ์ ํ๋ 0.7~์ธ์ ๋ฆฌ๋ก ์ถ๋ ฅ์ด ๋์๋ค. ๋ณดํต score๊ณผ ์ค์ ๊ฒฐ๊ณผ ์ ์ถ์ 0.05์ ๋ ์ฐจ์ด๊ฐ ๋๋ ๊ฒ์ผ๋ก ํ์ธ๋๋ฉฐ ์ด๋ฅผ ํตํด์ ๋ชจ๋ธ ์ฑ๋ฅ์ ํ์
ํ๊ณ ..์ด๊ฒ์ ๊ฒ ๋ง์ ธ๋ด์ผ ์ข์ ์ฑ๋ฅ์ ๋ผ ์ ์์ ๊ฒ ๊ฐ..
์์นํ๋ณ์ : boxplot์ ํตํ ์ด์์น์ ๊ฑฐ(familysize๋ณ์ ์์ฑ ํ ๊ธฐ์กด ๋ณ์ ์ญ์ VCL์ ํจ์ฑ๊ฒ์ฌ(์ ํจํ์ง ์๋ค๊ณ ์๊ฐํ๋ ๋ฌธํญ ์ญ์ ) ์๊ด๊ณ์ ๊ทธ๋ํ ํ๋ ฌ(๋ฒ์ฃผํ์ ์ ์ธํ๊ณ ) ์ํฅ์ด ์๋ค๊ณ ์๊ฐ๋๋ ์ปฌ๋ผ drop ๋ช
๋ชฉํ ๋ณ์->str(๋ฌธ์)->๋๋ฏธ๋ณํ ๋๋คํฌ๋ ์คํธ(RandomForestClassifier) +ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋ 1์ฐจ:0.713114415 2์ฐจ:0.7127885655 3์ฐจ:0.7121872187(VCL์ ์ ํจ์ฑ row์ ๊ฑฐํ ๋ฌธํญ์ญ์ ์ํจVCL6,9,12๋ง ์ญ์ !, ๋ชจ๋ธ์ ํฐ ์ํฅ์ ์ฃผ์ง ์๋ ๊ฒ์ผ๋ก ํ์
) ์ ์ฒ๋ฆฌ ์์๋ ๋ณ๊ฒฝํด๋ณด๊ณ EDA(boxpot, ์๊ด๊ณ์๊ทธ๋ํ)๋ฅผ ํตํด ์ ์ฒ๋ฆฌ๋ฅผ ์ถ๊ฐ ์งํํ๊ณ ๋๋ฆ ๋
ผ๋ฆฌ์ ์ผ๋ก ๋ชจ๋ธ์ ๊ตฌ์ฑํ๋ค๊ณ ์๊ฐํ๋๋ฐ ์ ํ๋๊ฐ ์ฒ์๋ณด๋ค ์ข๊ฒ ๋์ค์ง ์์..
์ด์์น์ ๊ฑฐ(familysize