๐Ÿ“š Study/ํ”„๋กœ์ ํŠธ

์ˆ˜์น˜ํ˜•๋ณ€์ˆ˜ : boxplot์„ ํ†ตํ•œ ์ด์ƒ์น˜์ œ๊ฑฐ(familysizestr(๋ฌธ์ž)->๋”๋ฏธ๋ณ€ํ™˜ RandomForestClassifier RandomForest : 0.7703455129 train/test๋กœ ๋‚˜๋ˆ„๊ณ  ๋์ด ์•„๋‹ˆ๋ผ ์ •ํ™•๋„๋ฅผ ํ™•์ธํ•˜๊ณ  ๋ฐ์ดํ„ฐ๋ฅผ ํ•ฉ์ณ์„œ ๋‹ค์‹œ ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ค๋‹ˆ ์„ฑ๋Šฅ์ด ๋” ์ข‹์•„์กŒ๋‹ค!!
์ˆ˜์น˜ํ˜•๋ณ€์ˆ˜ : boxplot์„ ํ†ตํ•œ ์ด์ƒ์น˜์ œ๊ฑฐ(familysizestr(๋ฌธ์ž)->๋”๋ฏธ๋ณ€ํ™˜ ๋ณ€์ˆ˜ ์ •๊ทœํ™” ์ง„ํ–‰(MinMaxScaler)+XGBoost(XGBoostclassifier) XGBoost : 0.6819231961 ์ •๊ทœํ™”๋•Œ๋ฌธ์ธ์ง€ XGB ๋ชจ๋ธ ๋•Œ๋ฌธ์ธ์ง€ ๊ฐ‘์ž๊ธฐ ์„ฑ๋Šฅ์ด ๋‚ฎ์•„์ง..๋ญ๊ฐ€ ๋ฌธ์ œ์ธ ๊ฒƒ์ธ๊ฐ€ ๊ณ„์† ์ •ํ™•๋„๋ฅผ ํŒ๋ณ„ํ• ๋•Œ model.score(y_test, pred)๋กœ ํ–ˆ์—ˆ๋Š”๋ฐ ๊ณ„์† 1๋กœ ์ถœ๋ ฅ์ด๋˜์„œ ๊ณผ๋Œ€ ์ ํ•ฉ์ธ๊ฐ€?ํ•˜๊ณ  ์ •ํ™•๋„๋ฅผ ์–ด๋ฆผ์žก์„ ์ˆ˜ ์—†์—ˆ๋Š”๋ฐ accuracy_score(y_test, pred)๋กœ ์‚ฐ์ถœ์„ ํ•˜๋‹ˆ 0.7~์–ธ์ €๋ฆฌ๋กœ ์ถœ๋ ฅ์ด ๋˜์—ˆ๋‹ค. ๋ณดํ†ต score๊ณผ ์‹ค์ œ ๊ฒฐ๊ณผ ์ œ์ถœ์€ 0.05์ •๋„ ์ฐจ์ด๊ฐ€ ๋‚˜๋Š” ๊ฒƒ์œผ๋กœ ํ™•์ธ๋˜๋ฉฐ ์ด๋ฅผ ํ†ตํ•ด์„œ ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ํŒŒ์•…ํ•˜๊ณ ..์ด๊ฒƒ์ €๊ฒƒ ๋งŒ์ ธ๋ด์•ผ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚ผ ์ˆ˜ ์žˆ์„ ๊ฒƒ ๊ฐ™..
์ˆ˜์น˜ํ˜•๋ณ€์ˆ˜ : boxplot์„ ํ†ตํ•œ ์ด์ƒ์น˜์ œ๊ฑฐ(familysize๋ณ€์ˆ˜ ์ƒ์„ฑ ํ›„ ๊ธฐ์กด ๋ณ€์ˆ˜ ์‚ญ์ œ VCL์œ ํšจ์„ฑ๊ฒ€์‚ฌ(์œ ํšจํ•˜์ง€ ์•Š๋‹ค๊ณ  ์ƒ๊ฐํ•˜๋Š” ๋ฌธํ•ญ ์‚ญ์ œ) ์ƒ๊ด€๊ณ„์ˆ˜ ๊ทธ๋ž˜ํ”„ ํ–‰๋ ฌ(๋ฒ”์ฃผํ˜•์„ ์ œ์™ธํ•˜๊ณ ) ์˜ํ–ฅ์ด ์—†๋‹ค๊ณ  ์ƒ๊ฐ๋˜๋Š” ์ปฌ๋Ÿผ drop ๋ช…๋ชฉํ˜„ ๋ณ€์ˆ˜->str(๋ฌธ์ž)->๋”๋ฏธ๋ณ€ํ™˜ ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ(RandomForestClassifier) +ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹ 1์ฐจ:0.713114415 2์ฐจ:0.7127885655 3์ฐจ:0.7121872187(VCL์€ ์œ ํšจ์„ฑ row์ œ๊ฑฐํ›„ ๋ฌธํ•ญ์‚ญ์ œ ์•ˆํ•จVCL6,9,12๋งŒ ์‚ญ์ œ!, ๋ชจ๋ธ์— ํฐ ์˜ํ–ฅ์€ ์ฃผ์ง€ ์•Š๋Š” ๊ฒƒ์œผ๋กœ ํŒŒ์•…) ์ „์ฒ˜๋ฆฌ ์ˆœ์„œ๋„ ๋ณ€๊ฒฝํ•ด๋ณด๊ณ  EDA(boxpot, ์ƒ๊ด€๊ณ„์ˆ˜๊ทธ๋ž˜ํ”„)๋ฅผ ํ†ตํ•ด ์ „์ฒ˜๋ฆฌ๋ฅผ ์ถ”๊ฐ€ ์ง„ํ–‰ํ•˜๊ณ  ๋‚˜๋ฆ„ ๋…ผ๋ฆฌ์ ์œผ๋กœ ๋ชจ๋ธ์„ ๊ตฌ์„ฑํ–ˆ๋‹ค๊ณ  ์ƒ๊ฐํ–ˆ๋Š”๋ฐ ์ •ํ™•๋„๊ฐ€ ์ฒ˜์Œ๋ณด๋‹ค ์ข‹๊ฒŒ ๋‚˜์˜ค์ง€ ์•Š์•„..
์ด์ƒ์น˜ ์ œ๊ฑฐ(familysize) ๋ช…๋ชฉํ˜• ๋ณ€์ˆ˜ ๋ณ€ํ™˜ ์˜ํ–ฅ ์—†๋Š” ์ปฌ๋Ÿผ ์ œ๊ฑฐ ์ถ”๊ฐ€์ปฌ๋Ÿผ ์ƒ์„ฑ(TIPI, ๋งˆํ‚ค์•„๋ฒจ๋ฆฌ์ฆ˜ ์Šค์ฝ”์–ด) VCL ์œ ํšจ์„ฑ ๊ฒ€์‚ฌ(์œ ํšจํ•˜์ง€ ์•Š์€ ๋‹จ์–ด์— ์‘๋‹ตํ•œ row์‚ญ์ œ) ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ(RandomForestClassifier) 0.7504515876
https://dacon.io/competitions/official/235902/overview/description SW์ค‘์‹ฌ๋Œ€ํ•™ ๊ณต๋™ AI ๊ฒฝ์ง„๋Œ€ํšŒ โฎ์˜ˆ์„ โฏ - DACON ๋ถ„์„์‹œ๊ฐํ™” ๋Œ€ํšŒ ์ฝ”๋“œ ๊ณต์œ  ๊ฒŒ์‹œ๋ฌผ์€ ๋‚ด์šฉ ํ™•์ธ ํ›„ ์ข‹์•„์š”(ํˆฌํ‘œ) ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. dacon.io