[K-Data x ๋ฌ๋์คํผ์ฆ] 3-1. ๋ชจ๋ธ ๊ธฐ๋ฐ ํ์ ํํฐ๋ง?
์ง๊ธ๊น์ง ์ ์ /์์ดํ ๊ฐ์ ์ ์ฌ๋๋ฅผ ๊ตฌํด ์ถ์ฒ์ ํ๋ User-based๋ Item-based ๊ฐ์ Neighborhood-based CF์ ๋ํด ๊ณต๋ถ๋ฅผ ํด๋ดค์ต๋๋ค!
์ด๋ฒ ํฌ์คํ ์์๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ํ์ฉํ๋ Model-based CF์ ๋ํด ์ ์ด๋ณด๋ ค๊ณ ํฉ๋๋ค!

# ๋ชจ๋ธ ๊ธฐ๋ฐ ํ์ ํํฐ๋ง?
-SVD(Singular Value Decomposition)
-MF(Matrix Factorization) / SGD, ALS, BPR ๋ฑ์ ์ข ๋ฅ๊ฐ ์์..
์ ์ /์์ดํ ๊ฐ์ ์ ์ฌ๋์ ์์กดํ๋ ๊ธฐ๋ฒ๋ค์ ๋ฐ์ดํฐ์ sparsity(๋ฐ์ดํฐ์ ๋น๊ณต๊ฐ?)์ ์ทจ์ฝํ๊ณ
์ถ์ฒ ๊ฒฐ๊ณผ๋ฅผ ์์ฑํ ๋๋ง๋ค ๋ง์ ์ฐ์ฐ์ ์๊ตฌํ๊ฒ ๋ฉ๋๋ค!
< Model-based CF์ ํน์ง >
- Model-based CF๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ฉฐ ๋ฐ์ดํฐ ์ ๋ณด๊ฐ ํ๋ผ๋ฏธํ ํํ๋ก ๋ชจ๋ธ์ ๋ํ๋๋ฉฐ ์ต์ ํ๋ฅผ ํตํด ์ด๋ฅผ ์ ๋ฐ์ดํธ!
- ์ด์๊ธฐ๋ฐ CF๋ ์ ์ /์์ดํ ๋ฒกํฐ๋ฅผ ๋ฐ์ดํฐ๋ฅผ ํตํด ๊ณ์ฐ๋ ํํ๋ก ์ ์ฅํ๋ ๋ฐ๋ฉด Model-based CF์ ๊ฒฝ์ฐ ์ ์ , ์์ดํ ๋ฒกํฐ๋ ํ์ต์ ํตํด ๋ณํจ!!
- ์ต๊ทผ์ Model-based CF์๋ฆฌ๋ฅผ ๋ฅ๋ฌ๋์ ์์ฉํ ๋ชจ๋ธ์ด ๋์ ์ฑ๋ฅ์ ๋
< Model-based CF์ ์ฅ์ >
1) ๋ชจ๋ธ์ ํ์ต/์๋น
: ์ ์ /์์ดํ ๋ฐ์ดํฐ๋ ํ์ต์๋ง ์ฌ์ฉ๋๊ณ ์ด๋ฏธ ํ์ต๋ ๋ชจ๋ธ์ ํตํด ์ถ์ฒ๊ฒฐ๊ณผ๋ฅผ ์๋น -> ์๋๊ฐ ๋น ๋ฆ
2) Sparsity/Scalability ๊ทน๋ณต
: ์ด์๊ธฐ๋ฐ CF์ ๋นํด sparseํ ๋ฐ์ดํฐ(๋น๊ณต๊ฐ์ด ์๋ ๋ฐ์ดํฐ)์์๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์,
๋ํ ์ฌ์ฉ์/์์ดํ ๊ฐ์๊ฐ ๋์ด๋๋ ์ข์ ์ถ์ฒ ์ฑ๋ฅ์ ๋ณด์
=> Limited Coverage
: ์ด์ ๊ธฐ๋ฐ CF์ ๊ฒฝ์ฐ ๊ณตํต์ ์ ์ /์์ดํ ์ ๋ง์ด ๊ณต์ ํด์ผ ์ ์ฌ๋ ๊ฐ์ด ์ ํํด์ง๋ค.
์ ์ฌ๋ ๊ฐ์ด ์ ํํ์ง ์์ ๊ฒฝ์ฐ ์ด์์ ํจ๊ณผ๋ฅผ ๋ณด๊ธฐ ์ด๋ ต๋ค. Model-based CF๋ ์ด์ ๊ธฐ๋ฐ CF๋ณด๋ค๋ ์ด ๋ฌธ์ ๊ฐ ๋ํ๋ค(?)๋ ์ฅ์
3) Overfitting ๋ฐฉ์ง
์ค๋์ ๊ฐ๋จํ๊ฒ Model-based CF์ ํน์ง์ ๋ํด ์ ๋ฆฌํด๋ณด์์ต๋๋ค!
๋ค์ ํฌ์คํ ์์๋ ์กฐ๊ธ ๋ ์์ธํ๊ฒ Model-based CF์ ์ฌ๋ฌ ๋ฐฉ๋ฒ์ ๋ํด ๊ฐ์ ธ์ค๋๋ก ํ๊ฒ ์ต๋๋ค
๋~~~
