# Latent Factor Model?
๊ฐ๋จํ๊ฒ ๋งํ๋ฉด ์๋ฒ ๋ฉ์ ํ๋ค๋ ๋ป!
๋ค์ํ๊ณ ๋ณต์กํ ์ ์ ์ ์์ดํ ์ ํน์ฑ์ ๋ช๊ฐ์ ๋ฒกํฐ๋ก compact(์๊ฒ?) ํํ
-> ์ ์ ์ ์์ดํ ์ ๊ฐ์ ์ฐจ์ ๋ฒกํฐ๋ก ํํํ์ฌ ๋ํ๋
-> ๊ฐ์ ๋ฒกํฐ ๊ณต๊ฐ์์ ์ ์ ์ ์์ดํ ์ ์ ์ฌํ ์ ๋๋ฅผ ๋์ผ๋ก ํ์ธํ ์ ์์
์์)

# ์ ํต์ SVD๋?
Matrix Factorization์ ์ฝ์ด ์์ด๋์ด๊ฐ ๋จ!

Rating Matrix R์ ๋ํด์
1) ์ ์ ์ ์ฌ ์์ธ ํ๋ ฌ
2) ์ ์ฌ ์์ธ ๋๊ฐํ๋ ฌ
3) ์์ดํ ์ ์ฌ ์์ธ ํ๋ ฌ
์ด๋ ๊ฒ ์ธ๊ฐ์ง์ ํ๋ ฌ๋ก ๋ถํดํ๋ ๊ฒ์ด๋ค.
=> ์ด๊ฒ์ ๊ทธ๋ฅ ์ ํ๋์ํ์์์ ๊ฐ๋ ์ผ๋ก
์ ์ ์ ์์ดํ ์ ์ ํด์ง ์ฐจ์์ผ๋ก ์๋ฒ ๋ฉํ๊ณ ์ถ๋ค๋ฉด?
# Truncated SVD?
๋ํ๊ฐ์ผ๋ก ์ฌ์ฉ๋ k๊ฐ์ ํน์ด๊ฐ๋ง ์ฌ์ฉํ๋ค.

ํน์ด์น์ Top n๊ฐ๋ฅผ ๋ฝ์!
R๊ณผ ์ต๋ํ ๋น์ทํ R^์ ๊ตฌํจ..์ ๋ณด์์ค์ ์ค์ด๋ฉด์~_~
* ์ ํต์ SVD์ ๋ฌธ์ ์
- ์ค์ ๋ฐ์ดํฐ๋ ๋๋ถ๋ถ Sparse Matrix์ธ๋ฐ SVD๋ ๊ฐ์ด ๊ฝ์ฐจ์์ด์ผ ๊ณ์ฐ ๊ฐ๋ฅํจ.
- ๋ฐ๋ผ์ ๊ฒฐ์ธก๋ ๊ฐ์ ์ฑ์์ Dense Matrix(๊ฝ์ฐจ์์)์ ๋ง๋ค์ด SVD๋ฅผ ์ํํ๋๋ฐ
์ด ๋ฐฉ๋ฒ์ ๋ฐ์ดํฐ์ ์์ ์๋นํ ์ฆ๊ฐ์์ผ ๊ณ์ฐ ๋น์ฉ์ด ๋์์ง๋ค.
- ์ ํํ์ง ์์ Imputation(๋ฐ์ดํฐ ์ฑ์ฐ๊ธฐ)๋ ๋ฐ์ดํฐ๋ฅผ ์๊ณก์ํค๊ณ ์์ธก ์ฑ๋ฅ์ ๋จ์ดํธ๋ฆฐ๋ค.
=> ๋ฐ๋ผ์ SVD์ ๊ธฐ๋ณธ์ ์ธ ์๋ฆฌ๋ฅผ ์ด์ฉํ๋, MF(Matrix Factorization)๋ฅผ ํ์ตํ๊ธฐ ์ํ ๊ทผ์ฌ์ ์ธ ๋ฐฉ๋ฒ์ด ํ์ํ๋ค!
# ์ค์ SVD์ Matrix Factorization


์ด๋ฐ์์ผ๋ก SVD๋ฅผ ํตํด ๋ถํด๋ ํ๋ ฌ์ ๊ฒฐ๊ตญ ์ ์ ๋งคํธ๋ฆญ์ค์ ์์ดํ ๋งคํธ๋ฆญ์ค์ ๊ณฑ์ด ๋จ..!

=> ๋น์ด์๋ ํ๋ ฌ R์ ์์ธก
# ์ต์ข Matrix Factorization ์ ์
Rating Matrix๋ฅผ P์ Q๋ก ๋ถํด
P-> U*k
Q-> I*k


MatrixFactorization์ ๊ฒฐ๊ณผ๋ก ๋์จ ์์ธก๊ฐ์ ์ถ์ฒ์ ํ์ฉํ๋ค!
์ต๋ํ ์ค์ ์ ๋น์ทํ๋๋ก(?)
์ค๋์ SVD ์๋ฆฌ๋ฅผ ์ด์ฉํ Matrix Factorization์ ๋ด์ฉ์ ๋ํ์ฌ ํฌ์คํ ํด๋ณด์์ต๋๋ค!
๋ด์ฉ์ด..์ํ์ ์๋ฆฌ๊ฐ ๋ค์ด๊ฐ๋ค๋ณด๋๊น ๋๋ฒ๋ค์ด๋ ์ดํด๊ฐ ์ด๋ ต๋๋ผ๊ตฌ์.!
๊ณ์ ๋ฐ๋ณต์ ์ผ๋ก ๋ณด๋ฉด์ ์ดํด๋ฅผ ํด๋ณด๋ ค๊ณ ํฉ๋๋ค.
๊ทธ๋ผ ์ค๋์ ๋~!~!

'๐ ๋จธ์ ๋ฌ๋ | ๋ฅ๋ฌ๋ > ์ถ์ฒ์์คํ ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[K-Data x ๋ฌ๋์คํผ์ฆ]3-4. BPR Optimization with MF (0) | 2022.01.25 |
---|---|
[K-Data x ๋ฌ๋์คํผ์ฆ] 3-3. Matrix Factorization๊ณผ ์ต์ ํ ๊ธฐ๋ฒ (0) | 2022.01.24 |
[K-Data x ๋ฌ๋์คํผ์ฆ] 3-1. ๋ชจ๋ธ ๊ธฐ๋ฐ ํ์ ํํฐ๋ง? (0) | 2022.01.19 |
[K-Data x ๋ฌ๋์คํผ์ฆ] 2-3. ์ ์ฌ๋ ๊ฐ๋ ์ดํดํ๊ธฐ (0) | 2022.01.16 |
[K-Data x ๋ฌ๋์คํผ์ฆ] 2-2. ํ์ ํํฐ๋ง(CF)์ ์๋ฆฌ (0) | 2022.01.15 |
# Latent Factor Model?
๊ฐ๋จํ๊ฒ ๋งํ๋ฉด ์๋ฒ ๋ฉ์ ํ๋ค๋ ๋ป!
๋ค์ํ๊ณ ๋ณต์กํ ์ ์ ์ ์์ดํ ์ ํน์ฑ์ ๋ช๊ฐ์ ๋ฒกํฐ๋ก compact(์๊ฒ?) ํํ
-> ์ ์ ์ ์์ดํ ์ ๊ฐ์ ์ฐจ์ ๋ฒกํฐ๋ก ํํํ์ฌ ๋ํ๋
-> ๊ฐ์ ๋ฒกํฐ ๊ณต๊ฐ์์ ์ ์ ์ ์์ดํ ์ ์ ์ฌํ ์ ๋๋ฅผ ๋์ผ๋ก ํ์ธํ ์ ์์
์์)

# ์ ํต์ SVD๋?
Matrix Factorization์ ์ฝ์ด ์์ด๋์ด๊ฐ ๋จ!

Rating Matrix R์ ๋ํด์
1) ์ ์ ์ ์ฌ ์์ธ ํ๋ ฌ
2) ์ ์ฌ ์์ธ ๋๊ฐํ๋ ฌ
3) ์์ดํ ์ ์ฌ ์์ธ ํ๋ ฌ
์ด๋ ๊ฒ ์ธ๊ฐ์ง์ ํ๋ ฌ๋ก ๋ถํดํ๋ ๊ฒ์ด๋ค.
=> ์ด๊ฒ์ ๊ทธ๋ฅ ์ ํ๋์ํ์์์ ๊ฐ๋ ์ผ๋ก
์ ์ ์ ์์ดํ ์ ์ ํด์ง ์ฐจ์์ผ๋ก ์๋ฒ ๋ฉํ๊ณ ์ถ๋ค๋ฉด?
# Truncated SVD?
๋ํ๊ฐ์ผ๋ก ์ฌ์ฉ๋ k๊ฐ์ ํน์ด๊ฐ๋ง ์ฌ์ฉํ๋ค.

ํน์ด์น์ Top n๊ฐ๋ฅผ ๋ฝ์!
R๊ณผ ์ต๋ํ ๋น์ทํ R^์ ๊ตฌํจ..์ ๋ณด์์ค์ ์ค์ด๋ฉด์~_~
* ์ ํต์ SVD์ ๋ฌธ์ ์
- ์ค์ ๋ฐ์ดํฐ๋ ๋๋ถ๋ถ Sparse Matrix์ธ๋ฐ SVD๋ ๊ฐ์ด ๊ฝ์ฐจ์์ด์ผ ๊ณ์ฐ ๊ฐ๋ฅํจ.
- ๋ฐ๋ผ์ ๊ฒฐ์ธก๋ ๊ฐ์ ์ฑ์์ Dense Matrix(๊ฝ์ฐจ์์)์ ๋ง๋ค์ด SVD๋ฅผ ์ํํ๋๋ฐ
์ด ๋ฐฉ๋ฒ์ ๋ฐ์ดํฐ์ ์์ ์๋นํ ์ฆ๊ฐ์์ผ ๊ณ์ฐ ๋น์ฉ์ด ๋์์ง๋ค.
- ์ ํํ์ง ์์ Imputation(๋ฐ์ดํฐ ์ฑ์ฐ๊ธฐ)๋ ๋ฐ์ดํฐ๋ฅผ ์๊ณก์ํค๊ณ ์์ธก ์ฑ๋ฅ์ ๋จ์ดํธ๋ฆฐ๋ค.
=> ๋ฐ๋ผ์ SVD์ ๊ธฐ๋ณธ์ ์ธ ์๋ฆฌ๋ฅผ ์ด์ฉํ๋, MF(Matrix Factorization)๋ฅผ ํ์ตํ๊ธฐ ์ํ ๊ทผ์ฌ์ ์ธ ๋ฐฉ๋ฒ์ด ํ์ํ๋ค!
# ์ค์ SVD์ Matrix Factorization


์ด๋ฐ์์ผ๋ก SVD๋ฅผ ํตํด ๋ถํด๋ ํ๋ ฌ์ ๊ฒฐ๊ตญ ์ ์ ๋งคํธ๋ฆญ์ค์ ์์ดํ ๋งคํธ๋ฆญ์ค์ ๊ณฑ์ด ๋จ..!

=> ๋น์ด์๋ ํ๋ ฌ R์ ์์ธก
# ์ต์ข Matrix Factorization ์ ์
Rating Matrix๋ฅผ P์ Q๋ก ๋ถํด
P-> U*k
Q-> I*k


MatrixFactorization์ ๊ฒฐ๊ณผ๋ก ๋์จ ์์ธก๊ฐ์ ์ถ์ฒ์ ํ์ฉํ๋ค!
์ต๋ํ ์ค์ ์ ๋น์ทํ๋๋ก(?)
์ค๋์ SVD ์๋ฆฌ๋ฅผ ์ด์ฉํ Matrix Factorization์ ๋ด์ฉ์ ๋ํ์ฌ ํฌ์คํ ํด๋ณด์์ต๋๋ค!
๋ด์ฉ์ด..์ํ์ ์๋ฆฌ๊ฐ ๋ค์ด๊ฐ๋ค๋ณด๋๊น ๋๋ฒ๋ค์ด๋ ์ดํด๊ฐ ์ด๋ ต๋๋ผ๊ตฌ์.!
๊ณ์ ๋ฐ๋ณต์ ์ผ๋ก ๋ณด๋ฉด์ ์ดํด๋ฅผ ํด๋ณด๋ ค๊ณ ํฉ๋๋ค.
๊ทธ๋ผ ์ค๋์ ๋~!~!

'๐ ๋จธ์ ๋ฌ๋ | ๋ฅ๋ฌ๋ > ์ถ์ฒ์์คํ ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[K-Data x ๋ฌ๋์คํผ์ฆ]3-4. BPR Optimization with MF (0) | 2022.01.25 |
---|---|
[K-Data x ๋ฌ๋์คํผ์ฆ] 3-3. Matrix Factorization๊ณผ ์ต์ ํ ๊ธฐ๋ฒ (0) | 2022.01.24 |
[K-Data x ๋ฌ๋์คํผ์ฆ] 3-1. ๋ชจ๋ธ ๊ธฐ๋ฐ ํ์ ํํฐ๋ง? (0) | 2022.01.19 |
[K-Data x ๋ฌ๋์คํผ์ฆ] 2-3. ์ ์ฌ๋ ๊ฐ๋ ์ดํดํ๊ธฐ (0) | 2022.01.16 |
[K-Data x ๋ฌ๋์คํผ์ฆ] 2-2. ํ์ ํํฐ๋ง(CF)์ ์๋ฆฌ (0) | 2022.01.15 |