์ด๋ฒ ํฌ์คํ ์์๋ Matrix Factorizaton๊ณผ ์ต์ ํ ๊ธฐ๋ฒ์ ์๊ฐํ๋ ค๊ณ ํฉ๋๋ค!_!

๋จผ์ ๋ค์ํ๋ฒ Matrix Factorization ๊ธฐ๋ฒ์ ๋ํด ์ ์ํด๋ณด๊ฒ ์ต๋๋ค~_~
Matrix Factorization์ด๋?
R๊ณผ ์ต๋ํ ์ ์ฌํ๊ฒ R^์ ์ถ๋ก ํ๋ ๊ฒ์ด ๋ชฉํ
์ฆ ๋ชฉ์ ํจ์๋ explicit feedback(1~5์ ํ์ )์์ true rating๊ณผ ์ฐ๋ฆฌ๊ฐ ์์ธกํ predicted rating์ ์ฐจ๋ฅผ Minimizeํ๋ ๊ฒ์ด๋ค.
Objective Fuction (๋ชฉ์ ํจ์)
1) ํ์ต๋ฐ์ดํฐ์ ์๋ ์ ์ u์ ์์ดํ i์ ๋ํ ์ค์ rating
2) ์ ์ u์ latent vector
3) ์์ดํ i์ latent vector
->2),3)์ ์ต์ ํ ๋ฌธ์ ๋ฅผ ํตํด ์ ๋ฐ์ดํธ ๋๋ ํ๋ผ๋ฏธํฐ
4) ๋๋ค term์ L2Regularization(์ ๊ทํ)๋ฅผ ์๋ฏธํ๋ค. ํ์ต๋ฐ์ดํฐ์ Overfitting(๊ณผ์ ํฉ)๋๋ ๊ฒ์ ๋ฐฉ์งํ๊ธฐ ์ํด weight ๊ฐ์ด ๋๋ฌด ์ปค์ง์ง ์๊ฒ ์กฐ์ ํ๋(?)๊ฒ์ด๋ค.
* ์ ๊ทํ์ ์ข ๋ฅ์๋ L1(๋ผ์), L2(๋ฆฟ์ง) ์ ๊ทํ๊ฐ ์๋ค!
๋จ L1๊ท์ ๋ weight๋ฅผ 0์ผ๋ก ๋ง๋ค์ด์ฃผ๊ธฐ ๋๋ฌธ์ ๊ตณ์ด ์ฌ์ฉํ์ง ์๊ณ MF์์๋ L2๋ง ์ฌ์ฉํ๋ค
MF์ ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ
- SGD (Stochastic Gradient Descent in MF)
๋ชจ๋ ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ์์ ๋ํดํธ๋ก ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ
์๋ฌ๋ฅผ ์ค์ฌ๋๊ฐ๋ ์ชฝ์ Gradient๋ฅผ ๊ตฌํด์ ํ๋ผ๋ฏธํฐ๋ฅผ Gradient(๊ธฐ์ธ๊ธฐ)์ ๋ฐ๋ผ ์ ๋ฐ์ดํธ ํ๋ ๋ฐฉ์
* SGD์ด๋ฆ์ Stochastic์ด ๋ถ์ ์ด์ ๋ ๋ฐ์ดํฐ ์ ์ฒด์ ๋ํด Gradient๋ฅผ ๊ตฌํ๋๊ฒ ์๋๋ผ ๋ฐ์ดํฐ ํ๋ํ๋ ํฌ์ธํธ์ ๋ํด Gradient๋ฅผ ๊ตฌํ๊ธฐ ๋๋ฌธ์ Stochastic์ด ๋ถ์!
- ALS (Alternative Least Square)
-> implicit feedback๋ฐ์ดํฐ์ผ ๊ฒฝ์ฐ ์ฌ์ฉ
- ์ ์ ์ ์์ดํ
๋งคํธ๋ฆญ์ค๋ฅผ ๋ฒ๊ฐ์๊ฐ๋ฉด์ ์
๋ฐ์ดํธ ํจ!
์) q๋ฅผ ๊ณ ์ ->p๋ฅผ ๋ณ๋ ฌ์ฐ์ฐ / p๋ฅผ ๊ณ ์ ->q๋ฅผ ๋ณ๋ ฌ์ฐ์ฐ
- Sparseํ ๋ฐ์ดํฐ(๋น์ด์๋ ๋ฐ์ดํฐ)์ ๋ํด SGD๋ณด๋ค Robust(ํฌ๊ฒ ์ํฅx)ํ ๋ชจ์ต
- SGD์ ๋ค๋ฅด๊ฒ ๋ณ๋ ฌ์ฒ๋ฆฌ๊ฐ ๊ฐ๋ฅํ์ฌ Spark์ ๊ฐ์ ๋ถ์ฐ ์ฒ๋ฆฌ ์์คํ ์์ ๋์ฉ๋ ๋ฐ์ดํฐ์ ๋ํด ๋น ๋ฅธ ํ์ต์ด ๊ฐ๋ฅํ๋ค
๋ ผ๋ฌธ์์ ์๊ฐ๋ ๋ค์ํ MF ํ ํฌ๋
- Adding Biases
- CF์์ deviation ์์ด๋์ด๋ฅผ ์ ์ฉํ์ฌ biases ์ถ๊ฐ๋ฅผ ํตํด ์์ธก ์ฑ๋ฅ์ ๋์ด๋ ๋ฐฉ๋ฒ
- ์ด๋ค ์ ์ ๋ ๋ชจ๋ ์ํ์ ๋ํด์ ํ์ ์ ์ง๊ฒ ์ค ์๋ ์์
- Temporal Dynamics
- ์๊ฐ์ ๋ฐ๋ผ ๋ณํํ๋ ์ ์ , ์์ดํ ์ ํน์ฑ์ ๋ฐ์ํ๊ณ ์ถ์
- ๋ฐ๋ผ์ ๋ช๋ฌ..์ด๋ ๊ฒ ๊ณ์ ํ ๋ชจ๋ธ์ ์ฐ๋ ๊ฒ์ ๋ถ๊ฐ
<daily ๋ชจ๋ธ>
daily ๋ชจ๋ธ์ ์ฌ์ฉํจ์ผ๋ก cold start ๋ฌธ์ ์ time effect(์ต์ ์ฑ) ๋ฌธ์ ๋ฅผ ํด๊ฒฐ
์๋ํ๋ฉด ์ต์ ์ฑ์ ๋ฐ์ํ๋๊ฒ ๋ฌด์กฐ๊ฑด ์ฑ๋ฅ์ด ์ข๊ธฐ ๋๋ฌธ..!
๋
ูฉ(ห แห*)ู
'๐ ๋จธ์ ๋ฌ๋ | ๋ฅ๋ฌ๋ > ์ถ์ฒ์์คํ ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[K-Data x ๋ฌ๋์คํผ์ฆ] 3-5. Annoy๋ฅผ ํ์ฉํ ์๋น (0) | 2022.01.28 |
---|---|
[K-Data x ๋ฌ๋์คํผ์ฆ]3-4. BPR Optimization with MF (0) | 2022.01.25 |
[K-Data x ๋ฌ๋์คํผ์ฆ] 3-2. Latent Factor Model๊ณผ SVD (0) | 2022.01.21 |
[K-Data x ๋ฌ๋์คํผ์ฆ] 3-1. ๋ชจ๋ธ ๊ธฐ๋ฐ ํ์ ํํฐ๋ง? (0) | 2022.01.19 |
[K-Data x ๋ฌ๋์คํผ์ฆ] 2-3. ์ ์ฌ๋ ๊ฐ๋ ์ดํดํ๊ธฐ (0) | 2022.01.16 |