[K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ] 3-2. Latent Factor Model๊ณผ SVD

2022. 1. 21. 23:39ยท ๐Ÿ ๋จธ์‹ ๋Ÿฌ๋‹ | ๋”ฅ๋Ÿฌ๋‹/์ถ”์ฒœ์‹œ์Šคํ…œ
๋ชฉ์ฐจ
  1. # Latent Factor Model?
  2. # ์ „ํ†ต์  SVD๋ž€?
  3. # Truncated SVD?
  4. # ์‹ค์ œ SVD์™€ Matrix Factorization
  5. # ์ตœ์ข… Matrix Factorization ์ •์˜
728x90

# Latent Factor Model?

๊ฐ„๋‹จํ•˜๊ฒŒ ๋งํ•˜๋ฉด ์ž„๋ฒ ๋”ฉ์„ ํ•œ๋‹ค๋Š” ๋œป!

๋‹ค์–‘ํ•˜๊ณ  ๋ณต์žกํ•œ ์œ ์ €์™€ ์•„์ดํ…œ์˜ ํŠน์„ฑ์„ ๋ช‡๊ฐœ์˜ ๋ฒกํ„ฐ๋กœ compact(์ž‘๊ฒŒ?) ํ‘œํ˜„

-> ์œ ์ €์™€ ์•„์ดํ…œ์„ ๊ฐ™์€ ์ฐจ์› ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•˜์—ฌ ๋‚˜ํƒ€๋ƒ„

-> ๊ฐ™์€ ๋ฒกํ„ฐ ๊ณต๊ฐ„์—์„œ ์œ ์ €์™€ ์•„์ดํ…œ์˜ ์œ ์‚ฌํ•œ ์ •๋„๋ฅผ ๋ˆˆ์œผ๋กœ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Œ

์˜ˆ์‹œ)

์œ ์ €์™€ ์•„์ดํ…œ์„ ๊ฐ™์€ ๋ฒกํ„ฐ๊ณต๊ฐ„์— ํˆฌ์˜


# ์ „ํ†ต์  SVD๋ž€?

Matrix Factorization์˜ ์ฝ”์–ด ์•„์ด๋””์–ด๊ฐ€ ๋จ!

์ „ํ†ต์  SVD

Rating Matrix R์— ๋Œ€ํ•ด์„œ 

1) ์œ ์ € ์ž ์žฌ ์š”์ธ ํ–‰๋ ฌ

2) ์ž ์žฌ ์š”์ธ ๋Œ€๊ฐํ–‰๋ ฌ

3) ์•„์ดํ…œ ์ž ์žฌ ์š”์ธ ํ–‰๋ ฌ

์ด๋ ‡๊ฒŒ ์„ธ๊ฐ€์ง€์˜ ํ–‰๋ ฌ๋กœ ๋ถ„ํ•ดํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

 

=> ์ด๊ฒƒ์€ ๊ทธ๋ƒฅ ์„ ํ˜•๋Œ€์ˆ˜ํ•™์—์„œ์˜ ๊ฐœ๋…์œผ๋กœ

 

์œ ์ €์™€ ์•„์ดํ…œ์„ ์ •ํ•ด์ง„ ์ฐจ์›์œผ๋กœ ์ž„๋ฒ ๋”ฉํ•˜๊ณ ์‹ถ๋‹ค๋ฉด?

# Truncated SVD?

๋Œ€ํ‘œ๊ฐ’์œผ๋กœ ์‚ฌ์šฉ๋  k๊ฐœ์˜ ํŠน์ด๊ฐ’๋งŒ ์‚ฌ์šฉํ•œ๋‹ค.

ํŠน์ด์น˜์˜ Top n๊ฐœ๋ฅผ ๋ฝ‘์Œ!

R๊ณผ ์ตœ๋Œ€ํ•œ ๋น„์Šทํ•œ R^์„ ๊ตฌํ•จ..์ •๋ณด์†์‹ค์„ ์ค„์ด๋ฉด์„œ~_~


* ์ „ํ†ต์  SVD์˜ ๋ฌธ์ œ์ 

- ์‹ค์ œ ๋ฐ์ดํ„ฐ๋Š” ๋Œ€๋ถ€๋ถ„ Sparse Matrix์ธ๋ฐ SVD๋Š” ๊ฐ’์ด ๊ฝ‰์ฐจ์žˆ์–ด์•ผ ๊ณ„์‚ฐ ๊ฐ€๋Šฅํ•จ.

- ๋”ฐ๋ผ์„œ ๊ฒฐ์ธก๋œ ๊ฐ’์„ ์ฑ„์›Œ์„œ Dense Matrix(๊ฝ‰์ฐจ์žˆ์Œ)์„ ๋งŒ๋“ค์–ด SVD๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š”๋ฐ

์ด ๋ฐฉ๋ฒ•์€ ๋ฐ์ดํ„ฐ์˜ ์–‘์„ ์ƒ๋‹นํžˆ ์ฆ๊ฐ€์‹œ์ผœ ๊ณ„์‚ฐ ๋น„์šฉ์ด ๋†’์•„์ง„๋‹ค.

- ์ •ํ™•ํ•˜์ง€ ์•Š์€ Imputation(๋ฐ์ดํ„ฐ ์ฑ„์šฐ๊ธฐ)๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์™œ๊ณก์‹œํ‚ค๊ณ  ์˜ˆ์ธก ์„ฑ๋Šฅ์„ ๋–จ์–ดํŠธ๋ฆฐ๋‹ค.

 

=> ๋”ฐ๋ผ์„œ SVD์˜ ๊ธฐ๋ณธ์ ์ธ ์›๋ฆฌ๋ฅผ ์ด์šฉํ•˜๋˜, MF(Matrix Factorization)๋ฅผ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•œ ๊ทผ์‚ฌ์ ์ธ ๋ฐฉ๋ฒ•์ด ํ•„์š”ํ•˜๋‹ค!

 


# ์‹ค์ œ SVD์™€ Matrix Factorization

์ด๋Ÿฐ์‹์œผ๋กœ SVD๋ฅผ ํ†ตํ•ด ๋ถ„ํ•ด๋œ ํ–‰๋ ฌ์€ ๊ฒฐ๊ตญ ์œ ์ €๋งคํŠธ๋ฆญ์Šค์™€ ์•„์ดํ…œ ๋งคํŠธ๋ฆญ์Šค์˜ ๊ณฑ์ด ๋จ..!

๊ตณ์ด ๋ฐ์ดํ„ฐ์˜ ๋นˆ๊ณต๊ฐ„์„ ์ฑ„์›Œ๋„ฃ์ง€ ์•Š์•„๋„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์ด๋จ!

=> ๋น„์–ด์žˆ๋Š” ํ–‰๋ ฌ R์„ ์˜ˆ์ธก

 

# ์ตœ์ข… Matrix Factorization ์ •์˜

Rating Matrix๋ฅผ P์™€ Q๋กœ ๋ถ„ํ•ด

P-> U*k

Q-> I*k

MatrixFactorization์˜ ๊ฒฐ๊ณผ๋กœ ๋‚˜์˜จ ์˜ˆ์ธก๊ฐ’์„ ์ถ”์ฒœ์— ํ™œ์šฉํ•œ๋‹ค!

์ตœ๋Œ€ํ•œ ์‹ค์ œ์™€ ๋น„์Šทํ•˜๋„๋ก(?)

 


์˜ค๋Š˜์€ SVD ์›๋ฆฌ๋ฅผ ์ด์šฉํ•œ Matrix Factorization์˜ ๋‚ด์šฉ์— ๋Œ€ํ•˜์—ฌ ํฌ์ŠคํŒ… ํ•ด๋ณด์•˜์Šต๋‹ˆ๋‹ค!

๋‚ด์šฉ์ด..์ˆ˜ํ•™์  ์›๋ฆฌ๊ฐ€ ๋“ค์–ด๊ฐ€๋‹ค๋ณด๋‹ˆ๊นŒ ๋‘๋ฒˆ๋“ค์–ด๋„ ์ดํ•ด๊ฐ€ ์–ด๋ ต๋”๋ผ๊ตฌ์š”.!

 

๊ณ„์† ๋ฐ˜๋ณต์ ์œผ๋กœ ๋ณด๋ฉด์„œ ์ดํ•ด๋ฅผ ํ•ด๋ณด๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

 

๊ทธ๋Ÿผ ์˜ค๋Š˜์€ ๋—~!~!

728x90

'๐Ÿ ๋จธ์‹ ๋Ÿฌ๋‹ | ๋”ฅ๋Ÿฌ๋‹ > ์ถ”์ฒœ์‹œ์Šคํ…œ' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ]3-4. BPR Optimization with MF  (0) 2022.01.25
[K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ] 3-3. Matrix Factorization๊ณผ ์ตœ์ ํ™” ๊ธฐ๋ฒ•  (0) 2022.01.24
[K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ] 3-1. ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ํ˜‘์—… ํ•„ํ„ฐ๋ง?  (0) 2022.01.19
[K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ] 2-3. ์œ ์‚ฌ๋„ ๊ฐœ๋… ์ดํ•ดํ•˜๊ธฐ  (0) 2022.01.16
[K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ] 2-2. ํ˜‘์—… ํ•„ํ„ฐ๋ง(CF)์˜ ์›๋ฆฌ  (0) 2022.01.15
  1. # Latent Factor Model?
  2. # ์ „ํ†ต์  SVD๋ž€?
  3. # Truncated SVD?
  4. # ์‹ค์ œ SVD์™€ Matrix Factorization
  5. # ์ตœ์ข… Matrix Factorization ์ •์˜
'๐Ÿ ๋จธ์‹ ๋Ÿฌ๋‹ | ๋”ฅ๋Ÿฌ๋‹/์ถ”์ฒœ์‹œ์Šคํ…œ' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€
  • [K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ]3-4. BPR Optimization with MF
  • [K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ] 3-3. Matrix Factorization๊ณผ ์ตœ์ ํ™” ๊ธฐ๋ฒ•
  • [K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ] 3-1. ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ํ˜‘์—… ํ•„ํ„ฐ๋ง?
  • [K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ] 2-3. ์œ ์‚ฌ๋„ ๊ฐœ๋… ์ดํ•ดํ•˜๊ธฐ
xod22
xod22
xod22
Data Analyst Story
xod22
์ „์ฒด
์˜ค๋Š˜
์–ด์ œ
  • ๐ŸŒณ Home ๐ŸŒณ (178)
    • ๐Ÿฌ MySQL (46)
      • ๋ฌธ์ œํ’€์ด (29)
      • SQL ๋ฐ์ดํ„ฐ๋ถ„์„ ์บ ํ”„ (9)
    • ๐Ÿ” ๋ฐ์ดํ„ฐ ๋ถ„์„ (53)
      • Product (5)
      • 01. Data Collection (7)
      • 02. Data Processing (7)
      • 03. Data Visualizaton (15)
      • 04. Data Analysis (19)
    • ๐Ÿ“š Study (20)
      • ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„๊ธฐ์‚ฌ ์‹ค๊ธฐ (8)
      • ADP ์‹ค๊ธฐ (7)
      • ๊ตฌ๊ธ€ ์• ๋„๋ฆฌํ‹ฑ์Šค (5)
      • ํ”„๋กœ์ ํŠธ (0)
    • โœ๏ธ ์ƒ๊ฐ ๊ธฐ๋ก (10)
      • ๋…์„œ (5)
      • ์ž๋ฃŒ ์Šคํฌ๋žฉ (2)
      • ์ทจ์—… ์ค€๋น„ (2)
    • ๐Ÿ’ป GitHub (6)
      • ์ˆ˜์ • ๋ฐ ๋ณ€๊ฒฝ (5)
    • ๐Ÿ ๋จธ์‹ ๋Ÿฌ๋‹ | ๋”ฅ๋Ÿฌ๋‹ (35)
      • ์ถ”์ฒœ์‹œ์Šคํ…œ (19)
      • ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ (1)
      • ํ…์ŠคํŠธ ๋ถ„์„ (10)

๊ณต์ง€์‚ฌํ•ญ

  • Github
  • How to ๊ตฌ๋…, ์ข‹์•„์š”

์ธ๊ธฐ ๊ธ€

์ตœ๊ทผ ๋Œ“๊ธ€

๋ธ”๋กœ๊ทธ ๋ฉ”๋‰ด

  • ํ™ˆ
  • ํƒœ๊ทธ
  • ๋ฐฉ๋ช…๋ก

ํƒœ๊ทธ

  • ๋น…๋ถ„๊ธฐ
  • ํฌ๋กค๋ง
  • ํŒŒ์ด์ฌ
  • ADP์‹ค๊ธฐ
  • tableau
  • ๋ฐ์ดํ„ฐ์‹œ๊ฐํ™”
  • ์ž‘์—…ํ˜•์ œ1์œ ํ˜•
  • ํ”„๋กœ๊ทธ๋ž˜๋จธ์Šค
  • ์„ธ๋ฏธ๋‚˜
  • github
  • Python
  • ๊นƒํ—ˆ๋ธŒ
  • MySQL
  • ์‹œ๊ฐํ™”
  • ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ
  • ์ถ”์ฒœ์‹œ์Šคํ…œ
  • ๋น…๋ฐ์ดํ„ฐ๋ถ„์„๊ธฐ์‚ฌ
  • Plot
  • ํ†ต๊ณ„์ ๋ชจ๋ธ๋ง
  • ๊ตฌ๊ธ€์• ๋„๋ฆฌํ‹ฑ์Šค
  • ๋ฐ์ดํ„ฐ๋ถ„์„
  • ํƒœ๋ธ”๋กœ
  • ํ•ด์ปค๋žญํฌ
  • ์ฝ”๋”ฉํ…Œ์ŠคํŠธ
  • SQL
  • pandas
  • ๊ธฐ์ถœํ’€์ด
  • ๋ฐ์ดํ„ฐ๋ฆฌ์•ˆ
  • ํ…์ŠคํŠธ๋ถ„์„
  • ์ „์ฒ˜๋ฆฌ

์ตœ๊ทผ ๊ธ€

hELLO ยท Designed By ์ •์ƒ์šฐ.v4.2.0
xod22
[K-Data x ๋Ÿฌ๋‹์Šคํ‘ผ์ฆˆ] 3-2. Latent Factor Model๊ณผ SVD
์ƒ๋‹จ์œผ๋กœ

ํ‹ฐ์Šคํ† ๋ฆฌํˆด๋ฐ”

๊ฐœ์ธ์ •๋ณด

  • ํ‹ฐ์Šคํ† ๋ฆฌ ํ™ˆ
  • ํฌ๋Ÿผ
  • ๋กœ๊ทธ์ธ

๋‹จ์ถ•ํ‚ค

๋‚ด ๋ธ”๋กœ๊ทธ

๋‚ด ๋ธ”๋กœ๊ทธ - ๊ด€๋ฆฌ์ž ํ™ˆ ์ „ํ™˜
Q
Q
์ƒˆ ๊ธ€ ์“ฐ๊ธฐ
W
W

๋ธ”๋กœ๊ทธ ๊ฒŒ์‹œ๊ธ€

๊ธ€ ์ˆ˜์ • (๊ถŒํ•œ ์žˆ๋Š” ๊ฒฝ์šฐ)
E
E
๋Œ“๊ธ€ ์˜์—ญ์œผ๋กœ ์ด๋™
C
C

๋ชจ๋“  ์˜์—ญ

์ด ํŽ˜์ด์ง€์˜ URL ๋ณต์‚ฌ
S
S
๋งจ ์œ„๋กœ ์ด๋™
T
T
ํ‹ฐ์Šคํ† ๋ฆฌ ํ™ˆ ์ด๋™
H
H
๋‹จ์ถ•ํ‚ค ์•ˆ๋‚ด
Shift + /
โ‡ง + /

* ๋‹จ์ถ•ํ‚ค๋Š” ํ•œ๊ธ€/์˜๋ฌธ ๋Œ€์†Œ๋ฌธ์ž๋กœ ์ด์šฉ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ํ‹ฐ์Šคํ† ๋ฆฌ ๊ธฐ๋ณธ ๋„๋ฉ”์ธ์—์„œ๋งŒ ๋™์ž‘ํ•ฉ๋‹ˆ๋‹ค.