🏁 λ¨Έμ‹ λŸ¬λ‹ | λ”₯λŸ¬λ‹/μΆ”μ²œμ‹œμŠ€ν…œ

[K-Data x λŸ¬λ‹μŠ€ν‘Όμ¦ˆ] 3-2. Latent Factor Modelκ³Ό SVD

xod22 2022. 1. 21. 23:39
728x90

# Latent Factor Model?

κ°„λ‹¨ν•˜κ²Œ λ§ν•˜λ©΄ μž„λ² λ”©μ„ ν•œλ‹€λŠ” 뜻!

λ‹€μ–‘ν•˜κ³  λ³΅μž‘ν•œ μœ μ €μ™€ μ•„μ΄ν…œμ˜ νŠΉμ„±μ„ λͺ‡κ°œμ˜ λ²‘ν„°λ‘œ compact(μž‘κ²Œ?) ν‘œν˜„

-> μœ μ €μ™€ μ•„μ΄ν…œμ„ 같은 차원 λ²‘ν„°λ‘œ ν‘œν˜„ν•˜μ—¬ λ‚˜νƒ€λƒ„

-> 같은 벑터 κ³΅κ°„μ—μ„œ μœ μ €μ™€ μ•„μ΄ν…œμ˜ μœ μ‚¬ν•œ 정도λ₯Ό 눈으둜 확인할 수 있음

μ˜ˆμ‹œ)

μœ μ €μ™€ μ•„μ΄ν…œμ„ 같은 벑터곡간에 투영


# 전톡적 SVDλž€?

Matrix Factorization의 μ½”μ–΄ 아이디어가 됨!

전톡적 SVD

Rating Matrix R에 λŒ€ν•΄μ„œ 

1) μœ μ € 잠재 μš”μΈ ν–‰λ ¬

2) 잠재 μš”μΈ λŒ€κ°ν–‰λ ¬

3) μ•„μ΄ν…œ 잠재 μš”μΈ ν–‰λ ¬

μ΄λ ‡κ²Œ μ„Έκ°€μ§€μ˜ ν–‰λ ¬λ‘œ λΆ„ν•΄ν•˜λŠ” 것이닀.

 

=> 이것은 κ·Έλƒ₯ μ„ ν˜•λŒ€μˆ˜ν•™μ—μ„œμ˜ κ°œλ…μœΌλ‘œ

 

μœ μ €μ™€ μ•„μ΄ν…œμ„ μ •ν•΄μ§„ μ°¨μ›μœΌλ‘œ μž„λ² λ”©ν•˜κ³ μ‹Άλ‹€λ©΄?

# Truncated SVD?

λŒ€ν‘œκ°’μœΌλ‘œ μ‚¬μš©λ  k개의 νŠΉμ΄κ°’λ§Œ μ‚¬μš©ν•œλ‹€.

특이치의 Top n개λ₯Ό λ½‘μŒ!

Rκ³Ό μ΅œλŒ€ν•œ λΉ„μŠ·ν•œ R^을 ꡬ함..정보손싀을 μ€„μ΄λ©΄μ„œ~_~


* 전톡적 SVD의 문제점

- μ‹€μ œ λ°μ΄ν„°λŠ” λŒ€λΆ€λΆ„ Sparse Matrix인데 SVDλŠ” 값이 κ½‰μ°¨μžˆμ–΄μ•Ό 계산 κ°€λŠ₯함.

- λ”°λΌμ„œ 결츑된 값을 μ±„μ›Œμ„œ Dense Matrix(κ½‰μ°¨μžˆμŒ)을 λ§Œλ“€μ–΄ SVDλ₯Ό μˆ˜ν–‰ν•˜λŠ”λ°

이 방법은 λ°μ΄ν„°μ˜ 양을 μƒλ‹Ήνžˆ μ¦κ°€μ‹œμΌœ 계산 λΉ„μš©μ΄ λ†’μ•„μ§„λ‹€.

- μ •ν™•ν•˜μ§€ μ•Šμ€ Imputation(데이터 μ±„μš°κΈ°)λŠ” 데이터λ₯Ό μ™œκ³‘μ‹œν‚€κ³  예츑 μ„±λŠ₯을 λ–¨μ–΄νŠΈλ¦°λ‹€.

 

=> λ”°λΌμ„œ SVD의 기본적인 원리λ₯Ό μ΄μš©ν•˜λ˜, MF(Matrix Factorization)λ₯Ό ν•™μŠ΅ν•˜κΈ° μœ„ν•œ 근사적인 방법이 ν•„μš”ν•˜λ‹€!

 


# μ‹€μ œ SVD와 Matrix Factorization

μ΄λŸ°μ‹μœΌλ‘œ SVDλ₯Ό 톡해 λΆ„ν•΄λœ 행렬은 κ²°κ΅­ μœ μ €λ§€νŠΈλ¦­μŠ€μ™€ μ•„μ΄ν…œ 맀트릭슀의 곱이 됨..!

ꡳ이 λ°μ΄ν„°μ˜ λΉˆκ³΅κ°„μ„ μ±„μ›Œλ„£μ§€ μ•Šμ•„λ„ μ‚¬μš©ν•  수 μžˆλŠ” 방법이됨!

=> λΉ„μ–΄μžˆλŠ” ν–‰λ ¬ R을 예츑

 

# μ΅œμ’… Matrix Factorization μ •μ˜

Rating Matrixλ₯Ό P와 Q둜 λΆ„ν•΄

P-> U*k

Q-> I*k

MatrixFactorization의 결과둜 λ‚˜μ˜¨ μ˜ˆμΈ‘κ°’μ„ μΆ”μ²œμ— ν™œμš©ν•œλ‹€!

μ΅œλŒ€ν•œ μ‹€μ œμ™€ λΉ„μŠ·ν•˜λ„λ‘(?)

 


μ˜€λŠ˜μ€ SVD 원리λ₯Ό μ΄μš©ν•œ Matrix Factorization의 λ‚΄μš©μ— λŒ€ν•˜μ—¬ ν¬μŠ€νŒ… ν•΄λ³΄μ•˜μŠ΅λ‹ˆλ‹€!

λ‚΄μš©μ΄..μˆ˜ν•™μ  원리가 λ“€μ–΄κ°€λ‹€λ³΄λ‹ˆκΉŒ λ‘λ²ˆλ“€μ–΄λ„ 이해가 μ–΄λ ΅λ”λΌκ΅¬μš”.!

 

계속 반볡적으둜 λ³΄λ©΄μ„œ 이해λ₯Ό 해보렀고 ν•©λ‹ˆλ‹€.

 

그럼 μ˜€λŠ˜μ€ 끗~!~!

728x90