[K-Data x λ¬λμ€νΌμ¦] 2-3. μ μ¬λ κ°λ μ΄ν΄νκΈ°
μ λ² ν¬μ€ν μ κ²μν CF(νμ νν°λ§) λ°©λ²μ 보면
[K-Data x λ¬λμ€νΌμ¦] 2-2. νμ νν°λ§(CF)μ μ리
μ λ² ν¬μ€ν μμλ 컨ν μΈ κΈ°λ° μΆμ²μΈ CB(Content-based Recommendation)μ λν΄ κ³΅λΆν΄λ΄€λλ°μ! μ΄λ²μλ λ§μ΄ μ°μ΄λ νμ νν°λ§(CF)μ λν΄ μ μ΄λ³΄λ €κ³ ν©λλ€!! # νμ νν°λ§? : CF(Collaborative Filterin..
xod22.tistory.com
μ μ¬λ κ³μ°μ΄ νμμ μΈλ°μ!
μ€λμ μ μ¬λ κ³μ°μ νλ μ¬λ¬κ°μ§ λ°©λ²μ λν΄ μμΈνκ² μ μ΄λ³΄λ €κ³ ν©λλ€!
κ·ΈλΌ μμ!

# 1) Cosine Similarity
: λ 벑ν°μ κ°λλ₯Ό μ΄μ©νμ¬ κ΅¬ν μ μλ μ μ¬λ.
μ§κ΄μ μΌλ‘ λ 벑ν°κ° κ°λ¦¬ν€λ λ°©ν₯μ΄ μΌλ§λ μ μ¬νμ§λ₯Ό μλ―Ένλ€.
μΌλ°μ μΌλ‘ κ³μ°μ μν΄μλ(λ΄μ ) λ 벑ν°μ μ°¨μμ κ°μμΌνλ€.
[1,2,3] μ΄λ κ² 3μ°¨μ 벑ν°λΌλ©΄ μλ λ²‘ν° μμ [2,4,6] μ΄λ°μμΌλ‘..!
# 2) MSD Similarity (Mean Squared Difference Similarity)
: μΆμ² μμ€ν μμλ§ μ°μ΄λ μ μ¬λ!
=> κ° κΈ°μ€(μ μ , μμ΄ν )μ λν μ μμ μ°¨μ΄λ₯Ό κ³μ°νλ€
=> μ μ¬λλ μ ν΄λ¦¬λ 거리μ λ°λΉλ‘..! / λΆλͺ¨μ 1μ λνλ μ΄μ λ λΆλͺ¨κ° 0μ΄λλ κ²μ λ°©μ§νκΈ° μν μΌμ’ μ smoothing
# 3) Jaccard Similarity
: μ§ν©μ κ°λ μ μ¬μ©ν μ μ¬λλ‘ μ μ°μ΄μ§ μμ!
μ½μ¬μΈ μ μ¬λ/νΌμ΄μ¨ μ μ¬λμ λ¬λ¦¬ κΈΈμ΄κ° λ¬λΌλ μ΄λ‘ μ μΌλ‘ μ μ¬λλ₯Ό ꡬν μ μμ!
λ μ§ν©μ΄ μΌλ§λ μ μ¬ν μμ΄ν μ 곡μ νκ³ μλκ°λ₯Ό λνλ
μ§ν©A : [1,2,3]
μ§ν©B : [3,2,1] => {1,2,3}
# 4) Pearson Similarity (Pearson Correlation)
: κ° λ²‘ν°λ₯Ό νλ³Έ νκ· μΌλ‘ μ κ·νν λ€μ μ½μ¬μΈ μ μ¬λλ₯Ό ꡬν κ°
1μ κ°κΉμ°λ©΄ μμ μκ΄κ΄κ³, 0μΌ κ²½μ° μλ‘ λ 립, -1μ κ°κΉμΈμλ‘ μμ μκ΄κ΄κ³λ₯Ό λνλ
User-basedμμ νΌμ΄μ¨ μ μ¬λλ₯Ό μ¬μ©νλ©΄ μ±λ₯μ΄ λλ€λκ²
νμ μ μ§κ²μ£Όκ±°λ ννκ² μ£Όκ±°λλ₯Ό κ³ λ €ν΄μ μ μ¬λλ₯Ό κ³μ°ν΄μ£ΌκΈ° λλ¬Έμ΄ μλκΉ..(?) λΌλ μκ°μ΄ λ λ€..!
μ΄λ κ² 4κ°μ§ λ°©λ²μ μ μ¬λ κ³μ°μ μ 리ν΄λ³΄μλλ°μ!
CFμμ User-based λ°©λ²μμλ νΌμ΄μ¨ μ μ¬λλ₯Ό μ¬μ©ν λ μ±λ₯μ΄ λκ³
Item-basedλ°©λ²μμλ μ½μ¬μΈ μ μ¬λλ₯Ό μ¬μ©ν λ μ±λ₯μ΄ λλ€λ μ¬μ€μ λ€μνλ² κΈ°μ΅ν΄λ³΄λ©΄μ μ 리νλ©΄ μ’μ κ² κ°μ΅λλ€!
κ·ΈλΌ λ~~!
