勵志

勵志人生知識庫

cosine相似度

餘弦相似度是一種用於評估兩個向量相似性的度量方式,它通過計算兩個向量間夾角的餘弦值來實現。這種相似度度量方法在n維空間中定義,其值範圍是[-1,1]。當餘弦相似度的值為1時,表示兩個向量完全相似;當值為-1時,表示兩個向量完全不相似。餘弦相似度不僅關注兩個向量在方向上的差異,而且對向量的長度或絕對數值不敏感,這使得它在處理用戶興趣相似度或差異時特別有用,尤其是在用戶評分或內容推薦系統中。餘弦相似度的計算公式為:

Similarity(A,B) = (A·B) / (||A|| × ||B||)

其中,`A·B` 是向量A和B的點積,`||A||` 和 `||B||` 分別是向量A和B的歐幾里得範數。點積的計算公式為:

∑ (A_i × B_i)

而範數的計算公式為:

√(∑ A_i^2)

餘弦相似度與歐幾里得距離不同,後者是基於空間中各點間的絕對距離來衡量相似性。相比之下,餘弦相似度更注重方向上的差異,而不是位置或長度上的差異。