Skip to content

Commit e49b840

Browse files
committed
NLP中文文本相似性计算,余弦相似度计算分析示例
1 parent 129b4ed commit e49b840

1 file changed

Lines changed: 3 additions & 7 deletions

File tree

_posts/2022/2022-06/2022-06-27-NLP-中文分词-文本相似度-余弦相似度.md

Lines changed: 3 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -14,21 +14,17 @@ author: Franklinfang
1414
余弦相似度 (Cosine Similarity) 通过计算两个向量的夹角余弦值来评估他们的相似度。将向量根据坐标值,绘制到向量空间中,求得他们的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表征这两个向量的相似性。夹角越小,余弦值越接近于1,它们的方向越吻合,则越相似。
1515

1616
- 余弦定理
17-
18-
![image](20267488-8c050a854764cb75.jpg)
17+
<img src="20267488-8c050a854764cb75.jpg">
1918

2019
以二维空间为例,上图的a和b是两个向量,我们要计算它们的夹角θ。余弦定理告诉我们,可以用下面的公式求得:
2120

2221
- 三角形的余弦公式
23-
24-
![image](20267488-9f823d91cf6090ad.jpg)
22+
<img src="20267488-9f823d91cf6090ad.jpg">
2523

2624
余弦的这种计算方法对n维向量也成立。假定A和B是两个n维向量,A是 [A1, A2, …, An] ,B是 [B1, B2, …, Bn] ,则A与B的夹角θ的余弦等于:
2725

2826
- N维向量的余弦定理
29-
30-
![image](20267488-ef9a62890a92b969.jpg)
31-
27+
<img src="20267488-ef9a62890a92b969.jpg">
3228

3329
# 余弦相似度算法
3430

0 commit comments

Comments
 (0)