Skip to content

Commit aa00fca

Browse files
committed
NLP中文文本相似性计算,余弦相似度计算分析示例
1 parent e49b840 commit aa00fca

1 file changed

Lines changed: 7 additions & 3 deletions

File tree

_posts/2022/2022-06/2022-06-27-NLP-中文分词-文本相似度-余弦相似度.md

Lines changed: 7 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -14,17 +14,21 @@ author: Franklinfang
1414
余弦相似度 (Cosine Similarity) 通过计算两个向量的夹角余弦值来评估他们的相似度。将向量根据坐标值,绘制到向量空间中,求得他们的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表征这两个向量的相似性。夹角越小,余弦值越接近于1,它们的方向越吻合,则越相似。
1515

1616
- 余弦定理
17-
<img src="20267488-8c050a854764cb75.jpg">
17+
18+
![image](/_posts/2022/2022-06/20267488-8c050a854764cb75.jpg)
1819

1920
以二维空间为例,上图的a和b是两个向量,我们要计算它们的夹角θ。余弦定理告诉我们,可以用下面的公式求得:
2021

2122
- 三角形的余弦公式
22-
<img src="20267488-9f823d91cf6090ad.jpg">
23+
24+
![image](/_posts/2022/2022-06/20267488-9f823d91cf6090ad.jpg)
2325

2426
余弦的这种计算方法对n维向量也成立。假定A和B是两个n维向量,A是 [A1, A2, …, An] ,B是 [B1, B2, …, Bn] ,则A与B的夹角θ的余弦等于:
2527

2628
- N维向量的余弦定理
27-
<img src="20267488-ef9a62890a92b969.jpg">
29+
30+
![image](/_posts/2022/2022-06/20267488-ef9a62890a92b969.jpg)
31+
2832

2933
# 余弦相似度算法
3034

0 commit comments

Comments
 (0)