推荐专题：

600字范文 > 文本相似度-词袋模型

文本相似度-词袋模型

时间：2023-09-07 08:35:58

相关推荐

文本相似度-词袋模型

1、词袋模型

将两篇文本通过词袋模型变为向量模型，通过计算向量的余弦距离来计算两个文本间的相似度。

词袋模型的缺点：

词袋模型最重要的是构造词表，然后通过文本为词表中的词赋值，但词袋模型严重缺乏相似词之间的表达。

比如“我喜欢北京”“我不喜欢北京”其实这两个文本是严重不相似的。但词袋模型会判为高度相似。

“我喜欢北京”与“我爱北京”其实表达的意思是非常非常的接近的，但词袋模型不能表示“喜欢”和“爱”之间严重的相似关系。（当然词袋模型也能给这两句话很高的相似度，但是注意我想表达的含义）

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

根据词袋模型使用Python实现一个简单的分析句子对相似度的软件

2021-11-07

文本相似度——自己实现文本相似度算法（余弦定理）

2018-09-12

短文本相似度计算_短文本相似度比较_短文本相似度查询_自然语言处理_百度

2022-07-11

mysql 短文本相似度_短文本相似度比较

2020-04-23

扩展阅读

: 一文讲述常见的文本相似度计算方法

: 一文讲述常见的文本相似度计算方法

: 自然语言处理之文本相似度计算

: 自然语言处理之文本相似度计算

: “千言数据集：文本相似度”权威评测网易易智荣登榜首

: 机器不学习：基于深度学习CNN的短文本相似度计算方案

最近发布

1. 爱的传递：与爱共舞的珍贵时刻（600字） 2. 爱的传递：温暖心灵的力量（600字）

2024-07-15

鱼的幸福：水中生活的快乐与平静

2024-07-15

传统与美食：元宵节600字作文精选

2024-07-15

1. 转身的力量：我的中考作文600字 2. 转身的决定：中考作文600字 3. 一次转身的经

2024-07-15

宠爱的小天使：我的弟弟

2024-07-15

平凡世界：一份600字的读后感

2024-07-15

推荐专题

铭记快乐作文600字清明节的一天作文600字以跌倒为话题的作文600字观朗读者有感600字我的一天初一作文600字高中作文600字记叙文初一军训心得600字朋友请听我说作文600字心灵深处的爱作文600字陪伴记叙文600字感悟人生作文600字陪伴为题的作文600字写海的作文600字这件事令我难忘600字走过那个拐角作文600字