当前位置: 首页 > news >正文

深度学习100问3-什么是共现矩阵及其作用


 一、看词和词的关系
共现矩阵就像一个表格,能让我们清楚地看到不同的词在一些文本里出现的关联情况。要是两个词经常一起出现,那在这个矩阵里对应的地方数字就会比较大,说明这两个词关系很紧密。比如在科技文章里,“人工智能”和“机器学习”可能老一起出现,那就说明它们在这个领域关系近。
 
二、帮着做词向量
在做词向量的时候,共现矩阵可是重要的基础呢。用一些方法处理共现矩阵,比如奇异值分解,就能把词变成高维空间里的向量。这些向量能抓住词和词之间的语义关系,后面做文本分类、找信息啥的任务就更方便了。比如说,意思差不多的词在向量空间里就会离得近,这样我们就能更好地理解和处理文本啦。
 
三、做文本分类和聚类
做文本分类的时候,共现矩阵能提供词的特征信息。看看不同类别的文本里词的共现情况,就能找到对分类有用的特点。比如体育新闻和财经新闻里,不同的词组合有不同的共现模式,用这些模式就能训练分类器,把新的文本分到合适的类别里。在文本聚类的时候,共现矩阵也能帮忙看文本之间像不像,把像的文本聚到一起。
 
四、找信息和推荐东西
在找信息的时候,共现矩阵能扩大查询词的范围。用户输入一个查询词,系统可以根据共现矩阵找到和它相关的其他词,这样找相关的文档就更准了。比如用户查“手机”,系统就能根据共现矩阵找到“智能手机”“品牌”“功能”这些经常和“手机”一起出现的词,然后找包含这些词的文档。在推荐系统里呢,共现矩阵可以根据用户看过或买过的东西对应的词,找到和它们经常一起出现的其他东西的词,给用户推荐相关的产品或内容。


http://www.mrgr.cn/news/8338.html

相关文章:

  • 后端Web之登录校验(上篇)
  • 【机器学习】数据预处理、特征缩放以及有偏分布的基本概念
  • 【HTML】为网页添加列表和超链接
  • nvm 安装老的node,npm版本
  • OSPF路由配置--多区域
  • 【c++】用if-else语句模拟法律中对于“防卫行为”
  • 拓扑排序,以及区间dp相关试题
  • EasyExcel动态实现表头以及数据封装
  • 前端——盒子模型
  • 信创海光x86服务器,定义、特点及应用详解
  • Flink内存调优
  • 【python】OpenCV—Single Human Pose Estimation
  • 数据结构总结
  • Spring的bean的生命周期
  • macOS安装搭建python环境
  • 自然语言处理系列四十二》新词发现与短语提取》新词发现》代码实战
  • redis 过期监听:高效管理数据生命周期
  • ffmpeg6.1集成ffmpeg-gl-transition滤镜
  • 在.NET开发中使用 Excel 的最佳方式之一:MiniExcel
  • leetcode53:最大子数组和