带你了解NLP的词嵌入

2023年4月10日下午11:55 • 深度学习

yizhihongxing

摘要：今天带领大家学习自然语言处理中的词嵌入的内容。

本文分享自华为云社区《【MindSpore易点通】深度学习系列-词嵌入》，作者：Skytier。

1 特征表示

在自然语言处理中，有一个很关键的概念是词嵌入，这是语言表示的一种方式，可以让算法自动的理解一些同类别的词，比如苹果、橘子，比如袜子、手套。

带你了解NLP的词嵌入

one-hot向量

比如我们通常会说：“I want a glass of orange juice.”但如果算法并不知道apple和orange的类似性（这两个one-hot向量的内积是0），那么当其遇到“I want a glass of apple __”时，并不知道这里也应该填写 juice。

如果用特征化的表示来表示库里的每个词，学习它们的特征或者数值。

带你了解NLP的词嵌入

这样我们就可以选用t-SNE算法来对特征向量可视化，通过观察这种词嵌入的表示方法，最终同类别的单词会聚集在一块，词嵌入算法对于相近的概念，学到的特征也比较类似。

2 词嵌入的使用

参考案例——句中找人名：Jack Li is a teacher.

使用词嵌入作为输入训练好的模型，如果看到一个新的输入：“Jack Li is a farmer.”因为知道teacher和farmer很相近，那么算法很容易就知道Jack Li是一个人的名字。同时，如果遇到不太常见的单词，比如：Jack Li is a cultivator.（假设训练集里没有cultivator这个单词），但是词嵌入的算法通过考察大量的无标签文本，会发现farmer、teacher、cultivator相近，把它们都聚集在一块。这样一来即使只有一个很小的训练集，但是使用迁移学习，把从大量的无标签文本中学习到的知识迁移到一个任务中——比如少量标记的训练数据集的命名实体识别任务。

如何用词嵌入做迁移学习的步骤：

1.先从大量的文本集中学习词嵌入。

2.用这些词嵌入模型把它迁移到新的只有少量标注训练集的任务中，比如说用300维的词嵌入来表示单词，这样就可以用更低维度的特征向量代替原来的10000维的one-hot向量。

3.当在新的任务上训练模型时，只有少量的标记数据集，可以选择不进行微调，而是用新的数据调整词嵌入。

当你的任务的训练集相对较小时，词嵌入的作用最明显，所以它广泛用于NLP领域，但是其对于一些语言模型和机器翻译并不适用。

3 类比推理

词嵌入有一个非常强大的特性就是可以帮助实现类比推理。比如从性别这个特征上来说，如果man应该对应woman，那么算法可以推导出king对应queen。

最常用的相似度函数是余弦相似度，假如在向量u和v之间定义相似度:

带你了解NLP的词嵌入

如果u和v非常相似，那么它们的内积将会很大，那么该式就是u和v的夹角Φ的余弦值，实际就是计算两向量夹角Φ角的余弦。夹角为0度时，余弦相似度就是1，当夹角是90度角时余弦相似度就是0，当夹角是180度时相似度等于-1，因此角度越小，两个向量越相似。

点击关注，第一时间了解华为云新鲜技术~

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：带你了解NLP的词嵌入 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

从头训练一个神经网络！教它学会莫奈风格作画！⛵

上一篇 2023年4月10日

TCN代码详解-Torch (误导纠正)

下一篇 2023年4月10日

深度学习中卷积层和pooling层的输出计算公式(转)

原文链接：https://blog.csdn.net/yepeng_xinxian/article/details/82380707 1.卷积层的输出计算公式class torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups…

深度学习 2023年4月13日
000
深度学习推荐阅读的论文

Papers to Read General Introduction LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521(7553), 436-444.nature14539.pdf [This is a general introduction by thr…

深度学习 2023年4月10日
000
《C语言深度解剖》学习笔记之符号

第2章符号 1.注释符号　　编译器会将注释剔除，用空格代替原来的注释　　y=x /* p; 编译器提示出错的原因：实际上，编译器会把“/*”当作一段注释的开始，直到出现“*/”为止。【规则 2-1】注释应当准确，易懂，防止二义性【规则 2-2】注释是对代码的提示，而不是文档【规则 2-3】边写代码边写注释【规则 2-4】一目了然的语句不加注释 …

深度学习 2023年4月11日
000
7月7日云栖精选夜读：专访 | 杨强教授谈CCAI、深度学习泡沫与人工智能入门

摘要：中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办，CSDN、中国科学院自动化研究所承办，云栖社区作为独家直播合作伙伴的第三届中国人工智能大会（CCAI 2017）将在杭州国际会议中心盛大开幕。中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办，CSDN、中国科学院自动化研究所承办，云栖社区作为独家直播合作伙伴的第三届中国人工智能大会（…

深度学习 2023年4月11日
000
什么是深度学习？它能解决什么问题？

深度学习是什么？深度学习既指深度神经网络，也指机器学习的其他分支，如深度强化学习。一般来说，它通常指的是深度神经网络。神经网络是一组算法，大致模仿人脑，旨在识别模式。他们通过一种机器感知，标记或聚类原始的输入来解释感官数据。它们识别的模式是数字的，包含在矢量中。所有现实世界的数据，无论是图像、声音、文本还是时间序列，都必须转换成矢量。神经网络可以帮助我…

2022年11月10日 • 深度学习
100
《神经网络和深度学习》系列文章十四：四个基本方程的证明

出处： Michael Nielsen的《Neural Network and Deep Learning》，点击末尾“阅读原文”即可查看英文原文。本节译者：哈工大SCIR本科生王宇轩声明：如需转载请联系wechat_editors@ir.hit.edu.cn，未经授权不得转载。使用神经网络识别手写数字反向传播算法是如何工作的热身：一个基于矩阵的…

深度学习 2023年4月12日
000
深度学习环境配置: 英伟达RTX2060 + CUDA 10.0 + cuDNN 7.5.0

前言拿到了新本本,就迫不及待想要开始配置好torch的深度学习环境了. 本本是MECHREVO深海系列的Z2-R, CPU i7-9750, 独立显卡英伟达RTX-2060 (性价比还算不错, 再加上本身的轻薄游戏本特性, 对我这种天天码代码偶尔打dota2的太合适了). 这篇博客主要记录CUDA 10.0 + cuDNN 7.5.0的安装配置流程. 资源…

深度学习 2023年4月10日
000
深度学习面试题19：1*1卷积核的作用

　　举例　　在Inception module上的应用　　参考资料可以减少计算量，可以增加非线性判别能力举例假设有1个高为30、宽为40，深度为200的三维张量与55个高为5、宽为5、深度为200的卷积核same卷积，步长=1，则结果是高为30、宽为40、深度为55的三维张量，如图所示：该卷积过程的乘法计算量大约为5*5*200*30*40*55…

深度学习 2023年4月12日
000

合作推广

合作推广

返回顶部