第七章(2):深度学习在自然语言处理NLP中的应用


欢迎大家来到安静到无声的 《基于pytorch的自然语言处理入门与实践》,如果对所写内容感兴趣请看《基于pytorch的自然语言处理入门与实践》系列讲解 - 总目录,同时这也可以作为大家学习的参考。欢迎订阅,请多多支持!

1. 深度学习概述

深度学习是2006年提出的基于机器学习的概念,其框架在于通过模拟人脑的神经网络,在进行分析、学习、解释,属于一种含有多层、隐层的学习结构。其跟浅层学习不同,因为其所建立的模型结构足够的深,一般都有3层以上的隐层节点,最高可达10层以上,可以完成非常复杂的函数分析,详见表1。并且其强调了特征学习,因为深度学习属于无监督的一种,通过非监督预训练算法,将原始的样本通过输入的方式来映射到一个新的特征空间,从而更好的实现预测、分类等。此外,其有效性跟浅层学习相比也比较强,一些在浅层结构无法表达的函数,可能在深层结构中解释的更好,因此深度学习被广泛的应用在我国的各个行业中。

第七章(2):深度学习在自然语言处理NLP中的应用-LMLPHP

2. 自然语言处理概述

自然语言处理(英语:Natural Language Processing,缩写NLP)是人工智慧语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言处理包括多方面和步骤,基本有认知、理解、生成等部分。

自然语言认知和理解是让电脑把输入的语言变成有意思的符号和关系,然后根据目的再处理。自然语言生成系统则是把计算机数据转化为自然语言。

第七章(2):深度学习在自然语言处理NLP中的应用-LMLPHP

2015年Tomas Mikolov提出了Word2vec的算法,这是种新的构建词向量的方法,属于以深度学习为基础的自然语言处理技术的发端。该方法有两种模型,一种是Skip-gram模型,一种是CBOW模型,其中Skip-gram模型是通过输入某个单词来预测周围的上下文语境,而CBOW模型是通过输入某个词语上下文的语境来预测这个词语的本身,所产生的词向量就是神经网络模型的输入向量。由此可以看出,Word2ve已经具备了一定的理解能力,也具备了以往IT-IDF无法实现的一些功能,也意味着自然语言处理技术有了无需人工处理干预就可以直接解释和理解文本语境的能力。紧接着,我国掀起了研究自然语言处理算法的热潮,一些模拟word2vec词向量的计算模型也相继被提出,深度学习也被应用到其中,有了将词性和命名实体标签与word2vec融合的sense2vec的算法。

随着深度学习等技术的快速发展,尤其是GPT-3等超大模型的出现,NLP进入了一个新纪元。超大模型相对于大模型来说更加复杂,参数数量更高,需要更大的计算资源和训练时间,但同时也可以在处理极其复杂的输入数据和高维度的特征时提高模型的准确性和性能。在这个新纪元中,超大模型如GPT-3已经开始在各个领域产生了广泛的应用,比如文本摘要、对话系统、问答机器人、机器翻译等。NLP的新纪元已经带来了革命性的变化,将进一步推动人工智能技术的进步和应用。

3. 应用

自然语言处理在当今世界中已经被广为应用。

(1) 分词和词性标注。分词主要是根据规范来将连续的字序进行重新组合,并将其组合成新的词序列的过程。而词性标注就是正确的标注该词的词性,如该次属于形容词、动词、名词等。目前应用深度学习法可以同时处理词性标注、语义角色标注、语块切分、以及命名实体识别等典型的自然语言处理任务。

(2) 句法分析。就是对句子的语法、以及语法之间的关系进行分析。应用深度学习法可以自动、快速的识别句子的句法单位、以及句法单位之间的关系,具体的做法就是输入一个给定的句子,利用其语法特征来构建短语结构树以此来进行分析和处理。

(3) 词义学习。在应用深度学习在词义学习上,是应用了其无监督的学习机制。其通过构建深度的神经网络模型,在利用该模型综合的对文本的上下文、以及全局进行分析,以此来找出词义更好的表达方式,并且找出词义隐藏的词汇,来更好对同名歧义的词进行解释。而且如果是多个多义性的词向量还可以通过改进模型的方式,丰富词向量的语义,让其表达的更加的清晰。

(4) 情感分析。应用深度学习来对情感进行分析,就是通过构建情感分析模型,在利用深度神经网络的训练部分来对情感标签的句子进行标注,并结合全局的规律、以及上下文的特征,来预测标注外句子的情感特征,以此来实现文档级、语句级、以及观点级的情感色彩分析。这种分析属于自然语言处理任务中的高级情感分析,由此可以看出,深度学习应用在自然语言处理中可以有效的提高处理效果。
第七章(2):深度学习在自然语言处理NLP中的应用-LMLPHP

4. 总结

总之,深度学习在自然语言处理中的意义在于提供了一种更加有效和灵活的方法来处理自然语言,能够帮助我们更好地理解、分析和生成文本数据。它在多个NLP任务中取得了显著的成果,推动了自然语言处理领域的发展。

--------推荐专栏--------
🔥 手把手实现Image captioning
💯CNN模型压缩
💖模式识别与人工智能(程序与算法)
🔥FPGA—Verilog与Hls学习与实践
💯基于Pytorch的自然语言处理入门与实践

参考

[1]韩志恒.浅析深度学习在自然语言处理NLP中的应用[J].电子元器件与信息技术,2020,4(11):46-47.DOI:10.19772/j.cnki.2096-4455.2020.11.022.
[2]江洋洋,金伯,张宝昌.深度学习在自然语言处理领域的研究进展[J].计算机工程与应用,2021,57(22):1-14.
[3]黎新川,方艺,方涛等.深度学习在自然语言处理中的运用[J].电子技术,2022,51(12):206-207.
第三章(1):自然语言处理概述:应用、历史和未来

07-14 09:13