本手、妙手、俗手?我用AI写2022高考全国作文题,会被看出来?-LMLPHP


1 自然语言处理(NLP)

计算机中的数据分为两大类:

  • 结构化数据:指可以按某种数据结构组织的数据,比如字母、数字、货币、日期
  • 非结构化数据:指没有按照预定义的方式组织或缺少特定数据模型的数据,比如文章、演示文稿、电子邮件、日志等

结构化数据易于处理,传统计算机可以代替人工高速处理这类结构化数据。然而实际上大多数数据都是非结构化的,而且非结构化数据比结构化数据具有更大的信息量。在人工智能出现后,对非结构化数据的处理进行了探索,并取得了一定成效。

自然语言处理(Natural Language Processing, NLP)就是一种通过分析非结构化人类语言,理解文本信息并加以利用的人工智能技术,是研究在人与人交互中以及在人与计算机交互中的语言问题的一门学科。

本手、妙手、俗手?我用AI写2022高考全国作文题,会被看出来?-LMLPHP
简单介绍一下NLP的发展历程:

2 NLP的核心问题

NLP作为人工智能领域的前沿学科和热点问题,包含众多挑战

  • 多样性
    自然语言组合方式非常灵活,不同的组合可以表达多种含义
  • 歧义性
    如果不联系上下文,缺少环境的约束,语言有很大的歧义性
  • 鲁棒性
    自然语言在输入的过程中,尤其是通过语音识别获得的文本,会存在多字、少字、错字、噪音等问题
  • 知识依赖
    语言是对世界的符号化描述,语言天然连接着世界知识,如何引入这些先验信息?

自然语言处理有两大核心任务自然语言理解(NLU)以及自然语言生成(NLG)。自然语言理解也称为计算语言学,常用于机器翻译、机器客服、智能音箱等;自然语言生成则常用于自动写作、聊天机器人、商场迎宾机器人等。

NLP目前的主要研究方向包括

  • 信息抽取:从给定文本中抽取重要的信息,比如时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等
  • 文本生成:机器像人一样使用自然语言进行表达和写作
  • 问答系统:对一个自然语言表达的问题,通过查询与语义分析,给出一个精准的答案
  • 对话系统:通过一系列的对话,理解用户意图,与用户进行沟通
  • 文本挖掘:包括文本聚类、分类、情感分析等
  • 语音识别和生成
  • 信息过滤:通过计算机系统自动识别和过滤符合特定条件的文档信息,主要用于信息安全和防护,网络内容管理等
  • 舆情分析:是指收集和处理海量信息,自动化地对网络舆情进行分析,以实现及时应对网络舆情的目的
  • 信息检索:对大规模文档进行索引
  • 机器翻译:把输入的源语言文本通过自动翻译获得另外一种语言的文本

3 用AI写高考作文

用AI写作是NLP文本生成的经典应用实例,这方面有很多开源算法,本文采用https://github.com/EssayKillerBrain/EssayKiller_V2的算法进行写作,大家有兴趣可以自己去试试。

这里选择了【2022年全国乙卷】和【2022年新高考全国I卷】作文题进行实验,看看AI写作的效果。由于AI每次作文的内容和质量都不同,所以下面选择了效果比较好的文章。

本手、妙手、俗手?我用AI写2022高考全国作文题,会被看出来?-LMLPHP
现在AI对主题的提炼还有待改善,所以我们需要自己概括文章主题送入文章生成器。本手、妙手、俗手这个作文题的主题我概括了若干个,发现都不如网上这篇《苦练本手,方能妙手随成》写得好,所以我就放了网上这篇。大家感兴趣可以自己试试,看看能不能写得更好。

本手、妙手、俗手?我用AI写2022高考全国作文题,会被看出来?-LMLPHP


🔥 更多精彩专栏

🏠 目前开放人工智能成长社群,想和更多志同道合的朋友交流请私信

06-13 11:53