博客
关于我
NLP中的迁移学习教程来啦!(238页PPT下载)
阅读量:566 次
发布时间:2019-03-09

本文共 2045 字,大约阅读时间需要 6 分钟。

 

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。

 

 

 

来源 | 新智元(AI_era)

 

近日,在美国明尼苏达州明尼阿波利斯的 NAACL2019 上, Sebastian Ruder, Matthew Peters, Swabha Swayamdipta 和 Thomas Wolf 分享了一个长达 238 页 PPT 关于“NLP中的迁移学习”的教程,今天拿来和大家分享。

 

经典的监督机器学习范式是基于对使用单个数据集的任务的单个预测模型的孤立学习。这种方法需要大量的训练示例,并且对于定义明确、范围狭窄的任务效果最好。迁移学习指的是一组方法,这些方法通过利用来自其他域或任务的数据来训练具有更好泛化特性的模型来扩展此方法。

 

近两年来,自然语言处理(NLP)领域出现了几种转移学习方法和体系结构,这些方法和体系结构大大提高了 NLP 任务的先进性。

 

这些改进,加上这些方法的广泛可用性和易集成性,使人们想起了导致计算机视觉中预训练字嵌入和 ImageNet 预训练成功的因素,并表明这些方法很可能成为 NLP 中的一种常用工具以及一个重要的研究方向。

 

我们将概述 NLP 中的现代迁移学习方法,如何对模型进行预培训,它们所学习的表示捕获哪些信息,并回顾有关如何在下游 NLP 任务中集成和适应这些模型的示例和案例研究。

 

01

什么是迁移学习?

 

 

 

(a)传统机器学习的学习过程:

任务1:学习系统

任务2:学习系统

任务3:学习系统

 

(b)迁移学习的学习过程:

源任务:知识

目标任务:学习系统

 

02

为什么是NLP迁移学习?

 

 

 

1. 许多 NLP 任务都有共同的语言知识(例如语言表示、结构相似性)

2. 任务可以互相通知,例如语法和语义

3. 注释数据很少,尽可能多地利用监督

4. 从经验上讲,迁移学习已经在 SOTA 形成了许多被监督的 NLP 任务(例如分类、信息提取、问答等)

 

 

为什么是NLP迁移学习?(凭经验)

 

在命名实体识别(NER)CONLL-2003(英语)上随着时间推移的表现。

 

 

NLP 中迁移学习的类型

 

03

本教程到底讲什么?

 

 

本教程讲的是什么,不讲的是什么:

 

1. 目标:提供 NLP 中迁移方法的广泛概述,重点介绍截至目前( 2019 年年中)最成功的经验方法

2. 提供实用的、实际操作的建议→在教程结束时,每个人都有能力将最新进展应用到文本分类任务中

3. 不讲的是什么:全面的(不可能在一个教程中涵盖所有相关的论文!)

4. (Bender Rule: 本教程主要是针对用英语完成的工作,其他语言的可扩展性取决于监督是否可用)

 

 

框架:

1、介绍

2、预训练

3、代表中有什么?

4、适应

5、下游

6、开放问题

 

 

顺序迁移学习

 

了解一个任务/数据集,然后迁移到另一个任务/数据集

 

预训练:

word2vec

GloVe

skip-thought

InferSent

ELMo

ULMFiT

GPT

BERT

 

适应:

分类

序列标记

问答

 

04

预培训任务和数据集

 

 

未标记数据和自我监督:

 

1. 易于收集的大型语料库:维基百科、新闻、网络爬虫、社交媒体等

2. 训练利用了分布假设:“你应该知道它所保存的一个词”(Firth,1957),通常形式化为训练某种语言模型的变体

3. 注重高效算法利用丰富的数据

 

监督预培训:

 

1. 在视觉上非常常见,由于缺乏大的监控数据集,在NLP中较少见

2. 机器翻译

3. 句子表达的 NLI 

4. 从一个问答数据集到另一个问答数据集的任务特定传输

 

05

目标任务和数据集

 

 

 

目标任务通常是受监控的,跨越一系列常见的NLP任务:

 

1. 句子或文档分类(如情感)

2. 句子对分类(如NLI、释义)

3. 字级(例如序列标记、提取性问答)

4. 结构化预测(如解析)

5. 生成(例如对话、总结)

 

 

具体示例——词向量

 

单词嵌入方法(例如word2vec)每个单词学习一个向量

 

06

主题:从单词到语境中的单词

 

 

主题:从单词到语境中的单词

 

词向量      句子/doc向量      语境中词向量

 

 

主题:LM预训练

 

1. 许多成功的预培训方法都是基于语言建模的

2. 非正式地,LM学习p(文本)或p(文本/其他文本)

3. 不需要人工注释

4. 许多语言有足够的文本来学习大容量模型

5. 多才多艺,能学习句子和词的表达,具有多种客观功能

 

 

主题:由浅入深

 

1层     24层

 

 

主题:预培训与目标任务

 

预培训和目标任务的选择是耦合的

1. 句子/文档表示法对单词级预测无效

2. 词向量可以跨上下文汇集,但通常比其他方法更好

3. 在语境词向量中,双向语境很重要

 

一般来说:

1. 类似的预培训和目标任务→最佳结果

 

《Transfer Learning in Natural Language Processing》PPT文件,可在公号“数智物语”后台回复“NLP中的迁移学习”查看详情。

 

 

数智物语征稿启事0613.png

 

星标我,每天多一点智慧

 

转载地址:http://osqpz.baihongyu.com/

你可能感兴趣的文章
NIFI1.21.0最新版本安装_配置使用HTTP登录_默认是用HTTPS登录的_Https登录需要输入用户名密码_HTTP不需要---大数据之Nifi工作笔记0051
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增删改数据分发及删除数据实时同步_通过分页解决变更记录过大问题_02----大数据之Nifi工作笔记0054
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增加修改实时同步_使用JsonPath及自定义Python脚本_03---大数据之Nifi工作笔记0055
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_插入修改删除增量数据实时同步_通过分页解决变更记录过大问题_01----大数据之Nifi工作笔记0053
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表或全表增量同步_实现指定整库同步_或指定数据表同步配置_04---大数据之Nifi工作笔记0056
查看>>
NIFI1.23.2_最新版_性能优化通用_技巧积累_使用NIFI表达式过滤表_随时更新---大数据之Nifi工作笔记0063
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_根据binlog实现update数据实时同步_实际操作05---大数据之Nifi工作笔记0044
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_根据binlog实现数据实时delete同步_实际操作04---大数据之Nifi工作笔记0043
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置binlog_使用处理器抓取binlog数据_实际操作01---大数据之Nifi工作笔记0040
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_实现数据插入数据到目标数据库_实际操作03---大数据之Nifi工作笔记0042
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_生成插入Sql语句_实际操作02---大数据之Nifi工作笔记0041
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_03_来吧用NIFI实现_数据分页获取功能---大数据之Nifi工作笔记0038
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_不带分页处理_01_QueryDatabaseTable获取数据_原0036---大数据之Nifi工作笔记0064
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_无分页功能_02_转换数据_分割数据_提取JSON数据_替换拼接SQL_添加分页---大数据之Nifi工作笔记0037
查看>>
NIFI从Oracle11G同步数据到Mysql_亲测可用_解决数据重复_数据跟源表不一致的问题---大数据之Nifi工作笔记0065
查看>>
NIFI从PostGresql中离线读取数据再导入到MySql中_带有数据分页获取功能_不带分页不能用_NIFI资料太少了---大数据之Nifi工作笔记0039
查看>>
nifi使用过程-常见问题-以及入门总结---大数据之Nifi工作笔记0012
查看>>
NIFI分页获取Mysql数据_导入到Hbase中_并可通过phoenix客户端查询_含金量很高的一篇_搞了好久_实际操作05---大数据之Nifi工作笔记0045
查看>>