Finetuned Language Models Are Zero-Shot Learners

news/2024/6/19 6:15:03 标签: 语言模型, 人工智能, 自然语言处理

Abstract

本文探索了一种简单的方法来提升语言模型的零样本(zero-shot)学习能力。我们发现 指令微调(instruction tuning) 显著提高了未见任务的零样本性能。

  • 指令微调:即在一组通过指令描述的数据集上对模型进行微调

我们对一个 137B 参数的预训练模型在 60 个 NLP 任务上进行指令微调。这些任务通过自然语言指令模板进行表述。我们将指令微调后的模型称为 FLAN。

我们在未见任务上进行评估,发现

  • FLAN 显著好于微调前的版本
  • 在 20/25 个任务上超过 zero-shot 175B GPT-3
  • FLAN 在 ANLI, RTE, BoolQ, AI2-ARC, OpenbookQA, StoryCloze 等任务上甚至超时 few-shot GPT-3

消融实验显示,微调数据集的大小、模型的规模、自然语言指令都是指令微调成功的关键。

1 INTRODUCTION

GPT-3 为代表的大语言模型在 few-shot 情况表现很好,但是在 zero-shot 上效果差多了。一个可能的原因是在没有 few-shot 样本时,模型很难在与预训练数据格式不相似的 Prompt 上表现良好。

针对以上问题,本文利用了 NLP 任务可以使用自然语言指令描述这一直觉,例如

  • “Is the sentiment of this movie review positive or negative?”
  • “Translate ‘how are you’ into Chinese.”

我们对 137B 参数的预训练模型进行指令微调,结果称为 FLAN (


http://www.niftyadmin.cn/n/5460974.html

相关文章

vscode初始化node项目

首先需要安装node环境,推荐直接使用nvm 安装node,方便切换node版本 1.npm init 初始化node项目 在命令行输入npm init指令 根据指令创建完成后会在当前目录下生成一个package.json文件,记住运行npm init执行的目录必须是一个空目录 2.创建…

深入理解npm常用命令

npm(Node Package Manager)是 Node.js 的包管理工具,用于管理 Node.js 应用程序的依赖包。除了安装、更新和卸载依赖包外,npm 还提供了许多其他功能,如初始化项目、运行脚本、查看依赖树等。本文将详细介绍一些常用的 …

【Qt】:多种方式编辑hello world

多种方式编辑hello world 一.QLabel二.对象树三.使用单行编辑框四.使用按钮 (小技巧:1.可以使用F4来进行头文件和对应cpp文件的切换;2.写完一个函数的声名之后,按下altenter,就可以自动的在对应的cpp 文件中添加函数的定义了.) 一.QLabel 注意这里是QSt…

asan原理详解

文章目录 一、asan介绍二、asan原理三、asan问题详解1. heap-buffer-overflow(堆溢出)1、代码2、编译连接,生成可执行文件3、执行可执行文件,生成asan4、分析4.1 初步分析4.2 深入分析 2、stack-buffer-overflow(栈溢出)1、代码2、编译连接,生…

【算法】基数排序

简介 基数排序(*Radix sort)是一种非比较排序算法(non-comparative sorting algorithm)。现代计算机的基数排序算法由 计数排序 算法的开发人哈罗德H西华德(Harold H. Seward)于1954年于麻省理工大学开发。…

【论文通读】AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation

AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation 前言AbstractMotivationFrameworkConversable AgentsConversation Programming ApplicationA1: Math Problem SolvingA2: Retrieval-Augmented Code Generation and Question AnsweringA3: Decision…

【鸿蒙HarmonyOS开发笔记】通用型工具封装之关系型数据库操作类的封装

概述 开发中难免遇到操作关系型数据库的场景,但是原生的relationalStore使用起来略显繁琐,此文封装一个通用的关系型数据库增删改查的工具类,只需要少量修改配置即可使用,大幅简化我们的开发成本,提高开发效率 完整代…

Predict the Next “X” ,第四范式发布先知AIOS 5.0

今天,第四范式发布了先知AIOS 5.0,一款全新的行业大模型平台。 大语言模型的原理是根据历史单词去不断预测下一个单词,换一句常见的话:Predict the Next “Word”。 当前对于行业大模型的普遍认知就是沿用这种逻辑,用大…