EFL

算法简介

Entailment as Few-Shot Learner（EFL）提出将 NLP Fine-tune 任务转换统一转换为 Entailment 二分类任务，为小样本场景下的任务求解提供了新的视角。EFL 的主要**如下图所示，该算法也可以使用 Template 实现标签描述与数据文本的拼接，定义方式详见Prompt API 文档。

快速开始

CLUE（Chinese Language Understanding Evaluation）作为中文语言理解权威测评榜单，在学术界和工业界都有着广泛影响。FewCLUE 是其设立的中文小样本学习测评子榜，旨在探索小样本学习最佳模型和中文实践。PaddleNLP 内置了 FewCLUE 数据集，可以直接用来进行 EFL 算法训练、评估、预测，并生成 FewCLUE 榜单的提交结果，参与 FewCLUE 竞赛。

代码结构说明

├── run_train.py # EFL 算法提示学习脚本
├── data.py      # 数据集构造、数据增强
├── utils.py     # FewCLUE 提交结果保存等工具函数
└── prompt/      # FewCLUE 各数据集的 prompt 定义文件

数据准备

读取 FewCLUE 数据集只需要 1 行代码，这部分代码在 data.py 脚本中。以情感分类数据集 eprstmt 为例：

from paddlenlp.datasets import load_dataset

# 通过指定 "fewclue" 和数据集名字 name="eprstmt" 即可一键加载 FewCLUE 中的 eprstmt 数据集
train_ds, dev_ds, public_test_ds = load_dataset("fewclue", name="eprstmt", splits=("train_0", "dev_0", "test_public"))

模型训练、评估、预测

通过如下命令，指定 GPU 0 卡, 在 FewCLUE 的 eprstmt 数据集上进行训练&评估

python -u -m paddle.distributed.launch --gpus "0" run_train.py \
    --output_dir checkpoint_eprstmt \
    --task_name eprstmt \
    --split_id few_all \
    --prompt_path prompt/eprstmt.json \
    --prompt_index 0 \
    --do_train \
    --do_eval \
    --do_test \
    --do_predict \
    --do_label \
    --max_steps 1000 \
    --learning_rate 3e-5 \
    --eval_steps 100 \
    --save_steps 100 \
    --logging_steps 5  \
    --per_device_train_batch_size 16 \
    --max_seq_length 128 \
    --load_best_model_at_end \
    --metric_for_best_model accuracy \
    --save_total_limit 1

参数含义说明

task_name: FewCLUE 中的数据集名字
split_id: 数据集编号，包括0, 1, 2, 3, 4 和 few_all
prompt_path: prompt 定义文件名
prompt_index: 使用定义文件中第 prompt_index 个 prompt
augment_type: 数据增强策略，可选 swap, delete, insert, substitute
num_augment: 数据增强策略为每个样本生成的样本数量
word_augment_percent: 每个序列中数据增强词所占的比例
pseudo_data_path: 使用模型标注的伪标签数据文件路径
do_label: 是否使用训练后的模型给无标签数据标注伪标签
do_test: 是否在公开测试集上评估模型效果
model_name_or_path: 预训练模型名，默认为 ernie-1.0-large-zh-cw
use_rdrop: 是否使用对比学习策略 R-Drop
alpha_rdrop: R-Drop 损失值权重，默认为 0.5
dropout: 预训练模型的 dropout 参数值，用于 R-Drop 策略中参数配置
export_type: 模型导出格式，默认为 paddle，动态图转静态图
更多配置参考 Trainer 参数文档和 PromptTrainer 参数文档

模型部署

Coming soon...

References

[1] Wang, Sinong, Han Fang, Madian Khabsa, Hanzi Mao, and Hao Ma. “Entailment as Few-Shot Learner.” ArXiv:2104.14690 [Cs], April 29, 2021. http://arxiv.org/abs/2104.14690.

ricardol1u / efl Goto Github PK

efl's Introduction

EFL

算法简介

快速开始

代码结构说明

数据准备

模型训练、评估、预测

模型部署

References

efl's People

Contributors

Stargazers

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent