Name	Name	Last commit message	Last commit date
parent directory ..
gdc	gdc
README.md	README.md
requirements.txt	requirements.txt

Name

Last commit message

Last commit date

On Reinforcement Learning and Distribution Matching for Fine-Tuning Language Models with no Catastrophic Forgetting

This directory contains source code accompanying the paper On Reinforcement Learning and Distribution Matching for Fine-Tuning Language Models with no Catastrophic Forgetting (NeurIPS 2022).

Contributors

Tomasz Korbak, tomasz.korbak@gmail.com

Hady Elsahar, hady.elsahar@naverlabs.com

Germán Kruszewski, german.kruszewski@naverlabs.com

Marc Dymetman, marc.dymetman@naverlabs.com

Citation

@inproceedings{
korbak2022on,
title={On Reinforcement Learning and Distribution Matching for Fine-Tuning Language Models with no Catastrophic Forgetting},
author={Tomasz Korbak and Hady Elsahar and Germ{\'a}n Kruszewski and Marc Dymetman},
booktitle={Advances in Neural Information Processing Systems},
editor={Alice H. Oh and Alekh Agarwal and Danielle Belgrave and Kyunghyun Cho},
year={2022},
url={https://openreview.net/forum?id=XvI6h-s4un}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

On Reinforcement Learning and Distribution Matching for Fine-Tuning Language Models with no Catastrophic Forgetting

Contributors

Citation

FilesExpand file tree

rm_vs_dm

Directory actions

More options

Directory actions

More options

Latest commit

History

rm_vs_dm

Folders and files

parent directory

README.md

On Reinforcement Learning and Distribution Matching for Fine-Tuning Language Models with no Catastrophic Forgetting

Contributors

Citation