instructgpt

[논문 매일 읽기 12일차] Training language models to follow instructions with human feedback

2025.02.03· 머신러닝, 딥러닝

논문 : https://arxiv.org/abs/2203.02155제목 : Training language models to follow instructions with human feedback발행일자 : 4 Mar 2022저자: Long Ouyang, Jeff Wu, Xu Jiang, Diogo Almeida, Carroll L. Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, John Schulman, Jacob Hilton, Fraser Kelton, Luke Miller, Maddie Simens, Amanda Askell, Peter Welinder, Paul Christiano, Jan..

티스토리툴바