标签 Prompt 下的文章

作者: wyli

时间: 2024-02-29

729 次阅读

大语言模型在上下文学习和思维链推理展现了较强的泛化能力。为了使大语言模型跟随自然语言指令和完成真实世界任务，研究人员探索了指令微调方法。这种方法要么利用人类标注的提示和反馈微调模型，要么利用开源benchmarks和datasets有监督微调。在这些方法中，自主指令精调是一个对齐LLM与人类意图简单和有效的方法。为了提升大语言模型的指令微调性能，基于GPT-4的微调利用GPT-4作为teacher生成数据，用于自主指令微调。

- 阅读剩余部分 -

标签 Prompt 下的文章

基于GPT-4的指令微调

最新文章

标签云 (Top20)

分类