DSP
Directional Stimulus Prompting:用 policy LM 生成 stimulus
Li 等人,(2023)提出了一种新的提示技术,以更好地指导 LLM 生成所需的摘要。
训练了一个可调节的策略 LM 来生成刺激/提示。越来越多地使用 RL 来优化 LLM。
下图显示了方向性刺激提示与标准提示的比较。策略 LM 可以很小,并且可以优化以生成指导黑盒冻结 LLM 的提示。

图片来源:Li 等人,(2023)
完整示例即将推出!
Directional Stimulus Prompting:用 policy LM 生成 stimulus
Li 等人,(2023)提出了一种新的提示技术,以更好地指导 LLM 生成所需的摘要。
训练了一个可调节的策略 LM 来生成刺激/提示。越来越多地使用 RL 来优化 LLM。
下图显示了方向性刺激提示与标准提示的比较。策略 LM 可以很小,并且可以优化以生成指导黑盒冻结 LLM 的提示。

图片来源:Li 等人,(2023)
完整示例即将推出!