ICML 2025 杰出论文:超越 Next Token Prediction 的创造力极限
ICML 2025 Outstanding Paper 一共评出 8 篇,Roll the Dice & Look Before You Leap: Going Beyond the Creative Limits of Next-Token Prediction 是其中之一,作者来自 CMU 与 Google Research。论文想回答为什么 LLM 在写谐音梗、出奥数题、想研究 idea 这类开放式任务上经常输出雷同的东西?
作者的核心论点:这类任务上人是先想到一个抽象点子再围绕它生成内容,next-token prediction(NTP)学不到这种模式。要改善,得先换掉训练目标让模型有能力学到这个隐藏点子,再把推理时的随机性从输出端挪到输入端,让这个点子在采样时不会被逐位置加噪拆碎。