与1500多支国内外队伍同台竞技,快手在NeurIPS 2024顶级大赛中上演双杀
这几天,学术圈的小伙伴肯定都很关注正在加拿大温哥华举办的机器学习顶会——NeurIPS 2024。本届会议于今日落下帷幕,共接收 15671 篇有效论文投稿,比去年增长了 27%,最终接收率为 25.8%。
本届会议上同样值得关注的,还有一项重要的赛事,它就是「NeurIPS 2024 Auto-Bidding in Large-Scale Auctions」(大规模拍卖中的自动出价),旨在探索当前火热的强化学习、生成模型、Agent 等前沿 AI 技术在广告投放以及决策智能场景的应用。
该赛事不仅是业内首次广告出价比赛,也是 NeurIPS 2024 唯一的搜广推比赛,可以说规格和含金量都很高,也因此收获了超高的热度,吸引超过 1500 支队伍参赛,其中不乏国内外知名高校和公司、专业研究机构以及决策智能领域知名团队的身影。
赛事主页:https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/
简单来说,在比赛中,参赛者扮演自动出价 Agent(即广告主),在大规模拍卖环境下与其他 47 个竞争对手对抗,作出有效的出价决策,并在满足投放需求的情况下帮助广告主最大化投放效果。
从①到⑤为典型广告平台的自动出价全流程。
此次比赛分为了两个赛道,分别是通用赛道和AIGB(AI-Generated Bidding)赛道。两个赛道侧重点各有不同,对参赛队伍提出了不同的技术要求,其中:
-
通用赛道关注不确定环境中的自动出价,需要解决数据稀疏性、转化方差、多坑等不确定问题;
-
AIGB 赛道使用生成模型来学习自动出价 Agent,需要采用生成模型来端到端输出决策。
算起来,自今年 6 月底注册阶段开始,经过了近半年的激烈角逐,比赛终于决出了胜负!
快手商业化算法团队(简称快手团队)从千余支队伍中脱颖而出,包揽了两个赛道的第一名,成为本次赛事最大赢家。
























-
优化目标对齐能力弱:一次性生成一条序列,序列之间约束较弱,甚至学不出剩余预算单调递减这一性质;
-
训练效率低:是两阶段范式,首先预测状态序列 {s_{t+1},s_{t+2},...,s_{T}},然后根据 {s_t,s_{t+1}} 预测最终出价,训练较为复杂。

-
首先训练模型预估下一时刻的 RTG,具备评估探索的出价系数好坏的能力。
-
每个 timestep 额外预测一个基于原始出价系数
探索新的出价系数
,鼓励模型探索下一时刻 RTG 更高的出价系数。
-
模型朝着原始出价系数和探索到的出价系数中更优的出价系数更新,避免 OOD 问题。
(来源:机器之心)