UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律
-
论文标题:UniReal: Universal Image Generation and Editing via Learning Real-world Dynamics
-
项目主页:https://xavierchen34.github.io/UniReal-Page/
-
论文链接:https://arxiv.org/abs/2412.07774








-
Context Prompt:用于补充描述不同任务和数据集的特性,包括任务目标、数据分特点等背景信息,从而为模型提供更丰富的上下文理解。
-
Image Prompt:对输入图像进行层次化划分,将其分为三类:
-
Asset(前景):需要重点操作或变更的目标区域;
-
Canvas(画布):作为生成或编辑的背景场景;
-
Control(控制):提供约束或引导的输入信号,如参考图像或控制参数。
(来源:机器之心)



