智象未来团队研发成果获ICML 2025收录!图像生成更有“全局视野”

2025-05-23 11:23:08 市场信息

智象未来团队提出全新层级自回归生成范式 Hierarchical Masked Autoregressive models (Hi-MAR),有效解决自回归图像生成中结构失真问题。该研究已被 ICML 2025 收录,并在多个图像生成任务中取得领先性能。

现有自回归图像生成模型存在缺乏全局结构建模能力、训练-推理分布不一致、尺度引导缺失等问题。Hi - MAR 借鉴人类绘画过程,采用自顶向下层次化生成范式,还引入多尺度联合训练策略等。实验显示,其在图像质量和语义一致性上优于主流方法,可以显著提升模型的全局感知能力与生成质量。

本次发表的论文《Hierarchical Masked Autoregressive Models with Low-Resolution Token Pivots》,展示了团队在多模态生成式基础架构设计领域的前沿探索。这一全新的层级自回归生成架构 Hi-MAR,为构建具备“全局感知+局部细化”能力的生成基础架构提供了新的范式,同时它也是HiDream系列开源模型家族重要的一员,为下一代多模态生成式基础架构的技术演进带来更多的可能性!

(责任编辑:王治强 HF013)

【免责声明】【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读