6月3日,Ideogram公司宣布推出其最新的4.0版本开放权重文生图模型,该模型以其卓越的性能在全球开源生图AI模型中占据领先地位。Ideogram4.0的核心规模为9.3B参数,采用单流架构,使得文本和图像tokens能够共享同一个自注意力序列,并将设计控制置于训练和推理格式的核心位置。该模型由Qwen3-VL-8B-Instruct文本编码器、可训练的34层单流DiT(扩散Transformer)、Euler流匹配采样器以及冻结的KL自动编码器组成,能够生成包括人物、场景和设计类图像在内的多样化内容,特别适合需要图片创作、视觉排版和文字海报的用户。
Ideogram4.0的突出能力在于文字绘制,它能够在图像中更准确地呈现较长文本,这对于海报、商品图、封面和社媒素材的制作至关重要。Ideogram还通过训练图片中的对象和文本边界框,使模型能够理解元素间的位置关系。结合结构化JSON字幕数据的训练,用户可以更清晰地通过提示词指定版式、对象位置和文本布局。在DesignArena的排名中,Ideogram4.0超越了NanoBananaPro,位列全球第4,这一成绩是基于隐藏模型名称后由人类评价生成结果质量的方法得出,因此具有较高的可信度。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。