今日,
马斯克旗下xAI公司宣布GrokImagineVideo1.5模型正式上线,并在xAIAPI中结束预览。该模型于2026年6月3日推出预览版,主打“静态图一键生成带同步音频的短视频”,在音画同步、运动真实性和生成速度方面进行了主要升级。在音画同步方面,GrokImagineVideo1.5模型能够在单次生成中同时输出音效、环境音和对话,精准对齐音频与画面动作,大幅提升语音清晰度和口型同步效果,适用于需要人物配音的短片创作。
在运动与物理表现方面,GrokImagineVideo1.5增强了视频内的运动连贯性,减少了人物肢体扭曲、物体飘浮等假象。模型能更好地模拟重量感与动量,如人物走路时衣摆的自然晃动、下落物体的加速轨迹,整体观感更接近真实物理世界。在生成速度方面,GrokImagineVideo1.5在Fast模式下,生成一段6秒、分辨率720p的视频仅需约25秒,而前代需要40秒以上。
GrokImagineVideo1.5现已结束预览,在xAIAPI中以grok-imagine-video-1.5模型名称提供。开发者可通过上传起始图片、描述运动方式,并选择分辨率和时长来调用该模型。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。