可灵AI在北京举行“灵感成真”2.0模型发布会,会上正式发布全新可灵2.0视频生成模型与可图2.0图像生成模型。据介绍,可灵2.0在动态质量、语义响应及画面美学等多个维度继续保持行业领先地位;而可图2.0则在指令遵循、电影质感及艺术风格展现等方面实现显著提升。
值得一提的是,早在3月27日,全球AI基准测试机构Artificial Analysis便已发布最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)凭借卓越性能,成功登顶图生视频(Image to Video)赛道。
在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念——Multi-modal Visual Language(MVL)。该理念使用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景等在内的多维度复杂创意,直接且高效地传达给AI。
基于MVL理念,可灵AI推出多模态编辑功能,该功能不仅局限于图片和视频,还可以引入声音、运动轨迹等其他模态的信息,使用户实现更为丰富的表达。为此,快手副总裁、可灵AI负责人张迪发布全新的可灵2.0大师版。这一版本全面升级视频及图像创作可控生成与编辑能力,并上线全新的多模态视频编辑功能。
此外,可图2.0的文生图能力也迎来全面升级,包括大幅提升指令遵循能力、显著增强电影美学表现力以及提供更多元的艺术风格等,为用户带来更加出色的创作体验。