快手可灵发布20版本：上线多模态视频编纂功能-bevictor伟德官网

bevictor伟德 > 针织行业 >

快手可灵发布20版本：上线多模态视频编纂功能

发布时间：

2025-06-08 19:05

　　跟着AI生成视频日渐走红，若何精确将用户心中的设法成AI视频，成为难题。用户常常发觉，仅仅依托文字很难描述本人的需求。4月15日，快手旗下可灵AI颁布发表，面向全球发布可灵2。0视频生成模子及可图2。0图像生成模子，快手高级副总裁、快手社区科学线担任人盖坤向磅礴旧事记者暗示，“AI正在辅帮创意表达上具有庞大潜力，但当前的行业成长示状还远远无法满脚用户需求，正在AI生成内容的不变性、以及用户复杂创意的切确传达上仍有良多挑和。最受关心的即是多模态视频编纂的新功能：可灵AI利用全新交互Multi-modal Visual Language（MVL），让用户可以或许连系图像参考、视频片段等多模态消息，将脑海中包含身份、气概、场景、动做、运镜正在内的度创意，高效传达给AI。同时，用户能够间接把本人的设法用图像等体例表做为输入，生成合适本人设法的创意视频。盖坤引见，MVL由TXT（Pure Text，语义骨架）和MMW（Multi-modal-document as a Word，多模态描述子）构成，能从视频生成设定的根本标的目的以及精细节制这两个层面，精准实现AI创做者们的创意表达。他暗示，MMW（多模态描述子）将不只局限于图片和视频，也能够引入其它模态的消息，例如声音、活动轨迹等，让用户实现愈加丰硕的表达。数据显示，自客岁6月发布以来，可灵AI已累计完成超20次迭代。来自世界各地的超1。5万开辟者和企业客户，将可灵的API使用于分歧的行业场景中。自客岁6月上线个月时间里，可灵AI的月活用户数量增加25倍，截至目前，全球用户规模冲破2200万。据盖坤引见，均稳居业内第一。例如正在文生视频范畴，可灵2。0对比谷歌Veo2的胜负比为205%，对比Sora的胜负比达367%。值得留意的是，当前图生视频约占到可灵AI视频创做量的85%，图片质量也对视频的生成结果发生主要感化。据快手副总裁、可灵AI担任人张迪引见，可图2。0文生图能力也送来全面升级，正在气概化响应上，可图2。0可支撑60多种气概化的结果转绘，模子出图创意和想象力实现大幅跃升。同时，可图2。0也上线图像可控编纂功能：局部沉绘和扩图，支撑图片的添加、点窜和修复。正在图像的多模态可控生成中，可图2。0还上线气概转绘功能，只需要上传一张图片加优势格描述，就能一键切换图片的艺术气概，同时精准保留原图的语义内容。除C端订阅用户，可灵AI也面向B端商家供给API接入等办事。目前，可灵AI已取包罗小米、亚马逊云科技、阿里云、Freepik、蓝色光标等正在内的数千家国表里企业客户成立合做关系。正在营收数据方面，快手2024年三季度财据显示，另据2024年快手四时度及全年财报，自可灵AI起头贸易化变现至2025年2月，可灵AI的累计停业收入曾经跨越1亿元。AI视频是互联网公司集体发力的赛道，客岁12月，腾讯混元大模子发布AI视频生成大模子，同时颁布发表开源，参数量达到130亿，为其时最大的视频开源模子，字节跳动、MiniMax、智谱AI等国内大厂和头部草创公司也推出了响应产物。

关键词：

上一篇：产教融通、学致使用丨聚焦教育赋能文化创意财

下一篇：秀场 Stephen Liu Design 2526秋冬系列表态中国国际时

上一篇：产教融通、学致使用丨聚焦教育赋能文化创意财

下一篇：秀场 Stephen Liu Design 2526秋冬系列表态中国国际时

附件下载

bevictor伟德纺织总部服务电话：0595-8205 0055 / 内幕交易举报电话：0595-8565 6506 陈美珍小姐（董事会秘书）

营业执照

针织行业 · 纺织百科 · 网站地图 · bevictor伟德