这两天 ,豆包字节又出手了 ,模型一口气放出一堆大货。上新
豆包大模型1.6 、字节豆包·视频生成模型 Seedance 1.0 pro 、持续豆包·语音播客模型,卷性价比豆包·实时语音模型...全家桶式上新 ,豆包看着热烈。模型
假如你仅仅扫一眼上述产品,上新或许觉得便是字节大厂又来了一波例行晋级 ,没什么特其他。持续现在AI圈更新节奏这么快,卷性价比新模型 、豆包版别号、模型榜单名次一大堆,上新的确不太简单提起爱好。
但略微往下看一看,会发现这次字节的做法不太相同。它并没有靠一两个参数或许演示视频来抢风头 ,而是开端把模型才能做成一整套“能直接跑起来”的运用,从文字、图画 、视频,到语音、操作体系,全都串在了一同 ,并且不少是直接挂进了豆包APP、火山方舟这些现已在用的产品里。
咱们就从两个中心产品说起 。
Seedance 1.0 Pro 实测体现:
安稳、成型,但仍有鸿沟 。
假如只看热度 ,这几个产品中。Seedance应该是被重视度最高的了 。
它刚上线就登上了第三方榜单Artificial Analysis的文生视频和图生视频两项榜首,超过了可灵2.0和谷歌的Veo 3 。榜单怎样评的咱们能够再评论 ,但至少阐明在业内规范下,Seedance的生成作用现已达到了干流模型中的较好水平 。
咱们来看下这个模型的根本情况。
Seedance 1.0 Pro支撑文字和图片输入 ,能生成10秒左右的1080p视频,支撑2-3个镜头切换 。它的首要特点 ,是着重镜头之间的连贯性和内容的安稳性。
这点在之前的视频生成模型里 ,的确是个短板。许多模型尽管能出图画,但内容连不起来,主角忽然消失或许布景颤动都很常见。
Seedance处理这个问题的方法,是把每个镜头的内容用文字描绘得更细,官方叫「精准描绘模型」。它先生成一段描绘 ,然后再依据这个描绘练习视频。这种方法能让模型更好地知道该生成什么内容,也更简单操控住动作和细节 。
Seedance能生成的视频风格也比较多样,能够支撑航拍、榜首人称、动画 、水墨等多种风格 。这点其实各家模型都有相似才能,仅仅Seedance在这方面的完结度和一致性更高一些 。
生成速度方面,5秒的1080p视频只需大约40秒,这个速度归于现在职业中等偏上的水平 。
来看一下咱们实测的效果(每个维度咱们都测验了多个case ,篇幅约束只展现其间的一个) :
镜头言语 。
,时长00:05 。
prompt :夜晚的加油站 ,一个男人戴上头盔骑上摩托车 ,发起,驶出油站,镜头跟拍他的背影穿过大街 ,途中掠过霓虹招牌和迎面驶来的车辆 。
这段首要是测验Seedance的快速运动+接连镜头才能 ,看它有没有编排感,能不能Hold住快节奏。
成果仍是能够的。骑上摩托车时是一个典型的近景静态镜头,画面很洁净。发起的瞬间光影有了改变,镜头在车发动后跟着往前推动 。
Seedance 在镜头言语这块 ,能了解根本拍法;节奏上有操控,不会一顿快切、也不会呆板地不动;镜头转场不是很僵硬堆叠,可是它对杂乱轨道、非线性镜头的了解还不行安稳