不学Sora?这家国产AI搞了个“无限续杯”的视频

2025-04-29 20:30

    

  创始人曹越和联创张拯早正在 2021 年的万引神文 Swin Transformer 就有合做,都曾就职于科技界的黄埔军校 —— 微软亚洲研究院。曹越仍是光年之外的创始人之一。正在强强联手的 buff 下,sand。ai 创立才一年多就有了本人的第一个视频生成模子 Magi-1。听说 Magi-1 是现正在市道上唯逐个款能进行无限时长视频续写的模子,还能精细化节制到每一秒生成的内容。要晓得现正在视频生成模子的极限遍及就几十秒,像可灵那样一分钟以上的都很少见。那是别的的。。。别的的代价也不可,这是底层模子的手艺问题。而Magi-1 支撑无限时长续写,还能够每次同时生成最多 16 个 1s 到 10s 的视频。不但手艺有立异,sand。ai 还暗示,他们曾经正在 4 月 21 日开源了模子,并同步上线产物 demo。连业界大佬都发文力挺 sand。ai,李开复发帖,这是继 DeepSeek 之后又一个开源的世界级模子。美团创始人王慧文也为 sand。ai 这波开源发声:“只要科技的不竭前行,强人类掉入零和逛戏的深坑。”我们先找了个梦中情车的反面特写慢镜头,预备续写接下超驾驶 Lamborghini秋名山车神再世的画面。测试的过程中,我们发觉 Magi-1 对于活动速度和镜头的节制确实很优良。兰博基尼正在上疾驰的结果做出来了,镜头也很有片子感,一曲聚焦正在跑车上。还有一个很较着的长处,就是 Magi-1 对于视频次要物体的很是到位。不会正在多次续写之后,跑车变身大黄蜂的环境。不外。。。Magi-1 仿佛有点健忘。好比前三段生成的视频都晓得车后是一面墙,成果第四段间接一个倒车摆尾漂移丝滑上了。并且场景理解自从上就越来越笼统了。除了克苏鲁风绿化带,提醒词让它正在红灯前刹车,本意,它间接来个交通惹事。打开 Magi-1 的提醒词加强,它能够把简单的提醒词扩展成更细致、容易让模子理解的指令。但正在现实利用的时候,它呈现了添枝接叶,假传圣旨的现象。但若是我们把提醒词复制一遍,只删掉扇同党的要求,关掉提醒词加强,生成的视频结果立即好起来了。这也侧面反映了,Magi-1 对于提醒词常并且要求很高的。想用好它,最好晓得什么样的提醒词才能让它出好活。AR 模子就像一条环环相扣的锁链,都正在前一帧的根本上。如许生成的视频相邻帧之间就会有强相关性。而 DiT 模子更像是放正在一路伪拆成锁链的一堆铁环。它为了效率会同时生成良多帧,但没有法子兼顾到帧取帧之间的联系关系。我们对 sand。ai 团队进行了简单的采访,很侥幸获得了对 Magi-1 更专业、久远的解答。sand。ai 暗示,他们早正在 Sora 发布前就洞察到了 AR 模子正在视频生成方面的潜力。 AR,是由于它正在狂言语模子上曾经被是可扩展的 (scalable) ,而 scalable 正在很大程度上决定了这个手艺正在将来的上限。理论上,AR 模子和言语模子的手艺线更接近,无机会让言语和视频同一建模,使文字和视频之间的关系就像现正在文生图一样慎密,结果有可能实现一次跃迁。另一方面,视频跟着时间的推移往往还有物理和逻辑的相关性。它就不会再掉落了。DiT 每帧生成的体例可能会堵截这种联系关系,没准会让篮球间接魂穿篮筐。而 AR 会更好地舆解视频内容,不只内容合理,还会正在活动幅度、速度上表示得更好。但 sand。ai 相信 AR 会是将来。跟着手艺的不竭迭代,也许就会找到最合理的 AR 模子视频生成的体例。于是按照他们的说法,正在敌手艺全面而地阐发后,sand。ai 正在 AR 视频生成上下了注。其实,正在视频生成范畴卷到飞起的今天,sand。ai 看似迟到了,但正在上限更高的AR 视频生成上他们倒是先发而至。科技行业的每一次严沉开源,城市带来一场百花齐放。等候 sand。ai 将来的更多产物,以及更多团队正在 Magi-1 根本上的立异。

福建瓦房店职业技术学校信息技术有限公司


                                                     


返回新闻列表
上一篇:系两AI企业牵手鞭策国产大模子立异 下一篇:7×24小时正在线利用中聚AI帮手企业运营效率提拔