闽商新媒体

闽商头条产业观察

文生视频sora刷屏,美图的“美”不止是颜值

发布时间:2024-02-20 阅读量:5229 来源:闽商网
Sora一夜之间刷屏。

2月16 日凌晨,在没有任何预兆和消息透露的情况下,OpenAI 突然发布了自己的首个文生视频模型:Sora,大幅刷新行业多个指标,重新定义了 AI 文生视频在现阶段的技术极限,颠覆了生成式AI在视频领域的全球市场格局。


据了解,Sora能够通过文本指令创建最长达60秒的视频,其逼真的视觉效果让全球诸多媒体都对其冠以“颠覆性”的美名,甚至有网友感叹“视频行业全都要被洗牌了”。


Sora到底有多牛?


对于生成式AI而言,其真正的难点是在文生视频,而非图生视频、视频生视频。各中奥妙在于,文生视频,需要根据指令,从文字解码出视频的时空逻辑,同时保证在这一逻辑下,画面中所有物体的运动、变化,符合要求,符合现实世界规律。而图生视频、视频生视频,皆有“照猫画虎”的意味,因此反倒要简单一些。这也是为什么,市面上的 AI 视频生成,始终停留在 2-4 s 的时长范围内——一旦超过了这个时长,视频的可控性和质量都将大大下降。

很多视频生成,更像是个固定人物配上动态背景,画面很单调,几乎没什么动作,这也是因为从文字到视频,在时空逻辑推理层面的局限。同时,很多企业更关注所谓 AI 视频生成的产品化、商业化,聚焦于推出一些基于模板,快速用于营销的视频生成工具,在世界模型层面有所欠缺,一旦视频时长增加,模型不能理解真实的物理运动和相互作用逻辑,变得十分无力。


而OpenAI 的 Sora ,就是在文生视频,增加视频时长,建立世界模型,这几大最主要的难点上,走出了突破性的一步。


目前OpenAI 官网上已经更新了48个样片,视频中人物、背景都具有惊人的一致性。并且借助于对语言的深刻理解,Sora创造出的角色能表达丰富的情感。


更令业内惊叹的是,Sora身上似乎开始出现“世界模型”的雏形。通过大量观察训练,它学会了许多关于真实世界的物理规律。


要知道,原先动画影视公司为让动物的数百万根毛发、皮肤纹理、衣物等细节在3D建模中表现得如现实场景般真实,为此专门成立研究部门,且投入了不菲的成本和时间才得以实现。而如今,Sora只需要一行描述、几次提示便能自动完成。


虽然,目前Open AI坦言Sora仍有一些效果上的瑕疵,也因潜在的风险暂未对公众开放。但凭借着极度真实的视觉效果,这一足以“模糊虚实”的王炸级技术,正粗暴地冲击着大众心智。


美图的美不止是颜值


事实上,文生视频并非Open AI的独门,赛道早已涌入大量玩家。去年下半年开始,谷歌、Meta及部分AI创业公司相继下场试水,国内的字节跳动、阿里云等公司也相继推出了类似的模型,在这其中,福建省内的美图公司表现尤为出众。

2023年12月,美图公司推出了自研AI视觉大模型MiracleVision 4.0 版本,相比上一代新增了“AI 设计”与“AI 视频”能力。其中,AI设计包含四大功能,分别为矢量图形、文字特效、智能分层和智能排版;AI视频能力包括文生视频、图生视频、视频运镜和视频生视频四大功能。目前,MiracleVision4.0已经从2024年1月开始陆续应用于美图旗下产品,同时开放商业API,并提供多个方案供用户选择。
同时,美图公司联手国内头部设计师社区站酷,以举办AI 设计赛事、推行“新锐AI 设计师”计划、构建AI 学习平台等方式,致力于打造面向未来的全新AI 设计生态,通过设计师创意和视觉大模型生产力相结合,鼓励设计师运用AI 创作内容并实现商业化变现,未来能够在AI 商业实践和探索中不断取得新的突破。
此外,美图还推出了全新的视觉模型商店并鼓励用户上传作品训练定制化模型,并允许拥有版权的优质模型商业化,通过AI视频达到多模态能力的突破,将为其下游更广泛的商业化应用打开空间,有望拓展全新应用场景,在未来将具备更强的竞争力。
目前,经过多年的深耕,美图已经在“美学经济”领域形成了丰富的产品矩阵,覆盖了众多细分需求,核心产品口碑突出,用户基本盘稳固。而All in AI也将是公司当前最核心产品战略。公司创始人、董事长兼 CEO 吴欣鸿表示,美图公司几乎所有产品都将以AIGC为内核,相信AIGC给生产力带来的巨大帮助前所未有。