首页香港脉搏理财/管理
港股强化版MQ
方展策

方展策

少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。

一句话变60秒影片!OpenAI Sora将加剧假片泛滥?

2024-02-26 15:25
1A+A-

   一名身穿黑色皮楼、红色长裙与黑色皮靴的女子,戴着太阳眼镜,在挂满霓虹灯招牌的东京街头漫步。这段看似平平无奇的短片,甫推出即引起轰动,全因它是由OpenAI新推出的影片生成模型“Sora”产制出来。用户只需输入提示词,它就可以生成包含精细场景、复杂运镜的1分钟电影级短片,跃居业界标竿。但如此逼真的AI生成影片效果,却可能对数码娱乐产业带来一定冲击,甚至加剧深伪假影片的泛滥。


影片呈现细腻场景、复杂运镜手法


   目前市场上的影片生成AI模型,顶多只能产制构图简单、镜头固定的十几秒短片,例如较多人使用的Runway可以输出4至18秒影片。OpenAI于2024年2月15日发表全新AI模型“Sora”,可根据用户输入的文字提示词或静态图片,生成长达60秒的连贯流畅影片,犹如一石激起千重浪,震撼整个AI业界。


OpenAI在官网上架设了Sora专页,讲解该模型的运作原理,并展示40多段由Sora产制的演示影片。(图片来源:翻摄OpenAI官网)


利用Sora所生成的东京女子街头漫步短片,输入AI提示词为“A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.”

(图片来源:翻摄OpenAI演示影片)


   Sora的厉害之处在于,所输出的1080p影片呈现出细腻精致场景、生动角色表情,并加入复杂运镜手法,产生有动态视角变化的画面;当拍摄角度变换时,影片人物和事物皆能在立体空间中连贯移动。


   即使影片中的人物与事物被挡住或移出画面,Sora仍能保持这些人与事存在于画面范围以外,当拍摄视角转换到能看到时,就会将这些人与事重新呈现出来,并保持外观和风格一致。科技网媒《Wired》盛赞,Sora生成的影片非常逼真,这是从未在其他AI模型作品中看过的真实感。


Sora生成的模拟航拍影片:一对情侣在樱花道上行走,航拍机紧随其后拍摄,视角产生多样变化,而画面一直保持着连贯性,影像逼真流畅。(图片来源:翻摄OpenAI演示影片)


生成影像符合现实世界物理定律


   OpenAI表示,Sora能够深入理解人类的语言,不但能准确地呈现提示词所描述的各种事物,还可知晓这些事物是如何存在于现实世界,并要遵循哪些物理规律。英伟达(NVIDIA)资深研究科学家Jim Fan以咖啡杯内海盗船大战的Sora影片为例,指出AI模拟两艘海盗船在杯内互相追逐和对战的场景,呈现出符合流体力学原理的咖啡液体流动。因此,他直言Sora是一个以数据驱动的物理引擎,能够仿真真实或虚拟世界。


Sora生成的咖啡杯内海盗船大战短片,对咖啡液体流动与光影变化处理均十分逼真,完全符合物理规律。(图片来源:翻摄OpenAI演示影片)


   不过OpenAI坦承,Sora尚有不少待改进之处。它无法完全模拟复杂场景里的物理规律,而且不太理解具体事例的因果关系,例如影片中人物吃了一口饼干,惟饼干却依然完整无缺。再者,它有时会搞混了提示词所述的空间细节,譬如左右不分,并且难以精确呈现随着时间变化的事物。


降影片制作门槛人人皆可做导演


   尽管如此,Sora已大幅降低影片制作的门槛了。就算阁下没有拍摄器材,又不懂得拍片和剪片技巧,只要用文字写出你的想法,Sora即可将之转化成短片,迈向“全民皆可做导演”的黄金年代。市调机构ABI Research高级分析师里斯·海登(Reece Hayden)认为,Sora这种影片生成模型将对数码娱乐产业造成重大影响。


   若说Sora真正威胁到电影制作行业,可能还有一段很长的路要走。因为即使输入完全相同的提示词,AI每次生成的影片内容总会有所差异,所以不可能简单地把120段1分钟短片拼接起来,就可以合并成一出剧情和画面连贯的电影。


YouTuber担忧被Sora完全取代


   观乎Sora可以生成1分钟短片的能耐,它很有机会成为颠覆社交媒体平台的新工具。近年Instagram Reels、YouTube Shorts、TikTok等短视频格式相继冒起,成为年轻网民最喜欢在社交媒体上收看的新类型内容。现在有了Sora,任何人都能用AI技术生成高质短片,这将进一步加快短视频的普及。海登指出,未来针对不同受众的客制化短片,将会在不同数码渠道上广泛传播。


   然而,这样却令不少YouTuber和内容创作者担忧,自己可能会否被AI完全取代。拥有逾1,800万名订户的科技YouTuber马克斯·布朗里(Marques Brownlee)表示,看到AI正在做他的工作,让他感到恐惧,并觉得受到威胁。


OpenAI正开发AI影片检测工具


   更严重的是,AI愈来愈逼真的影片生成能力,可能会令以深伪(Deepfake)技术制作的假影片变得更多,兼且更难以辨别。有鉴于此,逾400名来自学术界、政界、演艺界的知名人士联署一封公开信,呼吁加强对深伪制品的监管,包括:要求AI公司预防其工具被用来生成有害的深伪成品、把深伪儿童色情制品全面定为犯罪、以及对任何故意生成或促进散播有害深伪作品的个人判处刑罚。


   正因为Sora可能会带来巨大的潜在风险,所以OpenAI只将该模型定为研究预览版本,暂未全面开放给公众使用。除攻击模拟团队(Red Team)与有关AI专家外,目前Sora仅提供给少数受邀艺术家、设计师与电影制作人试用。


   OpenAI现正积极开发能够检验AI生成影片的工具,并拟在Sora输出影片中加入C2PA后设数据(Metadata),以便查证影片生成来源和相关资料。同时,Sora也会像图片生成工具Dall-E般拒绝产制暴力、性或仇恨内容,以及名人相关影像。由此可见,OpenAI应该会在做好防范措施后,始会全面推出Sora服务。


   《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。

上一篇Google推开源模型Gemma,为AI竞争添新变数
下一篇OpenAI自己造AI芯片!奥尔特曼拟集资7兆美元建厂房
评论
我来说两句1