扎克伯格最近忙着在全世界“抢风头”。
前不久,开启“二次创业”的他刚向我们展示了十年磨一剑的最强 AR眼镜 Meta Orion,尽管这只是一款押注未来的原型机器,却抢光了苹果 Vision Pro的风头。
而在昨晚,Meta在视频生成模型赛道再次大出风头。
Meta表示,全新发布的 Meta Movie Gen是迄今为止最先进的“媒体基础模型(Media Foundation Models)”。
不过,先打个预防针,Meta官方目前尚未给出明确的开放时间表。
官方宣称正在积极地与娱乐行业的专业人士和创作者进行沟通和合作,预计将在明年某个时候将其整合到 Meta自己的产品和服务中。
简单总结一下 Meta Movie Gen的特点:
拥有个性化视频生成、精确视频编辑和音频生成等功能。
支持生成1080P、16秒、每秒16帧的高清长视频
能够生成最长45秒的高质量和高保真音频
输入简单文本,即可实现复杂的精确视频编辑功能
演示效果优秀,但该产品预计明年才会正式向公众开放
告别“哑剧”,功能主打大而全
细分来说,Movie Gen具有视频生成、个性化视频生成、精确视频编辑和音频生成四大功能。
文生视频功能早已成为视频生成模型的标配,只是,Meta Movie Gen能够根据用户的需求生成不同长宽比的高清视频,这在业内尚属首创。
Text input summary: A sloth with pink sunglasses lays on a donut float in a pool. The sloth is holding a tropical drink. The world is tropical. The sunlight casts a shadow.
Text input summary: The camera is behind a man. The man is shirtless, wearing a green cloth around his waist. He is barefoot. With a fiery object in each hand, he creates wide circular motions. A calm sea is in the background. The atmosphere is mesmerizing, with the fire dance.
此外,Meta Movie Gen提供了高级的视频编辑功能,用户只需通过简单的文本输入即可实现复杂的视频编辑任务。
从视频的视觉风格,到视频片段之间的过渡效果,再到更细致的编辑操作,这一点,该模型也给足了自由。
在个性化视频生成方面,Meta Movie Gen也前迈进了一大步。
用户可以通过上传自己的图片,利用 Meta Movie Gen生成既个性化但又保持人物特征和动作的视频。
Text input summary: A cowgirl wearing denim pants is on a white horse in an old western town. A leather belt cinches at her waist. The horse is majestic, with its coat gleaming in the sunlight. The Rocky Mountains are in the background.
从孔明灯到透明彩色泡泡,一句话轻松替换视频同一物体。
Text input: Transform the lantern into a bubble that soars into the air.
尽管今年陆续已有不少视频模型相继亮相,但大多只能生成“哑剧”,食之无味弃之可惜,Meta Movie Gen也没有“重蹈覆辙”。
用户可以通过提供视频文件或文本内容,让 Meta Movie Gen根据这些输入生成相对应的音频。(PS:注意滑板落地的配音)