山东商报·速豹新闻网记者 邹通
AI又“进化”了?OpenAI近日发布了创新性文生视频模型Sora,画面效果炸裂,再次在全球掀起了人工智能关注浪潮。然而,因此引发的讨论也不少,Sora横空出世,意味着“新视界”即将到来,但随之而来的,它将带来哪些新的市场机遇又会制造哪些风险?其引发的“抢人类饭碗”焦虑将有何影响?都值得关注。
Sora到底是啥?
所谓“文生视频”,就是可以根据输入的文本内容自动生成相应的视频。这种技术利用深度学习和自然语言处理等技术,将文本转化为视频中的图像、音频和动作等元素,从而生成一段具有故事情节的视频。文生视频技术可以应用于多个领域,如教育、广告、娱乐等。在教育领域,文生视频可以将教材、小说等文本内容转化为视频,帮助学生更加直观地理解和学习。在广告领域,文生视频可以根据广告文案自动生成广告视频,提高广告制作效率和效果。在娱乐领域,文生视频可以生成各种有趣的视频内容,如动画、短视频等,为用户提供更加丰富的娱乐体验。
日前,美国OpenAI公司发布的全新的Sora文生视频模型,可以根据用户输入的文本指令,一次生成60秒的长视频,且视频的画面精细度、流畅度超越了以往的文生视频模型。值得一提的是,在Sora发布之后,有博主对当前市场上其他主流文生视频产品做了对比评测,在对Sora、Pika、Runway和StableVideo四个模型输入了相同的提示词后,Sora在视频生成质量和时间上均对同行“降维打击”,其更加清晰连贯、符合描述。
在OpenAI官方的技术报告中,对So-ra的定位为“作为世界模拟器的视频生成模型”。有多位业内人士接受采访时谈了对Sora的看法,“之前几款主流模型生成的视频时长仅在20秒以内,Sora不仅能够深入理解用户提示,还学会了物理世界的部分规律,比如:一个人吃汉堡后会留下咬痕、火车车窗上会产生逼真的倒影,Sora还可在单个视频中设计出多个镜头。”华金证券计算机首席分析师方闻千说。360集团创始人周鸿祎表示,以往文生视频软件都是在2D平面上对图形元素进行操作,可以把视频看成是多个真实图片的组合,并没有真正掌握这个世界的知识。这次OpenAI利用它的大语言模型优势,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是“真实”的。
大众自制视频时代将来?
Sora的真正魅力不在于让人眼前一亮的技术力和表现力,而在于它对人类创造力的促进作用。正如蒸汽机、发电机的发明会淘汰掉陈旧的生产方式,“文生视频”模型的出现同样会取代大量重复性的、缺少技术含量的工作,更加凸显IP的价值,让内容创作者更充分地发挥天马行空的想象力。Sora横空出世,标志着一个里程碑式的进步。未来将深刻改变短视频、游戏、娱乐影视、动漫、广告营销、新闻社交等内容制作领域。
但即便如此,Sora还存在技术上的缺陷,比如混淆左右,无法理解因果关系等。迫不及待地推出仍在开发中的不完美模型,更像是用一出大型广告秀吸引更多融资的高招。也有分析表示对Sora潜在的问题和风险而担忧,一方面,“文生视频”模型需要海量的训练数据来进行学习,这就会带来版权问题;另一方面,和所有其他人工智能工具一样,Sora过于逼真的视频表现也会带来对于伪造和传播虚假内容的忧虑。如何在未来的实践中保证数据安全、规避风险,确实值得关注。
有相关学者指出,大众生成3D视频的时代或将不远。观点认为,人类历史上,创造“平行世界”往往需要投入很多智力、人力和财力。第三次工业革命后,计算机建模技术开始用于创造“平行世界”,但成本投入方面并没有降低,这是一个资金、技术和劳动力密集型行业。然而Sora发布后,历史将要改写,因为世界建模技术实现了傻瓜化——人人都可以通过输入提示词,构建梦幻世界。
目前,Sora暂未公开使用权限,仅对一部分视觉艺术家、设计师和电影制作人开放。有分析认为,随着技术的进一步成熟,Sora将会推向所有用户。Sora预示AGI(通用人工智能)将加速到来,其后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响。
豹评
机遇与风险并存焦虑为时过早
Sora的出现,不但引起外界的广泛关注,相关行业内也引发震动,“新视界”或将开启。有人担忧,Sora会不会在不远的将来取代大量的劳动力,甚至抢走人类的“饭碗”?这并非“杞人忧天”,要知道,近日大火的游戏《幻兽帕鲁》的开发团队仅有4人,市场猜测该团队使用了AI生成技术制作游戏角色,以节省成本。这意味着,开发制作游戏的门槛可能会被进一步降低。
Sora目前产生的轰动效应,和当初的ChatGpt十分相似。此前ChatGpt一度引发类似担忧和焦虑,如今看来,为“Sora取代大量劳动力”而焦虑,大可不必。Sora技术目前还处于较为初级的阶段,很难做到完全取代人类,况且,要想得到质量更高的视频,并不是简单几个提示词就能完成的。而从媒体报道来看,OpenAI首席执行官山姆·奥特曼正与投资者洽谈,筹集资金用于研发,具体数目可能高达5万亿至7万亿美元。可见,AI技术的复杂性意味着需要大量金钱和算力资源投入。
此外,Sora引发的潜在风险也是未来可能制约其发展的一项因素。必须明确,如果一种媒介技术被大量用于违背公序良俗的用途,那么这种技术和技术背后的公司很难活得长久。将技术用于“正道”,才符合社会和政府的要求,也是科技企业为了长远发展的内在需求。
值得一提的是,有分析指出,Sora强大的文生视频能力将快速推进应用端商业化落地、拉动产业规模,进而传导到上游算力基础设施,算力需求将再次迎来爆发。据此,可以预见,高性能计算机和计算芯片的需求将进一步释放,诸多相关行业可以尽早谋篇布局,至于在未来谁能喝到这口汤?也是值得关注的焦点。