蓝海情报网

快手可灵战略提级,视频大模型混战时代来了?

蓝海情报网 708

快手可灵战略提级,视频大模型混战时代来了?

文:互联网江湖

作者:刘致呈

有一阵子没聊AI了,趁着最有时间,有点看法想跟大家交流。

DeepSeek诞生之后,各个行业朝气蓬勃,百度把DeepSeek做进了搜索,腾讯把大模型做进了微信,各种行业,各种产品都用上了语言大模型。

一场AI革命,已然发生了。

前十年,移动互联网时代掀起的流量革命,一开始是图文,然后就是视频。十年之后的今天,快手、抖音成了全网最大的注意力黑洞,虹吸着流量和以流量为生的业态。

往后看十年,AI亦如是。

DeepSeek改变了图文交互、语言交互,今天的AI正在改变视频交互。

快手可灵战略提级,视频大模型混战时代来了?

从AI生文、AI生图再到大模型生成视频,这一进化符合逻辑,也顺应历史周期。问题是,新的周期之下,这场AI革命将由谁主导?

快手、抖音:天下英雄惟使君与操耳

今天的视频大模型玩家,大概有这么几类:

第一类是巨头。

比如,腾讯混元视频大模型、阿里通义万相。

巨头布局文生视频,本质上是布局入口,同时为未来业务端的需求做技术储备。

腾讯做文生视频,可以给视频号做能力储备,一旦有了真正需求,现成的模型就能拿来用,阿里也是一样,淘宝越来越内容化,文生视频这个能力是留个后手。

符合大厂一贯的做派,我可以不用,但每个入口都要布局,每个能力都要面面俱到。如果赛道里有人跑通了,那就砸资源跟进。

语言大模型上,腾讯不也是观望了很久,直到DeepSeek出世,直接整合进微信,摘了最大的果子。

第二类,是AI公司。

比如,商汤科技的V-ME,科大讯飞的讯飞绘镜。

这些AI公司,囿于自身的实力以及资源限制,能够在文生视频上投入的资源并不多,更多的精力其实还是在自身业务。做大主营业务是核心KPI。做视频大模型,陪跑的概率很大。

第三:短视频平台。

短视频平台核心就两家:快手、抖音。

先来说快手。

最近,市面上有这么一则消息:快手成立了可灵 AI 事业部。快手高级副总裁盖坤担任可灵 AI 事业部负责人,AI战略在快手内部提升至最高级别。

这动作是什么意思呢?

枪擦完了子弹上膛,玩儿真的了。

快手可灵AI增长是很猛的。今年2月份可灵 AI 累计营业收入已超过 1 亿元,今年前三个月,可灵AI营收超过了2024年总和。商业化这块儿,可灵AI很有爆发力。

快手可灵AI生成的视频质量很高,可灵AI2.0的产品能力已经追平甚至部分超过Sora。目前定位于生产力工具。

生产力技术是最容易变现的。

AI的路线上,快手走的是当年微软走过的路子。

AI这样的技术,就是新时代的office,当年微软靠着office 、Windows挣得盆满钵满,就是因为软件作为生产力是一种刚需。

视频大模型,只有先把生产力变现的逻辑跑通了,才能支撑后续源源不断迭代。所以,快手内部会上,盖坤也提到要优先保证模型效果,聚焦professional creators。

好产品是不缺用户的。

可灵AI这一亿的营收背后是 2200 万用户,1.5 万开发者和企业客户贡献的。后续还会有多少付费用户,且看快手后续财报。

只是,这一个亿就像是一个标杆,后续视频大模型能不能触及商业化这个条线,一个小目标就是个重要的参考系。

与快手不同,抖音走的是另一条路。

最近,豆包大模型团队组建了AGI 长期研究团队,还发布 Seaweed-7B 模型,号称能在25秒内生成高质量视频。可见在视频大模型上,抖音还是聚焦技术。

相比快手可灵AI,字节即梦在视频生成效果上略显粗糙,但体验门槛低。这反映出团队还在继续打磨技术产品,并希望通过降低门槛,来把流量池做起来。

字节的优势是用户流量池很大,做AI也是复制过去成功的路径。当年抖音做起来,也是走的这个路子。

如今APP工厂的优势还在延续。

说穿了,字节做即梦,重点是铺量,内核其实还是互联网产品,并非生产力逻辑,而是游戏运营逻辑。

策略上即梦先免费,让99%的轻度用户免费爽,然后反馈数据优化版本,用1%的重度用户买单。

是不是跟某些游戏策划的脑回路很像?

这个策略最大的一个好处是,一方面版本可以继续升级,又有足够的用户交互反馈数据样本来优化模型,另一方面也能留一点商业化的火种。

但游戏运营,本质是个 UGC的路子。这个策略能不能走下去,关键就在于用户活跃度能不能维持下去。

维持用户活跃度,其实还是得靠产品,产品好用自然就不缺用户。所以怎么提升技术,产品能力,是即梦眼下最需要解决的问题。

生产力逻辑也好,游戏运营逻辑也罢,两家路线各有优劣,就看谁先能跑出来了。

生成式AI对于短视频的意义,如同自动驾驶对于网约车平台的意义。这个业务做好了,与快手、抖音主业是有强大的协同效应的。

这种协同效应,可能会进一步改写流量商业的底层规则。

视频大模型,能不能革流量成本的命?

除了短视频平台本身,视频大模型,还能颠覆很多。

从落地的角度来看,未来视频大模型的确有两个重要的方向。

一个是专业化方向。

视频大模型,最直接的一个价值就是降低影视的生产成本。

Sora当初之所以备受关注,是因为人们颠覆了人们对于视觉生产力的认知,觉得它能够颠覆很多行业的生产方式。

比如,Sora会改变整个好莱坞的成本结构。

一项新的技术、产品,先打透专业领域是一种普遍的规律。历史上,很多伟大的互联网产品,都是从B端到C端,比如最早的聊天软件MSN就是应用在商务端,到后来的QQ、微信普及,才扩散到C端。

当文生视频大模型强到一定程度,就变成了魔法,就像魔幻小说里写的,人人都有了言出法随的能力。

一句话变成了一个镜头、一段视频,这会革了摄影师的命。

比特币有个口号:code is law。代码即法律。换到视频生成大模型上就是:word is movie。

所述即所见。

放在影视行业里,所述即所见是很有价值的。

爱奇艺的自制剧有声有色,但问题就是自制剧相当耗费资源,所以成本一直是个问题。

你看爱奇艺年报,2024年爱奇艺总成本为219.5亿,内容成本就有157.1亿。同年净利润同比暴跌60%。天眼查APP融资信息显示,爱奇艺2018年上市,直到2023年度净利润才转正。

快手可灵战略提级,视频大模型混战时代来了?

这充分说明一个问题:好内容,是要花很多成本打磨的。

《哪吒2》,比如《流浪地球》系列,成本都不低。原因就在于整个电影工业化成本的问题。我们的电影行业缺乏工业基础,好内容的制作成本还是太高了。能解决这个问题的,目前看来只有AI。

在内容行业,降本这件事儿,是能解放创造力的。

人类历史中,铁器的大规模使用降低了农业生产成本,人活着的成本降低了,才有了诸子百家、才会有文艺复兴。

这几年,影视行业很惨,大的影视公司都在降本,从降本来看,视频大模型是个不错的方案。成本降下去了,好内容多了,影视消费也才能起得来。大家周末更愿意进电影院了,也能带动其他服务消费。

至此,服务消费的正循环就有了。

专业化方向之外,视频大模型的另一个方向是大众化。

百度有一个产品叫秒哒,这个产品可以通过自然语言描述需求快速生成应用程序,门槛很低。这个产品对于编程来说是划时代的,有了这个产品,普通也能变成了程序员。

对于今天的内容行业而言,文生视频大模型也是划时代的。这意味未来的内容创作者数量可能再次井喷,流量基础设施发生改变。

做内容行业这么多年,我有这么一个感觉:内容这个东西,本质上是一种注意力货币,是会发生通缩的。也因此内容越繁荣,供给越多,实际的单流量成本越低。

从图文、到视频,各种各样的内容暴增,单位流量成本是在一直降低的。

比如说,公众号时代,图文单位流量比搜索流量便宜。于是,微商崛起。短视频时代,视频平台单位流量比图文要便宜。然后直播带货崛起。

大模型时代,内容供给成本降低,创作数量一定会再次暴增,到那时候,生成视频的单位流量会不会更便宜?在此基础上会不会有新商业形态?

我认为这些都是可以期待的。

视频大模型的价值,一方面在于改变成本,另一方面也在于改变人们创造信息世界的方式。

人们创造信息世界,主要靠三种方式:码字,代码,拍摄。

前两种已经被大模型颠覆,现在正经历的是第三种。

现在的互联网上的大部分视觉内容,要么拍照片,要么拍视频上传,太没有效率了。不符合互联网的基本逻辑:极致的效率。

AI天生就是效率机器。

幻方量化为什么能孵化出DeepSeek,因为金融本身追求极致效率,这与AI的基因是相契合的。

不能否认,内容创作是需要创意的,创意这个东西,AI还不能完全替代人类,但有了这个效率工具,我们一定能加速进入下一个视觉互联网时代。

大模型生成视频,只是推动互联网向下个时代变革的第一步,走出了这一步,也许离真正的元宇宙互联网就不远了。

最后,行业格局未定,视频大模型仍有变数。今天的可灵AI、即梦、通义万相,一如当年的微信、飞信、来往。

图文AI领域,过去以为大家都以为最后的王者会是文心一言、会是ChatGPT,谁承想最后跑出来了DeepSeek。

DeepSeek颠覆了很多人的认知,证明大模型赛道,小而精的路线跑得通。那么问题来了,未来视频大模型,会不会出现像DeepSeek一样的Gamechanger?

最终,一切都要交给时间去验证。

看完觉得写得好的,不防打赏一元,以支持蓝海情报网揭秘更多好的项目。

标签:

ad2

推荐内容