我在MovieFlow的123天
今年6月的某个周末午后,阳光辣眼,我第一次来到高碑店某个文创园的MovieFlow办公地,与Wei和Kai见面。
这是一个很有独特气质的场地,电影剧作的招贴画挂在走道两侧,半百平米的空间内有个手办柜矗立着,Wei把我带入到他的小房间,地上堆满了碟片,与硕大的显示器错落相伴。
我对Wei说,窗外能看见一趟一趟的城轨火车,但这里却异常安静。Wei回应道,也许是香薰让炎热安静了下来,也许是这房屋的风水吧。
我们的交流在这样的开场下延伸着。Wei在过去十六年是一个电影人,在电影圈的起步之作是从和姜文导演的《让子弹飞》合作开始。他不厌其烦的接受着我对电影行业的好奇和拷问。凭借着对内容的一生热爱,Wei在大学就努力做着无限靠近电影的事,那个年代对电影热爱的人大多从做广告片和宣传开始,华谊、博纳如此,郭帆和饺子也是如此。
Wei一直是一个理想主义者。他拿过华谊和奥飞的数亿元融资,拍过数十部电影。但他不是一个在票房上施展过多阳谋的人。我对Wei说,你过去是不是比较爱拍文艺片?Wei说,这些都属于商业片啊。他津津乐道的讲着他手里曾握有的故事,那些本可以拍出更好的片子的故事。内容,永远是最能让Wei去兴奋交谈的方向。
但让Wei勇敢抛下电影的原因,并不是电影,而是环境。大的环境和小的环境。过去十五年,电影市场上分别经历了哪几波投资电影的资本玩家?他们为什么依次出现,又循序都不再投了?这是一个不好深究的话题。
Wei在十年前上过联想之星举办的“联想总裁班”,和一帮搞互联网的做起了同学,班里的人包括零一万物的CEO马杰、七牛云的创始人许式伟等。我对Wei说,我看出来了,你是电影圈里最不像电影圈的电影人。你有选择性的在关注一些行业边界的事,你说你对内容一往情深,但你更想干的是一个能被时代推着走的内容,而不是封尘在某一个间轴里的内容。你接受新的事物,也能打破自己。
无论是主动打破,还是被动打破,一是得感谢时代,二是要感谢自己的敏感,还就是看你自己相信什么。很多电影圈的人不相信AI,甚至Anti-AI,但Wei拥抱AI。好的内容是在生产力之上有生命力的内容,而不是逃避生产力的内容。
Wei说,一开始,我只是想让AI更好的帮我表达和创作电影,包括漫剧,我手里还有很多动漫IP;但后来,我觉得这事小了,我要在AI之上去建立属于这个生产力时代的内容平台。
这怎么听着就不像电影圈的人说出来的话。我说,你要做AI时代的抖音,不浪费时代。Wei说,唉(第二声),应该叫AI时代的YouTube,而且是有Netflix质感的YouTube,因为AI可以让每一个人仅凭idea拥有这种表达和试听的质感。
这个对话发生在今年6月,距离今天的第123天。比Sora APP上线要早近4个月。
在过去的123天里,我胖了10多斤。几乎每天最晚的一段饭,都是陪着Wei和Kai在一天里最早的时候吃的——凌晨1点半,我们三人雷打不动的夜宵时间。
Kai是一个40岁的技术艺术家,曾是某大厂的技术高P,也是中国第一批agent开发者。一张圆脸加上自来卷的长发,让他看起来像美剧《生活大爆炸》里的Raj。
Kai非常善于解决agent开发的攻坚问题,但他对自己最得意的部分,却是其对审美的嗜好和追求。没有人会觉得这是一个40岁男人开发的产品,这是一个比看起来像20岁男孩开发的产品更酷的事情。
9月28日,MovieFlow在全球上线了。在上线后的50天里,我们只累计花费了1.5万美元的市场营销费用,却带来了近40万的注册用户和超过5万美元的收入,ROI高达3.3,国内用户占比不到1%,平均每天都有1.3万个全球用户在制作视频,平均每条用户生成的视频内容长达2分钟。
怎么做到的,这里面有一些我们日日夜夜的思考。
首先是定位。MovieFlow肯定不做底座模型,这不是我们的基因;但做视频agent应用,我们首要满足谁,决定了我们需提供什么样的服务,并且作为产品服务的提供者,又是符合我们基因的。
Wei说,我过去是一个电影人,更本质上是一个靠内容讲故事的人,我的愿望就是要让各行各业、普普通通的人,都能靠idea和想法来最低门槛的创作内容,或娱乐自己、或用于商用、或记录人间。
为什么过去会有几大电影公司巨头的存在?核心原因是,创作电影是有门槛的。但每个人都有自己不同的故事,每个人也都有自己想表达的想法,这是无门槛的。如果,AI作为一个低门槛的工具,那么用AI创作内容这件事,理应是平权和普惠的,它就不应该还是服务一小撮人来创作的事,也不应该仅仅服务目前搞AIGC的手k党。
这就意味着,MovieFlow的定位不能只是一个workflow。因为workflow的人群是小B端做片子的专业或半专业人士,他们就像在AI发展初级阶段的4A公司,用当前传统行业报价和AI制作成本的差价来赶活儿。
但MovieFlow是要打破它,如果你相信AI模型底座的未来能力和发展速度,那么你要做的就是让各行各业的人能直接把你的产品用起来,而不是看到客户去找4A公司来交付给用户。
如果要服务各行各业的人,那就要考虑产品的易用性,以及他们使用这类产品的真实诉求。
Wei说,张一鸣最开始做抖音的时候,知道什么是吃播、团播么?
Kai说,是呀,真实诉求,这个咱们也没法闭门造车;先从产品的易用性开始,先把易用性搞出来、丢出去,看看第一批用户怎么玩嘛。
那如何做好易用性?很多AIGC的从业者使用底座模型,生成出来的一个分镜只有8秒、10秒,一个接一个的生成不同的分镜头,经过视频修图、剪辑之后,再把各个不同生成的分镜拼接起来,形成一个连贯、可观看的叙事短片。但这个过程是普通用户难以企及的。
Wei说,用户至少需要的是:输入一个概念,它就能有叙事性和故事性的影像跑出来。等AI的市场教育更成熟了,我们再推出操控性更强的产品来给用户作选择。
这意味着,它至少应是一个多分钟级的一次性生成的产品,并且支持对用户输入概念的脚本语言扩写,以及如何能激发模型的边界能力,和用不同的底座模型来搭配组合,生成出更好看、不同风格化的影视级镜头。
这里还有一个关键点,MovieFlow是以文生视频作为切入点,还是以图生视频作为切入点?我们不是做视频模型的聚合站点,我们是为用户提供一站式服务。在今年6月的那个时间点,这里便会有抉择。
Wei说,广大用户不是专业用户,他们的起点来自于想表达一个不那么完整的概念,而不是为了通过图片去强调一致性。在这个前提上,叙事性和娱乐性大于一致性上的小瑕疵。
此外,相对于海外的视频模型更多是文生,国内视频模型以图生作为优势。如果我们以图生为主,在国内模型巨头的势力圈子里做应用,恐怕日后也是凶多吉少。但谷歌在今年5月新推出了文生视频模型Veo,在海外切文生视频,至少还有很大红利。
Your Idea. A Movie. In Minutes.成为了我们的宣传语;以文生为切入,第一天就做海外,成为了我们的决定。
早期创业,定位要清晰,产品功能不求丰富但求精准。带着这样的思考,在今年7月,MovieFlow迎来了它最早阶段的产品雏形,并在两周时间内获得了一家美元基金的橄榄枝。
在接下来的8月和9月,MovieFlow的产品核心是如何把易用性做到极致。
围绕上述这一点,一是,我们做到了视频耗时的大幅提效。今年7月,我们耗时40、50分钟才能生成出3分钟的短视频;到了9月,我们只需要不到10分钟就可以生成长达6分钟的短视频,并且能做到几乎不抽卡。
其次,我们做到了同一个分镜下不同agent和不同模型底座的调用。Kai带领技术团队攻坚了很多工程化的难题。
其三,在文生视频的主输入框之外,我们还开发了数十个有趣的垂直模版。包括广告类模版、教育类模版、音乐类模版、文库类模版,以及一些非常tricks、节假日和热门影视类的模版。
Kai说,易用性是我们“看得到”的追求,而“看不到”的追求是什么?是源提示词体系的打造和沉淀。Kai非常深信Llya Sutskever的一句话——“大模型内部蕴含大量未被完全激发的智能结构。”而激发它边界的钥匙便是提示词能力。
在移动互联网时代,字节跳动以智能推荐引擎为基石,打造APP工厂。抖音只是其体系落地的一个产品结果。即使没有抖音,它也会长出其它的超级APP。而在AI时代,MovieFlow要以源提示词体系为能力基石,后续平台上的每一个产品玩法、模版,亦或其它长出来的东西,都以调用源提示词为基础,并通过场景和用户“上下文”来丰富agent系统的源提示词。
在构建提示词方面,我们也遇到了一个组织力的思考,是像其它AI公司那样一味的去卷技术工程师?还是发挥行业里有影视背景且学习能力强的人,在CTO的带领下来组建提示词团队?
毫无疑问,我们选择了后者。Kai说,谷歌、OpenAI只是提供了一个摄像机,而我们的提示词开发和agent是要作为不同的导演,用户用我们的产品,就是在平台上根据不同需求来选择不同的导演帮他们完成他们想要的片子。谷歌知道什么是周星驰风格的镜头语言么?但我们得给用户提供。因此,MovieFlow必然需要一定影视know how的人才来成为我们的同志,随着用户生成视频数量的提升,MovieFlow的提示词能力会像滚雪球一样越来越强。
易用性之后,就是要把产品丢出去看一看。9月28日,MovieFlow全球同步上线。
为了更好的观察用户行为,我们几乎没有做任何主观性的用户引导。KOL+用户积分裂变的组合拳是我们破冰的开始。在第一阶段,我们只找北美地区说英语的KOL来开启一定的声量和势能。
通过起初的几个KOL,我们主要是让大家知道MovieFlow是个什么,有什么功能?其它的,先一律不说。
50天内,MovieFlow的平台已经累计超过100万条短视频,用户用各种叙事来创建故事内容的占比为40%、广告片和有商业倾向的宣传片占比20%、动画动漫相关的占比15%、教育类占比10%、meme类占比10%。
在中东的一所9-12年级的女子学校,一位当地的教授为学校的老师们举办一场关于MovieFlow的培训研讨会。
也有一所土耳其1-12年级的学校老师在用MovieFlow生成给孩子学习英语的教学短片。
有一位美国用户生成了一个身患癌症的光头女孩在《美国之声》(The Voice)上歌唱并获得导师转身的感人故事。
也有一个讲述名叫奥尔马的男孩进入了一个有三扇门的房间,每扇门都有不同的颜色来代表不同的世界;这是一个给4-7岁轻度和中度学习障碍的儿童观看的短片。
还有一名女孩把自己在战乱中Gaza的旅途用她的第一视角生成了故事。
像上述的例子还有很多。通过产品力的易用性和用户裂变,MovieFlow迅速的建联了一张遍布200个国家和地区的用户网络,排名第一的国家和地区仅占比12%。我们每天都知道不同地区的用户在创建什么样的故事。Wei说,这种感觉比电影发行酷多了,过去你想把一部电影在一个多月内发行到全球200个国家和地区,这几乎无可能性。
通过运营手段,我们把高频用户、付费用户和做了出众视频的用户尽可能的导入到WhatsApp的社群里,我们希望用一种更近的方式能倾听他们的声音,和他们成为朋友。
在这个过程中,我认识了从来不用智能手机,只用PC上网的英国用户;也认识了不断给我们写产品分析报告的一位法国中年朋友;还包括能在MovieFlow平台上一天就生成50条视频的印尼小哥。
Wei每天晚上都沉浸在后台看着用户做的各种片子,并喜悦于用户在YouTube上主动分享的来自MovieFlow生成的视频,目前播放量已累计百万。Wei说,我现在已经能强烈的感觉到我们的路子是对的——先做到极致易用性,再丢出去给用户,不轻易做预判,有啥问题咱们再迭代嘛。
的确是这样的。过去在VC行业从业9年,我特别能理解VC的逻辑语言,你到底要服务哪个国家和地区,你到底是服务哪个垂直领域?广告片、动态漫、教育,都有专门的AI公司在做,你靠什么?
但这个问题往往容易让人忽略的一个前提是——你所处的历史时期是一个已经相对成熟的产业环境?还是一轮科技爆发的开始?
当三个PayPal的早期员工在2005年的情人节创办YouTube的时候,他们不会想说我只做动漫亦或是哪个其它的视频内容细分。他们只会因为Flash技术的成长红利、SNS生态和UGC文化的起势去做全内容分类的视频。
主打艺术短片的Vimeo在早YouTube一年之前就成立了,但它并没有活得很长。主打半专业编辑的Metacafe比YouTube早成立两年,却也没有活到最后。
在每一次科技爆发的开端,作为创业者,你更需要做的是靠尽可能多、尽可能丰富的内容来让用户沉淀下来,内容最好是你的八爪鱼,多一些爪能沉淀更多的用户。你不要担心哪些是不属于自己的用户,因为科技爆发会带来巨大的媒体效应和产生全新的事物,任何用户都会想要尝试来用。因为你是新的,用户也没有太多其它同类选择。而如果你今天还是做没有被AI提效的移动互联网产品,那你的机会才是必须要去找到细分。
今天很多的VC在过去6年饱受移动互联网红利消退的影响,他们的思维模式还偏向于通过细分来找出路的框架之中。但这个思维模式不应该在当下AI爆发的早期阶段继续延用。
想一想豆瓣,阿北(豆瓣创始人)常常把哪些人不是我的用户挂在嘴边,因此导致豆瓣错失了移动互联网的重大机遇。我在2013年第一次和张一鸣交流,他从来不说哪些不是今日头条的用户。要知道,豆瓣和今日头条在当年都以推荐引擎作为核心竞争力。
Wei说,这趟旅程,我们只需要坚守“不做什么”——在视频底座模型能力边界之内的事情,我们不做。我们不是科学家,不干拿着VC的钱去PK模型巨头的事。而激发模型潜力来帮助用户玩起来的事,不必给自己设限。
11月28日,我们灰度上线了“混合生”和全流程控制的功能。伴随用户数量的milestone达成,我们开始在易用性的基础上来提供用户分层的需求,用户可以通过不同图片锁定人物、场景、道具,并结合文生视频来一次性生成1-10分钟的叙事短视频。
Kai说,“全流程控制”不是要回到workflow的老路,而是在“自动挡”的基础上开放一些“手动挡”在局部的玩法上,并且,这个过程会伴随着用户和Chatbox虚拟人的交流,你如果不会开手动挡,它能一步一步教你,怎么拍会让片子呈现更好。
Wei说,我们当然不满足于只提供工具,这正如在今年6月时所达成的共识——AI时代一定会跑出AI native的社区。
一是,AI能极大效率的生产N倍于移动互联时代的短视频内容,AI内容供给会从原有的移动互联网平台大量的溢出;
二是,今天AI解放的是普通人的生产能力,他们并不是原来的视频内容创作的既得利益者,这些新的用户画像会带来新的社区文化;
三是,AI Videos具备新的技术交互的玩法,比如,MovieFlow马上推出的基于用户作品的“无限下一集”、用户拉用户来CP拍戏、和名人的数字形象一起拍等等,这些体验在传统的短视频产品上得不到充分满足。
我们的判断是,基于AI Videos的全新的技术交互的特性,AI native社区的增值服务收入方式会是移动互联产品时代的很多倍。因此,我们有底气相信,现在AI应用的收入并不是我们要放在首位来考虑的。
此外,和硅谷在当前特别看重ARR不同的是,美国的AI创业以infra居多,而华人的AI创业以应用居多。如果一个infra不能体现收入,那它的价值可能确实不高,因为infra没有网络效应,一个客户就是一把铲子,但AI应用并不完全是这样,你得先让用户爽起来,再去考虑在何处去收用户的钱。
也不必过分担心模型巨头自己做应用。谷歌、Meta成功的C端应用都是靠外部收购而来的。模型巨头有自家模型的成本优势,但并不一定具备体验优势和社区温度。只有OpenAI和字节才是有产品基因的模型公司,而MovieFlow可以用所有家的模型。
Wei说,如果你只是一个没有温度的工具,那当然会担心被模型巨头吃掉。但MovieFlow要做一个有温度和调性的AI内容社区,并保持持续的创新。至少在现在,全球干AI视频的团队,都在卷技术,却没有我们这样的背景。如果社区能被流量和成本打败,不会有B站和抖音。腾讯当年做短视频晚么?Pony不重视么?我看未必。
随着今年5月谷歌视频模型Veo的问世,MovieFlow开始了视频agent的行程,如今已有半年。我们已经走在了这个位置,并小心翼翼的踩在了每一个节奏上。
Wei说,我知道还有很多人在质疑我,质疑为什么你能做好海外,能做好平台的人为什么会是你?但我们现在已经有近40万的海外用户了。我不知道下一个困难会是什么时候,但只要一个个的去解决就够了。我也不知道汤姆克鲁斯为什么在X平台上关注我,但有这层资源,就是优势。
本文来自微信公众号“内森聊AI”,作者:内森先生,36氪经授权发布。















