西湖心辰蓝振忠:中国AI大模型很快可以赶上GPT3.5 | 解码数字新浙商No.91

数字经济发布·2023年06月06日 08:54
人工智能的发展很快会遇到瓶颈,不会一直高歌猛进。
西湖心辰
A轮浙江省2021-07
AI技术赋能的人工智能科技服务商
我要联系

很多人认为国内外在大模型方面的差距会拉大,我比较乐观,我感觉中美差距是在变小的。国内AI创业公司和有积累的研究团队应该可以比较快地赶上GPT3.5,并且会在后续的版本中逐步拉近和OpenAI的整体性能差距。 

——西湖心辰 蓝振忠

“我一直在寻找一种意义感,希望自己的研究能够真正帮助到别人。”卡耐基梅隆大学计算机系博士毕业后,蓝振忠在谷歌AI实验室就职,工作之余,他还组织了留学生抑郁互助团体。寻求安慰与支持的年轻人逐渐增多,蓝振忠开始思考,人工智能技术是否能降低心理疗愈的门槛,让更多人获得陪伴和帮助? 

2020年,蓝振忠回国创业,依托西湖大学的科研力量,创立西湖心辰。公司的第一个产品,就是AI心理疗愈机器人「聊会小天」,通过多轮对话,与需要陪伴的群体展开交流,抚慰他们的孤独。 

2022年推出的AI写作产品「FRIDAY」,AI绘画产品「造梦日记」,服务了用户更多日常需求,也沉淀了数据,让公司朝着“说中国话,画中国画”的多模态大模型目标进发。 

谈及“西湖心辰”的由来,蓝振忠表示,“心”诠释了业务方向。“西湖心辰想向内探索,读懂人的内心。像SpaceX,是面向浩瀚宇宙,向外探索。我们希望通过AI帮助人类了解自身和他人,才能更专心地探索浩瀚的世界。这场无止境的探索,希望抵达的是‘心辰’大海。” 

谈大模型

国内AI创业公司和有积累的研究团队应该可以比较快地赶上GPT3.5

章丰: 作为大模型专家,你如何看待近期大模型受追捧的现象,它的能力和成果是否被夸大? 

蓝振忠:从技术演进角度看,大模型的智能程度并没有增加,目前的AI离真正有自主意识的AGI(通用人工智能)还非常远。 语言模型已经有几十年的历史,大部分算法都是已有的。从2018年开始,我们在自监督学习方面有了较大突破。自监督学习,就是不需要通过人的标注,大量的原始数据让模型去学,这样就能把大模型做得特别大。 

从应用层面来说,本轮大模型确实给研究领域、商业领域都带来了影响,解决了很多问题。 

章丰: 据你观察, 国内大模型讨论的热度是否比美国更高? 

蓝振忠:国内几乎每天都有关于大模型的消息,越来越多行业需要大模型或垂类模型来赋能,在大模型基础上国内应用场景方面创新也会越来越多。 

章丰: 国内外的差异 背后是一种商业机制,还是行业文化的影响? 

蓝振忠: 两者兼有,商业机制比较规范,产业也具备合作的土壤和文化。国内所处的发展阶段不同,随着产业生态完善也会形成更清晰的商业规则、更高的商业互信。

充分竞争也有好处,你看中国的电动汽车走到全球前列也是充分竞争出来的。 很多人认为国内外在大模型方面的差距会拉大,我比较乐观,我 感觉中美差距是在变小的。 

国内AI创业公司和有积累的研究团队应该可以比较快地赶上GPT3.5,并且会在后续的版本中逐步拉近和OpenAI的整体性能差距。

目前已经有了大量论文、开源代码,都是可供我们学习的。有一个技术叫蒸馏,我们可以把ChatGPT作为老师去学习 ,这样我们学习起来是更快的。 因为大模型的优化会diminishing return(收益递减),开始训练时提升是非常明显的,到后面优化越来越难,会趋于平缓。

章丰: 你是一直持这观点,还是也发生过观念的变化? 

蓝振忠:肯定有迭代,我每天都在更新自己的认知。我最近也一直在“反思”自己,可能出于我对技术的了解,反而低估了技术壁垒的存在,觉得差距没有那么难以逾越和追赶。 

章丰: 大模型的商业转化,会比跨越技术壁垒花费更长时间吗? 因为其中还涉及到生 态,应用生态会是更高的壁垒。 

蓝振忠: 是的,现在OpenAI的生态正在建立起来。 生态建设需要投入大量的资源和时间,国内 的大公司在这方面会有一定优势。 

但在某些细分领域,比如西湖心辰的记忆功能和情感功能方面会有特色,我们和OpenAI优化的目标不同,搭载的应用也会呈现出不同的特征,差别会越来越大。

ChatGPT背后的大模型是高度中立的、知识性的、向外探索的。用户量级导致他们不能有偏向,只为用户提供更多知识。西湖心辰的大模型是向内的,我们希望它更像人、更理解人,用户怎么舒服怎么来。 比如你让ChatGPT跟你喝杯酒,它肯定说自己作为一个AI模型不会喝。心辰的模型会说,来吧,我们找一个很好的酒吧。 

谈心辰大模型

多模态数据量在可见的未来至少有2-3个量级的增加

以多模态大模型为目标,西湖心辰构建了“模型层——中间层——应用层”的产品架构。模型层包含西湖大模型、多模态图文模型,模型能力接近于GPT-3.5水平;中间层提供深入各个细分领域的模型,利用企业过往沉淀的数据充分赋能;应用层提供图片生成产品“造梦日记”、智能写作产品“Friday”和心理咨询AI助手“聊会小天”三款产品,覆盖文字内容生成、图片内容生成、聊天对话等领域。 

章丰: 大模型应用有很多方向,为什么西湖心辰选择定位到心理相关的领域? 

蓝振忠:我们很早就在研发对话系统,这个研究方向符合AI心理咨询的需求。另外也有我个人的原因,我是个“直男”,特别佩服别人察言观色的能力,对怎么沟通,怎么了解他人的想法比较好奇(笑)。 

章丰: 你们选了一个最难的方向,知识型的对话相对标准化,但是“人心难测”。 

蓝振忠:我们确实低估了这个领域的难度,心理咨询的非标化程度太高,很难量化评估,我们也一直在持续不断地寻找评估方式。目前心理咨询AI助手“小天”主要将用户的情绪表现等作为评估指标,做偏情感陪伴类的产品。不需要治疗你,实现陪伴也很好。 

聊会小天对话界面 ‍

‍‍ 章丰: 就像特鲁多医生的墓志铭,“有时去治愈,常常去帮助,总是去安慰”。

蓝振忠:我们的团队里有专业心理学背景的成员,在平台提供专家人工心理咨询,每个月有几百次的咨询量。这些咨询师会为团队收集语料、提供反馈。在很多情况下,机器比人答得好,心理咨询师需要高度集中,持续而稳定地输出是机器的优势。

章丰:机器可能打不出10分的“好球”,但能长时间保持在8分。除了AI心理,你们也布局了多模态的工具?

蓝振忠:ChatGPT还没有爆火的时候,心辰已经在文本与图像模态上同时发力,积累了超过百万的用户和大量的数据。我认为多模态数据量在可见的未来至少有2-3个量级的增加,所以心辰从相对更成熟的文字、图片领域入手,发布应用,以高效获得用户反馈数据。

贴合用户多种写作场景,心辰开发了80多种写作模板,能在几秒钟内生成原创作品,支持续写、改写、扩写等多种功能,包括公众号文章、营销广告或文案等,支持企业级定制。

用Friday生成小红书文案

造梦日记是去年新推出的AI绘画产品。点开网页或小程序,输入简单的文字,或提供可参考的图片,就能生成符合用户需要的新图片。未来我们还会持续地迭代算法。

章丰:AIGC领域正在经历一场爆炸式发展,目前市场上有很多AI绘画的产品,造梦日记有哪些优势?

蓝振忠:市场上的AI绘画平台大多基于开源模型研发生成,虽然能生成图片,但不够细致。比如,它可以生成人物或者动物的图片,但无法理解“小猫很难过”“小狗在挠头”等准确的情绪、动作细节。

用造梦日记还原周杰伦歌词中的意境

章丰:什么样的群体会成为西湖心辰最典型的用户?

蓝振忠:从C端来看,是需要陪伴的人。目前我们做的是AI+工具,在人们需要陪伴、写作、绘画的时刻持续展示它的功能。

近期我们开始积极和各类产业端展开合作。有自己垂类优质数据、大模型可以赋能的产业也会是我们典型用户。 譬如上周落地的垂类大模型FD,是和一家针对服装行业的AI公司知衣科技合作开发的,可以10秒左右就生成超过Midjourney效果图。 

引入垂类数据的大模型也会迭代地更智能,在特定场景有更强的针对性,可以充分发挥当前产业应用场景丰富的优势。

谈跨界身份

企业家和科学家高度重合,技术和商业的“蜜月期”到来

章丰:你现在适应企业家和科学家的双重身份吗?

蓝振忠:其实在创业早期蛮痛苦的,老实说,我只是不懂,就跳进来了。这也是我当时想找CEO的原因,得有一个角色在技术发展与商业转化间,帮助西湖心辰向 AGI 的理想更近一步。

章丰:据说你发了英雄帖找你的“Sam Altman”(OpenAI CEO),找到了吗?

蓝振忠:还没有,找到Sam Altman这样的人才很难。我们团队内部也调整了分工,我可以专心做技术,就没那么迫切。之前看到大家都风风火火进场了,我是有些压力的,但竞争也没想象中那么激烈。

AIGC让技术的商业转化率在不断升高,很多时候爆款的出现是因为技术的创新。 当技术优势足够明显,产品就会更有商业价值。 

章丰: 前提是技术必须要足够好。 

蓝振忠: 对。比如我之前对于Midjourney(AI绘画软件)是有一点误判的,我以为它作为一个工具性的产品,肯定很快会有人来颠覆它,或者说,技术会很快拉平。Midjourney团队只有11个人,做到1亿美金的收入,也没有融资。这波技术和商业化是贴得非常非常近的,基本上成熟算法立马就可以用。 

所以也可以说,企业家和科学家这两种身份其实是高度重合的,我只需要把我的技术做好,用户自然而然会来用。

章丰: 在技术变迁史上,可能会阶段性出现类似的技术和商业的蜜月期,当下就是一个很好的写照。这会给国内的商业生态带来哪些机会? 

蓝振忠:这轮会出现丰富的应用场景,现在是投资和创业的好时机。面对这种机会,大公司是迟疑的。 Google为什么不很快地接入ChatGPT?因为要改变已成熟的商业模式,而创业公司可以比较灵活地在模型层、中间层、应用层选择生态位。 

大模型公司除了把模型做得好,也要多关注应用场景,和生态伙伴一起打磨应用。目前西湖心辰将部分应用层交给了生态伙伴,我们也做一些应用,大模型需要应用的支撑和反馈来完成迭代,就像ChatGPT通过大量反馈,才迭代到GPT-4。

章丰: 国内大模型企业竞争到后面,会形成怎样的生态? 

蓝振忠: 可以参考云的市场,会有几朵大的公有云,也有很多细分领域的云服务解决方案提供商,估计云厂商也会入局人工智能。 

谈AI未来

我希望AGI能帮助人类和世界和解

章丰: 你认为接下来人工智能的核心技术会怎样迭代? 

蓝振忠:我预测人工智能的发展很快会遇到瓶颈,不会一直高歌猛进。就像上一波人工智能,经历了2012年-2015年快速发展后迎来了瓶颈。这波热潮从2018年开始,目前还在快速发展,预计很快就会进入一个平台期。 

可以确定的是,大规模语言模型不会是终点。目前我对未来人工智能的预想,是像电影《Her》里面的萨曼莎一样,能同时掌握文字、图像、语音等多个模态的能力,这会让大模型的智能程度进一步提升。 

章丰: 除了大模型以外,通往AGI是否还有别的道路?现在看起来大模型是一条被验证的路。 

蓝振忠: 我觉得要纠正这种说法,大模型并不是被验证的,终点尚不明确。颠覆式的创新依赖于环境上的巨变,就像2012年,当人类第一次将神经网络转移到GPU上,算力才获得了大幅的增加。 

大量的细微的进步和迭代正在发生,我们并不确信这种迭代能否引领人类走向AGI那条路,它仍然在被验证的过程中。这个过程就像在爬树,树很高,看着和月亮很近,但攀爬的过程中你会发现,它或许无法通往月亮,我们可能需要造一艘火箭。或许某一天,我们面前也会出现另一条路。

章丰:西湖心辰的愿景是“引领AGI走向每一个人”。通过AGI,西湖心辰想为人类带来怎样的改变?

蓝振忠:增进每个人之间的了解,打造一个更和谐的社会。我最近在看《不羁的灵魂》,里面就在讲怎么和自身、和他人、和社会达到和谐状态。书里认为,真正的自我会更像一个观察者。如果你把这个世界看成是自己意识到的客体,这个世界也就愿意让你知道你是谁。

比如你某天觉得:“我好笨,怎么又做得不好?”实际上那只是一种感受,当你意识到这份感受和外界既存的一张桌子、一把椅子并无区别,就能不受裹挟、保持中立。我从中受益匪浅,希望每个人都能够达成这种状态,和自己、和世界和解。

章丰:从“本我”到“超我”,这是一种很强大的自我管理的能力。

蓝振忠:这就是人们冥想希望达到的状态。西湖心辰在AGI上的“向内”,也是为了让人类更好地“向外”,人类和自身达成了和解,才能更专心地探索浩瀚的世界。

章丰:你怎么看待未来人与AI之间的关系?

蓝振忠:AI会替代一些重复性的工作,而人类可以解放出来,去谈哲学,去畅想未来,解放自己的脑力探索其他的东西。这就像古希腊,苏格拉底、柏拉图能够每天在广场上“侃大山”,很大程度上是因为有奴隶在后面帮他们做事。

章丰:苏格拉底天天在广场拉着人提各种问题,很像把这个社会当作一个“大模型”,不断地去输出他的“咒语”。

蓝振忠:不必太担心AI的进化。人类只是困在一个很小星球上的智能体,这个世界有太多知识等待我们去挖掘,我们要追寻的“心辰大海”还非常遥远,我希望AI可以帮助人类探索这些未知。

快问快答

达成目标后,你如何犒劳自己?

达成目标,就是最好的犒劳。 

挑选合作伙伴,你最看重的品质?

和我互补。 

给创业者的一个锦囊?

我更想得到创业者的建议,在创业方面我还是个“小学生”。 

你最想改变世界的一件事?

借由通用人工智能技术,增进人与人之间的了解,让社会更和谐 。 

如何定义“数字新浙商”?

创新。 

作者 | 程一苇 

编辑 | 王小猛

发现未来独角兽,项目BP发过来!

如果你的项目足够优秀,希望得到36氪浙江的报道,参加36氪浙江的“未来独角兽活动”,请将你的需求和BP发至36氪浙江项目征集邮箱:zhejiang@36kr.com,我们会及时回复。 

36氪浙江——让浙江创业者先看到未来!

本文来自微信公众号“数字经济发布”(ID:DigitalEconomy),作者:数字经济学会,36氪经授权发布。

+1
35

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

报道的项目

西湖心辰
我要联系
AI技术赋能的人工智能科技服务商
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业