文心一言发布十余天后,争论仍未有止歇的迹象。
有人给出了“拉垮”的评价,相比于多轮迭代的ChatGPT,文心一言在逻辑推理、多轮对话等方面的表现不尽如人意;也有人认为给文心一言值得肯定,原因是填补了中文互联网的空白,以及百度直面竞争的勇气。
可能最终会像李彦宏在发布会上所说的:当前文心一言的内测体验并不能叫作“完美”,发布是因为有市场需求,“文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你‘士别三日,当刮目相看’的惊喜。”
这里并非想对比文心一言与ChatGPT的差距,而是想要讨论这样一个话题:那些以“中国版ChatGPT”自居的玩家们,到底是“追风者”还是“追赶者”,不同的“初心”显然对应着不同的结果。
01 中国版ChatGPT的虚与实
国内企业对ChatGPT的态度,大致可以分为三个阶段:
第一个阶段是2023年农历春节前。
OpenAI在2022年11月30日推出了聊天机器人ChatGPT,5天时间注册用户量就超过了100万。期间不乏国内媒体的报道,微博等社交网络上逐渐流行起各种说法:ChatGPT可能将颠覆谷歌,掀起一场搜索引擎的大革命;大学生开始用ChatGPT写论文,部分高校宣布将禁用ChatGPT……
彼时“中国版ChatGPT”的话题已经在技术论坛里小范围讨论,国内大厂的工程师们大概率有参与其中。可由于ChatGPT频频被曝出回答错误、存在假消息,且商业化落地的前景不明朗,国内大多数企业都选择了缄默。
第二个阶段是ChatGPT爆红后。
时间来到2023年1月末,ChatGPT的注册用户破亿,成为史上扩散速度最快的应用,这场AI风暴终于吹到了太平洋对岸。国内社交媒体上充斥着ChatGPT的对话截图,并且出现了“ChatGPT概念股”的说法。
中国的科技大厂们“猛然醒悟”,纷纷开始就中国版ChatGPT表明态度:百度在2月7日官宣将在3月上线文心一言;腾讯在2月9日回应称“在相关方向上已有布局,专项研究也在有序推进”;阿里传出了类ChatGPT应用的对话截图;京东、网易有道、科大讯飞、小米也先后发声将推出相关产品。
第三个阶段是文心一言上线后。
可能因为发布会上的录屏展示,百度的股价在文心一言发布当天即下跌10%,一度成为互联网上的众嘲对象,即使李彦宏和百度CTO王海峰均在发布会上提前打了“预防针”,直言模型目前“训练不够充分”。
有趣的是其他科技大厂的态度。目前申请测试百度文心的用户已经百万,超过10家企业用户申请调用文心一言的企业版API。如果说ChatGPT的走红只是唤醒了国内网民的好奇心,摆出了一副吃瓜群众的姿态,现在已然被彻底点燃了热情。但百度文心上线近10天后,并未有第二家企业官宣。
个中原因恐怕离不开“功利”二字。
在ChatGPT的方向被论证前,国内的大部分投资人和技术领袖并不敢冒险跟进,不考虑短期收益的只有少数派中的少数派;ChatGPT爆红后,特别是“ChatGPT概念股”出现后,中国版ChatGPT已经成为一种政治正确,大厂们的表态也就无可厚非;文心一言上线后则是另一个极端,在“肉眼可见”的技术差距面前,暂时收敛锋芒是否也是一种避开被舆论讨伐的选项?
“中国版ChatGPT”或喧嚣或冷静的背后,似乎还有另外一种解释:在用户心理阈值最高的时候,跟风放出消息不失为一种聪明的商业策略,而落实到产品上,终归还要结合现实需求。就像科大讯飞董事长刘庆峰的观点:AI要兑现红利,标准之一就是有看得见摸得着的应用场景。
02 空间换时间的认知陷阱
至于ChatGPT类产品的商业空间,微软无疑是最佳的参考对象。
作为OpenAI的大股东,微软被中国网友们戏称为“坐在副驾驶上狂飙”,尤其是在ChatGPT的商业应用上,微软可谓动作频频:1月17日的公开活动上,微软CEO纳德拉表示,计划将ChatGPT整合进其所有产品;半个多月后,微软正式推出新版必应,将ChatGPT与搜索引擎融合;GPT-4发布两天后,微软发布了新功能Copilot,将用于Word、PowerPoint、Excel、Outlook等产品中,可自动生成PPT、自动写文章……
为何国内企业并没有兵临城下的危机感?最常见的说法是“空间换时间”,中文互联网的特殊性,为国内企业留下了充足的反应时间。譬如晚于ChatGPT三个半月诞生的文心一言,照旧抓住了大把的机会。诸如此类的说辞在某种程度上有其道理,却也存在一些不可小觑的认知陷阱。
比如中文语料库的问题。
在不少人的理解中,中文语料库是ChatGPT难以逾越的壁垒,李彦宏称“文心一言是更适合中国市场的人工智能模型”,理由正是中文特殊的分词和语法结构。中文语料库的建设需要大量的人力、物力和财力投入,同时还需要考虑语料的质量、版权等问题,几乎是一个天然避风港。
可国内互联网巨头的“数据隔离”也是不争的事实,尽管在工信部的施压下,大厂们被迫“拆墙”,但不同平台的数据仍然很难产生交流和总结,无形中增加了模型训练的难度。就连文心一言的图像生成都经被传出先将中文指令翻译成英文,再根据英文描述生成图像,中文语料的现状可见一斑。
再比如技术上的硬性门槛。
国内并不缺少媲美GPT-3的大模型,这也是很多企业自信可以开发出ChatGPT类应用的直接原因,然而算力资源、工程能力、模型迭代策略、调优机制等能力的缺失也是不争的事实。还是文心一言的例子,虽然有ChatGPT这个参考答案,迭代、调优的路还是要重新走一遍才行。
一个浅显的道理,OpenAI在推出ChatGPT前,已经在大模型上默默耕耘了4年时间,期间不知道有多少次的试错。毕竟一个现象级产品诞生,往往是资源、基础技术、人才、产业需求等一系列因素的集大成,国内到底有多少家企业能够越过技术上的硬性门槛,目前还是一个未知数。
按照华西证券的测算,百度的文心一言想要达到ChatGPT目前的能力,需要补足的训练、推理和数据标注成本分别为2.29亿元、13.62亿元、0.05亿元,需要保持年均16亿元的投入。
倘若再算上维持正常运转的人力成本、训练模型的算力成本、存储数据的数据中心耗费,百度想要追平OpenAI需要付出相当庞大的投入,遑论其他缺少前期布局的企业。
就在百度们还在追赶GPT-3.5时,OpneAI已经有条不紊的推出了功能更为强大的GPT-4,并在3月24日宣布部分解除了ChatGPT无法联网的限制,正在推出ChatGPT插件,可以访问训练数据外的信息,增加一些特定功能,开始了从工具向平台的进化。
03 “追风者”无缘“星辰大海”
最糟糕的并不是做一个“追赶者”,而是“反应迟钝”的追风者。
早在2020年的时候,OpenAI就借着GPT-3一鸣惊人,随即在全球范围内拉开了一场大模型军备竞赛,国内的华为、智源、浪潮、阿里云、百度、腾讯等企业先后发布了自家的预训练大模型品,并不断从NLP延伸出了双语、CV、跨模态等大模型。
而后的一段日子里,来自中国的大模型覇榜各类榜单,学术论文如流水线般生产。一些研究人员以发论文为己任,鲜有人思考学术以外的价值;企业对大模型满怀信心,并试图推动产业落地中来变现。最终也仅仅止步于此,没有一家企业能创造性地越过大模型到ChatGPT的天堑。
有人在知乎上问道:阻碍国内团队研究 ChatGPT 这样产品的障碍有哪些,技术、钱还是领导力?OneFlow创始人袁进辉的回答道出了问题的本质:“需要有远见且为理想而持之以恒的人。”
不可否认的是,“谈理想”在国内的商业环境中多少有些感性且不切实际,甚至连相应的故事都是“舶来品”:图灵奖得主Hinton潜心研究神经网络50多年;斯坦福的李飞飞教授花费6年时间创建了ImageNet数据集;OpenAI最初被定义为非营利性人工智能组织,要向全世界公开分享他们的研究成果……
国内盛行的是另一种商业故事:张小龙在2010年带领一个不到10人的团队,用了不足70天的时间开发出了微信的第一个版本;出行大战中胜出的滴滴,曾用四个月的时间拉来了一万多名网约车司机;2013年才立项测试外卖项目的美团,到了2014年就将外卖送到了全国200个城市……
问题在于,追逐风口、快速创新的打法到了人工智能时代是否依然奏效?不妨借用英伟达CEO黄仁勋的一个比喻:“每家公司都应该知道,未来的软件开发有点像炼丹,这是一个MLOps的过程。”其中的MLOps可以翻译为“人工智能研发运营体系”,涵盖开发、部署、交付验证三个必不可少的过程。
在中国版ChatGPT的研发中,国内的企业已然走了“捷径”:比如ChatGPT最大的特点就是引入了人类反馈的强化学习(RLHF),即用人工标注的方式,不断地将结果去反馈给模型,让模型不断自我迭代。百度等企业后来也采用了RLHF模式,并辅以“对话增强、有监督精调”等机制,底层架构和技术路径都与OpenAI相似。
最危险的地方恰恰也在于此。
不少人将ChatGPT比作是移动互联网时代的iPhone,意味着ChatGPT只是个开始,将有更多超出固有认知的新事物出现,可能是聊天机器人,可能是“画图高手”,也可能是当前还想不到的应用。同时也预示着层出不穷的新风口,凡是风口,皆有虚实,一味跟着别人走路,总有踏空的时候。
李彦宏曾在2021年初的内部信中写道:“我们熬得过万丈孤独,藏得下星辰大海。”冥冥中成了中国企业面对ChatGPT时的命运写照:熬不过万丈孤独,何谈星辰大海?
04 写在最后
中国版ChatGPT的故事还在继续,不排除有越来越多的相似产品上线,甚至出现“百花齐放”的局面。
需要警惕的是那些自诩为“国产之光“的追风者,聊天机器人的风口来临时,迅速整顿人马开发类似应用;AI生图的热度起来后,快速组建团队抓住新的契机;而当新的风向标出现时,会再次调转方向…… 不愿意在底层技术上“苦修”,注定要在风口里兜兜转转。
因为“追赶者”仍抱有理想、信念和希望,“追风者”注定只会在风中盘旋,被风势裹挟。
文/ 彭艺信 杨晓羽 曾嘉怡 编辑/侯煜 tiktok3月份外卖上线的消息铺天盖地。何夕,家住试点区北京回龙观,喜欢体验新事物,迅速打开tiktokapp点外卖。 与美团、饿了么等独立外卖应用相比,抖音点外卖程序繁琐——抖音app没有直接外卖入口,用户需打开“App-同城-附近的美食”用户也可以手动搜索进入商家购买界面“外卖”,从给出的列表中选择最喜欢的商家。 目前北京有烧烤/烧烤、火锅、小龙虾、日本料理、咖啡馆等25种美食品类。然而,并不是所有这些类别的商店都提供外卖服务,有些只提供外卖服务“到店团购”服务。以回龙观区域为例,点击商家界面时,发现前30家店中只有5家提供。“外卖到家”其他商店只提供服务“优惠团购”或“到店团购”服务。 能够点“外卖到家”店里卖的食物大部分都是套餐卖的,其中双人套餐和多人套餐多,单人套餐少,比如鲜芋头仙买的甜品。“【经典酿酒套餐】桂花红豆酿酒(热) 芋头4号(热)”以套餐的形式购买,套餐价格57元。值得一提的是,单人套餐在抖音外卖中很少见到。在选择上,美团和饿了么应用程序的灵活性并不高。 这体现在价格上,就是客户单价极高。以鲜芋仙甜品店为例,甜品价格80元—54元的价格区间,大部分产品在60-70元左右,而菜单中50元以上的价格套餐产品只有3款,优惠区间在9.6-9.7折不等。 何夕将范围设定在1公里范围内,选择“可外卖”,显示只有6家店铺,美团有50家,饿了么有40家店铺。由此可见,抖音外卖店的数量还远远不够。 最具戏剧性的是,美团的外卖兄弟在抖音平台上点餐。原来,抖音上架的商家可以选择三种配送方式:店内人员自行配送、抖音提供的第三方聚合配送、美团骑手配送。第三方聚合配送包括旧金山快递、闪送、达达等,抖音已达成合作,但使用聚合服务需要支付约8元的配送费。在抖音下订单后,联系客户服务取消,然后转移到美团订购,由美团骑手分发。 新鲜芋头仙女通过第三方配送平台美团完成闭环交易。 如此费劲的操作,导致配送成本远高于拥有配送系统的外卖平台。从时间上看,配送时间约为30分钟,速度略慢于其他外卖平台。配送费为3元,而在美团上下单则为0元。 在体验了抖音外卖业务后,我发现:第一,可选商店数量少;第二,商店只能接受3公里以内的订单接收距离;第三,外卖食品大多以套餐的形式销售,价格折扣不大,对个人消费者不友好;第四,骑手分销时间长,分销成本高。从用户层面来看,抖音外卖几乎没有明显的优势,外卖业务试水的意义还是很强的。 抖音外卖:低佣金、高运营成本 然而,对于商家来说,抖音巨大的流量和用户规模对商家非常有吸引力。此外,影响商家是否在抖音开店的因素之一是平台佣金。根据抖音的官方数据,抖音向商家收取的佣金比例在2%-10%之间,其中美食(餐饮)的佣金比例为2.5%,美团平台的佣金比例约为25%。 当然,佣金有绝对优势,但如果企业想在抖音上推出外卖,他们还需要操作短视频内容。这需要向该平台支付额外的视频拍摄、编辑和其他运营成本。这样,抖音平台的成本将高于美团和饿了么平台。 当然,抖音的数据推荐也是吸引企业的因素。抖音如何整合物流、商家和用户系统进行数据推荐?据抖音内部人士透露,抖音将在适当的时间向用户推送适应的外卖内容,用户完成订单,向商家和三方发送平台订单,并在此基础上不断优化数据模型。 从2022年开始,抖音本地生活团队将对用户进行三个阶段“打标签”:第一阶段是实际购买此类商品的用户;第二阶段是搜索、关注和赞扬此类商品的用户;第三阶段是基于年龄、工作组和生活习惯的数据系统,甚至挖掘潜在客户。 综上所述,抖音外卖佣金低,但运营成本不容小觑。因此,目前选择抖音平台的商家大多是资金实力雄厚的连锁企业。国海证券研究报告显示,抖音本地生活商家头部效应明显,头部商家比例较高。肯德基、麦当劳、瑞幸咖啡、奈雪、茶百道、小龙坎等 KA 以客户为例,这些品牌背后都有抖音城市整合营销服务的帮助。据某品牌相关合作负责人在网上透露,抖音整合营销价格约为100万元。因此,烧烤、火锅、小龙虾等高客户单价企业进入抖音是获得增量收入的好方法,但也需要在抖音渠道投入相应的资金进行运营。 觊觎已久,难以下定决心 在过去的三年里,抖音在外卖市场上做出了许多努力。抖音于2020年推出“团购”功能,在线心动餐厅板块;2021年内测;“心动外卖”,但效果并不令人满意。 但抖音并没有放弃,2022年7月,抖音在北京、上海、成都等城市试点“团购配送”服务。2022年8月还宣布与饿了么达成合作,12月与达达、顺丰、闪送达成合作,积极为平台“团餐配送”服务铺路,探索当地生活服务场景升级。 对于字节来说,外卖业务是实现流量的重要途径之一。字节的商业化取决于它的流量优势。到2022年底,抖音的日活量超过8亿,是目前最受欢迎的短视频软件。抖音之前的实现方式包括广告、直播商品等,即依靠短视频和直播分流来吸引商家和用户消费,并利用补贴鼓励商家进行广告,最终推动GMV的增长。 然而,2022年对字节跳动并不是一个美好的记忆,其收入仍然高度依赖于广告业务,特别是抖音单一平台;B端业务进展不大,云计算实力与阿里巴巴、腾讯、华为仍有很大差距;大量新旧业务和产品关闭,未找到下一个热门产品。 因此,对于抖音来说,如何增加商业实现一直是一个不可避免的问题。目前,没有其他业务比外卖更合适。 外卖业务也被视为抖音利用估值的杠杆。抖音母公司字节跳动成立于2012年3月,曾被视为增长潜力最大的独角兽公司。在成立后的十年里,该公司最高估值为4000亿美元,字节获得了9轮融资。 然而,自去年以来,字节估值一直在萎缩。根据胡润研究院发布的《2022年中国全球独角兽榜》,截至2022年6月30日,抖音公司估值从2.3万亿元降至1.34万亿元,相当于2万亿美元左右。 如果字节在未来上市,其估值将直接影响股票定价。目前,字节的目标是改变过度依赖广告贡献收入的收入结构,从抖音8亿日的活用户那里挖掘更多的造血机会。打外卖桩也有利于抖音收紧当地生活的篱笆,提高盈利能力,然后提高自己的估值。事实上,目前的直播外卖是抖音的本地生活“直播 团购”模式的延伸和扩展只改变了订单性能的方式。上线“抖音外卖”行业普遍认为字节跳动是提高自身市场价值的突破口。 然而,对于抖音外卖的发展前景,业内人士认为这是一条漫长的道路。回顾美团和饿了么的发展过程,两家公司花了近10年的时间建立了覆盖全国的外卖配送系统。到2021年底,美团共有527万外卖骑手,饿了么也有114万外卖骑手,总共有640多万人。只有这个分销系统才能反映出外卖业务发展的困难。 事实上,美团直到2019年才首次实现全年利润,直到2019年才承担高昂的成本;尽管美团对骑手权益的保护存在争议,但截至2022年第三季度,包括配送成本在内的销售成本占美团外卖总收入的70%。 成本如此之高的运营模式使得抖音很难下定决心大力发展外卖业务,这也应该是为什么外界经常看到抖音外卖,但水花并不大的原因。该行业对3月份在线外卖业务的前景也持谨慎态度。
原创文章,作者:admin,如若转载,请注明出处:http://readdaily.cn/other/22550.html