自OpenAI发布ChatGPT以来,这项被比尔·盖茨以“不亚于个人电脑与互联网的诞生”的技术,率先在中国开启了“饥饿游戏”的序幕。
(资料图)
据不完全统计,从2022年12月至今,国内公布将(已)推出大模型或类ChatGPT的公司将近40家。如此速度,国内大模型走向“百模大战”恐是指日可待。近日,星火认知大模型的登场,使得“AI第一股”科大讯飞成为国内继百度、阿里、商汤、昆仑万维后,第五家正式发布大语言模型的公司。
除却星火认知模型的实际测试以及相关产品落地外,科大讯飞董事长刘庆峰还公布了,10月24日,星火认知大模型通用模型将直接对标ChatGPT,其中,中文能力超越后者,英文能力与后者相当。
从国内所发布的产品来看,无论是文心一言、通义千问、日日新还是星火认知大模型仍与ChatGPT3.5有着不小的差距。而且,当前OpenAI已经发布ChatGPT4.0版本,预计Q4发布ChatGPT5.0版本。那么,若能真的达到此目标,难免令人好奇,科大讯飞保持成长“加速度”的底气来源于哪里。
一、科大讯飞:星星之火,可以燎原?
公共行政学、现代西方社会学的奠基人之一,哲学家马克思·韦伯提出过“合理性”的概念。他把合理性分为两种:价值理性与工具理性。工具理性是以结果为导向,强调效果的最大化;价值理性以目的为导向,强调动机的纯正和选择正确的手段去实现自己意欲达到的目的。
以工具理性来看,科大讯飞大模型首份成绩单不可谓不是“优秀的”。
从ChatGPT发布后,其他家大模型产品发布会来看,无论是谷歌的“巴德”、百度的“文心一言”、商汤的“日日新”,所产生的负面舆论远大于正面舆论。这是或许源于谷歌、百度作为搜索界大佬,面对着有望颠覆搜索业新技术的诞生与爆火,有种“赶鸭子上架”不得不发布的既视感。
这就所导致的,谷歌巴德“常识题”出现错误,百度的高调宣发后却是“预录制”的问答,难免引发观众们的心理落差。毕竟,有着ChatGPT作为“标杆”,用户想要更为先进的“工具”,并非面向于C端自娱自乐的“玩具”。
在用户低期待值的节点选择发布,科大讯飞可谓是“明智的”。当然,这种明智是需要一定技术力与产品力作基底的。
首先,科大讯飞发布会上展示出语音问答形式是“独树一帜的”,自动生成虚拟人的模式让观众眼前一亮、让不少人看到了运营短视频新的可能性。其次,一问一答基本没有出现大错误,一方面证实其偏工具的能力,另一方面回避了当前多轮问答与上下文联系能力上的不足。此外,极具互动感的用户体验加持上C端产品落地,可以让用户切实感受到“技术在改变生活”。
这种由虚向实的转变,加上率先给出商业化变现的能力,让这场发布会的“效果”最大化。
5月8日,科大讯飞星火认知大模型发布会后的首个交易日,公司股票放量涨停。自今年年初以来,科大讯飞累计涨幅高达94.52%,接近翻倍。
同时,所提出的10月24日对标ChatGPTD这个节点,成为用户所期待的“技术升级周期”,如若没有重大变故,为自己打造了五个月的“安全期”。
但科大讯飞所提出的10月24日这个节点,无论作为中国程序节还是科大讯飞第三季度财报发布区间,都充满着“公关性质”。拔高用户的期待值,也无疑把自身架在火上烤,如若不如预期、可想而知其结果。
或许将“有福转祸”,犹如清·严有禧《漱华随笔·贺相国》所言“天下事皆起于微,成于慎。微之不慎,星火燎原。”
从科技史来看,个人电脑、互联网、手机等每一项“里程碑式”技术的诞生,前期都充满着恐慌、混乱与不确定性,不到最后谁也不知道荣光花落谁家。犹如当年的手机系统之争,除却大家现如今熟知的安卓与iOS系统外,微软的Windows Phone系统也曾风光一时。
不过好在,科大讯飞说了对标ChatGPT,却没有明确说对标的是ChatGPT3.5、4.0还是下半年要发布的5.0,仍有回旋的余地。
但直白来说,科大讯飞星火认知大模型发布会其“诚意度”大于“技术度”。无论是语音问答、虚拟人还是把大模型运营到学习机、车载系统中都并非科大讯飞的“独家”,能够很快被百度、阿里等追平,可能很快会陷入同质化竞争中。
二、从“跟跑者”到“领跑者”,科大讯飞能否成功突围?
对于具有跨时代意义技术的同赛道竞争来说,可以说是尤为激烈,毕竟杠杆另一端的砝码足够诱人。那么,科大讯飞从“跟跑者”到“领跑者”,在这场“饥饿游戏”中成功突围的可能性有多少呢?
出于对技术人员的尊敬以及同为国人,笔者当然希望是100%。不过,从现实角度来看,作为“AI第一股”的科大讯飞并非占优势的那一家。
透过现象看本质,技术之争的核心仍落点于“技术”。当下,大模型成长速度仍受算力、算法与数据的限制。
以算力举例,美国试错研究机构TrendForce推算称,处理ChatGPT的训练数据需要2万枚A100芯片。而由于英伟达对国内科技公司禁售H100与A100芯片,伴随着“百模大战”阵容的壮大,算力或会步入紧张的境况中。
大模型训练所需要算力的门槛,也让每一个大模型成为一只只极为强悍的“吞金兽”。
据国盛证券估算,按单张A100芯片的价格为10万元算,大模型训练需要投入约10亿元。导体研究公司SemiAnalysis认为,GPT-3每天大规模服务用户的运营成本高达70万美元,一年则高达2.555亿美元(约17.6亿元人民币),新一代的GPT-4模型只会更烧钱。
5月4日,在媒体The Information的报道中,三位了解OpenAI财务状况的人士透露,由于去年开发ChatGPT,OpenAI的亏损大约翻了一番,达到5.4亿美元左右。不过,OpenAI背靠着年利润超700亿美元的微软,自然有恃无恐。并且,据TechCrunch报道,OpenAI再次完成103亿美元融资,估值达到270亿-290亿美元。
从OpenAI来看科大讯飞,一没有像微软这种巨头的助力,二也难获取到类似于OpenAI这种巨额融资。
从科大讯飞内部来看,其“经营”也似乎出现了一些问题。从财报来看,2022年科大讯飞实现营收188.2亿元,同比增长2.77%;净利润为5.61亿元,同比下降63.94%。可见,一是科大讯飞中断了自身2012~2021连续十年每年收入增长都超过25%的业界神话;二是其利润“腰斩”,已经陷入了增收不增利的境地。
同时,科大讯飞的营收费用在快速攀升,2022年科大讯飞的销售费用为31.64亿元,同比增长17.51%。销售费用大幅度增加,营收增速却大幅度下滑,难免让人怀疑科大讯飞产品的市场稀缺性与竞争力在逐渐下滑。
再回想起来,2021年2月8日的年度计划大会上,科大讯飞提出了未来五年千亿营收的目标。折算下来,等同于在2020年营收130.25亿的基础上,未来5年保持50%的CAGR。让人对科大讯飞当今的经营趋势有点“惋惜”。
在特殊时期已经过去的当下,从第一季度财报来看,不少企业已经在逐渐摆脱曾经大环境的“负面影响”。
但科大讯飞的状况并没有好转。2023年第一季度财报显示,报告期内科大讯飞该季度营业收入为28.88亿元,同比下降17.64%;归母净利润为亏损5790万元,是自2020年第一季度以来首次出现亏损。
在这样的经营走向下,面对着仍处于早期的大模型赛道,如若没有大额资金注入,科大讯飞恐怕很难让人信服,其财力能够支撑其走到最后。
科大讯飞发布会二级市场首日涨停后,大有着“一鼓作气,再而衰、三而竭”的趋势,5月9日与10日其股票收盘前一直下跌与上涨之间波动。5月11日,科大讯飞又因为“套壳”传闻,盘内一度下跌超7%。
哪怕科大讯飞及时回应称:“网上有谣言说讯飞星火大模型‘套壳OpenAI的ChatGPT’既不符合事实,也不符合逻辑。”不过,俗话说的好:“好事不出门,坏事传千里。”大概率已经有部分人受到“传闻”印象,对科大讯飞的产品蒙上一层疑虑。
其实想要树立口碑也并不难,开放让用户体验,如果产品真的够强,自然会有海量用户帮你宣传。OpenAI发布相关ChatGPT产品后才受到了广泛关注,并非先受到关注才发布产品。对比一下国外阵营,微软Bing已成为目前门槛使用最低的大语言模型。这意味着,你只需要注册一个微软账户,就可以使用Bing Chat了。
从数据来看,科大讯飞也并不具有优势。其自身的数据库集中于教育、医疗等垂直领域,数据的广度要弱于搜索引擎玩家,与拥有着C端大流量入口的腾讯、字节等大厂们。
好的是,科大讯飞已经率先进入产品落地阶段。无论是教育硬件还是办公硬件,都是科大讯飞所擅长的领域。虽然,对于通用大模型来说,“大模型+学习机”“大模型+办公本”这种落地场景的想象力有些过于狭隘,但活下去才能争取到更多的可能性。
以笔者来看,C端市场商业化的天花板或许并没有那么高。一是过去的“AI赋能万物”与“大模型赋能一切”的场景相近,二是C端场景,普及化与高利润往往是相悖的,无论是教育、办公还是医疗,对于C端用户来说更需要一个要素是“惠民”。
可见,未来大模型更重要的发力点在B端或者G端,类似于华为昆仑对于矿业、电业、气象业的助力。而科大讯飞可以利用教育、办公、医疗上的优势,结合大模型进一步上探与垂直扩张。
不过,无论面向于B端、G端还是C端,国内市场就那么大,大模型的成功只能说是进入大模型市场的第一步,之后还有着激烈的厮杀。好用不好用,仍旧需要时间与市场去验证。
或许大模型的战争,以资本的厚度来看,最后的赢家大概率会是BAT+华为其中之一。但技术探索对于科大讯飞自身业务与产品的赋能,也在加速其更快步入下一个台阶。
电影《饥饿游戏》有句台词是:“可怜的处境不会带来救助,但坚韧不屈却能够博得人们的尊敬。” 对于科大讯飞来说,数据的确不如拥有着国民级C端流量口的大厂,算力与资金也并没有那么充沛。但其在自身的领域,仍坚持不懈地向未来之门的边际触探,也并从未掉队。
声明:本文仅作交流,不构成投资建议。
原文标题 : 预告将超越ChatGPT,科大讯飞“实力”几何?
标签: