天生赢家凯发k8国际ღ★◈✿,k8凯发一触即发ღ★◈✿,凯发k8国际首页ღ★◈✿,凯发天生赢家一触即发凯发K8天生赢家一触即发ღ★◈✿,K8凯发·(中国)官方网站k8凯发官网ღ★◈✿,专家认为ღ★◈✿,国内基座大模型最后可能只剩下DeepSeekღ★◈✿、阿里ღ★◈✿、字节三家ღ★◈✿,关键在于技术理想主义和人才ღ★◈✿。
昨天ღ★◈✿,是国产 AI 六小虎之一百川智能成立的两周年ღ★◈✿,CEO 王小川发布全员信强调公司方向ღ★◈✿:“ 减少多余动作ღ★◈✿,专注医学方向ღ★◈✿。”
要知道ღ★◈✿,两年前ღ★◈✿,百川智能刚成立的时候ღ★◈✿,其愿景可是“ 旨在打造中国版的 OpenAI 基础大模型及颠覆性上层应用 ”ღ★◈✿,非常宏大凯发k8国际ღ★◈✿。
无独有偶ღ★◈✿,国产 AI 六小虎之中的零一万物的创始人李开复ღ★◈✿,今年 1 月在与媒体 “ 连线 Insight ” 对话时表示ღ★◈✿:“ 零一万物全面转向 ‘ 小而美 ’ღ★◈✿。”
而在零一万物刚成立的时候ღ★◈✿,其愿景则是宏伟的“ 打造 AI 2.0 全新平台ღ★◈✿,加速AGI到来 ”ღ★◈✿。
曾经的雄心壮志和现在战略收缩ღ★◈✿,让外界不少人调侃 “ 小虎 ” 已经成了 “ 小猫 ”ღ★◈✿,那么ღ★◈✿,在 AI 大模型市场风云变幻的现在ღ★◈✿,这些地位不稳的曾经的 “ 虎 ”ღ★◈✿,如何找到活下去的理由呢?
为了探究这个问题ღ★◈✿,知危编辑部找到了大模型技术专家ღ★◈✿、头部金融企业AI专家ღ★◈✿、头部医疗AI专家ღ★◈✿、一线大厂AI技术专家等多位专家进行对话ღ★◈✿,探究大模型企业们面临的问题以及如何更好的活下去ღ★◈✿。
表面上ღ★◈✿,今年春节DeepSeek爆火之后ღ★◈✿,整个大模型市场开始战战兢兢ღ★◈✿。它像是武松ღ★◈✿,几碗酒下肚给还没发育完全的 “ 小虎 ” 们打得头昏脑涨ღ★◈✿,一众大模型公司从最初斗志昂扬地同场竞技ღ★◈✿,转变到现在面对现实各自选择了不同的命运ღ★◈✿。
大模型技术专家ღ★◈✿、《 知识图谱大模型 》作者王文广告诉知危ღ★◈✿:“ 实际上ღ★◈✿,甚至还不到 DeepSeek V3 和 R1 的发布ღ★◈✿,在 DeepSeek V2.5 和阿里的 Qwen 70B 推出来的时候ღ★◈✿,国内有些大模型公司就已经开始放弃训练大模型了ღ★◈✿,成本实在太高ღ★◈✿。他们感到无论在资源还是性能上都赶不上或拉不出距离鬼吹灯私服ღ★◈✿,何况对方还是免费开源的ღ★◈✿。”
某人工智能技术服务企业专家梁贺( 化名 )则告诉知危ღ★◈✿:“ 大约 2024 年年中的时候ღ★◈✿,六小虎虽然还在训练大模型ღ★◈✿,但投入力度已经明显不如以往ღ★◈✿。”
直到 2025 年 1 月DeepSeek R1发布的时候ღ★◈✿,大部分中小企业发现彻底跟不上了ღ★◈✿。
百川ღ★◈✿、零一万物放弃预训练大模型ღ★◈✿,分别押注医疗AI和全面行业落地ღ★◈✿;MiniMax 收缩 To B 业务ღ★◈✿,并专注 C 端视频生成等场景的海外市场ღ★◈✿;智谱ღ★◈✿、月之暗面ღ★◈✿、阶跃星辰在开源社区依然活跃ღ★◈✿,但并未有能超越 DeepSeek R1 的新模型ღ★◈✿;获得大量融资和政企合作订单的智谱不愁生存ღ★◈✿;因为效果远不如开源而放弃了投流策略的月之暗面ღ★◈✿,其头号产品 Kimi 因为元宝的后来居上ღ★◈✿,在定位上正显得尴尬ღ★◈✿。
总体来看ღ★◈✿,六小虎与国内市场中 “ 最没有想象力 ” 的一部分即 To B SaaS 市场ღ★◈✿,交集越来越大ღ★◈✿。
近期ღ★◈✿,零一万物宣称要全面接入 DeepSeekღ★◈✿,将企业大模型一站式平台在各行各业落地ღ★◈✿。对此ღ★◈✿,业内普遍谨慎看零一万物的未来ღ★◈✿。
某金融企业 AI 专家姜绍( 化名 )甚至评价道ღ★◈✿:“ 零一万物基本上是转B端了ღ★◈✿,他们感觉是什么都想做ღ★◈✿,公司团队整体过于技术ღ★◈✿,但 DeepSeek 出来后技术上也看不出差距ღ★◈✿,商业化水平又比较一般ღ★◈✿。”
对于该类产品的技术门槛的评估ღ★◈✿,王文广是有亲身体会的ღ★◈✿,“ 我去年大概花了半年的时间ღ★◈✿,自己一个人就开发了这样的平台ღ★◈✿,现在也在通过个人的方式在售卖ღ★◈✿。而且我觉得这个产品通过公司来做很难赚到钱ღ★◈✿,但个人经营的方式还能慢慢赚到钱ღ★◈✿。”
“ 现在行业内有不少 To B 企业ღ★◈✿,他们不做大模型ღ★◈✿,但是也会做大模型的业务ღ★◈✿,只是缺少一个技术平台ღ★◈✿。我就跟他们合作ღ★◈✿,价格可以压得很低ღ★◈✿,只需要四五万一套ღ★◈✿,中大型公司肯定做不到这么便宜的ღ★◈✿。”
“ 我现在开发的平台ღ★◈✿,叫做 KAFღ★◈✿,即 Knowledge-based Agent Factoryღ★◈✿,就是基于知识图谱ღ★◈✿、向量数据库ღ★◈✿、搜索引擎ღ★◈✿,通过检索知识来提供大模型和 Agent 应用的平台ღ★◈✿。目标是让用户可以不写任何代码ღ★◈✿,通过提示词管理和模型管理就能构建自己想要的知识助手或 Agentღ★◈✿。就这样的平台ღ★◈✿,市面上有非常多相似的ღ★◈✿,估计能有一千个ღ★◈✿,也很容易复制ღ★◈✿。”
“ 比如一家公司想做 To B 的大模型应用ღ★◈✿,即便创始人自己没有这个能力ღ★◈✿,要想做出产品也很快ღ★◈✿。无非就是招两三个特别牛的人ღ★◈✿,当然领头人必须很厉害ღ★◈✿,不然可能没法入手ღ★◈✿。这种方式的成本会比训练大模型的成本低很多ღ★◈✿。即便是行业里的大牛ღ★◈✿,年薪千万也差不多了ღ★◈✿,再加上两三个年薪百万的ღ★◈✿,就能组成核心团队ღ★◈✿。实在不行ღ★◈✿,还可以找外部的 AI 公司合作ღ★◈✿。”
除了上述模式ღ★◈✿,还有 “ 企业大模型一站式平台 ” 的模式ღ★◈✿,属于一体机的类型ღ★◈✿,对于这类产品ღ★◈✿,平安保险技术平台组负责人张森森认为ღ★◈✿,“ 一体机有足够市场空间ღ★◈✿,但一体机是卖服务的ღ★◈✿,跟技术没有太大关系ღ★◈✿。”
“ 一体机就是将核心硬件鬼吹灯私服ღ★◈✿、软件ღ★◈✿、执行环境进行打包ღ★◈✿,达到开箱即用ღ★◈✿,主要面向技术部署能力较弱的机构ღ★◈✿,比如政府ღ★◈✿、教育机构等ღ★◈✿,也有一些企业客户ღ★◈✿,要点在于方便使用和技术自主性ღ★◈✿。当然它也有自己的优势ღ★◈✿,比如数据安全ღ★◈✿、隐私合规ღ★◈✿,因为它是私有化部署ღ★◈✿,面临监管的时候更容易通过安全审查ღ★◈✿。并且一体机是软硬件深度优化的ღ★◈✿,对于推理专用的芯片ღ★◈✿、端侧芯片ღ★◈✿,响应速度更快ღ★◈✿。还有另外一种考量ღ★◈✿,比如一体机对于国产芯片做了深度定制鬼吹灯私服ღ★◈✿,从而绕过一些底层限制ღ★◈✿,提高效率ღ★◈✿。有些企业倾向一体机ღ★◈✿,是因为对成本比较敏感ღ★◈✿,更关注 ROIღ★◈✿,一体机的使用寿命更长ღ★◈✿,对于做财务报告的 ROI 可能更好一些ღ★◈✿。”
实际上ღ★◈✿,过去多年以来ღ★◈✿,无论在任何具体的领域ღ★◈✿,包括大数据ღ★◈✿、云计算ღ★◈✿、计算机视觉等ღ★◈✿,国内 SaaS 市场都有非常相似的特点ღ★◈✿,或者说这是各个领域最终会发展成的固有形态ღ★◈✿,包括定制化需求较高ღ★◈✿、产品偏向通用和同质化ღ★◈✿、市场竞争激烈ღ★◈✿、低价策略普遍ღ★◈✿、资本更关注短期变现等ღ★◈✿。这些 SaaS 企业的客户数字化程度较低ღ★◈✿,付费意愿较弱ღ★◈✿。
相比之下ღ★◈✿,海外 SaaS 市场更注重专业化分工ღ★◈✿,企业专注于特定领域ღ★◈✿,提供深度服务ღ★◈✿,以大中型企业客户为主ღ★◈✿,付费意愿更强ღ★◈✿。
2024 年ღ★◈✿,亚马逊宣布与成立两年的 AI Agent 初创公司 Adept 达成技术授权协议ღ★◈✿,Adept 部分成员将加入亚马逊支持 AGI 团队ღ★◈✿。
这些初创公司都通过专注大模型技术的一个细分领域获得了资本成功或企业发展ღ★◈✿。但在国内ღ★◈✿,这种事例几乎为零ღ★◈✿。据知危了解ღ★◈✿,不少中小型企业在发展自身技术和业务时ღ★◈✿,甚至还要时刻提防大厂也来 “ 抢肉吃 ”ღ★◈✿。
基于自身在 To B 市场多年的行业经验ღ★◈✿,王文广向知危描述了这个市场的残酷性ღ★◈✿:“一站式平台产品肯定有市场ღ★◈✿,而且市场还很大ღ★◈✿,但是会非常碎片化ღ★◈✿。我合作的这些小公司规模都不大ღ★◈✿,他们的运营成本相比中大型公司是更低的ღ★◈✿,可以把价格定在 30 到 50 万之间ღ★◈✿,即便这样也可以赚钱ღ★◈✿。因为他们不需要考虑研发成本ღ★◈✿,只负责实施ღ★◈✿,能够覆盖人力成本就行ღ★◈✿。如此一来ღ★◈✿,就会把整个 To B 场景的应用服务价格压的很低ღ★◈✿,何况我参与的市场肯定不只有我在做ღ★◈✿。中大型创企参与的市场可能只能做大型的企业客户ღ★◈✿,那也会面临其它创企ღ★◈✿、传统集成商等竞争对手ღ★◈✿。即便是大厂ღ★◈✿,在 To B 市场的业务策略也都差不多ღ★◈✿,大厂还能有自己的大模型和品牌优势ღ★◈✿。”
“ 我也在用 DeepSeekღ★◈✿,还有大量其他企业也在用 DeepSeekღ★◈✿,那就没有任何差异化的地方ღ★◈✿。国内有多少云厂商ღ★◈✿,就至少会有多少个竞争对手ღ★◈✿。国内 To B 市场一直是这样ღ★◈✿,想要活下去ღ★◈✿,要么关系硬ღ★◈✿,要么服务好ღ★◈✿,要么价格低ღ★◈✿。”
李开复目前将零一万物的业务完全转向To B应用ღ★◈✿,主推企业大模型一站式平台ღ★◈✿,这个做法在商业上肯定是没有问题的ღ★◈✿,但是市场会很卷ღ★◈✿。
零一万物要做出比大厂更低价的大模型产品ღ★◈✿,其实也是没办法的事情ღ★◈✿,因为应用层面没有什么能够保持独特优势的地方ღ★◈✿。
零一万物转向To Bღ★◈✿,说明它AGI的想象力也就弱了ღ★◈✿,做的事情不够性感了ღ★◈✿。这跟2017年以来的上一波CV浪潮的视觉公司后来的结果很类似ღ★◈✿。
姜绍告诉知危ღ★◈✿:“ 百川转向医疗ღ★◈✿,只是给自己找一条活路ღ★◈✿。但相比零一万物ღ★◈✿,百川至少是在尝试做一个细分市场ღ★◈✿。”
张森森表示ღ★◈✿:“相比科技公司ღ★◈✿,我更看好拥有医疗数据的公司做医疗大模型ღ★◈✿。这个对于任何想做行业大模型的公司都是同样的道理ღ★◈✿。因为做医疗大模型的关键难点不在于大模型ღ★◈✿,而在于数据ღ★◈✿。中国有那么多好的医院ღ★◈✿,医院也可以自己用 DeepSeek 微调出一个大模型出来自己用ღ★◈✿。”
如何有效地获取医疗数据?姜绍表示ღ★◈✿:“ AI 技术创业公司在数据上没有优势ღ★◈✿,如果想做医疗大模型ღ★◈✿,可能需要和原本就在帮医院做信息化的公司去合作才行ღ★◈✿。”
而据知危所知ღ★◈✿,六小虎中已有公司跟国内大型医生交流论坛进行独家合作ღ★◈✿,利用该论坛中医生交流产生的大量案例对模型进行训练ღ★◈✿。
梁贺认为ღ★◈✿:“ 王小川要专攻医疗ღ★◈✿,成不成ღ★◈✿,要看他是要做理想还是要赚钱ღ★◈✿。如果是要做理想ღ★◈✿,做出有突破性的医疗 AI 研究成果ღ★◈✿,那我更看好ღ★◈✿。从我对王小川的理解来看ღ★◈✿,他应该更倾向前者ღ★◈✿。”
王文广则强调了这个市场陈旧的一面ღ★◈✿:“如果是想短期内做商业化ღ★◈✿,那其实医疗这个赛道也是很卷的ღ★◈✿,和 To B 市场整体的情况没什么本质区别ღ★◈✿。商业化层面ღ★◈✿,用知识图谱ღ★◈✿、向量搜索加大模型来做医疗ღ★◈✿,很多公司都能做ღ★◈✿。”
据知危与医疗 AI 专家的沟通ღ★◈✿,医疗本身还有巨大的知识盲区ღ★◈✿,新知识在快速增长ღ★◈✿。因此基于大模型做医疗基础研究ღ★◈✿,有很大想象空间ღ★◈✿。以蛋白质结构预测的 AlphaFold 模型为例ღ★◈✿,据梅斯医学报道ღ★◈✿,截至 2024 年 5 月ღ★◈✿,全球已经有 180+ 万的科学家使用 AlphaFold 加速研究ღ★◈✿,包括开发生物可再生材料ღ★◈✿,或推进基因研究等ღ★◈✿。
对此ღ★◈✿,张森森表示ღ★◈✿:“通用医疗大模型目前在国内市场尚无明显突破ღ★◈✿,主要原因在于大规模数据的收集和应用依赖于强大的医疗设备支持ღ★◈✿。国内许多医疗设备还没有广泛普及ღ★◈✿,因此 AI 难以进行精准诊断ღ★◈✿。但一些综合实力强的医院ღ★◈✿,如海外的梅森医疗中心等ღ★◈✿,已经开始探索推出自己的大模型ღ★◈✿。尽管短期内很难看到盈利机会ღ★◈✿,但从长远来看ღ★◈✿,这类大模型有可能对医疗行业产生深远影响ღ★◈✿。”
“ 医疗行业还面临全自动诊断的挑战ღ★◈✿,尤其是在国内设备不足的情况下ღ★◈✿,AI 无法完全替代传统诊断方式ღ★◈✿。部分医疗设备尚未普及ღ★◈✿,尤其在边远地区ღ★◈✿,医疗技术难以全面覆盖ღ★◈✿,因此全自动诊断仍然存在较大的难度ღ★◈✿。”
“由于医疗行业具有严格的牌照和合规要求ღ★◈✿,大模型在进入医疗领域时必须解决合规问题ღ★◈✿。未来的 C 端医疗服务可能通过结合医生技术和 AI 技术来提升诊疗效率ღ★◈✿,尤其是面向 80 后ღ★◈✿、90 后ღ★◈✿、00 后等年轻群体ღ★◈✿。”
最后ღ★◈✿,即便抛开国内 To B 市场本身的特点ღ★◈✿,单从大模型应用竞争的角度ღ★◈✿,To B 市场的存活难度也相当大ღ★◈✿。王文广表示ღ★◈✿:“ 虽然整体上大模型 To B 产品的设计模式还在摸索中ღ★◈✿,但最终还是会趋同的ღ★◈✿。这方面不仅是国内ღ★◈✿,就连硅谷科技公司也类似ღ★◈✿,比如OpenAIღ★◈✿、Anthropicღ★◈✿、谷歌等ღ★◈✿,只要模型本身的性能拉不开差距ღ★◈✿,在这个市场里就一定不能赚钱ღ★◈✿,最后会卷到大家都处于同样的水平ღ★◈✿。”
“这也是为什么 DeepSeek R1 其实最大的影响力不在国内ღ★◈✿,而是在国外ღ★◈✿,特别是对硅谷科技公司ღ★◈✿。美股就是从 R1 发布开始持续高位震荡然后开始下跌ღ★◈✿。背后的核心逻辑很简单ღ★◈✿,就是硅谷的大模型被中国追上了ღ★◈✿。不能说超越ღ★◈✿,但是被追上了之后ღ★◈✿,硅谷这边拉不开差距ღ★◈✿,就无法支撑这么高的估值ღ★◈✿,于是股价就下跌了ღ★◈✿。”
当然ღ★◈✿,To B 市场还有一种方式能够很好地吸引客户ღ★◈✿,那就是开源ღ★◈✿。企业开源的主要盈利模式包括额外提供收费级功能ღ★◈✿、云托管ღ★◈✿,以及基于开源技术的企业级咨询ღ★◈✿、培训等增值服务ღ★◈✿。
开源大模型最直接的作用就是推动技术的普及ღ★◈✿,张森森表示ღ★◈✿:“ DeepSeek 开源之后ღ★◈✿,对于企业在应用大模型上有非常大的加速作用ღ★◈✿。公司高层对大模型的应用是很支持的ღ★◈✿,随着大模型在实际应用中表现良好ღ★◈✿,尤其是在降低人工干预ღ★◈✿、提升效率等方面优势逐步显现ღ★◈✿,支持力度将不断加大ღ★◈✿。”
“ 金融行业作为数据质量最好的行业ღ★◈✿,在 AI 方面一直有丰富的技术积累ღ★◈✿,自然能够很快跟上凯发k8国际ღ★◈✿。不管有没有 DeepSeekღ★◈✿,金融都会落地 AI 技术ღ★◈✿。但有了 DeepSeek 之后ღ★◈✿,除了过去 AI 赋能的金融主营业务ღ★◈✿,现在也会将 AI 用到一些日常办公ღ★◈✿、过去比较难做的运维等业务ღ★◈✿。”
“ 运维原本成本是很高的ღ★◈✿,比如对于根因分析ღ★◈✿,之前需要基于传统的运维监控和 AIOps 来做ღ★◈✿,也需要专门训练一些小模型来做ღ★◈✿,现在可以用 DeepSeek 结合知识库去生成应用方案ღ★◈✿,来处理监控ღ★◈✿、告警ღ★◈✿、自助分析ღ★◈✿,以及溯源ღ★◈✿、自动化处理ღ★◈✿、稳定性提升等工作ღ★◈✿,这比 AIOps 更加灵活ღ★◈✿。”
“ 其次ღ★◈✿,对于运维工作ღ★◈✿,AI 的覆盖面也变得更广了ღ★◈✿,现在会更加考虑到交互性和主动性ღ★◈✿,主动性也就是让 AI 主动去做运维ღ★◈✿。从过去依赖规则ღ★◈✿、人工甚至个人经验ღ★◈✿,人的经验高低决定了运维能力的水平ღ★◈✿,现在可以用更加轻量级的 AI 模型来直接实现ღ★◈✿。”
“ 尽管 DeepSeek 的幻觉率依然较高ღ★◈✿,甚至与其它同类模型表现差距不大ღ★◈✿。但相比其它同类模型ღ★◈✿,DeepSeek 的推理和实际应用能力已足以抵消幻觉带来的负面影响ღ★◈✿,我们会通过微调和优化ღ★◈✿,采用 RAG 等相关技术ღ★◈✿,将这一问题逐步改善ღ★◈✿。”
阿里大模型技术专家高鹏( 化名 )则认为ღ★◈✿,DeepSeek 的影响力对大型公司和中小型公司的影响有所不同ღ★◈✿:
“ 阿里内部使用的大模型一直是业内最先进的ღ★◈✿,所以 DeepSeek 出来之后对我们的影响没那么大ღ★◈✿。我们会拿 DeepSeek 做性能评估和对比鬼吹灯私服ღ★◈✿,对阿里而言ღ★◈✿,更多是技术上的启发ღ★◈✿。DeepSeek 在 Reasoning 上的落地比较快ღ★◈✿,而技术细节上还是比较通用的ღ★◈✿,DeepSeek 也肯定有受到千问的影响ღ★◈✿。”
“相比之下ღ★◈✿,DeepSeek 对于中小型公司影响比较大ღ★◈✿,因为之前没有一个模型可以达到 DeepSeek 那样效果的同时ღ★◈✿,实现低成本的私有化部署ღ★◈✿。DeepSeek 出来以后ღ★◈✿,也涌现了大量卖 DeepSeek 一体机的公司ღ★◈✿。但实际上ღ★◈✿,跟很多开源模型一体机相比ღ★◈✿,DeepSeek 也不是最便宜的ღ★◈✿,要看具体的标准ღ★◈✿。”
无论怎样ღ★◈✿,现阶段国内开源大模型枝繁叶茂ღ★◈✿,并已经能参与全球竞争ღ★◈✿。然而ღ★◈✿,从平安保险自身落地大模型的情况ღ★◈✿,张森森认为开源大模型还有难以克服的局限性ღ★◈✿:
“ 对于我们而言ღ★◈✿,DeepSeek 主要是成本上的巨大优势ღ★◈✿,在能力方面的话ღ★◈✿,比如在运维场景ღ★◈✿,在推理ღ★◈✿、泛化能力ღ★◈✿、上下文理解上可能比其它模型更好一些ღ★◈✿。但在金融风控等更复杂的场景下ღ★◈✿,DeepSeek 的表现并不突出ღ★◈✿。这是因为需要更细致的微调ღ★◈✿,甚至结合其它模型进行优化ღ★◈✿。因此还需要根据具体应用场景进行针对性的微调ღ★◈✿,来进一步提升模型表现ღ★◈✿。”
“ 平安自研的大模型ღ★◈✿,主要分为两层ღ★◈✿,底层是基础大模型ღ★◈✿,再往上是分别负责银行ღ★◈✿、保险等业务等领域模型ღ★◈✿。我们内部使用的大模型在专业知识领域的表现确实超越了 DeepSeekღ★◈✿,尤其是在金融和医疗等特定领域ღ★◈✿,模型的表现更加精准ღ★◈✿。然而ღ★◈✿,在推理能力上ღ★◈✿,DeepSeek 依然具备强大的优势ღ★◈✿。有一些场景ღ★◈✿,我们希望先用 DeepSeek 做一个小规模的尝试ღ★◈✿,看看能不能跑通ღ★◈✿。”
“对于阿里千问ღ★◈✿、百度文心和智谱 ChatGLM 这些开源大模型ღ★◈✿,它们在这方面与 DeepSeek 的区别并不明显ღ★◈✿。判断的依据是ღ★◈✿,这些模型在推理能力和知识库结构上与 DeepSeek 并无太大差异ღ★◈✿。”
DeepSeek 在极短时间内强势崛起ღ★◈✿,其月活人数从几乎默默无闻到大大超越 Claudeღ★◈✿、Perplexityღ★◈✿,只用了一个月的时间ღ★◈✿。
在移动端的使用时长方面( 基于平均每周每位用户的会话数和每位用户的分钟数 )ღ★◈✿,DeepSeek 也略高于Perplexity 和 Claudeღ★◈✿,但目前和 ChatGPT 相比仍有较大差距ღ★◈✿。
最受欢迎的应用并不一定能带来最多的收入ღ★◈✿。比如 ChatGPT 有最高的收入ღ★◈✿,OpenAI 却仍然年亏 50 亿美元ღ★◈✿,而大量 ChatGPT 的 “ 山寨 ” 应用倒是很可能实现了快速盈利ღ★◈✿;DeepSeek 火了以后ღ★◈✿,模仿者ღ★◈✿、仿冒者也是排山倒海而来ღ★◈✿。
从 C 端市场来观察六小虎的境遇ღ★◈✿,实际上也不乐观ღ★◈✿。综合知危与业内专家的沟通ღ★◈✿,普遍认为大厂将带来极大生存压力ღ★◈✿。
姜绍表示ღ★◈✿:“ 消费市场方面ღ★◈✿,六小虎里面做的比较好的是月之暗面的 Kimiღ★◈✿。但现在排第一的是腾讯的元宝ღ★◈✿,第二是DeepSeekღ★◈✿,第三是豆包ღ★◈✿,头三家公司几乎占据了大部分市场份额ღ★◈✿。腾讯的元宝凭借微信生态圈获得了大量的客户流量ღ★◈✿,而 DeepSeek 则凭借其技术创新和在多个场景中的优异表现脱颖而出ღ★◈✿。”
梁贺表示ღ★◈✿:“Kimi 的大模型技术和竞争对手没有太大区别ღ★◈✿,那就只能免费ღ★◈✿,这就导致月之暗面商业化变得特别困难ღ★◈✿。作为一个 To C 应用ღ★◈✿,看不出它跟元宝ღ★◈✿、豆包的区别在哪里ღ★◈✿。而且ღ★◈✿,豆包可以用字节其它业务来养ღ★◈✿,元宝可以用腾讯其它业务来养ღ★◈✿,它们可以投入 1000 亿来养这些应用ღ★◈✿。”
姜绍补充道ღ★◈✿:“对于 C 端用户ღ★◈✿,更加关心产品易用好用ღ★◈✿,腾讯和字节在这方面做得更好ღ★◈✿。当然阿里也有机会ღ★◈✿,阿里正在孵化名为 ‘ AI 听声 ’ 的应用ღ★◈✿,这个应用通过 AI 进行聊天和交互ღ★◈✿,目标是取代抖音在短视频平台中的地位ღ★◈✿。虽然抖音吸引大量创作者生成优质内容ღ★◈✿,但 AI 聊天应用通过提供更加个性化和互动的体验ღ★◈✿,有潜力在一定程度上吸引用户群体ღ★◈✿。两者的差异主要在于内容创作和互动方式ღ★◈✿。如果阿里能够突破这一块ღ★◈✿,也有机会翻身ღ★◈✿,当然如果腾讯跟进仿制ღ★◈✿,就不好说了ღ★◈✿。”
梁贺认为ღ★◈✿:“MiniMax 的海螺 AI 目前是挺赚钱的ღ★◈✿,它算是找到了自己的一条路ღ★◈✿,但这条路能不能让 MiniMax 的估值做的足够大ღ★◈✿,还是个未知数ღ★◈✿。由于偏向应用ღ★◈✿,MiniMax 在 DeepSeek 出来之后更轻松了ღ★◈✿,如果他们全部使用 DeepSeek 的模型ღ★◈✿,反而是节省了模型的研发成本ღ★◈✿,而它的应用还能继续赚钱ღ★◈✿,甚至赚的更多ღ★◈✿。”
姜绍则认为ღ★◈✿:“ MiniMax 如果后面能够做出一个爆款 APP 的话是有机会的ღ★◈✿,但阿里可能会超过它先做出爆款 APPღ★◈✿,所以 MiniMax 即便有机会概率也不大ღ★◈✿。”
根据 a16z 的 “ Top 100 Gen AI Consumer Apps ” 最新报告ღ★◈✿,许多使用率较低的应用其实实现了更好的收入ღ★◈✿。有些通用性很差的产品比如植物识别ღ★◈✿、营养等吸引付费用户的能力反比通用产品而更大ღ★◈✿。
而做差异化如果垂直深度不够ღ★◈✿,也容易被基座大模型通过能力升级所内化ღ★◈✿。比如ღ★◈✿,最近 GPT-4o 的生图能力就对 Midjourney 等文生图创企带来了降维打击ღ★◈✿。这种覆盖能力ღ★◈✿,很多时候都是随机的ღ★◈✿、不可预测的ღ★◈✿,正所谓“ 毁灭你ღ★◈✿,与你无关ღ★◈✿。”
竞争对手的像素级模仿ღ★◈✿,基座大模型的快速升级ღ★◈✿,让 C 端 AI 初创公司的风光几乎永远只保持很短的时间ღ★◈✿。
六小虎走入今天的困境ღ★◈✿,很大一部分是因为当初在基座大模型上投注过大ღ★◈✿,低估了要在这个赛道上生存和拔尖需要的人力ღ★◈✿、财力ღ★◈✿、物力ღ★◈✿,导致现在在应用赛道上也很难打出差异化ღ★◈✿。
如今六小虎对攻克 AGI 的决心越来越弱ღ★◈✿,李开复近日还公开直言ღ★◈✿,国内的基座大模型最后只会剩下 DeepSeekღ★◈✿、阿里ღ★◈✿、字节三家ღ★◈✿。
姜绍表示ღ★◈✿:“ 现在还在继续死磕大模型技术的创业公司基本都得死ღ★◈✿。最有希望的肯定是 DeepSeekღ★◈✿,第二是阿里巴巴ღ★◈✿,第三是字节跳动ღ★◈✿,第一名预计能分到 50%-80% 的流量ღ★◈✿,后面两名可能分到 10% 的流量ღ★◈✿。核心在于谁先把 AGI 做出来ღ★◈✿,谁就是最后的赢家凯发k8国际ღ★◈✿。”
“ DeepSeek 目前在大模型领域最具竞争力ღ★◈✿,其技术创新和在实际应用中的表现无可挑剔ღ★◈✿。阿里巴巴和字节跳动也具备较强的竞争力ღ★◈✿,尤其是在跨平台应用和数据资源上的优势ღ★◈✿。排名的依据主要是基于各家公司在基础技术ღ★◈✿、算力ღ★◈✿、数据资源以及实际应用中的创新能力ღ★◈✿。”
“ 智谱和 Kimi 的团队坚信ღ★◈✿,继续增强基础模型的能力才是未来的出路ღ★◈✿。与之相对ღ★◈✿,我认为随着市场需求的变化和应用场景的多样化ღ★◈✿,单纯强化基础模型的路线可能会受到局限ღ★◈✿,更灵活ღ★◈✿、适应性强的模型发展路径才可能更加具备市场竞争力ღ★◈✿。”
“大模型技术竞争异常激烈ღ★◈✿,投入巨大的公司最终必须在创新ღ★◈✿、算力ღ★◈✿、数据和优化上有明显突破ღ★◈✿,才能保持竞争力ღ★◈✿。其他未能跟上技术进步或无法应对市场需求的公司将逐渐被淘汰ღ★◈✿。”
梁贺表示ღ★◈✿:“国内的基础大模型公司未来只会剩下 DeepSeekღ★◈✿、阿里ღ★◈✿、字节三家公司ღ★◈✿,依据就是这三家能够有实力和决心投入超大资源来研发ღ★◈✿。对于字节而言ღ★◈✿,它不可能错失大模型这个机会ღ★◈✿,不然对它整体影响会非常大ღ★◈✿。而且DeepSeek的技术对于字节而言不会有太大的壁垒ღ★◈✿,更多是研发效率上DeepSeek目前更有优势ღ★◈✿。阿里的千问开源模型本身水平比较高ღ★◈✿,在DeepSeek火起来以前ღ★◈✿,千问和Llama基本是你追我赶的状态ღ★◈✿。对于阿里来说ღ★◈✿,千问模型可以不赚钱ღ★◈✿,但是相关的云业务可以赚钱ღ★◈✿,字节也是类似的ღ★◈✿,还能将大模型技术不断用于优化抖音等App的体验ღ★◈✿。而对于 AI 创业公司ღ★◈✿,如果模型本身不赚钱ღ★◈✿,就触及了生存的根本ღ★◈✿。”
王文广则表示ღ★◈✿:“DeepSeek 的优势主要在于技术理想主义ღ★◈✿。春节前后两三个月内ღ★◈✿,DeepSeek 的流量巨大ღ★◈✿,如果它想做商业化的话ღ★◈✿,很快就能达到全球第一ღ★◈✿,豆包等其它大模型根本没有机会ღ★◈✿。只要 DeepSeek 不在最近的开源周把基础设施相关的优化方法开源出来ღ★◈✿,以后它都可以依靠这个来赚钱ღ★◈✿,如此一来别人都没有机会ღ★◈✿。DeepSeek 也没有融资凯发k8国际ღ★◈✿,不需要受到投资人的影响ღ★◈✿。技术理想主义和人才是最大的壁垒ღ★◈✿。对比 OpenAIღ★◈✿,OpenAI 现在能看到的成果基本上都是在 Altman 和 Ilya 的纷争发生之前的研究成果ღ★◈✿,至少创新点是已经确定了ღ★◈✿,如今最初那帮有理想的人才离开了之后ღ★◈✿,OpenAI 本身的创新几乎就没有了ღ★◈✿。目前 OpenAI 的创新更多是在应用层面ღ★◈✿,比如 Deep Researchღ★◈✿,应用层面的创新没有什么壁垒ღ★◈✿,所以它也要跟着竞争对手一起卷ღ★◈✿。”
某大厂 AI技 术专家王牧( 化名 )告诉知危ღ★◈✿:“ 除非有钱ღ★◈✿、有人才ღ★◈✿、有硬件ღ★◈✿,否则没必要在预训练大模型上浪费功夫ღ★◈✿,DeepSeek 起码在 2021 年就有万卡集群了ღ★◈✿,也不缺钱凯发k8国际ღ★◈✿。反观其它中小公司ღ★◈✿,基本凑不齐这个条件ღ★◈✿。”
高鹏表示ღ★◈✿:“ AI 创业公司要想活下去ღ★◈✿,还是要转向应用ღ★◈✿,一两年前我也是这么认为的ღ★◈✿,现在转都可能太晚了ღ★◈✿。接下来第一批要被淘汰的 AI 公司就是做基座大模型的公司ღ★◈✿。大模型的训练ღ★◈✿,其实有很多复杂的细节ღ★◈✿,非常依赖经验的积累ღ★◈✿。Transformer 架构内部的细节是普遍比较了解的ღ★◈✿,但不管开源还是闭源模型的论文基本都不会告诉你数据是如何准备的ღ★◈✿,数据细节是什么ღ★◈✿,数据规模有多大ღ★◈✿,数据质量如何等等ღ★◈✿,业界也没有一个统一的标准ღ★◈✿。”
“ 开源开一半 ” 在大模型赛道一直是典型做法ღ★◈✿,当前ღ★◈✿,会将代码ღ★◈✿、权重ღ★◈✿、数据集ღ★◈✿、训练过程全公开的大模型少之又少ღ★◈✿,比较知名的有 OLMoღ★◈✿、BLOOM 等ღ★◈✿。
然而ღ★◈✿,即便转向应用就能活下来了吗?从前面对 To B 赛道和 To C 赛道的分析鬼吹灯私服ღ★◈✿,AI 创业公司在应用上几乎很难形成自己的行业壁垒ღ★◈✿。对此ღ★◈✿,高鹏表示ღ★◈✿:“ 要想形成自己的行业壁垒ღ★◈✿,关键在于自己拥有哪些数据ღ★◈✿,模型谁都能用ღ★◈✿。数据分为两个方面ღ★◈✿,一方面是创业者的领域经验ღ★◈✿,一方面就是手里的数据了ღ★◈✿。”
从企业文化的角度ღ★◈✿,高鹏认为研发基座大模型需要的是一种实验型ღ★◈✿、工程型的艰苦探索精神ღ★◈✿,“之前很长一段时间ღ★◈✿,国内很多 AI 创业公司都太高调了ღ★◈✿,做技术本来是先应该低调的做ღ★◈✿,做好再去高调地宣传ღ★◈✿。有些团队学术界的组成比较重ღ★◈✿,但学术界的人研究技术有时过于理论化ღ★◈✿。人才或团队方面ღ★◈✿,一个大模型团队能不能成功主要看老板理不理解大模型ღ★◈✿。如果老板都不理解大模型技术ღ★◈✿,或者没有信仰去坚持ღ★◈✿,因为不赚钱就放弃了ღ★◈✿,是根本行不通的ღ★◈✿。DeepSeek 能成功更多是依靠自顶向下的组织模式ღ★◈✿,老板对技术细节很懂ღ★◈✿,带大家一起干ღ★◈✿。国内符合这种模式的太少了ღ★◈✿。”
对于业内热烈讨论的国内基座大模型最后的赢家预测ღ★◈✿,高鹏认为这个论断还太早ღ★◈✿,“ 能参与竞争的玩家ღ★◈✿,技术路线上不会有太大的差别ღ★◈✿,就按着 Transformer 架构去做细节优化就行ღ★◈✿,Mamba 和 RWKV 也有希望ღ★◈✿。关键是要踏踏实实做事ღ★◈✿,时间会证明一切ღ★◈✿。最后的赢家ღ★◈✿、前三名这种事都不好说ღ★◈✿,大模型技术栈是很复杂的东西ღ★◈✿,而且谁知道是不是还有很多人在默默地干一件事情ღ★◈✿,只不过时间还没到而已ღ★◈✿。”
在模型赢家很难判断的现在ღ★◈✿,数据开始变成了最重要的护城河ღ★◈✿。红杉资本合伙人 Konstantine Buhler 曾表示ღ★◈✿,OpenAI 在 ChatGPT 上犯的一个错误就是不允许编辑回复ღ★◈✿,而这本来可以在反馈循环中提供更高质量的数据ღ★◈✿,并构建更深厚的护城河ღ★◈✿。
数据能否让某个行业在当下借助AI进一步发展或者带来新的商业机会也很重要ღ★◈✿,张森森表示ღ★◈✿:“ AI 落地的成熟度更加接近金融ღ★◈✿、互联网两个行业的ღ★◈✿,我比较看好 AI 办公ღ★◈✿、AI 政务ღ★◈✿、AI 电商ღ★◈✿。主要是基于其数字化程度高ღ★◈✿,以及业绩的高确定性ღ★◈✿。”
“尽管电商已经比较成熟ღ★◈✿,但 AI 将继续提升电商的效率ღ★◈✿,尤其是在商品推荐ღ★◈✿、客户服务ღ★◈✿、物流优化等方面ღ★◈✿。AI 通过更精准的市场分析和决策优化ღ★◈✿,能够提升电商平台的效率ღ★◈✿。这种效率的提升将不仅仅是线下零售的继续ღ★◈✿,而是能带来新的电商形态ღ★◈✿,尤其是在跨境电商领域ღ★◈✿,AI 将助力其爆发式增长ღ★◈✿。”
“ 相比之下ღ★◈✿,金融行业在 2024 年就出现了一次业绩爆发ღ★◈✿,2025 年随着 AI 业务深入ღ★◈✿,业绩能还有很大的增长空间ღ★◈✿。”
“反观那些 AI 落地不成熟的行业ღ★◈✿,特别是智能制造ღ★◈✿,有大量的定制化的东西ღ★◈✿,每个企业生产的产品都是不一样的ღ★◈✿,没有一个统一的标准ღ★◈✿。所以企业想推动 AI 工作自动化比较困难ღ★◈✿,数据的价格很高ღ★◈✿,精度要求也很高ღ★◈✿。虽然说工业软件基本是智能制造落地最早的解决方向ღ★◈✿,有比较好的效果ღ★◈✿。但是制造业的 AI 化升级是有历史包袱的ღ★◈✿,大部分的制造行业的数据和信息化的水平是不够的ღ★◈✿,就导致它们在做 AI 化的时候是缺乏数据的ღ★◈✿,特别是异常样本的收集几乎是没有的ღ★◈✿。复杂度也高ღ★◈✿,比如设备种类繁多ღ★◈✿、数据标准不统一ღ★◈✿,导致算法可迁移性很差ღ★◈✿,常常忽略一些关键因素比如温度ღ★◈✿、材料或者一些不可预测的变量的影响ღ★◈✿。而且ღ★◈✿,企业对传感器数据的关注是有偏差的ღ★◈✿,对于各种传感器故障数据ღ★◈✿,企业主要关注的是会影响生产结果的数据ღ★◈✿,但实际上ღ★◈✿,那些边缘的传感器数据ღ★◈✿,未来很有可能成为我们撬动整个制造业创新和商业化的一个支点ღ★◈✿。AI 能够通过对这些数据的分析ღ★◈✿,发现潜在的优化机会ღ★◈✿,从而推动整个行业的进步ღ★◈✿。”
“ 而且ღ★◈✿,制造业的能力要求和其它行业也有一些不一样ღ★◈✿,它要求必须实时处理问题ღ★◈✿,大模型的延迟性在这里会难被接受ღ★◈✿。所以ღ★◈✿,智能制造短期内是没有投资回报率的ღ★◈✿,当然国家肯定会把这个行业的 AI 化给扶持起来ღ★◈✿。可能未来五年ღ★◈✿,会产生一个大规模增长凯发k8国际ღ★◈✿,机器人化和 AI 化会做一个双重结合ღ★◈✿。”
说到底ღ★◈✿,对于初创公司来讲ღ★◈✿,无论是做基础大模型还是做 To B 或是 To Cღ★◈✿,你都很难找到一个坚固的护城河ღ★◈✿,如果没有长年积累的数据或技术经验ღ★◈✿,都无法形成竞争壁垒ღ★◈✿。
所以ღ★◈✿,初创公司一旦没有在小有名气的时候把雪球滚起来ღ★◈✿,很容易就逐渐落寞最终找不到活下去的理由ღ★◈✿。