您的位置 首页 科技

DeepSeek完成7亿美元C轮融资?多位投资人称是假消息;R2延迟发布,背后资方规模缩水

出品|搜狐科技作者|梁昌均 郑松毅编辑|杨锦DeepSeek新模型没等来,新融资的消息却先吸引到了圈内关注。

出品|搜狐科技

作者|梁昌均 郑松毅

编辑|杨锦

DeepSeek新模型没等来,新融资的消息却先吸引到了圈内关注。

8月15日,有消息称,“据企查查消息,DeepSeek已于8月14日完成超过7亿美元的C轮融资,由国家产业投资基金领投,多家顶级风险资本、科技巨头投资部门以及主权财富基金等共同参与。本轮融资后,DeepSeek估值突破80亿美元。”

DeepSeek完成7亿美元C轮融资?多位投资人称是假消息;R2延迟发布,背后资方规模缩水

消息传出后快速在圈内发酵,搜狐科技随即向企查查方面求证,相关负责人表示,“消息来源不明,官方网页中相关资讯消息为机器自动抓取,已做删除处理。”

另有多位投资人向搜狐科技表示“投资圈普遍认为是假消息,投资参与者信息模糊。且DeepSeek此前并未有融资,直接进入C轮很蹊跷。”

其中,一名业内人士向搜狐科技展示了一则对话,对话中一名疑似DeepSeek人士调侃道,“(是)企查查帮我们融的,不是我们融的。”

展开全文

另有业内人士向搜狐科技直言,“他们(DeepSeek)这个身位,肯定是不会要财务投资人钱的。国家给了非常多资助和支持。像王坚院士领导的之江实验室,提供了几十亿的算力支持,基本是倾囊相助。”

搜狐科技向DeepSeek致电求证,DeepSeek相关工作人员表示来电提问已登记,暂不知情。截止发稿,搜狐科技尚未收到回复。

梁文锋曾拒绝盲目商业化,称“不着急融资”

两年前,梁文锋决定下场做大模型后接受媒体采访时表示,当时有找不同出资方谈融资,但接触下来,感觉很多VC对做研究有顾虑,他们有退出需求,希望尽快做出产品商业化。

“按照我们优先做研究的思路,很难从VC那里获得融资。”梁文锋表示,幻方作为出资人之一,有充足的研发预算,另外每年有几个亿的捐款预算,如果需要也可以进行调整。

今年春节,DeepSeek爆火后,整个投资圈传出VC错过DeepSeek的说法,和DeepSeek北京公司同在一栋楼的百度风投曾就因此面临过质疑。

随后不少投资人都尝试和梁文锋进行接触,希望参与融资。此前表态坚决不投大模型的金沙江创投管理合伙人朱啸虎甚至也转变态度称,“我肯定会投,价格已经不太重要了,关键是参与在这里面”。

当时有媒体报道称,腾讯和阿里等科技公司高管与梁文锋会面,探讨潜在的合作机会,但梁文锋表示现在并不急于融资,因为担心外部投资者会干预公司决策。

后来,市场有消息传出阿里将以100亿美元的估值注资DeepSeek,从而获取其10%的股份。但随后,阿里副总裁颜乔对此进行了否认,阿里公关团队也同步发表了否认声明。但当时有消息称,DeepSeek正与投资人接触,估值是80亿美元。

此前,DeepSeek还放出了多个财务相关岗位,涉及CFO、COO、财务副总裁、财务总监等,引发市场对DeepSeek开放融资的猜测。不过,有业内知名投资人对此表示不清楚。

《新财富》杂志发布的创富榜显示,梁文锋以1846亿元财富首次上榜即闯入前十,而彭博调研给予DeepSeek约300亿美元估值预期。

是什么让DeepSeek“沉默”?

自DeepSeek成为国产“AI黑马”,凭低成本比肩海外顶尖模型以来,AI圈始终对其保持高度关注。

然而,DeepSeek新模型发布一再“跳票”,相较于外媒《路透社》最早披露的5月初发布计划,R2的亮相迄今已推迟近百天。

究竟是什么原因,在海外OpenAI、Google等一众大厂发起猛攻时,DeepSeek却保持了“沉默”?

有报道称,DeepSeek-R2的训练遭遇了问题,导致模型发布延迟。据SemiAnalysis公开信息显示,R1使用芯片量包括3万张H20,1万张H800,以及1万张H100。R2若进行全面部署,对算力的需求只增不减。然而受限于美国芯片的出口管制,让DeepSeek“巧妇难为无米之炊”。

浙江大学计算机学院智能所和人工智能协同创新中心的百人计划研究员王则可认为,“H20主要针对推理场景优化。虽然大模型训练和部署主要依赖于H100等高端卡,但H20的短缺会对大模型的推理能力造成直接影响。”

除芯片外,业内认为DeepSeek新模型延迟发布的另一原因是性能表现未达到梁文锋标准。

据知名投行摩根士丹利近期发布的研报透露,新模型R2将采用混合MoE架构,主打编程、多语言推理、及多模态能力。总参数量从R1的6710亿直接飙升到了1.2万亿,活跃参数也从之前的370亿涨至780亿。

这意味着,R2每次思考时,会调用多一倍数量的“脑细胞”来处理问题,思考的深度和质量都会发生质的变化。同时按DeepSeek风格,依然在追求低成本实现。

该研报分析,R2的输入成本,将达到每百万Token仅需0.07美元(R1是0.15美元);输出成本,将达到每百万Token仅需0.27美元(R1是2.19美元)。

但可能正因为目标过高,反而卡在了发布前的“最后一公里”。

据The Tech Basic报道,“R2在内部基准测试中的表现并未对R1形成全面碾压,尤其在编程、推理等关键指标项上能力提升有限。”CEO梁文锋坚称,“达不到标准,就不发布。”

美国杜克大学电气与计算机工程专业的杰出教授陈怡然向搜狐科技表示,“不清楚梁文锋具体为什么不满意,但R2肯定是要与这些顶尖模型进行对标的,不说超越但至少不能差太远,可以理解DeepSeek会对发布比较谨慎。”

可见的是,眼下DeepSeek没有选择一味追随竞品发布节奏,而似乎在等待“精准出击”。

母公司幻方量化规模缩水

DeepSeek的主要资金来源于梁文锋旗下的量化投资公司幻方量化。

据私募排排网数据,2018年之前,幻方量化的规模只有几十亿,此后逐步形成“北九坤、南幻方”的市场格局,2019年成长为百亿私募,2021年更是成为首家突破千亿资产规模的量化投资机构,但随后因业绩回撤缩水至2024年的约450亿元。

这背后则主要是幻方量化的盈利波动导致。公开数据显示,在2024年百亿私募业绩排名中,幻方以12.18%的收益率均值和13.02%的中位数位列第19名,勉强跻身TOP20,远落后于头部机构,如东方港湾高达60.59%的收益。

同时,幻方旗下基金盈利差距显著。据同花顺数据显示,该公司截至去年底共有65只基金公开披露净值,其中有29只基金年内涨幅超过10%,其余基金年内下跌,最大跌幅超6%。

今年上半年,幻方旗下11只产品平均收益为24.75%,继续稳居百亿量化前列。来自量化投资与机器学习的数据显示,目前幻方和衍复、明汯、九坤以600亿元至700亿元区间的管理规模成为新的量化四大天王。

如果DeepSeek坚持不融资,那么幻方量化的资产规模和投资收益将是其未来重要的资金来源。

SemiAnalysis早期发布的一份报告估计,DeepSeek总服务器资本支出约为13亿美元,其中仅集群运营成本就高达7.15亿美元。

同时,该机构提到,DeepSeek的团队规模超百人,且扩张速度极快,而薪资水平也远超中国其他科技公司,为顶尖研究人员开出了超过百万美元的年薪。

随着对R2等大模型的持续投入,包括算力等基础设施、人才招揽等,DeepSeek的资金需求恐也将持续增长。

本文来自网络,不代表冰河马新闻网立场,转载请注明出处:http://www.wqgzj.cn/41178.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部