百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

DeepSeek十问十答

mhr18 2025-02-08 11:57 19 浏览 0 评论

来源:华泰睿思

DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值等十个关键问题进行了深入分析。

核心观点

1.DeepSeek是否会抑制算力增长?短期抑制VS长期爆发

我们认为DeepSeek本质是对现有AI算法的效率优化,短期可能导致训练需求下降,但随着模型普及和应用场景扩展,长期推理需求将显著增长,这种趋势类似于"蒸汽机降低煤耗但提升煤炭总用量"的历史现象。

2.DeepSeek是否会改变AI算力的增长范式:目前不会

AI算力大致分为1)用于研发前沿模型相关的探索性算力(AGI方向),2)面向消费者的应用性算力(现有模型推理)。目前北美四大AI公司主要通过扩大GPU集群规模的方式探索下一代大模型。只要这个探索工作还在继续产生正向回报,AI算力的增长范式短期或不会发生变化。

3. DeepSeek会改变市场投资逻辑吗?软件有望跑赢硬件

我们认识到,1)未来大模型竞争中,"算法效率"的重要性或上升, 投资重点可能从"算力军备"转向"算法效率"。2)开源协议使中小开发者能基于前沿模型二次开发,创造更多创新机会。投资角度,看好美股软件表现好于硬件。

4.芯片市场格局是否会改变?高端GPU用途受限,ASIC占比或提升

DeepSeek的成功显示即使不使用最先进的GPU,也可以开发满足一般消费者需求的大模型。这可能意味着,英伟达的Blackwell/Rubin等最先进的GPU的用途,可能会局限在探索下一代超大规模模型(Frontier Model)上。

5.DeepSeek真的那么便宜吗?可能没有

DeepSeek在其V3技术报告中估计其训练成本只有557.6万美元,根据SemiAnalysis分析,这只包含预训练阶段的部分成本,而加上GPU算力投资,研发、数据收集等其他重要成本或远大于这个数字。

6.DeepSeek到底有哪些创新?混合专家MoE,强化学习,蒸馏等

主要创新包括模型架构(混合专家MoE,MLA)、训练方法(纯强化学习)、蒸馏优化和推理效率提升等,显著提升了AI算法效率和性能。

7.DeepSeek会带动中国科技资产价值重估吗?有可能

目前(2025/2/3),恒生科技指数12月前向PE 20.0倍,远低于纳斯达克的35.4倍。DeepSeek的成功可能提高中国AI公司估值预期。

8.DeepSeek会推动端侧智能发展吗?有可能,但需要时间

DeepSeek的高性价比模型有利于模型在智能手机和汽车等智能设备上落地,我们认为智能硬件迭代不会一蹴而就,模型能力提升只是其中一环。

9.DeepSeek会导致美国提升出口管制压力吗?可能会

我们注意到DeepSeek发布后,美国媒体进一步限制中国发展AI声音抬头。建议关注后续:1)高端AI芯片出口管制,2)前沿模型的开源限制,3)模型回传限制,4)数据获取限制等风险。

10.DeepSeek会改变开源软件生态吗?会

目前基础大模型的开发,主要集中在OpenAI、Google、Anthropic、阿里,字节、百度的科技巨头手中。DeepSeek这次的成功丰富了AI开源生态,也为中小开发者依托开源生态实现快速发展提供了一条发展路径。

风险提示:中美贸易摩擦升级风险,宏观下行风险,创新品渗透不及预期风险。本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。

正文

DeepSeek十问十答

问题#1:DeepSeek是否会抑制算力增长?

据DeepSeek V3技术报告,V3模型的训练总计只需要278.8万 GPU小时,相当于在2048卡的H800GPU集群上训练约2个月,合计成本约557.6万美金,相较而言,Llama 3系列模型的计算预算则多达 3930万 H100 GPU小时,DeepSeek训练成本约相当于Llama 3系列模型的7%。

我们认为,DeepSeek对算力需求的影响呈现出短期抑制、长期增长的复杂趋势。短期内,DeepSeek的低成本高效训练方法可能导致训练需求下降。然而,从长远来看,随着模型的普及和应用场景的扩展,推理需求将显著增长。这种趋势类似于"蒸汽机降低煤耗但提升煤炭总用量"的历史现象。

随着AI技术成本的下降,其应用范围将大幅扩展,最终可能导致算力需求的大幅增长。微软CEO纳德拉认为AI效率提升将激发指数级需求。

问题#2:DeepSeek是否会改变AI算力的增长范式

AI算力大致分为1)用于研发通向通用人工智能(AGI)的前沿模型相关的探索性算力(AGI方向),2)面向一般消费者的应用性算力(现有模型推理)。过去两年,推动算力增长的主要动力是,探索性算力增速(25x/2年)远高于摩尔定律(2倍/年),导致GPU需求激增。只要这个探索工作还在继续产生正向回报, AI算力的增长范式短期或不会发生变化。

在通用人工智能(AGI)愿景的驱动下,我们看到,主要科技巨头仍然在加大投入,例如:

1)1/24, Meta宣布计划2025年资本支出达600-650亿美元,主要用于AI基础设施(训练集群和数据中心建设)。

2)1/21,OpenAI宣布和软银、Oracle启动的“Project Stargate”计划投资超1000亿美元建设AI基础设施,显示资本仍集中流向需要海量算力的前沿探索。

根据Factset一致预期,微软、谷歌、亚马逊、Meta、苹果等北美五大科技公司合计资本开支2025年有望继续增长19.6%。其中很大部分投入是用在包括GPT-5、Llama4等在内下一代模型的算力投资。另一方面,Agent等应用目前仍处于探索的初期阶段,大规模商用的时间点仍存在不确定性,所以我们认为目前AI算力的增长范式没有变化。

问题#3:DeepSeek会改变市场投资逻辑吗?

DeepSeek这次的“惊喜”让我们认识到,

1) 未来大模型公司之间的竞争中,"算法效率"的重要性可能上升, 投资重点可能从"算力军备"转向"算法效率"。AI竞赛正从"算力军备"转向"算法效率"。未来的竞争重点或将更多地集中在算法优化和生态活力上。

2) 开源协议能使中小开发者基于前沿模型二次开发,推动大模型创新从少数科技巨头向分布式社区转移,为中小软件企业创造更多创新机会。从投资角度,我们认为2025年是AI发展进入商业化落地的一年。以Agent AI为代表的企业软件有望迅速落地,提升企业工作效率,带动美股软件板块表现或好于硬件。

问题#4:DeepSeek是否会改变芯片市场格局?

根据Jon Peddie Research,3Q24英伟达在全球GPU市场份额达到90%。其中,H100等高端GPU是主要产品之一。DeepSeek的成果显示,在面向一般消费者的大模型市场,企业可以通过使用A100、H800等相对低端的芯片实现类似性能。这可能会影响英伟达2025年以后,B200等最先进GPU在云计算、主权AI等领域的普及。Blackwell/Rubin等最先进的GPU的用途,初期可能会被局限在探索下一代超大规模模型(Frontier Model)上。

问题#5:DeepSeek真的那么便宜吗?

但是,SemiAnalysis在报告中指出,557.6万美金这个数字主要指的是模型预训练的GPU成本,并不包括研发、数据收集、清理等其他重要成本。实际上,DeepSeek的总体投资规模相当可观。据SemiAnalysis估计,其GPU投资就超过5亿美元。考虑到服务器资本支出、运营成本等因素,DeepSeek的总拥有成本(TCO)在4年内可能达到25.73亿美元。DeepSeek的成本优势主要体现在其高效的训练方法和创新的模型架构上。例如,其推理成本降至OpenAI的1/50,这在实际应用中可以带来显著的成本节约。然而,这种成本优势并不意味着整体AI开发和运营成本的大幅降低。

问题#6:DeepSeek到底有哪些创新?

DeepSeek在多个方面展现出技术创新,主要包括模型架构创新、训练方法突破、蒸馏优化、推理效率提升等。其中,混合专家(MoE)架构和多头潜在注意力(MLA)的引入显著提升了模型性能和效率。R1-zero模型采用纯强化学习(RL)训练,跳过监督微调,验证了RL在AI训练中的优先级和有效性。这些创新使DeepSeek在性能、效率和成本方面都取得了显著进展,为AI技术的发展提供了新的方向。特别是在解决复杂数学、物理和推理问题时,其速度是ChatGPT的两倍,且在编程问题上提供了迅速而全面的答案。

1)采用混合专家(MoE)架构,动态调用子模型降低计算量;

2)引入多头潜在注意力(MLA)压缩内存,支持长文本处理;

3)强化学习(RL):R1-zero模型跳过监督微调,通过纯RL直接训练,验证了RL的优先级和有效性;

4)蒸馏优化:利用R1生成数据微调小模型,提升特定场景性能(如数学、代码任务)

模型架构创新、训练方法突破、蒸馏优化、推理效率提升等。

问题#7:DeepSeek会带动中国科技资产价值重估吗?

目前(2025/2/3),恒生科技指数12月前向PE 20.0倍,远低于纳斯达克的35.4倍。DeepSeek的成功可能提高投资者对中国AI公司产业链的估值预期,吸引更多资本投资中国AI领域。

问题#8:DeepSeek会推动端侧智能发展吗?

DeepSeek很可能会显著推动端侧智能的发展,其高性价比模型使得更多企业可能考虑在端侧设备上部署AI应用,推动智能设备的智能化进程。微软推出的专为NPU设计的DeepSeek-R1模型,支持Copilot+PC等设备,实现半连续运行的主动智能体验,为智能手机、汽车等端侧设备提供了高效本地化部署方案。DeepSeek的技术进步可能加速端侧智能的普及和发展,推动AI技术向更广泛的终端设备渗透,从而改变现有的计算范式和用户交互方式。这不仅提升了端侧AI性能,还有助于保护用户隐私,降低了AI应用部署的技术门槛。

但是,从Apple Intelligence过去一年的发展历程中,我们看到,智能硬件的迭代是循序渐进过程,不会一蹴而就。模型能力提升只是其中一环,还存在生态链协调等很多挑战,对2025年AI手机等端侧智能的发展不应抱过高预期。

问题#9:DeepSeek会导致美国提升出口管制压力吗?

DeepSeek发布后,美国媒体进一步限制中国发展AI声音抬头。我们看到以下几个风险:

1) 芯片出口管制收紧:美国可能会加强对高端AI芯片的出口管制;

2)开源限制:美国政府可能会限制科技公司开源大模型,以防止技术扩散;

3)模型回传限制:在2024年年底发布的出口管制政策中,美国政府已经限制在新加坡等第三国训练好的模型回传中国,阻止技术转移;

4)数据获取限制:美国可能会限制用于AI训练的大规模数据集的获取;

5)算力资源限制:除了芯片管制,还可能限制美国云服务提供商的高性能计算资源的使用。

问题#10:DeepSeek会改变开源软件生态吗?

全球主要大模型公司中,OpenAI、Google、Anthropic、字节、百度等采用闭源模式,Meta、阿里等采用开源模式。如下图所示,闭源模型一直保持对开源模型的性能优势。

这次DeepSeek通过开源接近最先进的闭源的高性能模型,可能降低AI技术的使用门槛。开源模式带来边际成本持续下降的技术红利,为AI技术的真正普及奠定了基础。此外,DeepSeek的做法也可能推动其它AI公司重新思考其商业模式。

风险提示

1)中美贸易摩擦升级,影响产品供需与公司海外布局风险;

2)宏观经济下行风险;

3)创新品渗透不及预期,导致公司增长不及预期。

4)本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖

相关研报

研报:《DeepSeek 十问十答》2025年2月4日

本文源自券商研报精选

相关推荐

AlmaLinux 9.6发布:升级工具、初步支持IBM Power虚拟化技术

IT之家5月21日消息,科技媒体linuxiac昨日(5月20日)发布博文,报道称代号为SageMargay的AlmaLinux9.6发行版已上线,距上一版本9.5发...

Java最新学习路线,系统全面,零基础适用

首先,我个人比较推崇的学习方法是:先学java前段,也就是HTML,css,js,因为学习java以后肯定是往javaee方向发展的,学习完前端,在学习后端很多东西比计较容易理解!其中J2SE是关键...

深入理解数据库事务(数据库事务处理的理解)

Transaction作为关系型数据库的核心组成,在数据安全方面有着非常重要的作用,本文会一步步解析事务的核心特性,以获得对事务更深的理解。什么是事务数据库几乎是所有系统的核心模块,它将数据有条理地保...

IvorySQL 4.4 发布(1044mysql)

IvorySQL4.4已于2025年3月10日正式发布。新版本全面支持PostgreSQL17.4,新增多项新功能,并修复了已知问题。增强功能PostgreSQL17.3增强功...

Oracle 与 Google Cloud 携手大幅扩展多云服务

据DCD4月10日报道,甲骨文(Oracle)与谷歌云(GoogleCloud)深化合作,全力扩展多云产品。双方计划为OracleDatabaseGoogleCloud解决方案新增11...

Izzi 利用 Oracle 云提高计费效率和客户体验

据thefastmode网5月2日报道,墨西哥电信运营商Izzi宣布采用Oracle云基础设施(OCI),对其业务支持系统(BSS)进行现代化改造增强客户体验,已经成功完成。通过在OCI上运行...

好莱坞群星也有明星脸?硅谷科技名人本尊分身比一比

假如有部电影齐聚了众科技名人角色,如同许多好莱坞大牌卡司所共同主演的《瞒天过海》(Ocean’sEleven)那样,演出彼此在商场上竞逐、或共同对抗外来竞争捍卫硅谷的故事,更在剧中有不少对手戏,会不...

澳大利亚Find My iPhone被黑 多人被黑客锁机

FindMyiPhone本来是一个用于协助找回被盗手机的好工具,但是现在,澳洲的苹果用户发现他们的FindMyiPhone变成了黑客的帮凶。昨天,这名自称为OlegPliss的黑客使用Fin...

服务器密码错误被锁定怎么解决(服务器密码失效)

#服务器密码错误被锁定解决方案当服务器因多次密码错误导致账户被锁定时,可以按照以下步骤进行排查和解决:##一、确认锁定状态###1.检查账户锁定状态(Linux)```bash#查看账户锁定...

凌晨突发的数据库重大故障,我排查了一整天……

春节期间过得太热闹了,上班确实没啥状态,这不刚发生的一个重大性能故障,排查了整整一天,后面的领导都站成了一排,本次把故障发生的详细分析过程分享给大家!本次故障发生在凌晨,核心应用卡顿非常严重,Orac...

Oracle锁表紧急处理!3招快速解锁方案

开篇:突发故障现场凌晨1点,某电商系统突然卡顿,数千笔支付订单无法完成——数据库出现死锁,技术团队紧急响应...(遇到类似情况的,欢迎在评论区分享经历)一、问题重现:死锁是如何产生的?典型场景:问题根...

JetBrains DataGrip Mac中文破解版V2025.1下载安装教程

DataGripforMac是由JetBrains开发的数据库集成开发环境(IDE),专为数据库管理员和开发人员设计。它支持多种数据库(如MySQL、PostgreSQL、Oracle、SQ...

电脑装安卓系统,安卓X86版5.1 RC1下载

日前,谷歌放出了Android-x865.1的第一个候选版本Android-x865.1RC1,该版本基于Android5.1.1r24Lollipop开发,更新包括大量x86(32位)代...

来来来!一文告诉你Eclipse的正确安装使用姿势,你都清楚吗?

前言本学习笔记是有关如何设置Eclipse的详细说明。即使你天天在使用它,但是,相信我,或许你并不足够了解它。安装Java运行时环境Eclipse是Java应用程序,因此设置Eclipse的第一步是安...

分享收藏的 oracle 11.2.0.4各平台的下载地址

概述oracle11.2.0.4是目前生产环境用的比较多的版本,同时也是很稳定的一个版本。目前官网上已经找不到下载链接了,有粉丝在头条里要求分享一下下载地址。一、各平台下载地址1.1Linuxx...

取消回复欢迎 发表评论: