DeepSeek爆火：推理算力需求的新变局

DeepSeek：AI 领域的新 “顶流”

在 AI 技术迅猛发展的当下，新的模型和应用如雨后春笋般不断涌现。而最近，DeepSeek 无疑成为了 AI 领域中最耀眼的那颗星，成功吸引了全球的目光。

短短时间内，DeepSeek 便在各大平台上掀起了下载热潮，一举登顶美国区苹果应用商店免费 App 下载排行榜，甚至超越了长期占据高位的 ChatGPT。这一成绩的取得，不仅让 DeepSeek 在国内社交媒体上引发了广泛讨论，诸如 “中国 AI 大模型震动华尔街”“全球掀 DeepSeek 复现狂潮” 等话题迅速冲上热门，还成功吸引了《黑神话：悟空》制作人冯骥、金沙江创投朱啸虎等业内大咖纷纷下场推荐。

从技术层面来看，DeepSeek 的表现同样令人惊艳。1 月 20 日，DeepSeek 发布了性能对标 OpenAI o1 正式版的 R1 大模型，并同步开源模型权重。该模型在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力，在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。更值得一提的是，在模型训练费用昂贵的当下，DeepSeek 仅仅花费了 560 万美元训练 R1 模型，但该模型在很多 AI 基准测试中已经达到甚至超越 OpenAI o1 模型，真正实现了低成本高回报，这让整个 AI 业界为之震惊。

DeepSeek 的爆火，绝非偶然，它是技术创新、成本控制以及市场需求等多方面因素共同作用的结果。但在这火爆现象的背后，也隐藏着一个关键的问题，那就是随着 DeepSeek 的广泛应用和不断发展，其对推理算力的需求也在急剧攀升。那么，这种庞大的推理算力需求究竟会给 AI 行业带来怎样的影响？又会引发哪些新的挑战和机遇呢？

DeepSeek 为何能掀起热潮

（一）性能卓越，成本亲民

在 AI 模型的竞技场上，性能无疑是决定其价值的关键因素。DeepSeek R1 模型在数学、代码、自然语言推理等多个重要领域都展现出了卓越的实力。以数学推理任务为例，在 AIME2024 的测试中，DeepSeek R1 以 79.8% 的准确率力压 OpenAI o1-1217 的 79.2% ，在 MATH-500 任务里，它也以 97.3% 的准确率超越了 OpenAI o1-1217 的 96.8%，彰显出强大的数学解题能力。在编程领域，LiveCodeBench 任务中，DeepSeek R1 取得 65.9% 的 Pass@1 准确率，高于 OpenAI o1-1217 的 63.4%，在 Codeforces 任务中，其评分达到 2029，与 OpenAI o1-1217 的 2015 相当，接近人类顶尖选手水平，能够出色地应对各种编程挑战。

而在自然语言推理方面，尽管在 MMLU 任务中，DeepSeek R1 的 90.8% 准确率略低于 OpenAI o1-1217 的 91.8%，但在 MMLU-Pro 任务中，它以 84.0% 的准确率成功反超，展现出在特定自然语言推理任务上的独特优势。

然而，DeepSeek 的优势不仅仅体现在性能上，其成本控制能力同样令人瞩目。在 AI 模型训练成本普遍高昂的今天，许多知名模型的训练费用动辄数亿甚至数十亿美元。例如，OpenAI 训练一个模型可能需要花费数亿美元，如此高昂的成本让众多企业和研究机构望而却步。而 DeepSeek R1 的预训练费用仅为 557.6 万美元，在 2048 块英伟达 H800 GPU 集群上运行 55 天即可完成训练，仅是 OpenAI GPT-4o 模型训练成本的不到十分之一。这种低成本高回报的特性，使得 DeepSeek 在众多 AI 模型中脱颖而出，为更多企业和开发者提供了使用和开发高性能 AI 模型的可能。

（二）开源策略，激发活力

除了性能和成本优势外，DeepSeek 的开源策略也是其迅速走红的重要原因之一。在 AI 发展的历程中，开源与闭源一直是备受关注的话题。OpenAI 创立之初，曾怀揣着 “以最有可能造福全人类的方式推进数字智能发展，而不受产生财务回报需求的限制” 的美好愿景，但在 GPT-3 发布之后，却逐渐限制了对模型的访问权限，在 GPT-4 发布之后更是彻底隐藏了训练数据和模型权重，走向了 “闭源” 之路。

与之形成鲜明对比的是，DeepSeek 坚定不移地采用了完全开源策略。它允许用户自由使用、修改和商用其模型，这种开放的态度吸引了全球大量开发者和研究人员的目光。通过开源，DeepSeek 在 GitHub 等平台上引发了热烈的讨论和积极的参与，开发者们可以自由获取和修改模型代码，根据自己的需求进行定制化开发。这种开放式的创新模式极大地激发了 AI 开发者社区的协作活力，促进了 AI 技术的快速发展。例如，一些开发者基于 DeepSeek 的开源模型，开发出了更加高效的自然语言处理工具，用于智能客服、文档翻译等领域；还有一些研究人员则在其基础上进行算法优化，进一步提升了模型的性能和效率。

英伟达高级研究科学家 Jim Fan 称赞 DeepSeek 是 “真正开放的前沿研究，赋能所有人”。通过开源，DeepSeek 不仅为自身赢得了良好的口碑和广泛的支持，也为整个 AI 行业的发展注入了新的活力，让 AI 技术的发展不再局限于少数大型科技公司，而是成为全球开发者共同参与的创新盛宴。

DeepSeek 引发的推理算力需求变革

（一）需求激增的现状

DeepSeek 的火爆程度从其惊人的用户增长数据中可见一斑。中信建投研报数据显示，在网页端，2024 年 10 月至 12 月，DeepSeek 的访问量呈现出爆发式增长，分别达到 245 万、422 万和 1101 万，短短两个月时间，访问量增长了近 4 倍，这样的增速在 AI 应用领域极为罕见。而在 App 端，其表现同样惊艳。2025 年 1 月 10 日上线后，仅用了 18 天，日活跃用户数就突破了 1500 万，如此迅猛的用户增长速度，超越了许多同类 AI 应用数月甚至数年的积累。

随着用户数量的井喷式增长，DeepSeek 对推理算力的需求也随之水涨船高。每一次用户与 DeepSeek 的交互，无论是提出问题、寻求建议还是进行复杂的任务求解，都需要模型进行快速而准确的推理运算。大量用户的同时在线，使得这种推理算力的需求在短时间内急剧膨胀，犹如一场汹涌的浪潮，冲击着现有的算力基础设施。

（二）推理算力的重要性凸显

在 AI 商业化落地的进程中，推理算力正逐渐成为核心要素。随着 “低成本 + 高性能” 模型的不断涌现，如 DeepSeek R1 模型，为 AI Agent、AI 应用等的大规模应用提供了可能。

以 AI Agent 为例，它就像是一个智能的数字助手，能够理解用户的需求，并通过调用各种工具和知识来完成任务。而这一切的实现，都依赖于强大的推理算力。在用户提出需求后，AI Agent 需要在极短的时间内，运用推理能力对问题进行分析、理解，并从海量的知识储备中寻找解决方案。例如，在智能客服场景中，AI Agent 需要根据用户的咨询内容，快速推理出问题的关键所在，然后从知识库中检索相关信息，为用户提供准确的回答。如果推理算力不足，AI Agent 的响应速度就会变慢，甚至无法准确理解用户的意图，导致用户体验急剧下降，进而影响 AI 应用的商业价值。

同样，在各种 AI 应用中，无论是图像识别、语音交互还是数据分析，推理算力都起着关键作用。在图像识别应用中，模型需要对输入的图像进行快速推理，识别出图像中的物体、场景等信息；在语音交互应用中，要实时将语音转换为文本，并理解文本的含义，给出合适的回复。这些应用的广泛普及和深入发展，使得推理环节的算力需求成为了 AI 商业化落地的关键制约因素。只有具备充足的推理算力，才能确保 AI 应用的高效运行，为用户提供流畅、智能的服务体验，从而推动 AI 技术在各个领域的广泛应用和商业化落地。

如何满足庞大的推理算力需求

（一）国产算力厂商的适配行动

面对 DeepSeek 带来的庞大推理算力需求，国产算力厂商迅速行动起来，积极开展适配工作，展现出了强大的技术实力和市场响应能力。

华为昇腾与潞晨科技携手，联合发布基于昇腾算力的 DeepSeek R1 系列推理 API 及云镜像服务。在这次合作中，潞晨以自研国产推理引擎为技术底座，成功实现了昇腾算力与 DeepSeek R1 系列模型的推理适配优化，其性能表现与使用高端 GPU 持平，为开发者提供了高效、灵活、稳定的 AI 推理服务。2025 年 2 月 4 日，DeepSeek - R1、DeepSeek - V3、DeepSeek - V2、Janus - Pro 正式上线昇腾社区，支持一键获取 DeepSeek 系列模型，在昇腾硬件平台上实现了开箱即用，推理快速部署，极大地提升了 AI 开发和应用的效率。

壁仞科技凭借自主研发的壁砺 TM 系列产品出色的兼容性能，仅用数小时即完成对 DeepSeek R1 全系列蒸馏模型的支持，涵盖了从 1.5B 到 70B 各等级参数版本，包括 LLaMA 蒸馏模型和千问蒸馏模型。壁仞科技成为少数实现国际、国内多模型同步高效适配的芯片平台之一，证明了国产芯片对复杂 AI 应用任务的驾驭能力。目前，壁仞 AI 算力平台已正式上线 DeepSeek R1 蒸馏模型推理服务，全球开发者可云端体验 1.5B、7B、8B、14B、32B、70B 全系列模型服务，该服务具备零部署成本和多场景覆盖的优势，为开发者提供了便捷、高效的模型使用体验。

天数智芯与 Gitee AI 联合，仅用时一天，便成功完成了与 DeepSeek R1 的适配工作，并且已正式上线多款大模型服务，其中包括 DeepSeek R1 - Distill - Qwen - 1.5B、DeepSeek R1 - Distill - Qwen - 7B、DeepSeek R1 - Distill - Qwen - 14B 等。天数智芯的产品是通用 GPU，在芯片设计的技术路线上和国际主流路线相近，其 IXUCA 软件栈在软件生态层面兼容国际主流生态，所以适配 DeepSeek 的 V2、V3、R1、Janus 等模型版本非常顺利。目前天数已经完成了 V3、R1、Janus 等模型的推理适配工作，在公开数据的精度测试上也和论文相当，为 DeepSeek 的推理服务提供了有力的支持。

摩尔线程作为国产全功能 GPU 创新企业，快速实现对 DeepSeek 蒸馏模型推理服务的高效部署，旨在赋能更多开发者基于摩尔线程全功能 GPU 进行 AI 应用创新。通过与 DeepSeek 的适配，摩尔线程提升了 DeepSeek 模型的计算效率和资源利用率，为开发者在 AI 应用开发过程中提供了更强大的算力支持，助力他们实现更多创新的 AI 应用场景。

沐曦与开源平台 Gitee AI 联合首发全套 DeepSeek R1 千问蒸馏模型，本次上线的四个模型均部署在国产沐曦曦云 GPU 上，实现了从芯片到平台，从算力到模型的全部国产研发。这次合作不仅为 DeepSeek 的推理算力需求提供了国产算力的支持，也进一步推动了国产 GPU 在 AI 领域的应用和发展，促进了国产 AI 产业链的完善和壮大。

（二）未来的发展方向探讨

为了进一步满足 DeepSeek 及未来 AI 发展带来的推理算力需求，我们可以从技术创新和合作模式等多个方面进行深入探索。

在技术创新方面，持续提升芯片性能是关键。研发更先进的制程工艺，提高芯片的计算密度和运行速度，降低能耗，从而在单位面积和功耗下提供更强大的推理算力。例如，不断探索新的芯片架构和设计理念，像采用异构计算架构，将 CPU、GPU、FPGA 等不同类型的计算单元进行有机结合，充分发挥各自的优势，实现计算资源的高效利用，以满足 AI 推理任务对多样化计算能力的需求。

同时，优化算法和软件框架也不容忽视。通过改进深度学习算法，减少模型推理过程中的计算量和内存占用，提高推理效率。开发更高效的推理引擎，针对不同的硬件平台进行深度优化，实现算法与硬件的无缝对接，充分发挥硬件的性能潜力。例如，对模型进行量化、剪枝等优化操作，在不影响模型精度的前提下，减小模型规模，降低推理时的计算复杂度，提升推理速度。

在合作模式上，加强产学研合作是推动技术进步和产业发展的重要途径。高校和科研机构在基础研究方面具有深厚的积累，能够为推理算力技术的创新提供理论支持和前沿思路。企业则具有强大的工程化能力和市场敏锐度，能够将科研成果快速转化为实际产品和服务。通过产学研合作，各方可以共享资源、优势互补，加速新技术的研发和应用，共同攻克推理算力领域的关键难题。

此外，建立开放的生态系统也是未来发展的重要方向。不同的算力厂商、软件开发商、应用服务商等应加强合作，共同打造一个开放、兼容、协同发展的 AI 生态。在这个生态系统中，各方可以共享技术、数据和应用场景，实现资源的优化配置和协同创新。例如，算力厂商提供强大的算力支持，软件开发商基于这些算力开发丰富多样的 AI 应用和工具，应用服务商则将这些 AI 应用推广到各个行业，满足不同用户的需求，形成一个良性循环的生态发展模式，共同推动 AI 技术在推理算力支持下的广泛应用和发展。

展望：DeepSeek 与推理算力的未来

DeepSeek 的成功，犹如一颗投入 AI 湖面的巨石，激起了层层涟漪，对推理算力需求产生了深远而持久的影响。它不仅在短期内引发了推理算力需求的井喷式增长，推动了国产算力厂商的积极适配和技术创新，还从长远角度改变了 AI 产业对推理算力的认知和发展方向。

随着 DeepSeek 的持续优化和拓展应用领域，其对推理算力的需求将继续保持高位增长态势。这将进一步促使算力厂商加大研发投入，推动芯片技术、算法优化以及软件框架等方面的持续创新，以满足不断增长的推理算力需求。同时，DeepSeek 的开源模式也将吸引更多的开发者和企业参与到 AI 生态的建设中来，形成一个更加繁荣、开放的 AI 产业生态。

在未来的 AI 领域中，DeepSeek 和推理算力将呈现出协同发展的紧密关系。强大的推理算力是 DeepSeek 实现高效运行和不断创新的基础支撑，而 DeepSeek 的广泛应用和发展又将为推理算力技术的进步提供更多的应用场景和实践机会。两者相互促进、相辅相成，共同推动 AI 技术向更高水平迈进，为人类社会的发展带来更多的可能性。

DeepSeek 的火爆只是 AI 发展浪潮中的一个缩影，它所引发的推理算力需求变革，将成为推动 AI 产业持续发展的重要动力。让我们拭目以待，共同见证 DeepSeek 和推理算力在未来 AI 领域中创造更多的辉煌。