从算力竞赛到算法革新：DeepSeek 引领的 AI 新范式(2) / BTC123

强化学习算法突破

DeepSeek的新强化学习算法GRPO（Generalized Reward-Penalized Optimization）优化了模型训练过程。强化学习像是给模型配备了一个教练，教练通过奖励和惩罚来引导模型学习更好的行为。传统的强化学习算法在这个过程中可能会消耗大量的计算资源，而DeepSeek的新算法则更加高效，它能够在保证模型性能提升的同时，减少不必要的计算，从而实现性能和成本的平衡。

这些创新不是孤立的技术点，而是形成了完整的技术体系，从训练到推理全链条降低算力需求。普通消费级显卡现在也能运行强大的AI模型，大幅降低了AI应用的门槛，使更多开发者和企业能够参与到AI创新中来。

对英伟达的影响

很多人认为DeepSeek绕过了Cuda层，从而摆脱了对英伟达的依赖。实际上，DeepSeek直接通过英伟达的PTX（Parallel Thread Execution）层进行算法优化。PTX是一种介于高级CUDA代码和实际GPU指令之间的中间表示语言，通过操作这一层级，DeepSeek能够实现更精细的性能调优。

这对英伟达的影响是双面的，一方面，DeepSeek其实与英伟达的硬件以及Cuda生态绑定更深了，AI应用门槛的降低又可能扩大整体市场规模；另一方面，DeepSeek的算法优化可能改变市场对高端芯片的需求结构，一些原本需要H100等GPU才能运行的AI模型，现在可能在A100甚至消费级显卡上就能高效运行。

对中国AI产业的意义

DeepSeek的算法优化为中国AI产业提供了技术突围路径。在高端芯片受限背景下，"软件补硬件"的思路减轻了对顶尖进口芯片的依赖。

在上游，高效算法降低了算力需求压力，使算力服务商能通过软件优化延长硬件使用周期，提高投资回报率。在下游，优化后的开源模型降低了AI应用开发门槛。众多中小企业无需大量算力资源，也能基于DeepSeek模型开发竞争力应用，将催生更多垂直领域AI解决方案的出现。

对Web3+AI的深远影响

去中心化AI Infra

DeepSeek的算法优化为Web3 AI基础设施提供了新的动力，创新的架构、高效的算法和较低的算力需求，使得去中心化的AI推理成为可能。MoE架构天然适合分布式部署，不同节点可以持有不同的专家网络，无需单一节点存储完整模型，这显著降低了单节点的存储和计算要求，从而提高模型的灵活性和效率。

FP8训练框架则进一步降低了对高端计算资源的需求，使得更多的计算资源可以加入到节点网络中。这不仅降低了参与去中心化AI计算的门槛，还提高了整个网络的计算能力和效率。

Multi-Agent System

智能交易策略优化：通过实时市场数据分析agent、短期价格波动预测agent、链上交易执行agent、交易结果监督agent等的协同运行，帮助用户获取更高的收益。