DeepSeek新动向：或将拥抱国产GPU，绕过CUDA加速研发？,软银携手OpenAI，邀500家企业共筑日本人工智能新生态,OpenAI携手软银，欲在日本共建AI基础设施与数据中心,ChatGPT Canvas大升级：o1模型上线，HTML与React代码渲染功能来袭,硅基流动携华为云首发DeepSeek R1&V3大模型推理服务，性能媲美高端GPU,360携手DeepSeek，打造安全大模型新标杆，“自动驾驶”安全时代来临,币安陷争议：行业爆料文章指其存在利益输送与内部贪腐问题,国产大模型全

边缘云论坛 · 发布于 2025-2-3 15:40:09

苏瓦裸金属,多哈云主机_

近期，有消息称DeepSeek在大模型研发领域取得了突破性进展，正着手适配国产GPU，这一消息在业界引起了广泛关注。据悉，DeepSeek在研发过程中成功绕过了英伟达CUDA的限制，直接基于GPU驱动函数进行新开发，这一创新举措为更加精细化的操作提供了可能。

具体而言，DeepSeek在多节点通信方面，摒弃了传统的CUDA路径，转而采用PTX（Parallel Thread Execution）技术。这一转变虽然在一定程度上限制了硬件加速的算法灵活性，但却极大地提升了运算速度。例如，在其他模型需要十天训练时间的情况下，DeepSeek凭借这一技术优势，仅需五天即可完成同等训练量，从而能够处理更多数据，进一步提升模型效果。

据内部人士透露，DeepSeek团队中不乏精通PTX语言开发的专家。他们凭借深厚的技术积累，成功克服了适配过程中的诸多技术难题。而随着国产GPU的崛起，DeepSeek在硬件适配方面也将迎来新的机遇。

据了解，DeepSeek在适配国产GPU时，将主要依赖于对这些硬件驱动提供的基本函数接口的了解。在此基础上，他们可以参考英伟达GPU硬件的编程接口，编写相应的代码，从而实现自家大模型与国产硬件的无缝对接。这一举措不仅将降低适配成本，还将大幅提升模型在国产硬件上的运行效率。

业内专家指出，DeepSeek此次成功绕过CUDA限制，并实现与国产GPU的适配，不仅展示了其强大的技术实力，也为国产AI硬件的发展注入了新的活力。随着国产GPU技术的不断进步和DeepSeek等领先企业的持续推动，国产AI硬件将迎来更加广阔的发展前景。