来源 :快科技2026-05-01
快科技5月1日消息,摩尔线程的旗舰级AI训推一体智算卡MTT S5000,搭配自研的MUSA软件栈,基于SGLang开源推理框架,成功完成了DeepSeek-V4的完整运行验证。
至此,摩尔线程已构建起从硬件架构核心计算引擎承接、热点算子支持,再到端到端部署验证的系统化适配链路,证明国产GPU可以实现前沿大模型的“框架级兼容、开箱即落地”。
随着大模型架构持续演进,DeepSeek-V4等先进模型对底层精度能力、算子覆盖、编译优化、并行通信和推理效率提出了严苛要求。
摩尔线程充分发挥S5000原生FP8算力、MUSA对CUDA深度兼容、TileLang MUSA编译器对TileLang生态完美支持等优势,结合TileKernels开源库复用,基于TileLang快捷开发自定义算子等手段,快速打通了DeepSeek-V4推理适配链路。
值得注意的是,TileLang-MUSA已正式进入TileLang官方主线,实现了对DeepSeek-V4最新发布TileLang算子库TileKernels的Day-0无缝支持。
这意味着,MUSA平台已具备承载前沿LLM算子生态的工程基础,为后续先进开源模型适配提供了直接复用的算子通路。