近日摩尔线程发布了全新智算加速卡MTT S4000,显存训推兼顾专为大模型打造,服不服摩单卡支持48GB显存。尔线
据介绍,布智MTT S4000采用了第三代MUSA内核,算加速单卡支持48GB显存和768GB/s的显存显存带宽,FP32性能为25TFLOPs、服不服摩TF32性能为50TFLOPs、尔线INT8性能为200TFLOPs。布智
基于摩尔线程自研MTLink1.0技术,MTT S4000还可以支持多卡互联,显存片间互联可达240GB/s,服不服摩助力千亿大模型的尔线分布式计算加速。
同时,布智MTT S4000还提供96路1080P硬件解码,算加速先进的图形渲染能力和超高清8K HDR显示能力,助力AI计算、图形渲染、多媒体等综合应用场景的落地。
最重要的是,通过摩尔线程自研MUSIFY开发工具,MTT S4000计算卡可以充分利用现有CUDA软件生态,实现CUDA代码零成本迁移到MUSA平台。
摩尔线程还同时发布了国内首个以国产全功能GPU为底座的大规模算力集群。
基于MTT S4000和双路8卡GPU服务器MCCX D800,该算力集群支持从单机多卡到多机多卡,从单卡到千卡集群的无缝扩展,未来还将推出更大规模的集群。