2026-02-17

GPU市场十五年FP64分割终结者

摘要

本文分析了英伟达GPU十五年来FP64双精度性能的市场分割现象。消费级GPU的FP64:FP32性能比从2010年的1:8逐步恶化至2020年的1:64，而企业级维持1:2至1:3。AI兴起使低精度计算成为主流，传统分割逻辑失效。最新Blackwell Ultra架构的企业级B300 GPU的FP64比率降至1:64，反向印证这一转变。FP64 emulation技术如Ozaki方案利用FP8/FP4张量核心模拟双精度，正在成为HPC新路径。

内容框架与概述

文章开篇指出RTX 5090的FP32与FP64性能存在64倍差距，这种人为限制延续十五年。接着梳理了英伟达GPU架构演变：Fermi到Ampere期间，消费级FP64比率从1:8恶化为1:64，而企业级保持强劲。随后揭示这一策略的市场动因——HPC依赖FP64，消费应用无需，企业卡因而享有溢价。2017年EULA禁令进一步将隐性格式分割转为显性合同限制。最后分析AI工作负载对FP16/BF16的偏好如何动摇分割基础，Blackwell Ultra的架构调整标志着传统分割逻辑的终结。