2011年Fermi架构的缺点是散热拉跨
2012年Kepler架构重点是改善散热问题,设计思路从high-performance转向power-efficient
2014年Maxwell在内部加入了更多的逻辑控制电路,精准控制
2015年Google开发出了TPU,大幅度降低了存储和链接需求,将芯片空间最大程度让渡给了计算
2016年Pascal架构采用16nm制程,引入了NVLink,显著提升带宽,对标TPU
2017年Volta架构面向深度学习设计,引入TensorCore
2021年Google推出了TPUv4,计算速度是A100的1.2-1.7倍,功耗降低1.3-1.9倍
2022年Hopper架构,在硬件层面映入Transformer,并推出了H100产品,具有7296个CUDA核心,80GB的HBM2显存以及900GB/s的NVLink 4.0
2021年Tesla展示了用3000块自研芯片D1搭建的超算Dojo ExaPOD,D1芯片由TSMC代工,7nm工艺
2011年Fermi架构的缺点是散热拉跨
2012年Kepler架构重点是改善散热问题,设计思路从high-performance转向power-efficient
2014年Maxwell在内部加入了更多的逻辑控制电路,精准控制
2015年Google开发出了TPU,大幅度降低了存储和链接需求,将芯片空间最大程度让渡给了计算
2016年Pascal架构采用16nm制程,引入了NVLink,显著提升带宽,对标TPU
2017年Volta架构面向深度学习设计,引入TensorCore
2021年Google推出了TPUv4,计算速度是A100的1.2-1.7倍,功耗降低1.3-1.9倍
2022年Hopper架构,在硬件层面映入Transformer,并推出了H100产品,具有7296个CUDA核心,80GB的HBM2显存以及900GB/s的NVLink 4.0
2021年Tesla展示了用3000块自研芯片D1搭建的超算Dojo ExaPOD,D1芯片由TSMC代工,7nm工艺