基准测试表明英特尔Gaudi2加速器较英伟达A100更具特定优势

2022年07月05日 08:37 次阅读 稿源:cnBeta.COM 条评论

在 2019 年以 20 亿美元收购了以色列 Habana Labs 后,英特尔推出了 Gaudi2 数据中心加速卡,并将之与面世已有两年的英伟达 A100 进行了对比。事实上,Habana 制造了两种专用加速器 —— 除了面向神经网络训练的 Gaudi2,还有主打推理任务的 Goya / Greco 。

访问:

阿里云服务器精选特惠:1核1G云服务器低至0.9元/月

1.jpg

虽然早在 5 月就发布,但 MLPerf 公共数据库直到上周才接收到它的基准测试成绩。

由其分享的图表可知,Gaudi2 系统的分数,被拿来和英伟达 / 戴尔的 A100 系统进行了横向比较。

1.webp

首先,ResNet-50 能够测试硬件在 AI 图像分类工作上的表现。可知 Habana 的 Gaudi2 系统只需 18 分钟就通过测试,而英伟达 A100 系统需要将近半个小时。

其次,Gaudi2 只用了 17 分钟来训练 BERT 模型,较 A100 系统快了大约一分钟。作为一个自然语言处理(NLP)模型,这项测试使用了来自维基百科的文章来训练。

2.webp

虽然所有测试平台都使用了八卡加速器 / GPU,但 Habana 系统搭配了双路 40 核的 Intel Xeon 8380 CPU,而英伟达系统则采用了双路 64 核的 AMD EPYC 7742 CPU 。

规格方面,Gaudi2 具有 24 个张量处理(TPC)内核 + 并行运行的两部分矩阵乘法(MME)引擎。其支持包括 FP32、TF32、BF16、FP16 和 FP8 在内的广泛数据类型。

2.jpg

此外 Gaudi2 有一个专用于处理音视频输入的媒体引擎,集成 48MB 内部缓存 + 板载 96GB(6×16GB)HBM2e 高带宽内存,总带宽达到了 2.45 TB/s 。

连接方面,该加速器使用了 PCIe 4.0 x16 接口、辅以 24 个 100 Mbps RoCE2(RDMA over Converged Ethernet 2)端口。

3.jpg

需要指出的是,英伟达 A100 / H100 的功能要更加全面一些,Gaudi2 在某些特定任务上更具优势。

不过就算英伟达早在三个月前就发布了 H100 新品,Gaudi2 还是有望成为 A100 的一个有力竞争对手。

访问购买页面:

英特尔旗舰店

相关文章:

英特尔开始推出Habana Labs Gaudi2 Linux驱动程序代码

对文章打分

基准测试表明英特尔Gaudi2加速器较英伟达A100更具特定优势

2 (29%)
已有 条意见

    最新资讯

    加载中...

    今日最热

    加载中...

    热门评论

      Top 10

      招聘


      Advertisment ad adsense googles cpro.baidu.com
      created by ceallan