3.91倍T4实测性能提升!鲲云科技发布全球首款数据流AI芯片

星空X9加速卡发布星空X9加速卡发布星空X9加速卡发布星空X9加速卡发布

星空X9加速卡发布

星空X9加速卡为搭载4CAISA 芯片的深度学习推断板卡,峰值性能43.6TOPS,主要满足高性能场景下的AI计算需求。同英伟达旗舰产品T4相对,X9ResNet-50, YOLO v3等模型上的芯片利用率提升2。84-11。64倍。在实测性能方面,X9ResNet50可达5240FPS,与T4性能接近,在YOLO v3UNet Industrial等检测分割网络,实测性能相较T41.83-3.91倍性能提升。在达到最优实测性能下,X9处理延时相比于T4降低1.83-32倍。实测性能以及处理延时的大幅领先,让数据流架构为AI芯片的发展提供了提升峰值性能之外的另一条技术路线。

CAISA X9

T4

X9 vs T4

模型名称

网络来源

数据集

吞吐(batch=16FPS

延时(batch=16, ms

芯片利用率

模型名称

网络来源

数据集

吞吐(batch=128FPS

延时(batch=128, ms

芯片利用率

芯片利用率

延时降低

吞吐率

ResNet-50

TensorFlow

ImageNet 50000

5227.72

3.06

92.3%

ResNet-50

TensorFlow

ImageNet 50000

5415.00

23.64

32.1%

2.88

7.73

0.97

ResNet-152

TensorFlow

ImageNet 50000

1841.08

8.68

95.4%

ResNet-152

TensorFlow

ImageNet 50000

1935.25

66.14

33.6%

2.84

7.62

0.95

YOLOv3

DarkNet

COCO

503.00

31.06

82.4%

YOLOv3

GitHub*

COCO

128.80

993.78

7.1%

11.64

32.00

3.91

SSD-ResNet50

NVIDIA

COCO

728.64

21.96

77.1%

SSD-ResNet50

NVIDIA

COCO

212.00

150.94

7.5%

10.25

6.87

3.44

U-Net Industrial

NVIDIA

COCO2017

216.04

74.07

65.0%

U-Net Industrial

NVIDIA

COCO2017

118.00

135.59

11.9%

5.46

1.83

1.83

*模型参考:

3.91倍T4实测性能提升!鲲云科技发布全球首款数据流AI芯片3.91倍T4实测性能提升!鲲云科技发布全球首款数据流AI芯片3.91倍T4实测性能提升!鲲云科技发布全球首款数据流AI芯片

鲲云科技通过CAISA数据流架构提高芯片利用率,同样的实测性能,对芯片峰值算力的要求可大幅降低3-10倍,从而降低芯片的制造成本,为客户提供更高的算力性价比。目前星空X3加速卡已经实现量产,星空X9加速卡将于今年8月推出市场。鲲云科技成为国内首家在发布会现场披露BenchmarkAI芯片公司。

商业落地先行,鲲云加速卡实现多领域规模落地

作为技术驱动的AI芯片公司,鲲云科技自成立以来一直注重商业落地,目前鲲云科技已与多家行业巨头达成战略合作,成为英特尔全球旗舰FPGA合作伙伴,在技术培训、营销推广以及应用部署等方面进行合作;与浪潮、戴尔达成战略签约,在AI计算加速方面开展深入合作;与山东产业技术研究院共建山东产研鲲云人工智能研究院,推进人工智能芯片及应用技术的规模化落地。明星产品星空加速卡已在电力、教育、航空航天、智能制造、智慧城市等领域落地。自2016年成立至今,鲲云科技已经完成了天使轮,Pre-A轮及A轮融资,设有深圳、山东、伦敦研发中心。2018年成立人工智能创新应用研究院,定位于建立人工智能产业化技术平台,支持人工智能最新技术在各垂直领域快速实际落地,启动鲲云高校计划,开展人工智能课程培训和科研合作。除与Intel合作进行人工智能课程培训外,鲲云人工智能应用创新研究院已同帝国理工学院、哈尔滨工业大学、北京航空航天大学、天津大学、香港城市大学等成立联合实验室,在定制计算、AI芯片安全、工业智能等领域开展前沿研究合作。

鲲云简介

鲲云科技是一家高性能人工智能芯片公司,由数据流定制计算领域院士团队创立,致力于提供下一代人工智能计算平台,加速人工智能落地。

鲲云科技聚焦于基于数据流架构的定制AI计算引擎,其自主研发的CAISA架构基于公司自1991年近三十年技术积累,在支持深度学习通用算法的同时发挥最高95。4%的芯片利用率,在同等峰值性能下,提供远超于指令集芯片的算力,实测架构效率超过国际芯片水平。针对数据流架构开发的端到端编译工具链RainBuilder在保持高算力同时,无缝链接TensorFlow, Caffe, ONNX,Pytorch等多种主流框架,提供易用性,支持VGG, YOLO, ResNet等多种算法模型,保证其通用性。鲲云一方面基于自主研发人工智能芯片,提供一体化计算平台设备,保证产品标准化,大幅降低人工智能落地成本。另一方面,鲲云提供与CAISA芯片配套的领域落地解决方案,大幅降低鲲云计算平台落地门槛与使用难度。

目前鲲云科技已与多家行业巨头达成战略合作,成为英特尔全球旗舰FPGA合作伙伴,在技术培训、营销推广以及应用部署等方面进行合作;与浪潮、戴尔达成战略签约,在AI计算加速方面双方开展深入合作;与山东产业技术研究院共建山东产研鲲云人工智能研究院,推进人工智能芯片及应用技术在山东落地。明星产品星空加速卡已在航空、航天、电力、教育、工业检测、智慧城市等领域落地。自2016年成立至今,鲲云科技已经完成了天使轮,A轮及A+轮融资,设有深圳、山东、伦敦研发中心。2018年成立人工智能创新应用研究院,定位于建立人工智能产业化技术平台,支持人工智能最新技术在各垂直领域快速实际落地,启动鲲云高校计划,开展人工智能课程培训和科研合作。除与Intel合作进行人工智能课程培训外,鲲云人工智能应用创新研究院已同帝国理工学院、哈尔滨工业大学、北京航空航天大学、天津大学等成立联合实验室,在定制计算、AI芯片安全、工业智能等领域开展前沿研究合作。

对标芯片数据来源:

T4性能数据来源:

Xavier性能数据来源:

ResNet50ResNet152算法网络来源:

YOLO算法网络来源:

1.    [官方]

2.    [其他]

SSD-ResNet50算法网络来源:

UNet Industrial算法网络来源:

美狮彩票相关的文章

Digi-Key