PaddleX压缩模型库

图像分类

数据集:ImageNet-1000

量化

模型 压缩策略 Top-1准确率 存储体积 TensorRT时延(V100, ms)
MobileNetV1 70.99% 17MB -
MobileNetV1 量化 70.18% (-0.81%) 4.4MB -
MobileNetV2 72.15% 15MB -
MobileNetV2 量化 71.15% (-1%) 4.0MB -
ResNet50 76.50% 99MB 2.71
ResNet50 量化 76.33% (-0.17%) 25.1MB 1.19

分类模型Lite时延(ms)

设备 模型类型 压缩策略 armv7 Thread 1 armv7 Thread 2 armv7 Thread 4 armv8 Thread 1 armv8 Thread 2 armv8 Thread 4
高通835 MobileNetV1 96.1942 53.2058 32.4468 88.4955 47.95 27.5189
高通835 MobileNetV1 量化 60.5615 32.4016 16.6596 56.5266 29.7178 15.1459
高通835 MobileNetV2 65.715 38.1346 25.155 61.3593 36.2038 22.849
高通835 MobileNetV2 量化 48.3495 30.3069 22.1506 45.8715 27.4105 18.2223
高通835 ResNet50 526.811 319.6486 205.8345 506.1138 335.1584 214.8936
高通835 ResNet50 量化 476.0507 256.5963 139.7266 461.9176 248.3795 149.353
高通855 MobileNetV1 33.5086 19.5773 11.7534 31.3474 18.5382 10.0811
高通855 MobileNetV1 量化 37.0498 21.7081 11.0779 14.0947 8.1926 4.2934
高通855 MobileNetV2 25.0396 15.2862 9.6609 22.909 14.1797 8.8325
高通855 MobileNetV2 量化 28.1631 18.3917 11.8333 16.9399 11.1772 7.4176
高通855 ResNet50 185.3705 113.0825 87.0741 177.7367 110.0433 74.4114
高通855 ResNet50 量化 328.2683 201.9937 106.744 242.6397 150.0338 79.8659
麒麟970 MobileNetV1 101.2455 56.4053 35.6484 94.8985 51.7251 31.9511
麒麟970 MobileNetV1 量化 62.4412 32.2585 16.6215 57.825 29.2573 15.1206
麒麟970 MobileNetV2 70.4176 42.0795 25.1939 68.9597 39.2145 22.6617
麒麟970 MobileNetV2 量化 53.0961 31.7987 21.8334 49.383 28.2358 18.3642
麒麟970 ResNet50 586.8943 344.0858 228.2293 573.3344 351.4332 225.8006
麒麟970 ResNet50 量化 489.6188 258.3279 142.6063 480.0064 249.5339 138.5284

剪裁

PaddleLite推理耗时说明:

环境:Qualcomm SnapDragon 845 + armv8

速度指标:Thread1/Thread2/Thread4耗时

模型 压缩策略 Top-1 存储体积 PaddleLite推理耗时 TensorRT推理速度(FPS)
MobileNetV1 70.99% 17MB 66.052\35.8014\19.5762 -
MobileNetV1 剪裁 -30% 70.4% (-0.59%) 12MB 46.5958\25.3098\13.6982 -
MobileNetV1 剪裁 -50% 69.8% (-1.19%) 9MB 37.9892\20.7882\11.3144 -

目标检测

量化

数据集: COCO2017

模型 压缩策略 数据集 Image/GPU 输入608 Box AP 存储体积 TensorRT时延(V100, ms)
MobileNet-V1-YOLOv3 COCO 8 29.3 95MB -
MobileNet-V1-YOLOv3 量化 COCO 8 27.9 (-1.4) 25MB -
R34-YOLOv3 COCO 8 36.2 162MB -
R34-YOLOv3 量化 COCO 8 35.7 (-0.5) 42.7MB -

剪裁

数据集:Pasacl VOC & COCO2017

PaddleLite推理耗时说明:

环境:Qualcomm SnapDragon 845 + armv8

速度指标:Thread1/Thread2/Thread4耗时

模型 压缩策略 数据集 Image/GPU 输入608 Box mmAP 存储体积 PaddleLite推理耗时(ms)(608*608) TensorRT推理速度(FPS)(608*608)
MobileNet-V1-YOLOv3 Pascal VOC 8 76.2 94MB 1238\796.943\520.101 60.04
MobileNet-V1-YOLOv3 剪裁 -52.88% Pascal VOC 8 77.6 (+1.4) 31MB 602.497\353.759\222.427 99.36
MobileNet-V1-YOLOv3 COCO 8 29.3 95MB - -
MobileNet-V1-YOLOv3 剪裁 -51.77% COCO 8 26.0 (-3.3) 32MB - 73.93

语义分割

数据集:Cityscapes

量化

模型 压缩策略 mIoU 存储体积
DeepLabv3-MobileNetv2 69.81 7.4MB
DeepLabv3-MobileNetv2 量化 67.59 (-2.22) 2.1MB

图像分割模型Lite时延(ms), 输入尺寸769 x 769

设备 模型类型 压缩策略 armv7 Thread 1 armv7 Thread 2 armv7 Thread 4 armv8 Thread 1 armv8 Thread 2 armv8 Thread 4
高通835 Deeplabv3-MobileNetV2 1282.8126 793.2064 653.6538 1193.9908 737.1827 593.4522
高通835 Deeplabv3-MobileNetV2 量化 981.44 658.4969 538.6166 885.3273 586.1284 484.0018
高通855 Deeplabv3-MobileNetV2 639.4425 390.1851 322.7014 477.7667 339.7411 262.2847
高通855 Deeplabv3-MobileNetV2 量化 705.7589 474.4076 427.2951 394.8352 297.4035 264.6724
麒麟970 Deeplabv3-MobileNetV2 1771.1301 1746.0569 1222.4805 1448.9739 1192.4491 760.606
麒麟970 Deeplabv3-MobileNetV2 量化 1320.386 918.5328 672.2481 1020.753 820.094 591.4114

剪裁

PaddleLite推理耗时说明:

环境:Qualcomm SnapDragon 845 + armv8

速度指标:Thread1/Thread2/Thread4耗时

模型 压缩方法 mIoU 存储体积 PaddleLite推理耗时 TensorRT推理速度(FPS)
FastSCNN 69.64 11MB 1226.36\682.96\415.664 39.53
FastSCNN 剪裁 -47.60% 66.68 (-2.96) 5.7MB 866.693\494.467\291.748 51.48