PaddleX模型列表(昇腾 NPU)¶
PaddleX 内置了多条产线,每条产线都包含了若干模块,每个模块包含若干模型,具体使用哪些模型,您可以根据下边的 benchmark 数据来选择。如您更考虑模型精度,请选择精度较高的模型,如您更考虑模型存储大小,请选择存储大小较小的模型。
图像分类模块¶
模型名称 | Top1 Acc(%) | 模型存储大小(M) |
---|---|---|
CLIP_vit_base_patch16_224 | 85.36 | 306.5 M |
CLIP_vit_large_patch14_224 | 88.1 | 1.04 G |
ConvNeXt_base_224 | 83.84 | 313.9 M |
ConvNeXt_base_384 | 84.90 | 313.9 M |
ConvNeXt_large_224 | 84.26 | 700.7 M |
ConvNeXt_large_384 | 85.27 | 700.7 M |
ConvNeXt_small | 83.13 | 178.0 M |
ConvNeXt_tiny | 82.03 | 101.4 M |
MobileNetV1_x0_75 | 68.8 | 9.3 M |
MobileNetV1_x1_0 | 71.0 | 15.2 M |
MobileNetV2_x0_5 | 65.0 | 7.1 M |
MobileNetV2_x0_25 | 53.2 | 5.5 M |
MobileNetV2_x1_0 | 72.2 | 12.6 M |
MobileNetV2_x1_5 | 74.1 | 25.0 M |
MobileNetV2_x2_0 | 75.2 | 41.2 M |
MobileNetV3_large_x0_5 | 69.2 | 9.6 M |
MobileNetV3_large_x0_35 | 64.3 | 7.5 M |
MobileNetV3_large_x0_75 | 73.1 | 14.0 M |
MobileNetV3_large_x1_0 | 75.3 | 19.5 M |
MobileNetV3_large_x1_25 | 76.4 | 26.5 M |
MobileNetV3_small_x0_5 | 59.2 | 6.8 M |
MobileNetV3_small_x0_35 | 53.0 | 6.0 M |
MobileNetV3_small_x0_75 | 66.0 | 8.5 M |
MobileNetV3_small_x1_0 | 68.2 | 10.5 M |
MobileNetV3_small_x1_25 | 70.7 | 13.0 M |
PP-HGNet_base | 85.0 | 249.4 M |
PP-HGNet_small | 81.51 | 86.5 M |
PP-HGNet_tiny | 79.83 | 52.4 M |
PP-HGNetV2-B0 | 77.77 | 21.4 M |
PP-HGNetV2-B1 | 79.18 | 22.6 M |
PP-HGNetV2-B2 | 81.74 | 39.9 M |
PP-HGNetV2-B3 | 82.98 | 57.9 M |
PP-HGNetV2-B4 | 83.57 | 70.4 M |
PP-HGNetV2-B5 | 84.75 | 140.8 M |
PP-HGNetV2-B6 | 86.30 | 268.4 M |
PP-LCNet_x0_5 | 63.14 | 6.7 M |
PP-LCNet_x0_25 | 51.86 | 5.5 M |
PP-LCNet_x0_35 | 58.09 | 5.9 M |
PP-LCNet_x0_75 | 68.18 | 8.4 M |
PP-LCNet_x1_0 | 71.32 | 10.5 M |
PP-LCNet_x1_5 | 73.71 | 16.0 M |
PP-LCNet_x2_0 | 75.18 | 23.2 M |
PP-LCNet_x2_5 | 76.60 | 32.1 M |
PP-LCNetV2_base | 77.05 | 23.7 M |
ResNet18_vd | 72.3 | 41.5 M |
ResNet18 | 71.0 | 41.5 M |
ResNet34_vd | 76.0 | 77.3 M |
ResNet34 | 74.6 | 77.3 M |
ResNet50_vd | 79.1 | 90.8 M |
ResNet50 | 76.5 | 90.8 M |
ResNet101_vd | 80.2 | 158.4 M |
ResNet101 | 77.6 | 158.7 M |
ResNet152_vd | 80.6 | 214.3 M |
ResNet152 | 78.3 | 214.2 M |
ResNet200_vd | 80.9 | 266.0 M |
SwinTransformer_base_patch4_window7_224 | 83.37 | 310.5 M |
SwinTransformer_small_patch4_window7_224 | 83.21 | 175.6 M |
SwinTransformer_tiny_patch4_window7_224 | 81.10 | 100.1 M |
注:以上精度指标为ImageNet-1k验证集 Top1 Acc。
目标检测模块¶
模型名称 | mAP(%) | 模型存储大小(M) |
---|---|---|
CenterNet-DLA-34 | 37.6 | 75.4 M |
CenterNet-ResNet50 | 38.9 | 319.7 M |
DETR-R50 | 42.3 | 159.3 M |
FasterRCNN-ResNet34-FPN | 37.8 | 137.5 M |
FasterRCNN-ResNet50-FPN | 38.4 | 148.1 M |
FasterRCNN-ResNet50-vd-FPN | 39.5 | 148.1 M |
FasterRCNN-ResNet50-vd-SSLDv2-FPN | 41.4 | 148.1 M |
FasterRCNN-ResNet101-FPN | 41.4 | 216.3 M |
FCOS-ResNet50 | 39.6 | 124.2 M |
PicoDet-L | 42.6 | 20.9 M |
PicoDet-M | 37.5 | 16.8 M |
PicoDet-S | 29.1 | 4.4 M |
PicoDet-XS | 26.2 | 5.7M |
PP-YOLOE_plus-L | 52.9 | 185.3 M |
PP-YOLOE_plus-M | 49.8 | 83.2 M |
PP-YOLOE_plus-S | 43.7 | 28.3 M |
PP-YOLOE_plus-X | 54.7 | 349.4 M |
RT-DETR-H | 56.3 | 435.8 M |
RT-DETR-L | 53.0 | 113.7 M |
RT-DETR-R18 | 46.5 | 70.7 M |
RT-DETR-R50 | 53.1 | 149.1 M |
RT-DETR-X | 54.8 | 232.9 M |
YOLOv3-DarkNet53 | 39.1 | 219.7 M |
YOLOv3-MobileNetV3 | 31.4 | 83.8 M |
YOLOv3-ResNet50_vd_DCN | 40.6 | 163.0 M |
注:以上精度指标为COCO2017验证集 mAP(0.5:0.95)。
语义分割模块¶
模型名称 | mloU(%) | 模型存储大小(M) |
---|---|---|
Deeplabv3_Plus-R50 | 80.36 | 94.9 M |
Deeplabv3_Plus-R101 | 81.10 | 162.5 M |
Deeplabv3-R50 | 79.90 | 138.3 M |
Deeplabv3-R101 | 80.85 | 205.9 M |
OCRNet_HRNet-W48 | 82.15 | 249.8 M |
PP-LiteSeg-T | 73.10 | 28.5 M |
注:以上精度指标为Cityscapes数据集 mloU。
实例分割模块¶
模型名称 | Mask AP | 模型存储大小(M) |
---|---|---|
Mask-RT-DETR-H | 50.6 | 449.9 |
Mask-RT-DETR-L | 45.7 | 113.6 |
Mask-RT-DETR-M | 42.7 | 66.6 M |
Cascade-MaskRCNN-ResNet50-FPN | 36.3 | 254.8 |
Cascade-MaskRCNN-ResNet50-vd-SSLDv2-FPN | 39.1 | 254.7 |
PP-YOLOE_seg-S | 32.5 | 31.5 M |
注:以上精度指标为COCO2017验证集 Mask AP(0.5:0.95)。
文本检测模块¶
模型名称 | 检测Hmean(%) | 模型存储大小(M) |
---|---|---|
PP-OCRv4_mobile_det | 77.79 | 4.2 M |
PP-OCRv4_server_det | 82.69 | 100.1M |
注:以上精度指标的评估集是 PaddleOCR 自建的中文数据集,覆盖街景、网图、文档、手写多个场景,其中检测包含 500 张图片。
文本识别模块¶
模型名称 | 识别Avg Accuracy(%) | 模型存储大小(M) |
---|---|---|
PP-OCRv4_mobile_rec | 78.20 | 10.6 M |
PP-OCRv4_server_rec | 79.20 | 71.2 M |
注:以上精度指标的评估集是 PaddleOCR 自建的中文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 1.1w 张图片。
模型名称 | 识别Avg Accuracy(%) | 模型存储大小(M) |
---|---|---|
ch_SVTRv2_rec | 68.81 | 73.9 M |
注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务A榜。
模型名称 | 识别Avg Accuracy(%) | 模型存储大小(M) |
---|---|---|
ch_RepSVTR_rec | 65.07 | 22.1 M |
注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务B榜。
表格结构识别模块¶
模型名称 | 精度(%) | 模型存储大小(M) |
---|---|---|
SLANet | 76.31 | 6.9 M |
注:以上精度指标测量自PubtabNet英文表格识别数据集。
版面区域分析模块¶
模型名称 | mAP(%) | 模型存储大小(M) |
---|---|---|
PicoDet_layout_1x | 86.8 | 7.4M |
注:以上精度指标的评估集是 PaddleOCR 自建的版面区域分析数据集,包含 1w 张图片。
时序预测模块¶
模型名称 | mse | mae | 模型存储大小(M) |
---|---|---|---|
DLinear | 0.382 | 0.394 | 72K |
NLinear | 0.386 | 0.392 | 40K |
Nonstationary | 0.600 | 0.515 | 55.5 M |
PatchTST | 0.385 | 0.397 | 2.0M |
RLinear | 0.384 | 0.392 | 40K |
TiDE | 0.405 | 0.412 | 31.7M |
TimesNet | 0.417 | 0.431 | 4.9M |
注:以上精度指标测量自ETTH1数据集 (在测试集test.csv上的评测结果)。
时序异常检测模块¶
模型名称 | precison | recall | f1_score | 模型存储大小(M) |
---|---|---|---|---|
AutoEncoder_ad | 99.36 | 84.36 | 91.25 | 52K |
DLinear_ad | 98.98 | 93.96 | 96.41 | 112K |
Nonstationary_ad | 98.55 | 88.95 | 93.51 | 1.8M |
PatchTST_ad | 98.78 | 90.70 | 94.57 | 320K |
TimesNet_ad | 98.37 | 94.80 | 96.56 | 1.3M |
注:以上精度指标测量自PSM数据集。
时序分类模块¶
模型名称 | acc(%) | 模型存储大小(M) |
---|---|---|
TimesNet_cls | 87.5 | 792K |