跳到主要内容
版本:2.8.1

平台算子支持列表

A210 平台算子支持列表

A210 主要支持 w8a8,w4a16 和 w16a16_fp16 3 种量化方式,以下是算子列表和限制说明详情。

算子名量化方式限制说明
addw8a8, w16a16_fp16不支持 broadcast 第一个维度。
argmaxw8a8, w16a16_fp16无限制。
argminw8a8, w16a16_fp16无限制。
avgpoolw8a8, w16a16_fp16
  • pad 不大于 15。
  • stride 不大于 16。
  • filter 不大于 16。
  • 输入的高不大于 8192。
  • 输入的宽不大于 2048。
concatw8a8, w16a16_fp16
  • 输入不能是常数。
  • 输入量化参数与输出相同。
convolutionw8a8, w16a16_fp16
  • 权重必须是常数。
  • 输入的通道数要能被 group 整除。
  • 权重的 batch 要能被 group 整除。
  • dilation 必须等于 1。
  • stride 不大于 32。
depthwise convolutionw8a8, w16a16_fp16
  • 权重必须是常数。
  • dilation 必须等于 1。
  • stride 不大于 32。
deconvolutionw8a8, w16a16_fp16
  • 权重必须是常数。
  • dilation 必须等于 1。
  • stride 不大于 15。
depth to spacew8a8, w16a16_fp16depth 要能被参数整除。
divw16a16_fp16无限制。
flattenw8a8, w16a16_fp16无限制。
linear / fullyconnectedw8a8, w4a16, w16a16_fp16权重必须是常数。
leaky reluw8a8, w16a16_fp16无限制。
maxpoolw8a8, w16a16_fp16
  • pad 不大于 15。
  • stride 不大于 16。
  • filter 不大于 16。
  • 输入的高不大于 8192。
  • 输入的宽不大于 2048。
Reduce maxw8a8, w16a16_fp16无限制。
Reduce meanw8a8, w16a16_fp16无限制。
mulw8a8, w16a16_fp16不支持 broadcast 第一个维度。
padw8a8, w16a16_fp16无限制。
preluw8a8, w16a16_fp16无限制。
reluw8a8, w16a16_fp16无限制。
relu6w8a8, w16a16_fp16无限制。
reshapew8a8, w16a16_fp16无限制。
resizew8a8, w16a16_fp16缩放值必须是整数。
sigmoidw8a8, w16a16_fp16无限制。
softmaxw8a8, w16a16_fp16无限制。
space to depthw8a8, w16a16_fp16无限制。
splitw8a8, w16a16_fp16不支持分割第一个维度。
squeezew8a8, w16a16_fp16无限制。
unsqueezew8a8, w16a16_fp16无限制。
strided slicew8a8, w16a16_fp16无限制。
subw8a8, w16a16_fp16不支持 broadcast 第一个维度。
transposew8a8, w16a16_fp16无限制。
gatherw8a8, w16a16_fp16无限制。
sinw16a16_fp16无限制。
cosw16a16_fp16无限制。
tanhw16a16_fp16无限制。
sqrtw16a16_fp16无限制。
logw16a16_fp16无限制。
expw16a16_fp16无限制。
topkw16a16_fp16无限制。
ROPEw16a16_fp16无限制。
RMS normw16a16_fp16无限制。
SDPAw16a16_fp16无限制。

A200 平台算子支持列表

A200 支持 w8a8 和 w16a16_int16 两种量化方式,以下是算子列表和限制。

算子名量化方式限制说明
addw8a8, w16a16_int16不支持 broadcast 第一个维度。
argmaxw8a8, w16a16_int16
  • 输入仅支持 4 维 float32。
  • 软件扩展。
avgpoolw8a8, w16a16_int16
  • pad 不大于 15。
  • stride 不大于 16。
  • filter 不大于 16。
  • 输入的高不大于 8192。
  • 输入的宽不大于 2048。
batch to spacew8a8, w16a16_int16
  • batch 维度要能被参数整除。
  • 软件扩展。
concatw8a8, w16a16_int16
  • 输入不能是常数。
  • 输入量化参数与输出相同。
convolutionw8a8, w16a16_int16
  • 权重必须是常数。
  • 输入的通道数要能被 group 整除。
  • 权重的 batch 要能被 group 整除。
  • dilation 必须等于 1。
  • stride 不大于 32。
depthwise convolutionw8a8, w16a16_int16
  • 权重必须是常数。
  • dilation 必须等于 1。
  • stride 不大于 32。
deconvolutionw8a8, w16a16_int16
  • 权重必须是常数。
  • dilation 必须等于 1。
  • stride 不大于 15。
depth to spacew8a8, w16a16_int16depth 要能被参数整除。
divw8a8, w16a16_int16不支持第二输入为变量的情况。
flattenw8a8, w16a16_int16无限制。
fullyconnectedw8a8, w16a16_int16
  • 权重必须是常数。
  • bias 的 zp 必须等于 0。
leaky reluw8a8, w16a16_int16无限制。
LRNw16a16_int16无限制。
maximumw16a16_int16无限制。
maxpoolw8a8, w16a16_int16
  • pad 不大于 15。
  • stride 不大于 16。
  • filter 不大于 16。
  • 输入的高不大于 8192。
  • 输入的宽不大于 2048。
meanw8a8, w16a16_int16无限制。
minimumw16a16_int16无限制。
mulw8a8, w16a16_int16不支持 broadcast 第一个维度。
padw8a8, w16a16_int16无限制。
preluw16a16_int16无限制。
reluw8a8, w16a16_int16无限制。
relu1w8a8, w16a16_int16无限制。
relu6w8a8, w16a16_int16无限制。
reshapew8a8, w16a16_int16无限制。
resizew8a8, w16a16_int16缩放值必须是整数。
sigmoidw8a8, w16a16_int16无限制。
softmaxw8a8, w16a16_int16软件扩展。
space to batchw8a8, w16a16_int16
  • batch 要能被参数整除。
  • 软件扩展。
space to depthw8a8, w16a16_int16软件扩展。
splitw8a8, w16a16_int16不支持分割第一个维度。
squeezew8a8, w16a16_int16无限制。
strided slicew8a8, w16a16_int16无限制。
subw8a8, w16a16_int16不支持 broadcast 第一个维度。
transposew8a8, w16a16_int16无限制。