版本：2.8.1

平台算子支持列表

A210 平台算子支持列表

A210 主要支持 w8a8，w4a16 和 w16a16_fp16 3 种量化方式，以下是算子列表和限制说明详情。

算子名	量化方式	限制说明
add	w8a8, w16a16_fp16	不支持 broadcast 第一个维度。
argmax	w8a8, w16a16_fp16	无限制。
argmin	w8a8, w16a16_fp16	无限制。
avgpool	w8a8, w16a16_fp16	pad 不大于 15。 stride 不大于 16。 filter 不大于 16。输入的高不大于 8192。输入的宽不大于 2048。
concat	w8a8, w16a16_fp16	输入不能是常数。输入量化参数与输出相同。
convolution	w8a8, w16a16_fp16	权重必须是常数。输入的通道数要能被 group 整除。权重的 batch 要能被 group 整除。 dilation 必须等于 1。 stride 不大于 32。
depthwise convolution	w8a8, w16a16_fp16	权重必须是常数。 dilation 必须等于 1。 stride 不大于 32。
deconvolution	w8a8, w16a16_fp16	权重必须是常数。 dilation 必须等于 1。 stride 不大于 15。
depth to space	w8a8, w16a16_fp16	depth 要能被参数整除。
div	w16a16_fp16	无限制。
flatten	w8a8, w16a16_fp16	无限制。
linear / fullyconnected	w8a8, w4a16, w16a16_fp16	权重必须是常数。
leaky relu	w8a8, w16a16_fp16	无限制。
maxpool	w8a8, w16a16_fp16	pad 不大于 15。 stride 不大于 16。 filter 不大于 16。输入的高不大于 8192。输入的宽不大于 2048。
Reduce max	w8a8, w16a16_fp16	无限制。
Reduce mean	w8a8, w16a16_fp16	无限制。
mul	w8a8, w16a16_fp16	不支持 broadcast 第一个维度。
pad	w8a8, w16a16_fp16	无限制。
prelu	w8a8, w16a16_fp16	无限制。
relu	w8a8, w16a16_fp16	无限制。
relu6	w8a8, w16a16_fp16	无限制。
reshape	w8a8, w16a16_fp16	无限制。
resize	w8a8, w16a16_fp16	缩放值必须是整数。
sigmoid	w8a8, w16a16_fp16	无限制。
softmax	w8a8, w16a16_fp16	无限制。
space to depth	w8a8, w16a16_fp16	无限制。
split	w8a8, w16a16_fp16	不支持分割第一个维度。
squeeze	w8a8, w16a16_fp16	无限制。
unsqueeze	w8a8, w16a16_fp16	无限制。
strided slice	w8a8, w16a16_fp16	无限制。
sub	w8a8, w16a16_fp16	不支持 broadcast 第一个维度。
transpose	w8a8, w16a16_fp16	无限制。
gather	w8a8, w16a16_fp16	无限制。
sin	w16a16_fp16	无限制。
cos	w16a16_fp16	无限制。
tanh	w16a16_fp16	无限制。
sqrt	w16a16_fp16	无限制。
log	w16a16_fp16	无限制。
exp	w16a16_fp16	无限制。
topk	w16a16_fp16	无限制。
ROPE	w16a16_fp16	无限制。
RMS norm	w16a16_fp16	无限制。
SDPA	w16a16_fp16	无限制。

A200 平台算子支持列表

A200 支持 w8a8 和 w16a16_int16 两种量化方式，以下是算子列表和限制。

算子名	量化方式	限制说明
add	w8a8, w16a16_int16	不支持 broadcast 第一个维度。
argmax	w8a8, w16a16_int16	输入仅支持 4 维 float32。软件扩展。
avgpool	w8a8, w16a16_int16	pad 不大于 15。 stride 不大于 16。 filter 不大于 16。输入的高不大于 8192。输入的宽不大于 2048。
batch to space	w8a8, w16a16_int16	batch 维度要能被参数整除。软件扩展。
concat	w8a8, w16a16_int16	输入不能是常数。输入量化参数与输出相同。
convolution	w8a8, w16a16_int16	权重必须是常数。输入的通道数要能被 group 整除。权重的 batch 要能被 group 整除。 dilation 必须等于 1。 stride 不大于 32。
depthwise convolution	w8a8, w16a16_int16	权重必须是常数。 dilation 必须等于 1。 stride 不大于 32。
deconvolution	w8a8, w16a16_int16	权重必须是常数。 dilation 必须等于 1。 stride 不大于 15。
depth to space	w8a8, w16a16_int16	depth 要能被参数整除。
div	w8a8, w16a16_int16	不支持第二输入为变量的情况。
flatten	w8a8, w16a16_int16	无限制。
fullyconnected	w8a8, w16a16_int16	权重必须是常数。 bias 的 zp 必须等于 0。
leaky relu	w8a8, w16a16_int16	无限制。
LRN	w16a16_int16	无限制。
maximum	w16a16_int16	无限制。
maxpool	w8a8, w16a16_int16	pad 不大于 15。 stride 不大于 16。 filter 不大于 16。输入的高不大于 8192。输入的宽不大于 2048。
mean	w8a8, w16a16_int16	无限制。
minimum	w16a16_int16	无限制。
mul	w8a8, w16a16_int16	不支持 broadcast 第一个维度。
pad	w8a8, w16a16_int16	无限制。
prelu	w16a16_int16	无限制。
relu	w8a8, w16a16_int16	无限制。
relu1	w8a8, w16a16_int16	无限制。
relu6	w8a8, w16a16_int16	无限制。
reshape	w8a8, w16a16_int16	无限制。
resize	w8a8, w16a16_int16	缩放值必须是整数。
sigmoid	w8a8, w16a16_int16	无限制。
softmax	w8a8, w16a16_int16	软件扩展。
space to batch	w8a8, w16a16_int16	batch 要能被参数整除。软件扩展。
space to depth	w8a8, w16a16_int16	软件扩展。
split	w8a8, w16a16_int16	不支持分割第一个维度。
squeeze	w8a8, w16a16_int16	无限制。
strided slice	w8a8, w16a16_int16	无限制。
sub	w8a8, w16a16_int16	不支持 broadcast 第一个维度。
transpose	w8a8, w16a16_int16	无限制。

A210 平台算子支持列表​

A200 平台算子支持列表​

A210 平台算子支持列表

A200 平台算子支持列表