A210 产品规格书
Copyright
本文件为知合计算技术(上海)有限公司(以下简称“公司”)的财产,未经公司同意或书面同意,不得向任何第三方披露、给予或转让。如违反本条规定,给公司造成损失的,应当承担赔偿责任。
Contacts
知合计算技术(上海)有限公司
地址: 上海市浦东新区申江路 5005 弄星创科技广场 3 号楼 12F
邮箱: business@zhcomputing.com
电话: 0571-87208790
简介
功能特性
高性能处理器核
-
8 核 64 位 RISC-V 处理器( 4×C920 + 4×C908)
-
C920@1.9 GHz,支持 RISC-V 64GCV 指令集
-
9~12 级深流水架构
-
3 发射 8 执行的超标量架构,对软件完全透明
-
支持按序取指,乱序发射,乱序完成和按序退休
-
支持 64 KB I Cache 和 64 KB D Cache
-
支持共享 1MB L2 Cache
-
支持 588 GFlops@INT8/294 GFlops@FP16 矢量运算
-
-
C908@1.9 GHz,支持 RISC-V 64GCV 指令集
-
9 级流水架构
-
支持按序双发射,按序取指、发射、执行和退休
-
支持 32 KB I Cache 和 32 KB D Cache
-
支持共享 512 KB L2 Cache
-
支持 121.6 GFlops@INT8/60.8 GFlops@FP16 矢量运算
-
-
每个核都支持矢量运算,遵循 RISC-V V 扩展
-
支持 FP16/BF16/FP32/FP64 浮点的矢量运算
-
支持 INT8/INT16/INT32/INT64 整形的矢量运算
-
支持 128 位矢量寄存器位宽
-
-
支持小端模式
-
支持 TEE 和 REE
-
支持相互独立的可执行域
-
支持 Zone 间相互隔离
-
支持每个 Zone 内的应用程序和应用程序之间、应用程序和内核之间的相互隔离
-
支持 Zone 之间共享内存访问
-
支持 Zone 之间的可信通信
-
支持提供兼容 GP 规范的 TEE 执行环境
-
-
支持 SV39 模式
-
支持两级 TLB 内存管理单元,实现虚实地址转换与内存管理
-
支持半精度、单精度和双精度的浮点运算
-
支持 DVFS
AI 计算引擎
-
支持性能高达 12TOPS@INT8 的神经网络加速引擎
-
推理 DeepSeek-7B 可达 8 tokens/s
-
4 Die 级联推理 DeepSeek-7B 可达 25 tokens/s
-
支持 INT4、INT8、INT16、FP8、FP16 和 BF16 等类型
-
支持 2MB SRAM
-
支持CNN、RNN
-
支持 TensorFlow、Caffe、HuggingFace、ONNX 等深度学习框架
-
支持 Transformer 加速,支持 LLM 模型
-
支持权重无损压缩
-
支持混合精度运算,INT4 与 FP16 混合使用
图形处理器
-
支持 APIs:
-
支持 Vulkan 1.1/1.2
-
支持 OpenCL 1.1/1.2/2.0
-
支持 OpenGL ES 1.1/2.0/3.0/3.1/3.2
-
-
基于分片的 3D 图形渲染,支持多个分片同时处理
-
可编程的高质量抗混叠
-
先进的 DMA 操作,降低 CPU 负载
-
压缩纹理编码
-
无损数据压缩
-
固件执行专用处理器
-
性能:
-
支持 50.34 GFLOPS 的运算
-
支持 3D 图形加速引擎,3.14 GPixel@786MHz
-
支持 F32 操作,每个时钟周期 64 次
-
支持 F16 操作,每个时钟周期 128 次
-
支持整数操作,每个时钟周期 32 次
-
支持几何操作,每 4 个时钟周期 1 次三角形操作
-
电源管理单元
-
集成 1 个 RISC-V E902@100MHz
-
集成 1 个 RTC
-
集成 1 个 POR
-
集成 1 个 Watchdog
-
集成 PMC 控制单元
存储接口
-
LPDDR4/LPDDR4X
-
支持 2 个 32 位 LPDDR4/LPDDR4X,最高速率 4266 Mbps
-
兼容 JEDEC 标准 LPDDR4-2133/LPDDR4-3200/LPDDR4-3733/LPDDR4-4266/LPDDR4X-2133/LPDDR4X-3200/LPDDR4X-3733/LPDDR4X-4266 SDRAM
-
支持 2 个通道,每个通道 32 位数据位宽
-
LPDDR4/4x 最大支持 16GB
-
支持不同 LPDDR4/4X 颗粒时序参数可配置
-
支持命令重排序和调度,最大化带宽利用率
-
支持 ODT 电阻可编程,动态 PVT 补偿
-
-
SPI NOR/NAND Flash 接口
-
支持两路 QSPI 和两路 SPI
-
QSPI 和 SPI 最高 52.625MHz
-
支持 1 位/2 位/4 位数据线模式传输
-
-
eMMC5.1 接口
-
兼容 JEDEC 标准 eMMC 5.1 和 eMMC 5.0
-
支持 eMMC 启动
-
在 8 位数据线模式下:
-
HS400 模式(200MHz DDR),理论最高数据率可达 400MB/s
-
HS200 模式(200MHz SDR),最高数据率 200MB/s
-
DDR52 模式(52MHz DDR),最高数据率 104MB/s
-
-
支持 1 位/4 位/8 位数据线模式传输
-
-
SD 3.0 接口
-
兼容 SD3.0
-
1 个 SD 接口,可配置为 SD/SDIO
-
最高数据传输带宽 100MB/s
-
支持 1 位/4 位数据线传输模式
-
图像信号处理器
-
支持最多 4 路 Sensor 输入
-
支持 RAW 8/10/12 位输入
-
支持最大 12M 像素输入
-
支持 LSC 和坏点校正
-
支持 3A 统计信息输出
-
支持 2D/3D 图像降噪
-
支持边缘锐化
-
支持畸变校正/鱼眼校正
-
支持真实宽动态
视频处理
-
支持视频缩放处理
-
支持缩小,最大缩小倍数为 128 倍
-
支持放大,最大放大倍数为 4 倍
-
支持 YUV 和 RGB888 输出
-
支持 3 个缩放模块并行工作
-
SE0 支持输出最大分辨率为 4K
-
SE1 支持输出最大分辨率为 1080P
-
SE2 支持输出最大分辨率为 1080P
-
-
-
支持畸变校正