9月15日,2020西安全球硬科技创新大会分论坛——“下一代AI 芯片产业发布暨Chiplet产业联盟启动成立圆桌论坛”将于高新国际会议中心丈八厅盛大启幕。届时,将重磅发布“启明920”AI加速芯片(以下简称“启明920”)。
8月20日,“启明920”由清华大学交叉信息研究院马恺声教授领衔的西安交叉核心院芯片中心研发成功并完成测试,这在我国芯片领域具有重大意义。
面向低速自动驾驶,硬件峰值有效加速比近9倍
“启明920”通过软硬件协同设计的思路,对使用图案剪枝(已申请专利)优化的模型,采用了特定技术,实现存储优化与计算加速,能够将神经网络模型实现最高4.5倍的存储压缩,同时充分发挥硬件稀疏计算的效率,硬件加速比可达3.5倍,而神经网络模型精度损害仅在1%以内。
“启明920”进一步利用卷积核剪枝技术,与图案剪枝技术相兼容,进而实现最大合计11.25倍的模型存储压缩,硬件峰值有效加速比近9倍,可充分缩短计算时间。此外,“启明920”通过统一架构对多模式的数据量化提供高效的支持,可适配线性与非线性权重参数的量化方法,可适配不同使用场景的需求。
“启明920”在片外访存的设计上,对DRAM访问做了专门优化,充分复用处理单元资源,一方面采用数据“即到即算”的策略缩短计算延时;另一方面采用交替更新激活与权重的形式,减少片外带宽需求。
通过上述技术创新,“启明920”可面向高能效的低速无人车、AGV、计算机视觉加速等AI应用场景。
历时九个月,“启明920”研发神速
2019年12月24日,高新区首颗AI加速芯片“启明 910” 研发成功后,在马恺声教授的带领下,西安交叉核心院芯片中心正式启动“启明920”AI加速芯片研发。3月中旬,西安交叉核心院全面复工,研发团队全员集结,加速推进研发工作。在此期间,研发团队取得多项相关研究成果,在CVPR、DAC等国际顶会发布论文3篇,并申请国内发明专利5项。经过月余的攻坚克难,4月27日,芯片正式在联电流片;7月15日,“启明920”流片完成;历时一个月,8月20日研发团队完成芯片测试并全面达标。
(马恺声教授与研发团队在实验室进行技术研讨)
(研发团队在实验室开展芯片测试)
“启明930”启动研发
“启明920”的研发成功是国产芯片加速发展的一个缩影,也是西安交叉核心院推进基础前沿科技研究的全新起点。“启明920”研发成功后,西安交叉核心院迅速启动研发“启明930”AI加速芯片,该款芯片将实现可扩展、高性能的设计,直接面向计算密集型的自动驾驶应用场景。
领取专属 10元无门槛券
私享最新 技术干货