题 目:面向边缘终端的人工智能芯片及系统设计
报告时间:2019年10月30日下午3:30
报告地点:中南大学校本部计算机楼313会议室
报告人:陈小柏博士
报告摘要:
随着人工智能技术在移动通信,金融,安防,自动驾驶等领域的大范围应用,带来了面向人工智能技术的新的计算需求。传统的CPU,GPU等指令驱动的计算平台难以支持密集计算和超大数据通信的人工智能技术,且在储能有限的移动终端设备中,高达上百瓦的功耗也难以长时间支持人工智能技术应用。
针对边缘终端设备中人工智能计算的算力,功耗和灵活性的瓶颈,报告人设计了算力充足,低功耗,高灵活性的人工智能计算方案。通过对算法,指令集,编译工具,硬件(芯片)的软硬协同设计,来获得支持所有主流神经网络算法的高灵活性,以及在55nm工艺下的芯片高达2.2 Tops/W的计算能效。在软件层面,报告人提出了面向神经网络的专用指令集,此指令集携带并行参数和数据复用信息,同时设计相应指令生成器来解析神经网络算法,通过获取硬件计算和存储资源信息来综合生成优化执行的指令。在硬件层面,根据神经网络计算形式和数据特点,设计了查表乘法阵列和可重构计算引擎,在低位宽计算中获得相比常规乘法器阵列79%的能效优势。根据数据储存需求的结构性变化,设计了多层卷积层流水线计算技术,使神经网络计算过程中的高功耗代价的片外通信的需求得到显著降低甚至降低到0,从而大幅降低芯片的整体功耗。
报告人简介:
陈小柏,男,中山大学-卡耐基梅隆大学联合工程学院联合培养博士,主要研究方向为计算机体系结构,人工智能专用集成电路设计。读博期间作为第一作者发表了4篇SCI/EI学术论文(其中2篇trans期刊,分别为电路与系统领域顶级期刊TCSVT,超大规模集成电路领域顶级期刊TVLSI),并在2017年吉隆坡,2018年美国夏威夷举办的两次APSIPA ASC学术会议上做人工智能芯片研究的口头报告。设计并流片的低功耗神经网络芯片的能效达到2.2 Tops/W,为2018年最优设计,领先国内外同行工作。申请了3项发明专利以及1项集成电路布图,并担任IEEE TVLSI,TCAS,TVLSI的学术审稿人。曾在微软亚洲研发集团,联想研究院任职工程师和研究员。并于2017年创建知名AI芯片企业真微科技,担任总裁和首席科学家。带领公司推出了面向图像视频流AL系列,穿戴设备领域BL系列的超低功耗人工智能芯片产品并成为华为联想等系统厂商的技术合作方,成功推进了人工智能芯片技术发展和商业化。带领公司获得了2018年科技部全国双创冠军,为业界具备前沿学术科研能力和科技产业化的学者之一。