深圳大学新葡的京集团350vip8888
College of Computer Science and Software Engineering, SZU
蔡晔

副教授

高性能计算研究所

Email:caiye@szu.edu.cn

蔡晔

     硕士生导师,2010.1博士毕业于中国科学院计算技术研究所,博士期间参与了龙芯处理器芯片和系统的研究工作,研究方向为非一致性缓存结构上的大规模软件一致性存储。

     现工作于深圳大学高性能计算所,现面向研究生招生的主要研究方向为:

 

      1、开源RISC-V微处理器设计以及体系结构研究。
        与中国科学院计算技术研究所、鹏城国家实验室、北京开源芯片研究院合作,研究生参与高性能开源处理器-香山(https://github.com/OpenXiangShan/XiangShan)的研究。香山处理器是国内研发的一款在国际上性能最高的开源处理器芯片。 目前已经完成基于香山处理器核的28nm工艺处理器流片,正进行14nm处理器的研制。目前合作的厂商包括Intel、腾讯、字节跳动、华为、中兴、百度、奕斯伟、大疆等。

 

ü  研究RISC-V指令集:以及压缩、浮点、向量等扩展指令集,探索可大幅提升芯片设计效率的芯片敏捷设计方法;

ü  研究基于RISC-V的处理器芯片:设计高效的处理器结构,包括前端取 指、分支预测、乱序引擎、指令调度、运算部件、内存系统和模拟器等;

ü  IP及高性能SOC芯片设计技术

ü  后端物理设计技术

ü  “0基础”培训计划: 可先期通过参与“一生一芯”计划(www.ysyx.org)进行芯片设计实践的入门学习。

     
    主要就业领域包括intel,ARM中国,NVIDA等国际一流半导体与芯片设计公司以及国内相关的信息技术公司,或可在深大、中国科学院以及鹏城国家实验室等博士培养单位进行深造。


      2、开源集成电路EDA(电子设计自动化)软件研究。
       与鹏城国家实验室合作,主要研究从芯片RTL 设计开始,综合(Synthesis)、布局(placement)、布线(Routing)以及验证(Verifying)各个阶段的软件以及算法研究。

ü  研究EDA算法:神经网络,启发式算法,动态规划,数学规划,数值计算,图算法,组合优化;

ü  设计EDA软件:支撑全流程芯片设计,具体包括:逻辑综合、布局、时钟树综合、布线、静态时序分析和物理验证等;

ü  研究高性能算法:分析性能瓶颈,设计高性能计算方法(并行计算/向量计算/GPU),优化算法执行性能;

ü  “0基础”培训计划:  学习EDA知识和软件设计(4周),学习数据结构和高性能计算(3周),项目锻炼加具体指导

 

      3、芯片和EDA中的AI模型研究   

 

ü  研究AI+EDA:研究EDA中的AI问题,强化学习,深度学习,图神经网络,版图图像处理,指标预测,算法优化等;

ü  研究AI+IC:研究IC设计过程中的设计空间探索,强化学习,自编码,自然语言处理等等。

ü  “0基础”培训计划:学习EDA知识和软件设计(4周),学习数学理论和算法设计(3周),项目锻炼加具体指导


     4、高性能计算机系统研究。
       研究基于国产处理器实现面向高性能计算、云计算、AI计算等大规模系统的软硬件关键技术以及应用软件开发。负责KD60:基于龙芯多核处理器3A的万亿次高性能计算机硬件系统的研制;负责KD90:基于龙芯多核处理器3B的万亿次高性能计算机硬件系统的研制,负责SD30:基于龙芯多核处理器3B2000的国产高性能云计算系统的研制。相关工作已获得教育部科技进步二等奖。


      5、面向人工智能和大数据领域的软硬件协同优化技术研究。
      主要研究通过软硬件协同技术对大数据以及人工智能领域的核心算法进行加速。负责研制大数据系统计算技术国家工程实验室大数据一体机的研制,使用龙芯平台和比特大陆的AI系统异构结合,支持进行人工智能方面的大数据分析、计算。并采用软硬件协同技术实现基于分布式大数据存储系统HDFS的硬件压缩加速以及DEEPFM等人工智能算法的加速,支撑数据的采集、数据存储、数据处理、数据分析到数据呈现的全环节覆盖,研究交通大数据并行结构化分析平台的关键技术,支持千万级以上规模图片的管理、高速特征提取,支持多路大规模实时视频的车辆和人体的检测、跟踪、抓拍和识别,实时处理,延时低,准确度高。


       6、基于华为昆仑架构的大数据一体机。

      以华为昆仑架构为基础,针对大数据应用需求对计算、存储以及IO资源进行合理配置和扩展,并进行软硬件协同优化设计。系统互连采用华为自研NC(Node Controller)处理器互联芯片Hi1503。利用商业化的x86 CISC架构处理器来构造开放架构的大规模的CC-NUMA系统,操作系统可以使用Linux或者Windows,从而获得更广泛的应用软件支持,降低系统的软硬件成本。采用分布式共享存储CC-NUMA系统。互联性能远远超越消息传递系统,满足大数据的带宽需求,适合多线程、多事务的并发处理模式。并基于华为昆仑架构面向大数据应用进行了存储系统的设计扩展以及基于FPGA面向大数据处理的软硬件深度优化技术。
     目前主持或参与多项国家、省市级项目以及横向项目,科研经费充足。

XML 地图