主页
团队成员
教师信息
学术活动
课题组介绍
课题组的主要成员来自武汉大学计算机学院,课题组长期专注于程序分析和系统级优化,具体包括:系统层软件优化(内存管理、虚拟机、垃圾回收器)、AI系统优化等。
课题组积极为硕士生、博士生积极创造良好的科研条件:
科研津贴
资助参加国内外学术交流
与国际知名高校联合培养
赴国际知名高校交流访问
推荐头部企业研实习
招生说明:没有硬性条件,但是有学习底层技术的热情、编程能力和英语能力,不畏挑战,有良好的自我时间管理(实验室不打卡,每周一次meeting)。
学生就业及深造
课题组跟相关领域头部企业(包括华为、OPPO、百度、平头哥、国产芯片企业等)有良好的合作与沟通,可以为同学们就业提供较好的指导和帮助。
与此同时,课题组跟澳洲UNSW、香港城市大学、国防科大等高校有良好的合作关系,有意向攻读博士学位的同学也能提前了解学习。可以在本实验室考虑硕博连读(通常会与海外专家联合指导),也可以推荐海外求学。已推荐多名学生前往美国Georgia Institute of Technology、加拿大University of British Columbia、澳洲UNSW、香港城市大学深造。
课题组的研究方向大多都涉及编译优化、系统层软件优化、内存管理等领域,因此在科研训练过程中,有一定的门槛和挑战;但是,同时,该方向也能建立一定的壁垒,适合长期沉淀积累,该方向的研究或工程人员供不应求,薪资待遇普遍高于多数开发岗位。课题组对于研究生毕业后的研究发展没有限制,乐于为同学们工作或继续深造提供建议和帮助。
科研方向
面向AI计算的系统层优化
方向介绍:
探索AI计算的编译流程,以及相关开发框架(比如Pytorch、TensorFlow)的原理,并提出和验证新颖、有效的优化方法。
实验验证平台:开源的AI编译框架,包括CMU的TVM、百度的PaddlePaddle和阿里的MNN等软件,以及GPU、NPU、CPU等硬件。
相关技能或知识点 :C++编程、编译原理、虚拟内存、智能计算系统、深度学习
部分学习资料:AI编译
项目:
基于DNN开发框架的高性能优化方法研究(基金)
基于多范式编程模型和张量优化的智能计算框架平台关键技术研发(基金)
面向深度神经网络的内存分配与优化方法研究(基金)
面向国产NPU的深度学习框架适配与优化(CCF-飞腾基金)
Android内核分析与优化
方向介绍:
探索Android内核的原理,重点关注其编译流程和虚拟机机制,并提出和验证新颖、有效的优化方法。
实验验证平台:开源的Android实现版——AOSP,以及可刷AOSP的手机Pixel。
相关技能或知识点 :Java虚拟机、Android虚拟机、虚拟内存、操作系统、编译原理、C++编程
部分学习资料:AOSP
项目:
Android应用代码尺寸优化方法研究(企业)
Android虚拟机的内存管理优化方法(企业)
程序分析与软件优化
方向介绍:
面向传统或新型芯片的编译方法;基于程序分析的软件优化方法。
实验验证平台:开源编译器LLVM等。
相关技能或知识点 :C++、编译原理、计算机组成与设计、程序分析等
部分学习资料:程序分析与优化
项目:
面向专用处理器的编译优化方法研究(企业)
面向嵌入式系统的编译器内存优化方法(企业)
加入课题组
人员详细信息
欢迎报考研究生(欢迎联系 )
2023级博士生 (已满)
2025级硕士生 (开放中)
欢迎本科生同学以灵活的形式参加本课题组(要求:在知识学习和技术方面积极主动)
毕业设计:鼓励与读研的研究方向衔接,欢迎有意向读研的同学
暑期实习实训:适合大二、大三暑期实习实训 -> 鼓励后续与毕业设计衔接
实习实训、毕设、研究生可选的题目(仅供参考)
支持和鼓励基于实习、实训或毕设阶段的工作发表学术论文或专利。要求:无硬性要求,但是需要对学习有热情,愿意投入精力。
面向AI的软件优化方法
背景:新的AI模型不断涌现,新的硬件加速器也在不断更新,二者之间需要一套AI开发框架以及对应的优化方法,使得新模型能够在新的硬件加速器上高效运行。
内容:研究面向AI计算框架的内存优化 (预期收获:AI计算框架的机理、内存优化、计算图优化、算子调度与算子优化等)
参考资料:AI编译
高性能GC设计
背景:当前Java虚拟机无论在服务器端还是移动端,都面临性能瓶颈。克服瓶颈的一大方向是改善内存管理的性能。
内容:研究和实现高性能的内存垃圾回收器(Garbage Collector, GC) (预期收获:Java虚拟机原理)
参考资料:GC
基于Android的移动设备性能优化
内容:研究Android App的代码特点,识别其中的重复、相似和冗余,并探讨优化方案(预期收获:Android系统架构、App代码组成与结构、虚拟机、编译)
持久化内存(persistent memory,PM)
背景:PM能够对传统的存储架构带来巨大变革,展现了巨大的潜力;但是当前面临一致性问题,影响了PM产品的大规模推广。
内容:研究面向持久化内存的内存模型、I/O系统 (预期收获:内存模型、编程模型、文件系统等)
并发编程研究
背景:当前的并发编程主要是利用多线程机制。但是线程机制涉及内核上下文切换的成本。为此,业界提出了很多用户态的并发机制,比如协程。这些机制需要显示管理并发任务之间的同步,给编程带来了不小的挑战。
内容:研究并发编程的特性;提出编程友好的、高效的并发编程模型。
编译器研发
内容:基于LLVM,设计和实现面向特定领域芯片的编译器(预期收获:LLVM工具、后端代码优化、后端代码生成、汇编器的实现、链接器的实现)
参考资料: 编译器
本站访客量 人
本站点击量 次
鄂ICP备18027762号-1
鄂ICP备18027762号-3