研究项目
序号 | 项目名称 | 项目编号 | 项目来源 | 起止时间 | 项目经费 |
研究领域
课题组最终的目标是用理论理解神经网络、打开深度学习的“黑箱”。具体而言,我们希望最终能够做到:通过理论
1. 对于现有模型现象进行解释,
2. 对于给定数据、模型和算法,能够在不训练的情况下预测模型结果
3. 对于给定数据结构能够找到对应的有效(甚至是最优)模型和算法
我当下比较感兴趣的小问题包括:
1. 泛化相关,包括但不限于算法稳定性在非凸优化中的使用、特殊模型结构的隐式正则、轨迹性质对泛化理论的提升、网络结构数据格式和算法的相互作用等
2. 大模型相关,包括但不限于如何加速大模型、如何压缩大模型、大模型的不确定性问题等
3. 共形预测相关,包括但不限于对共形预测假设的放松、对不同数据格式的建模等
4. 因果推断相关,包括但不限于非线性问题的因果推断、因果推断的鲁棒性等
当然,如果你有其他好玩的问题也欢迎和我联系,带我入门
教育经历
2020年9月-2024年7月 清华大学交叉信息研究院 博士
2016年9月-2020年7月 上海财经大学统计与管理学院 学士
工作经历
2024年7月--至今,上海财经大学,统计与管理学院,助理教授。
研究成果

奖励,荣誉
2024 清华大学优秀博士学位论文
2024 清华大学优秀毕业生
2023 清华大学王大中奖学金
2022 清华大学国家奖学金
2020 上海市优秀毕业生
社会工作
Seminar Organizer: FAI-Seminar(www.fai-seminar.ac.cn)
Workshop Organizer : BGPT @ICLR 2024
Reviewer: ICML, NeurIPS, ICLR, AISTATS, T-PAMI



