2024年11月8日下午,数理学院刘佳敏博士和常续阳副教授于理化楼404,作题为“Kernel-Based Decentralized Policy Evaluation for Reinforcement Learning”和“Brightness and Contrast Corrections for Space-Time Stereocorrelation via Proper Generalized Decomposition”的学术报告。该报告为“德贤数理”青年人才学术沙龙第三十二期,我院多位师生参加了本次沙龙,本次沙龙由统计系主任刘秀芹和应用力学系党支部书记许鹏主持。
刘佳敏博士和常续阳副教授先后作学术报告分享。刘佳敏博士首先介绍了多智能体强化学习问题,对强化学习问题中的时间差分算法及存在的问题进行了阐述。随后,她讨论了非参数框架下多智能体强化学习和去中心化分布式学习的联系,重点讲解了用于价值函数估计的多阶段梯度下降算法及其收敛性,并通过数值模拟结果比较了新算法和传统时间差分算法的估计误差。最后刘佳敏博士展望了未来将算法推广到状态价值函数等其他强化学习问题的可能性。
常续阳副教授在报告开始引入了广义本征正交分解表征PVB夹层玻璃的低速撞击试验,介绍了PVB夹层玻璃的特性,强调了表征其力学本构模型的研究意义。随后他从三个部分展开,具体讲述了如何构建三维表面数字图像相关法、如何进行全局亮度与对比度矫正、以及如何在时空有限元计算的框架内,通过广义本征正交分解的方法,同时表征多物理场的时空变化。最后,常续阳副教授介绍了表征PVB夹层玻璃力学的研究进展和使用三维表面数字图像相关法进行实验表征的优势。
交流环节中,刘佳敏博士和常续阳副教授与在座师生围绕算法收敛性、误差界和如何进行PVB夹层玻璃的力学本构关系进行建模等问题进行了详细探讨,学术沙龙最终在热烈的掌声中圆满结束。
“德贤数理”青年人才学术沙龙在本学期将持续开展,邀请各学科领域优秀青年教师分享学术前沿问题及学术成长发展道路。
第三十三期学术沙龙将于11月11日(星期一)上午10:30在理化楼404举行,主讲人闫弘轩博士,欢迎各位老师和同学届时参加。