报告题目:融入先验知识的强化学习
报告时间:2022年3月23日(星期三)16:00-16:45
报告地点:腾讯会议 872-833-754
报告摘要:在本次报告中,围绕如何把先验知识融入到强化学习的设计与训练的主题,介绍我们近期的一些工作,包括未知通信信道数据的远程状态估计器的调度设计、在不规则环境下的抓取的快速学习。其中,调度器的设计中,Q函数被证明是关于状态和行为值是次模和单调的。基于此,设计了保结构的Q学习算法,以强制瞬时的Q函数满足上述的结构。算法的收敛性得到了理论证明而大量的实验数据显示出了此算法相比于经典的Q学习算法的收敛速度提升。在不规则环境下的抓取中,提出了一种通过不规则度量化及Q映射的掩藏的预抓取和抓取快速学习深度强化学习算法。此算法在需要极少的训练数据即可实现与当前主流算法相当的抓取精度。
演讲嘉宾:任肖强,上海大学机电工程与自动化学院教授、博导,国家海外高层次人才引进计划
|
任肖强,上海大学机电工程与自动化学院教授、博导。2012年获得浙江大学学士学位,2016年获得香港科技大学博士学位,其后在香港科技大学、新加坡南洋理工大学、瑞典皇家理工学院从事博士后研究工作。任肖强教授的研究兴趣为信息物理融合系统的安全智能控制。2019年入选了国家海外高层次人才引进计划青年项目,主持国家重点研发项目课题一项。 |
太阳成集团tyc9728、我校科技处、江苏省人工智能学会