蚂蚁彩票平台 pk10 pk10开奖 pk10 pk10开奖 pk10
 
计算机科学与技术学院学术报告:Stabilizing reinforcement learning in dynamic environments

报告题目:Stabilizing reinforcement learning in dynamic environments

报告人: 俞扬 南京大学 副教授、博导

报告时间:2018315   10:30-11:30

地点:苏州大学本部理工楼633会议室

 

报告摘要:

经典强化学习常常假设agent在静态环境中学习,然而在真实应用中,物理环境常常会不断波动。环境的波动易造成agent观测扰动、回报偏差等问题,导致难以学到良好的策略。本次报告将汇报我们在波动环境中稳定强化学习方法的一些尝试,以及在真实推荐系统上的试用结果。

 

报告人简介:

俞扬,博士,南京大学副教授,博士生导师。主要研究领域为人工智能、机器学习、演化计算、数据挖掘。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位。20118月加入南京大学计算机科学与技术系、机器学习与数据挖掘研究所(LAMDA)从事教学与科研工作。曾获2013年全国优秀博士学位论文奖、2011年中国计算机学会优秀博士学位论文奖。发表论文40余篇,包括多篇Artificial IntelligenceIJCAIAAAINIPSKDD等人工智能、机器学习和数据挖掘国际顶级期刊和顶级会议论文。

 


(计算机科学与技术学院)
苏大概况 教育教学
院部设置 科学研究
组织机构 合作交流
招生就业 公共服务
Copyright 苏州大学 2016, All Rights Reserved

苏州市十梓街1号 组织策划:校长办公室

苏ICP备-10229414  苏公网安备 32050802010530号
推荐使用IE8.0以上浏览器,1280*760分辨率访问本网
友情链接:快三在线投注平台  快三在线投注平台  快3网上投注平台  快三  快三在线投注平台  快3投注平台  快三在线投注平台  

免责声明: 本站资料及图片来源互联网文章,本网不承担任何由内容信息所引起的争议和法律责任。所有作品版权归原创作者所有,与本站立场无关,如用户分享不慎侵犯了您的权益,请联系我们告知,我们将做删除处理!