題目:基于強(qiáng)化學(xué)習(xí)的離散時(shí)間均值-方差策略
報(bào)告人: 李迅
時(shí)間:2024年11月22日(周五),上午10:00-11:00
報(bào)告地點(diǎn): 理學(xué)院1-301會(huì)議室(騰訊會(huì)議:609-272-073)
報(bào)告摘要:本報(bào)告研究了一種基于強(qiáng)化學(xué)習(xí)的離散時(shí)間均值-方差模型。與Wang-Zhou (2020)的連續(xù)時(shí)間模型相比,離散時(shí)間模型對(duì)資產(chǎn)收益分布的假設(shè)更為廣泛。通過(guò)使用熵來(lái)衡量探索成本,推導(dǎo)出最優(yōu)投資策略,其密度函數(shù)同樣為高斯類型。此外,設(shè)計(jì)了相應(yīng)的強(qiáng)化學(xué)習(xí)算法。模擬實(shí)驗(yàn)和實(shí)證分析表明,離散時(shí)間模型在分析實(shí)際數(shù)據(jù)時(shí),相較于連續(xù)時(shí)間模型具有更好的適用性。
報(bào)告人簡(jiǎn)介:
李迅,于1992年獲上海科技大學(xué)數(shù)學(xué)系學(xué)士學(xué)位,1995年獲上海大學(xué)數(shù)學(xué)系碩士學(xué)位。2000年在香港中文大學(xué)系統(tǒng)工程與工程管理學(xué)系獲得博士學(xué)位,并于2001年在該系擔(dān)任博士后研究員。從2001年至2003年,他在卡爾加里大學(xué)數(shù)學(xué)與計(jì)算金融實(shí)驗(yàn)室擔(dān)任博士后研究員。2003年至2007年,他是新加坡國(guó)立大學(xué)數(shù)學(xué)系的訪問(wèn)學(xué)者。2007年起,他加入香港理工大學(xué)應(yīng)用數(shù)學(xué)系,擔(dān)任助理教授,2013年晉升為副教授,目前為教授。其主要研究領(lǐng)域?yàn)殡S機(jī)控制與金融應(yīng)用中的應(yīng)用概率,已在SIAM Journal on Control and Optimization、Annals of Applied Probability、IEEE Transactions on Automatic Control、Automatica、Journal of Differential Equations、Mathematical Finance、Finance and Stochastics以及Quantitative等期刊發(fā)表論文。
中國(guó)·浙江 湖州市二環(huán)東路759號(hào)(313000) 浙ICP備10025412號(hào)
浙公網(wǎng)安備 33050202000195號(hào) 版權(quán)所有:黨委宣傳部