97免费公开视频-97免费观看视频-国产成人精品影院-国产成人精品在线-精品一二三四-精品一二三四区-欧美多人猛交狂配-欧美俄罗斯乱妇-日批毛片-日批免费观看-亚洲国产精品免费视频-亚洲国产精品免费在线观看-婷婷五月深爱憿情网-免费国产高清毛不卡片基地-久久婷婷色五月综合图区-蜜臀性色av免费

湖州師范學院黨委宣傳部、新聞中心主辦

數學學科2025系列學術報告之二十八

來源:理學院 發布日期:2025-11-18

  題目:Unified continuous-time q-learning for mean-field game and mean-field control problems

  報告人:魏曉利

  時間:2025年11月20日(周四),晚上19:00-20:00

  地點:騰訊會議(會議號:706282801)

  英文摘要:In this talk, we study the continuous-time q-learning in mean-field jump-diffusion models when the population distribution is not directly observable. We propose the integrated q-function in decoupled form (decoupled Iq-function) from the representative agent's perspective and establish its martingale characterization, which provides a unified policy evaluation rule for both mean-field game (MFG) and mean-field control (MFC) problems. Moreover, we consider the learning procedure where the representative agent updates the population distribution based on his own state values. Depending on the task to solve the MFG or MFC problem, we can employ the decoupled Iq-function differently to characterize the mean-field equilibrium policy or the mean-field optimal policy respectively. Based on these theoretical findings, we devise a unified q-learning algorithm for both MFG and MFC problems by utilizing test policies and the averaged martingale orthogonality condition. For several financial applications in the jump-diffusion setting, we obtain the exact parameterization of the decoupled Iq-functions and the value functions, and illustrate our q-learning algorithm with satisfactory performance.

  中文摘要:在本次報告中,我們研究當總體分布不可直接觀測時,均值場跳躍-擴散模型中的連續時間Q學習問題。從典型智能體視角出發,我們提出解耦形式的集成Q函數(解耦Iq函數),并建立其鞅刻畫定理,為均值場博弈和均值場控制問題提供了統一的策略評估準則。此外,我們考慮典型智能體根據自身狀態值更新總體分布的學習流程。通過區分求解均值場博弈或均值場控制任務,可差異化運用解耦Iq函數分別表征均值場均衡策略與均值場最優策略。基于這些理論發現,我們利用測試策略和平均鞅正交性條件,構建了適用于均值場博弈與均值場控制問題的統一Q學習算法。針對跳躍-擴散場景下的若干金融應用,我們獲得了解耦Iq函數與價值函數的精確參數化表示,并通過數值實驗驗證了該算法具有令人滿意的性能。

  報告人簡介:魏曉利,哈爾濱工業大學副教授(準聘)。本科畢業于中國科學技術大學,2018年于巴黎第七大學獲得博士學位。2019-2021年在加州大學伯克利分校從事博士后。2021年-2023年就職于清華大學深圳國際研究生院。主要從事隨機微分博弈、強化學習等研究。論文發表在Operations Research,Mathematical Finance, SIAM Journal on Control and Optimization等期刊雜志。

97免费公开视频-97免费观看视频-国产成人精品影院-国产成人精品在线-精品一二三四-精品一二三四区-欧美多人猛交狂配-欧美俄罗斯乱妇-日批毛片-日批免费观看-亚洲国产精品免费视频-亚洲国产精品免费在线观看-婷婷五月深爱憿情网-免费国产高清毛不卡片基地-久久婷婷色五月综合图区-蜜臀性色av免费
<strike id="424g2"></strike>
  • <li id="424g2"><source id="424g2"></source></li>
    主站蜘蛛池模板: 亚洲丁香婷深爱综合| 成人啪啪免费看| 欧美另类xxx| 久久亚洲影音av资源网| 日韩亚洲精品视频| 欧美成人在线免费视频| 色综合导航网站| 久久青草福利网站| 欧美综合激情网| 国产精品色午夜在线观看| 91精品在线影院| 亚洲天天在线日亚洲洲精| 这里只有精品久久| 欧美日韩日本国产| 欧美亚洲视频在线观看| 国产精品尤物福利片在线观看| 亚洲a区在线视频| 亚洲网址你懂得| 欧美wwwwww| 91av视频在线观看| 色妞色视频一区二区三区四区| 精品色蜜蜜精品视频在线观看| 高清欧美性猛交xxxx| 国产精品视频大全| 在线播放国产一区中文字幕剧情欧美| 成人97在线观看视频| 91高潮精品免费porn| 亚洲自拍偷拍色片视频| 尤物yw午夜国产精品视频明星| 日韩欧美国产黄色| 国产精品久久91| 国产一区二区三区在线看| 欧美风情在线观看| 亚洲va国产va天堂va久久| 中文字幕精品一区久久久久| 色综合视频一区中文字幕| 国产精品爽黄69| 精品国产视频在线| 国产精品久久久久77777| 国产午夜精品全部视频播放| 久久久久久一区二区三区|