Cross-Domain Policy Optimization via Bellman Consistency and Hybrid Critics

Ming-Hong Chen^1* Kuan-Chen Pan^1* You-De Huang^1* Xi Liu² Ping-Chun Hsieh¹

¹ National Yang Ming Chiao Tung University, Hsinchu, Taiwan
² Applied Machine Learning, Meta AI, Menlo Park, CA, USA

^* These authors contributed equally to this work.

The project page is coming soon.

Citation

@inproceedings{
chen2026cross,
title={Cross-domain policy optimization via bellman consistency and hybrid critics},
author={Ming-Hong, Chen and Kuan-Chen, Pan and You-De, Huang and Xi, Liu and Ping-Chun, Hsieh},
booktitle={The Fourteenth International Conference on Learning Representations},
year={2026},
url={https://openreview.net/forum?id=kTXRFtWHnM}
}