Haiyang Xu

USTC
B.S.
2020 - 2024

UC San Diego
Ph.D. student
2024 - Present

I am a second-year Ph.D. student at UCSD, advised by Zhuowen Tu. My current research focus is on generative models, especially on topics such as controllable image, video, vector, and 3D generation.

Previously, I was a Research Intern at Adobe in 2025 Summer, working with Dr. Zhaowen Wang, Dr. Li-Yi Wei, Dr. Nanxuan Zhao and Dr. Cuong Nguyen; at NYU Courant in 2024 Fall, working with Prof. Saining Xie; and at Baidu in 2022 Summer, working with Dr. Dongliang He and Dr. Jingdong Wang. During my undergraduate, I was fortunate to work with Prof. Xiangnan He and Dr. Shuo Wang.

I am currently looking for internship positions in 2026 Spring. Feel free to contact me if you have any opportunities!

CV Google Scholar GitHub X LinkedIn Email

Experience

USTC
Research Intern
Jan 2022 - Jun 2023
Advised by: Prof. Xiangnan He and Dr. Shuo Wang

Baidu
Research Intern
Jul 2022 - Nov 2022
Advised by: Dr. Dongliang He and Dr. Jingdong Wang

UC San Diego
Research Intern
Jul 2023 - Nov 2023
Advised by: Prof. Zhuowen Tu

NYU Courant
Research Intern
Jan 2024 - Nov 2024
Advised by: Prof. Saining Xie

Adobe
Research Intern
Jun 2025 - Nov 2025
Advised by: Dr. Zhaowen Wang, Dr. Li-Yi Wei, Dr. Nanxuan Zhao and Dr. Cuong Nguyen

Adobe
Research Intern
2026 (Incoming)
Advised by: Dr. Mingze Xu and Dr. Yuanjun Xiong

Latest News

New! Feb 2026 My Adobe internship work is accepted to CVPR 2026. Thanks to all my mentors and collaborators!

Jan 2026 One paper accepted to ICLR 2026. Congrats to Enxin!

Publications (* equal contribution, † project leader)

SemLayer: Semantic Generative Segmentation and Layer Reconstruction for Abstract Icons

CVPR 2026

Haiyang Xu, Ronghuan Wu, Li-Yi Wei, Nanxuan Zhao, Chenxi Liu, Cuong Nguyen, Zhuowen Tu, Zhaowen Wang

Website PDF Code

VideoNSA: Native Sparse Attention Scales Video Understanding

ICLR 2026

Enxin Song, Wenhao Chai, Shusheng Yang, Ethan Armand, Xiaojun Shan, Haiyang Xu, Jianwen Xie, Zhuowen Tu

Website PDF Code

CVP: Central-Peripheral Vision-Inspired Multimodal Model for Spatial Reasoning

WACV 2026

Zeyuan Chen, Xiang Zhang, Haiyang Xu, Jianwen Xie, Zhuowen Tu

Website PDF Code

OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps

NeurIPS 2025

Bingnan Li*, Chen-Yu Wang*, Haiyang Xu*^†, Xiang Zhang, Ethan Armand, Divyansh Srivastava, Xiaojun Shan, Zeyuan Chen, Jianwen Xie, Zhuowen Tu

Website PDF Code

DepR: Depth Guided Single-view Scene Reconstruction with Instance-level Diffusion

ICCV 2025

Qingcheng Zhao*, Xiang Zhang*, Haiyang Xu, Zeyuan Chen, Jianwen Xie, Yuan Gao, Zhuowen Tu

Website PDF Code

YOLO-Count: Differentiable Object Counting for Text-to-Image Generation

ICCV 2025

Guanning Zeng, Xiang Zhang, Zirui Wang, Haiyang Xu, Zeyuan Chen, Bingnan Li, Zhuowen Tu

Website PDF Code

Science-T2I: Addressing Scientific Illusions in Image Synthesis

CVPR 2025

Jialuo Li, Wenhao Chai, Xingyu Fu, Haiyang Xu, Saining Xie

Website PDF Code

Bayesian Diffusion Models for 3D Shape Reconstruction

CVPR 2024

Haiyang Xu*, Yu Lei*, Zeyuan Chen, Xiang Zhang, Yue Zhao, Yilin Wang, Zhuowen Tu

Website PDF Code

Omni-ControlNet: Dual-stage Integration for Conditional Image Generation

CVPRW 2024

Yilin Wang*, Haiyang Xu*, Xiang Zhang, Zeyuan Chen, Zhizhou Sha, Zirui Wang, Zhuowen Tu

Website PDF Code

Feature Mixture on Pre-trained Model for Few-shot Learning

IEEE TIP 2024

Shuo Wang, Jinda Lu, Haiyang Xu, Yanbin Hao, Xiangnan He

PDF

Vision Transformer with Attention Map Hallucination and FFN Compaction

arXiv 2023

Haiyang Xu, Zhichao Zhou, Dongliang He, Fu Li, Jingdong Wang

PDF

Reviewer Services

Conference: CVPR 2025|26, ICCV 2025, NeurIPS 2025 (Top Reviewer), SIGGRAPH 2026
Journal: IEEE TMM, IEEE TIP, IEEE TPAMI