Nonparametric Data Attribution for Diffusion Models

Zhao, Yutian; Du, Chao; Zheng, Xiaosen; Pang, Tianyu; Lin, Min

Computer Science > Machine Learning

arXiv:2510.14269 (cs)

[Submitted on 16 Oct 2025]

Title:Nonparametric Data Attribution for Diffusion Models

Authors:Yutian Zhao, Chao Du, Xiaosen Zheng, Tianyu Pang, Min Lin

View PDF HTML (experimental)

Abstract:Data attribution for generative models seeks to quantify the influence of individual training examples on model outputs. Existing methods for diffusion models typically require access to model gradients or retraining, limiting their applicability in proprietary or large-scale settings. We propose a nonparametric attribution method that operates entirely on data, measuring influence via patch-level similarity between generated and training images. Our approach is grounded in the analytical form of the optimal score function and naturally extends to multiscale representations, while remaining computationally efficient through convolution-based acceleration. In addition to producing spatially interpretable attributions, our framework uncovers patterns that reflect intrinsic relationships between training data and outputs, independent of any specific model. Experiments demonstrate that our method achieves strong attribution performance, closely matching gradient-based approaches and substantially outperforming existing nonparametric baselines. Code is available at this https URL.

Subjects:	Machine Learning (cs.LG); Machine Learning (stat.ML)
Cite as:	arXiv:2510.14269 [cs.LG]
	(or arXiv:2510.14269v1 [cs.LG] for this version)
	https://doi.org/10.48550/arXiv.2510.14269

Submission history

From: Chao Du [view email]
[v1] Thu, 16 Oct 2025 03:37:16 UTC (3,532 KB)

Computer Science > Machine Learning

Title:Nonparametric Data Attribution for Diffusion Models

Submission history

Access Paper:

Current browse context:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Machine Learning

Title:Nonparametric Data Attribution for Diffusion Models

Submission history

Access Paper:

Current browse context:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators