CiPO: Counterfactual Unlearning for Large Reasoning Models through Iterative Preference Optimization

Source code for CiPO (ACL 2026 Main Conference Oral Presentation).

Code coming soon.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md

Provide feedback