Parameter</th>	Current</th>	Try</th>	Effect</th></tr></thead>
`num_train_epochs</code></td>`	10</td>	5-20</td>	More = better learning, but slower</td></tr>
`learning_rate</code></td>`	3e-4</td>	1e-4 to 5e-4</td>	Higher = faster, but less stable</td></tr>
`r</code> (LoRA rank)</td>`	8</td>	4-32</td>	Higher = more capacity, more memory</td></tr>
`lora_alpha</code></td>`	32</td>	16-64</td>	Usually 2-4x rank</td></tr> </tbody></table> 3. Add Validation Data

Developer Guide: Getting Started with LLM Fine-Tuning

2026-02-13T00:00:00+00:00

A comprehensive guide for developers new to Large Language Model (LLM) development, covering the complete workflow from running a base model to fine-tuning it with custom data.</p> </span>

A comprehensive guide for developers new to Large Language Model (LLM) development, covering the complete workflow from running a base model to fine-tuning it with custom data.</p>

You can find all the code for this guide in the smol-training GitHub repository</a>.</p>

Developer Notes

Developer Guide: Getting Started with LLM Fine-Tuning

Hello, world