Curve-fitting är en anpassning av en modells villkor och parametrar till historisk data som inte har samma framtida ”edge”. Generellt används curve-fitting (inklusive överoptimering) ofta för att beskriva en rad förklaringar till att en modell inte fungerar(eller inte lika bra) framåt efter backtesting och optimering. Curve-fitting finns mer eller mindre alltid. Några orsaker är tex:
För många villkor och parametrar, det går att lägga till fler villkor och parametrar för att beskriva vad som hänt.
Överoptimering av parametrar, det går att skruva alla parametervärden för att beskriva vad som hänt.
För få affärer, det statistiska underlaget är för litet.
Optimeringsparadoxen, det går aldrig att hitta optimala parametervärden. Det gäller att hitta parametervärden som inte är för känsliga. Om en liten förändring av ett parametervärde får stor påverkan är det risk för cf.
Lägga till nya villkor som endast påverkar en eller ett fåtal affärer som kanske inte kommer att inträffa i framtiden.
Genom att dela upp historiken i två delar går det att testa för curve-fitting innan modellen sjösätts. Egentligen bara en koll hur modellen skulle ha fungerat om den startades tidigare. En träningsdel som används vid byggandet. Sedan testas modellen på data som den inte har sett. Alternativ går det att köra rullande optimering. Tex optimera data under ett år och sedan testa på osedd data under 3 månader, upprepa processen tills data tar slut.
För många villkor och parametrar, det går att lägga till fler villkor och parametrar för att beskriva vad som hänt.
Överoptimering av parametrar, det går att skruva alla parametervärden för att beskriva vad som hänt.
För få affärer, det statistiska underlaget är för litet.
Optimeringsparadoxen, det går aldrig att hitta optimala parametervärden. Det gäller att hitta parametervärden som inte är för känsliga. Om en liten förändring av ett parametervärde får stor påverkan är det risk för cf.
Lägga till nya villkor som endast påverkar en eller ett fåtal affärer som kanske inte kommer att inträffa i framtiden.
Genom att dela upp historiken i två delar går det att testa för curve-fitting innan modellen sjösätts. Egentligen bara en koll hur modellen skulle ha fungerat om den startades tidigare. En träningsdel som används vid byggandet. Sedan testas modellen på data som den inte har sett. Alternativ går det att köra rullande optimering. Tex optimera data under ett år och sedan testa på osedd data under 3 månader, upprepa processen tills data tar slut.
Comment