Inhoud
Wanneer u een rechte lijn aan een set gegevens aanpast, wilt u misschien weten hoe goed de resulterende lijn bij de gegevens past. Een manier om dit te doen is om de som van de kwadratenfout (SSE) te berekenen. Deze waarde geeft aan hoe goed de best passende lijn de gegevensset benadert. De SSE is belangrijk voor de analyse van experimentele gegevens en wordt in slechts een paar korte stappen bepaald.
Zoek een lijn die het beste past bij het modelleren van de gegevens met behulp van regressie. De best passende lijn heeft de vorm y = ax + b, waarbij a en b parameters zijn die u moet bepalen. U kunt deze parameters vinden met behulp van een eenvoudige lineaire regressieanalyse. Neem bijvoorbeeld aan dat de best passende lijn de vorm y = 0.8x + 7 heeft.
Gebruik de vergelijking om de waarde van elke y-waarde te bepalen, voorspeld door de best passende lijn. U kunt dit doen door elke x-waarde te vervangen door de vergelijking van de lijn. Als x bijvoorbeeld gelijk is aan 1, geeft vervanging van dat in de vergelijking y = 0,8x + 7 7,8 voor de y-waarde.
Bepaal het gemiddelde van de voorspelde waarden uit de lijn van de best passende vergelijking. U kunt dit doen door alle y-waarden die uit de vergelijkingen zijn voorspeld op te tellen en het resulterende getal te delen door het aantal waarden. Als de waarden bijvoorbeeld 7,8, 8,6 en 9,4 zijn, geeft het optellen van deze waarden 25,8 en het delen van dit getal door het aantal waarden, 3 in dit geval, geeft 8,6.
Trek elk van de individuele waarden af van het gemiddelde en kwadraat het resulterende getal. Als we in ons voorbeeld de waarde 7,8 van de gemiddelde 8,6 aftrekken, is het resulterende getal 0,8. Het kwadrateren van deze waarde geeft 0,64.
Som alle gekwadrateerde waarden uit stap 4. Als u de instructies in stap 4 toepast op alle drie de waarden in ons voorbeeld, vindt u waarden van 0,64, 0 en 0,64. Het optellen van deze waarden geeft 1,28. Dit is de som van de kwadratenfout.