Inhoud
Een van de meest basale hulpmiddelen voor engineering of wetenschappelijke analyse is lineaire regressie. Deze techniek begint met een gegevensset in twee variabelen. De onafhankelijke variabele wordt meestal "x" genoemd en de afhankelijke variabele wordt meestal "y" genoemd. Het doel van de techniek is om de lijn, y = mx + b, te identificeren die de gegevensset benadert. Deze trendlijn kan, grafisch en numeriek, relaties tonen tussen de afhankelijke en onafhankelijke variabelen. Uit deze regressieanalyse wordt ook een waarde voor correlatie berekend.
Identificeer en scheid de x- en y-waarden van uw gegevenspunten. Als u een spreadsheet gebruikt, voert u deze in aangrenzende kolommen in. Er moet hetzelfde aantal x- en y-waarden zijn. Zo niet, dan is de berekening onnauwkeurig of geeft de spreadsheetfunctie een foutmelding. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Bereken de gemiddelde waarde voor de x-waarden en de y-waarden door de som van alle waarden te delen door het totale aantal waarden in de set. Deze gemiddelden worden "x_avg" en y_avg genoemd. "X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
Maak twee nieuwe gegevenssets door de x_avg-waarde van elke x-waarde en de y_avg-waarde van elke y-waarde af te trekken. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6 ...) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5, ...) y1 = (-3, -2, 4, -4, 3, 2, 0)
Vermenigvuldig elke x1-waarde met elke y1-waarde, in volgorde. x1y1 = (0 * -3, -1 * -2, 5 * 4, ...) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Vierkant elke x1 waarde. x1 ^ 2 = (0 ^ 2, 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)
Bereken de sommen van de x1y1-waarden en x1 ^ 2-waarden. sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 sum_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Deel "sum_x1y1" door "sum_x1 ^ 2" om de regressiecoëfficiënt te krijgen. sum_x1y1 / sum_x1 ^ 2 = 11/36 = 0.306