DERIVE 6

FIT-Funktion, Regressionen

Verschiedenste Regressionstypen können mit Hilfe der FIT-Funktion auf vorhandene Daten angewendet werden. FIT(v,A) minimiert die Summe der Quadrate der Abweichungen zu den Datenpunkten.

FIT(v,A)

  • v ... enthält als Vektor die Datenvariablen und die Regressionsfunktion, einen Ausdruck mit einem oder mehreren Parametern.
  • A ... Datenmatrix

Die Regressionsfunktion muss von den Parametern linear abhängen - von den Datenvariablen muss der Ausdruck nicht linear abhängen. Die Zeilen der Datenmatrix müssen immer dieselbe Reihenfolge der Elementen haben, wie sie im Vektor v gegeben sind. Ist die Anzahl der Datenzeilen gleich der Anzahl der Parameter, dann liefert FIT eine Kurve, die bis auf Rundungsfehler exakt durch die gegebenen Werte verläuft.

Beispiel - quadratische Regression:

Gegeben sind drei Punkte P(-5,2), Q(-1,3) und R(3,0). Bestimme jene Parabel, die durch die drei Punkte geht.

Regression:

Fit-quadratisch

Graph - Punkte und Funktion:

Fit-quadratisch Grafik

Hinweis - die Qualität der gefundenen Funktion lässt sich über die Funktion GOODNESS_OF_FIT(u,x,A) feststellen (u ... gefundene Funktion, x ... Variable, A ... Datenmatrix).

Die FIT-Funktion bietet zwar viele Möglichkeiten, ist aber nicht für alle Regressionen geeignet. Der Faktor, dass die Parameter nur in linearem Zusammenhang stehen dürfen, wirkt hier erschwerend. Einen Ausgleich kann man mit entsprechenden Zusatzdateien schaffen oder mit Hilfe der Interconnectivity (Datenaustausch zwischen DERIVE und TI-Rechnern) und einem CAS-Rechner wie dem Voyage200 von TI, der eine breite Palette von Regressionsmöglichkeiten eingebaut hat.

Tip - in der Ausgabe 46, Juni 2002 der DNL (DERIVE-Newsletter = regelmäßig erscheinende Veröffentlichung der DERIVE-User-Group) finden Sie ein Utility von Don Philips und Josef Böhm für diverse gängige Regressionstypen.

Beschreibung:

Öffnen Sie die folgende Datei: e_funkt04reg.dfw und verwenden Sie die folgenden Regressionsfunktionen. Der Aufruf der Funktionen erfolgt mit Regressionsname(Datenmatrix)!

linreg - Lineare Regression y=a*x+b (Methode der kleinsten Quadrate)
medreg - Median-Median y=a*x+b (Methode der Median-Median-Linie)
quadreg - Quadratische Regression y=a*x^2+b*x+c
cubicreg - Kubische Regression y=a*x^3+b*x^2+c*x+d
quartreg - Regression vierter Ordnung y=a*x^4+b*x^3+c*x^2+d*x+e
lnreg - Logarithmische Regression y=a+b*ln(x)
expreg - Exponentialregression y=a*b^x
Pwrreg - Powerregression y=a*x^b
sinreg - Sinusregression a*SIN(b*x+c)+d
logisticreg - Logistische Regression a/(1+e^(c*x)*b)

Beispiel - Sinusregression:

Welches Wetter herrscht in Wien? - die Lufttemperatur schwankt täglich und hängt von zahlreichen Einflüssen ab. Untersucht man jedoch den Verlauf der langjährigen Monatsmittelwerte, so lassen sich erstaunliche Gesetzmäßigkeiten erkennen.

JAN FEB MÄR APR MAI JUN
-1.4 0.4 4.7 10.3 14.8 18.1
JUL AUG SEP OKT NOV DEZ
19.9 19.3 15.6 9.8 4.8 1.0

Wien-Temperatur

Der Plot der Datenpunkte und der mit Hilfe der Regression bestimmten Funktion zeigt den Zusammenhang - bei den monatlichen Durchschnittstemperaturen erhält man (bis auf lokal begründbare Abweichungen) eine Sinuskurve! Die Parameter lassen sich recht leicht auch geographisch begründen:
die Amplitude (10.65) errechnet sich als (Juli = Max - Dezember = Min)/2, die Frequenz (ca. 0.5) ergibt sich durch 2.pi/12 (12 Monate!), die Phasenverschiebung in y-Richtung entspricht ca. 3.5 Monate (Jahresbeginn 1.Jänner gegenüber Tag-Nacht-Gleich am 21.März + 1 Monat zusätzlich, da die Temperatur dem Sonnengang ca. 1 Monat "nachhinkt") + vertikale Verschiebung um die Durchschnittstemperatur von ca. 9.8 Grad - entspricht ziemlich genau der vom System ermittelten Kurve!

Wien-Plot

© PI-NOe, letzte Änderung am 5. Mai 2007, erstellt von Mag. Walter Wegscheider