- Kleinste vierkanten-methode
- Opgeloste oefeningen
- Oefening 1
- Oplossing
- Oefening 2
- Waar is het voor?
- Referenties
De methode van de kleinste kwadraten is een van de belangrijkste toepassingen bij de benadering van functies. Het idee is om een curve te vinden zodat, gegeven een set geordende paren, deze functie de gegevens het beste benadert. De functie kan een lijn zijn, een kwadratische curve, een kubus, etc.
Het idee van de methode bestaat uit het minimaliseren van de som van de kwadraten van de verschillen in de ordinaat (Y-component) tussen de punten gegenereerd door de gekozen functie en de punten die bij de dataset horen.

Kleinste vierkanten-methode
Voordat we de methode geven, moeten we eerst duidelijk zijn over wat "betere aanpak" betekent. Stel dat we zoeken naar een lijn y = b + mx die de lijn is die het beste een reeks van n punten weergeeft, namelijk {(x1, y1), (x2, y2)…, (xn, yn)}.

Zoals getoond in de vorige afbeelding, als de variabelen x en y gerelateerd waren door de lijn y = b + mx, dan zou voor x = x1 de overeenkomstige waarde van y b + mx1 zijn. Deze waarde verschilt echter van de werkelijke waarde van y, namelijk y = y1.
Onthoud dat in het vlak de afstand tussen twee punten wordt gegeven door de volgende formule:

Met dit in gedachten, om de manier te bepalen om de lijn y = b + mx te kiezen die de gegeven gegevens het beste benadert, lijkt het logisch om als criterium de selectie van de lijn te gebruiken die de som van de kwadraten van de afstanden tussen de punten minimaliseert. en het rechte stuk.
Aangezien de afstand tussen de punten (x1, y1) en (x1, b + mx1) y1- (b + mx1) is, is ons probleem beperkt tot het vinden van getallen m en b zodat de volgende som minimaal is:

De lijn die aan deze voorwaarde voldoet, staat bekend als de «benadering van de kleinste kwadratenlijn naar de punten (x1, y1), (x2, y2),…, (xn, yn)».
Als het probleem eenmaal is verkregen, hoeft u alleen nog een methode te kiezen om de kleinste-kwadratenbenadering te vinden. Als de punten (x1, y1), (x2, y2), …, (xn, yn) allemaal op de lijn y = mx + b staan, zouden we hebben dat ze collineair y zijn:

In deze uitdrukking:

Ten slotte, als de punten niet collineair zijn, dan is y-Au = 0 en kan het probleem worden vertaald in het vinden van een vector u zodanig dat de Euclidische norm minimaal is.

Het vinden van de minimaliserende vector u is niet zo moeilijk als u misschien denkt. Aangezien A een nx2-matrix is en u een 2 × 1-matrix, hebben we dat de vector Au een vector is in R n en behoort tot het beeld van A, dat een deelruimte is van R n met een dimensie die niet groter is dan twee.
We gaan ervan uit dat n = 3 om te laten zien welke procedure moet worden gevolgd. Als n = 3, is het beeld van A een vlak of een lijn door de oorsprong.

Laat v de minimaliserende vector zijn. In de figuur zien we dat y-Au wordt geminimaliseerd als het orthogonaal is op het beeld van A. Dat wil zeggen, als v de minimaliserende vector is, dan gebeurt het dat:

Vervolgens kunnen we het bovenstaande op deze manier uitdrukken:

Dit kan alleen gebeuren als:

Ten slotte hebben we voor v opgelost:

Het is mogelijk om dit te doen omdat A t A omkeerbaar is zolang de n punten die als gegevens worden gegeven, niet collineair zijn.
Als we nu in plaats van naar een lijn te zoeken een parabool wilden vinden (waarvan de uitdrukking de vorm y = a + bx + cx 2 zou hebben ) die een betere benadering zou zijn van de n datapunten, zou de procedure zijn zoals hieronder beschreven.
Als de n datapunten in deze parabool zouden zijn, zouden we hebben:

Vervolgens:

Evenzo kunnen we y = Au schrijven. Als alle punten niet in de parabool liggen, hebben we dat y-Au anders is dan nul voor elke vector u en ons probleem is opnieuw: zoek een vector u in R3 zodat zijn norm --y-Au-- zo klein mogelijk is .
Door de vorige procedure te herhalen, kunnen we tot de conclusie komen dat de gezochte vector is:

Opgeloste oefeningen
Oefening 1
Zoek de lijn die het beste bij de punten (1,4), (-2,5), (3, -1) en (4,1) past.
Oplossing
We moeten:

Vervolgens:


Daarom concluderen we dat de lijn die het beste bij de punten past, wordt gegeven door:

Oefening 2
Stel dat een object van een hoogte van 200 m valt. Bij het vallen worden de volgende stappen genomen:

We weten dat de hoogte van genoemd object, nadat een tijd t is verstreken, wordt gegeven door:

Als we de waarde van g willen verkrijgen, kunnen we een parabool vinden die een betere benadering is van de vijf punten in de tabel, en dus zouden we hebben dat de coëfficiënt die bij t 2 hoort een redelijke benadering is van (-1/2) g als de metingen zijn nauwkeurig.
We moeten:

En later:


Dus de datapunten passen bij de volgende kwadratische uitdrukking:

Dus je moet:

Dit is een waarde die redelijk dichtbij correct is, namelijk g = 9,81 m / s 2 . Om een nauwkeuriger benadering van g te verkrijgen, zou het nodig zijn om uit te gaan van nauwkeurigere waarnemingen.
Waar is het voor?
In de problemen die zich voordoen in de natuur- of sociale wetenschappen, is het handig om de relaties die bestaan tussen verschillende variabelen te schrijven door middel van een wiskundige uitdrukking.
In de economie kunnen we bijvoorbeeld kosten (C), inkomen (I) en winst (U) met elkaar in verband brengen door middel van een eenvoudige formule:

In de natuurkunde kunnen we de versnelling die wordt veroorzaakt door de zwaartekracht, de tijd dat een object is gevallen en de hoogte van het object volgens de wet relateren:

In de vorige uitdrukking is s o de initiële hoogte van het object en is v o de beginsnelheid.
Het vinden van dergelijke formules is echter geen gemakkelijke taak; Het is meestal aan de dienstdoende professional om met veel gegevens te werken en herhaaldelijk verschillende experimenten uit te voeren (om te verifiëren dat de verkregen resultaten constant zijn) om verbanden te vinden tussen de verschillende gegevens.
Een gebruikelijke manier om dit te bereiken, is door de gegevens die in een vlak zijn verkregen als punten weer te geven en te zoeken naar een continue functie die die punten optimaal benadert.
Een van de manieren om de functie te vinden die de gegeven gegevens het beste benadert, is door de methode van de kleinste kwadraten te gebruiken.
Bovendien, zoals we ook in de oefening hebben gezien, kunnen we dankzij deze methode vrij dicht benaderingen krijgen van fysieke constanten.
Referenties
- Charles W Curtis lineaire algebra. Springer-Velarg
- Kai Lai Chung. Elementaire waarschijnlijkheidstheorie met stochastische processen. Springer-Verlag New York Inc.
- Richar L Burden & J.Douglas Faires. Numerieke analyse (7ed). Thompson leren.
- Stanley I. Grossman. Toepassingen van lineaire algebra. MCGRAW-HILL / INTERAMERICANA DE MEXICO
- Stanley I. Grossman. Lineaire algebra. MCGRAW-HILL / INTERAMERICANA DE MEXICO
