Metoda najmanjih kvadrata u Excelu. Regresijska analiza

NASTAVNI RAD

disciplina: informatika

Tema: Aproksimacija funkcije metodom najmanjih kvadrata

Uvod

1. Izjava problema

2. Formule za izračun

Izračun pomoću tablica izrađenih u programu Microsoft Excel

Dijagram algoritma

Izračun u MathCad-u

Rezultati dobiveni korištenjem linearne funkcije

Prikaz rezultata u obliku grafikona

Uvod

Svrha kolegija je produbiti znanje iz područja informatike, razviti i učvrstiti vještine rada s tabličnim procesorom Microsoft Excel i programskim proizvodom MathCAD te ih koristiti za rješavanje problema korištenjem računala iz znanstveno-istraživačkog područja.

Aproksimacija (od latinskog "approximare" - "približiti se") je približan izraz bilo kojeg matematičkog objekta (na primjer, brojeva ili funkcija) kroz druge koji su jednostavniji, praktičniji za korištenje ili jednostavno poznatiji. U znanstvenom istraživanju aproksimacija se koristi za opisivanje, analizu, generalizaciju i daljnju upotrebu empirijskih rezultata.

Kao što je poznato, između veličina može postojati egzaktna (funkcionalna) veza, kada jedna određena vrijednost odgovara jednoj vrijednosti argumenta, i manje precizna (korelacijska) veza, kada jedna određena vrijednost argumenta odgovara približnoj vrijednosti ili određeni skup funkcijskih vrijednosti, u jednoj ili drugoj mjeri bliskih jedna drugoj. Kada provodite znanstveno istraživanje, obrađujete rezultate promatranja ili eksperimenta, obično se morate pozabaviti drugom opcijom.

Pri proučavanju kvantitativnih ovisnosti različitih pokazatelja, čije se vrijednosti određuju empirijski, u pravilu postoji određena varijabilnost. Dijelom je određen heterogenošću proučavanih objekata nežive i, posebice, žive prirode, a dijelom je određen pogreškom opažanja i kvantitativne obrade materijala. Posljednju komponentu nije moguće uvijek u potpunosti eliminirati, već je jedino moguće minimizirati pažljivim odabirom odgovarajuće istraživačke metode i pažljivim radom. Stoga, pri izvođenju bilo kojeg istraživačkog rada, pojavljuje se problem identificiranja prave prirode ovisnosti proučavanih pokazatelja, ovaj ili onaj stupanj maskiran neuspjehom uzimanja u obzir varijabilnosti: vrijednosti. U tu svrhu koristi se aproksimacija - približan opis korelacijske ovisnosti varijabli odgovarajućom jednadžbom funkcionalne ovisnosti koja prenosi glavnu tendenciju ovisnosti (ili njezin "trend").

Pri izboru aproksimacije treba poći od konkretnog problema istraživanja. Obično, što je jednostavnija jednadžba korištena za aproksimaciju, to je rezultirajući opis odnosa približniji. Stoga je važno pročitati koliko su značajna i što uzrokuje odstupanja pojedinih vrijednosti od rezultirajućeg trenda. Pri opisivanju ovisnosti empirijski utvrđenih vrijednosti mnogo veća točnost može se postići korištenjem neke složenije, višeparametarske jednadžbe. Međutim, nema smisla nastojati prenijeti slučajna odstupanja vrijednosti u određenim nizovima empirijskih podataka s maksimalnom točnošću. Puno je važnije shvatiti opći obrazac, koji je u ovom slučaju najlogičnije i s prihvatljivom točnošću izražen upravo dvoparametarskom jednadžbom funkcije snage. Stoga, pri odabiru metode aproksimacije, istraživač uvijek čini kompromis: on odlučuje u kojoj je mjeri u ovom slučaju uputno i prikladno "žrtvovati" detalje i, sukladno tome, kako općenito treba izraziti ovisnost uspoređivanih varijabli. Uz identificiranje obrazaca maskiranih slučajnim odstupanjima empirijskih podataka od općeg uzorka, aproksimacija također omogućuje rješavanje mnogih drugih važnih problema: formaliziranje pronađene ovisnosti; pronaći nepoznate vrijednosti zavisne varijable interpolacijom ili, ako je prikladno, ekstrapolacijom.

U svakom zadatku formulirani su uvjeti problema, početni podaci, obrazac za izdavanje rezultata i naznačene su glavne matematičke ovisnosti za rješavanje problema. U skladu s metodom rješavanja problema razvija se algoritam rješenja koji je prikazan u grafičkom obliku.

1. Izjava problema

1. Koristeći metodu najmanjih kvadrata, aproksimirajte funkciju danu u tablici:

a) polinom prvog stupnja ;

b) polinom drugog stupnja;

c) eksponencijalna ovisnost.

Za svaku ovisnost izračunajte koeficijent determinizma.

Izračunajte koeficijent korelacije (samo u slučaju a).

Za svaku ovisnost nacrtajte liniju trenda.

Pomoću funkcije LINEST izračunajte numeričke karakteristike ovisnosti o.

Usporedite svoje izračune s rezultatima dobivenim pomoću funkcije LINEST.

Zaključite koja od dobivenih formula najbolje aproksimira funkciju.

Napišite program na jednom od programskih jezika i usporedite rezultate izračuna s gore dobivenim.

Opcija 3. Funkcija je dana u tablici. 1.

Stol 1.


2. Formule za izračun

Često se pri analizi empirijskih podataka javlja potreba za pronalaženjem funkcionalnog odnosa između veličina x i y, koje su dobivene kao rezultat iskustva ili mjerenja.

Xi (nezavisnu vrijednost) postavlja eksperimentator, a yi, zvane empirijske ili eksperimentalne vrijednosti, dobiva se kao rezultat eksperimenta.

Analitički oblik funkcionalnog odnosa koji postoji između veličina x i y obično je nepoznat, pa se postavlja praktički važan zadatak - pronaći empirijsku formulu

, (1)

(gdje su parametri), čije bi se vrijednosti malo razlikovale od eksperimentalnih vrijednosti.

Prema metodi najmanjih kvadrata, najbolji koeficijenti su oni za koje će zbroj kvadrata odstupanja pronađene empirijske funkcije od zadanih vrijednosti funkcije biti minimalan.

Koristeći nužni uvjet za ekstremum funkcije više varijabli - jednakost parcijalnih derivacija nuli, nalazimo skup koeficijenata koji daju minimum funkcije definirane formulom (2) i dobivamo normalni sustav za određivanje koeficijenata :

(3)

Stoga se pronalaženje koeficijenata svodi na rješavanje sustava (3).

Vrsta sustava (3) ovisi o klasi empirijskih formula od kojih tražimo ovisnost (1). U slučaju linearne ovisnosti sustav (3) će imati oblik:

(4)

U slučaju kvadratne ovisnosti sustav (3) će imati oblik:

(5)

U nekim slučajevima se kao empirijska formula uzima funkcija u kojoj nesigurni koeficijenti ulaze nelinearno. U ovom slučaju ponekad se problem može linearizirati, tj. svesti na linearno. Takve ovisnosti uključuju eksponencijalnu ovisnost

gdje su a1 i a2 nedefinirani koeficijenti.

Linearizacija se postiže logaritmiranjem jednakosti (6), nakon čega se dobiva relacija

(7)

Označimo i redom s i , tada se ovisnost (6) može napisati u obliku , što nam omogućuje primjenu formula (4) uz zamjenu a1 s i s .

Graf rekonstruirane funkcionalne ovisnosti y(x) na temelju rezultata mjerenja (xi, yi), i=1,2,…,n naziva se regresijska krivulja. Za provjeru slaganja konstruirane regresijske krivulje s eksperimentalnim rezultatima obično se uvode sljedeće numeričke karakteristike: koeficijent korelacije (linearna ovisnost), omjer korelacije i koeficijent determinacije.

Koeficijent korelacije je mjera linearnog odnosa između ovisnih slučajnih varijabli: on pokazuje koliko dobro, u prosjeku, jedna od varijabli može biti predstavljena kao linearna funkcija druge.

Koeficijent korelacije izračunava se pomoću formule:

(8)

(9)

gdje je aritmetička sredina x, y, redom.

Koeficijent korelacije između slučajnih varijabli u apsolutnoj vrijednosti ne prelazi 1. Što je bliži 1, to je bliži linearni odnos između x i y.

U slučaju nelinearne korelacije, uvjetne prosječne vrijednosti nalaze se u blizini zakrivljene linije. U ovom slučaju preporuča se koristiti omjer korelacije kao karakteristiku jakosti veze, čija interpretacija ne ovisi o vrsti ovisnosti koja se proučava.

Omjer korelacije izračunava se pomoću formule:

(10)

Gdje a brojnik karakterizira disperziju uvjetnih prosjeka oko bezuvjetnog prosjeka.

Stalno. Jednakost = odgovara slučajnim nekoreliranim vrijednostima; = ako i samo ako postoji točna funkcionalna veza između x i y. U slučaju linearne ovisnosti y o x, omjer korelacije podudara se s kvadratom koeficijenta korelacije. Vrijednost se koristi kao pokazatelj odstupanja regresije od linearne.

Omjer korelacije je mjera korelacije između y i x u bilo kojem obliku, ali ne može dati ideju o stupnju približavanja empirijskih podataka posebnom obliku. Da bismo saznali koliko točno izgrađena krivulja odražava empirijske podatke, uvodi se još jedna karakteristika - koeficijent determinacije.

Koeficijent determinizma određuje se formulom:

gdje je Sres = - rezidualni zbroj kvadrata, karakterizira odstupanje eksperimentalnih podataka od teoretskih total - ukupni zbroj kvadrata, gdje je prosječna vrijednost yi.

- regresijska suma kvadrata koja karakterizira širenje podataka.

Što je rezidualni zbroj kvadrata manji u usporedbi s ukupnim zbrojem kvadrata, to je veći koeficijent determinacije r2, koji mjeri koliko dobro regresijska jednadžba objašnjava odnose između varijabli. Ako je jednak 1, tada postoji potpuna korelacija s modelom, tj. nema razlike između stvarnih i procijenjenih vrijednosti y. U suprotnom slučaju, ako je koeficijent determinacije 0, tada je regresijska jednadžba neuspješna u predviđanju vrijednosti y.

Koeficijent determinizma uvijek ne prelazi omjer korelacije. U slučaju kada je jednakost zadovoljena, možemo pretpostaviti da konstruirana empirijska formula najtočnije odražava empirijske podatke.

3. Izračun pomoću tablica izrađenih u programu Microsoft Excel

Za izračune preporučljivo je podatke složiti u obliku tablice 2, pomoću tabličnog procesora Microsoft Excel.

tablica 2












Objasnimo kako se sastavlja tablica 2.

Korak 1. U ćelije A1:A25 unosimo vrijednosti xi.

Korak 2. U ćelije B1:B25 unosimo vrijednosti yi.

Korak 3. U ćeliju C1 unesite formulu = A1^2.

Korak 4. Ova se formula kopira u ćelije C1:C25.

Korak 5. U ćeliju D1 unesite formulu = A1 * B1.

Korak 6. Ova se formula kopira u ćelije D1:D25.

Korak 7. U ćeliju F1 unesite formulu = A1^4.

Korak 8. Ova formula se kopira u ćelije F1:F25.

Korak 9. U ćeliju G1 unesite formulu = A1^2*B1.

Korak 10. Ova formula se kopira u ćelije G1:G25.

Korak 11. U ćeliju H1 unesite formulu = LN(B1).

Korak 12. Ova se formula kopira u ćelije H1:H25.

Korak 13. U ćeliju I1 unesite formulu = A1*LN(B1).

Korak 14. Ova formula se kopira u ćelije I1:I25.

Sljedeće korake izvodimo koristeći automatsko zbrajanje S.

Korak 15. U ćeliju A26 unesite formulu = SUM(A1:A25).

Korak 16. U ćeliju B26 unesite formulu = SUM(B1:B25).

Korak 17. U ćeliju C26 unesite formulu = SUM(C1:C25).

Korak 18. U ćeliju D26 unesite formulu = SUM(D1:D25).

Korak 19. U ćeliju E26 unesite formulu = SUM(E1:E25).

Korak 20. U ćeliju F26 unesite formulu = SUM(F1:F25).

Korak 21. U ćeliju G26 unesite formulu = SUM(G1:G25).

Korak 22. U ćeliju H26 unesite formulu = SUM(H1:H25).

Korak 23. U ćeliju I26 unesite formulu = SUM(I1:I25).

Aproksimirajmo funkciju linearnom funkcijom. Za određivanje koeficijenata koristit ćemo se sustavom (4). Koristeći zbrojeve tablice 2, koji se nalaze u ćelijama A26, B26, C26 i D26, zapisujemo sustav (4) u obliku

(11)

rješavajući koje, dobivamo i .

Sustav je riješen Cramerovom metodom. Suština toga je sljedeća. Razmotrimo sustav od n algebarskih linearnih jednadžbi s n nepoznanica:

(12)

Determinanta sustava je determinanta matrice sustava:

(13)

Označimo - determinantu koja se dobiva iz determinante sustava Δ zamjenom j-tog stupca stupcem

Dakle, linearna aproksimacija ima oblik

Sustav (11) rješavamo pomoću programa Microsoft Excel. Rezultati su prikazani u tablici 3.

Tablica 3











inverzna matrica






U tablici 3 u ćelijama A32:B33 zapisana je formula (=MOBR(A28:B29)).

U ćelijama E32:E33 zapisana je formula (=MULTIPLE(A32:B33),(C28:C29)).

Zatim aproksimiramo funkciju kvadratnom funkcijom . Za određivanje koeficijenata a1, a2 i a3 koristimo sustav (5). Koristeći zbrojeve tablice 2, koji se nalaze u ćelijama A26, B26, C26, D26, E26, F26, G26, zapisujemo sustav (5) u obliku

(16)

čijim rješavanjem dobivamo a1=10,663624, I

Dakle, kvadratna aproksimacija ima oblik

Sustav (16) rješavamo pomoću programa Microsoft Excel. Rezultati su prikazani u tablici 4.

Tablica 4














inverzna matrica







U tablici 4 u ćelijama A41:C43 zapisana je formula (=MOBR(A36:C38)).

U ćelijama F41:F43 zapisana je formula (=MULTIPLE(A41:C43),(D36:D38)).

Sada aproksimirajmo funkciju eksponencijalnom funkcijom. Da bismo odredili koeficijente i, uzimamo logaritam vrijednosti i, koristeći zbrojeve tablice 2, koji se nalaze u ćelijama A26, C26, H26 i I26, dobivamo sustav

(18)

Nakon što smo riješili sustav (18), dobivamo i .

Nakon potenciranja dobivamo .

Dakle, eksponencijalna aproksimacija ima oblik

Sustav (18) rješavamo pomoću programa Microsoft Excel. Rezultati su prikazani u tablici 5.

Tablica 5











inverzna matrica




U ćelijama A50:B51 zapisana je formula (=MOBR(A46:B47)).

U ćelijama E49:E50 zapisana je formula (=MULTIPLE(A50:B51),(C46:C47)).

U ćeliji E51 zapisana je formula =EXP(E49).

Izračunajmo aritmetičku sredinu pomoću formula:

Rezultati proračuna u programu Microsoft Excel prikazani su u tablici 6.

Tablica 6



U ćeliji B54 zapisana je formula = A26/25.

U ćeliji B55 zapisana je formula = B26/25

Tablica 7


Korak 1. U ćeliju J1 unesite formulu = (A1-$B$54)*(B1-$B$55).

Korak 2. Ova se formula kopira u ćelije J2:J25.

Korak 3. U ćeliju K1 unesite formulu = (A1-$B$54)^2.

Korak 4. Ova formula se kopira u ćelije k2:K25.

Korak 5. U ćeliju L1 unesite formulu = (B1-$B$55)^2.

Korak 6. Ova formula se kopira u ćelije L2:L25.

Korak 7. U ćeliju M1 unesite formulu = ($E$32+$E$33*A1-B1)^2.

Korak 8. Ova formula se kopira u ćelije M2:M25.

Korak 9. U ćeliju N1 unesite formulu = ($F$41+$F$42*A1+$F$43*A1^2-B1)^2.

Korak 10. Ova formula se kopira u ćelije N2:N25.

Korak 11. U ćeliju O1 unesite formulu = ($E$51*EXP($E$50*A1)-B1)^2.

Korak 12. Ova formula se kopira u ćelije O2:O25.

Sljedeće korake izvodimo koristeći automatsko zbrajanje S.

Korak 13. U ćeliju J26 unesite formulu = SUM(J1:J25).

Korak 14. U ćeliju K26 unesite formulu = SUM(K1:K25).

Korak 15. U ćeliju L26 unesite formulu = CUM(L1:L25).

Korak 16. U ćeliju M26 unesite formulu = SUM(M1:M25).

Korak 17. U ćeliju N26 unesite formulu = SUM(N1:N25).

Korak 18. U ćeliju O26 unesite formulu = SUM(O1:O25).

Izračunajmo sada koeficijent korelacije pomoću formule (8) (samo za linearnu aproksimaciju) i koeficijent determinacije pomoću formule (10). Rezultati izračuna u programu Microsoft Excel prikazani su u tablici 8.

Tablica 8


Koeficijent korelacije

Koeficijent determinizma (linearna aproksimacija)



Koeficijent determinizma (kvadratna aproksimacija)



Koeficijent determinizma (eksponencijalna aproksimacija)



U ćeliji E57 formula je zapisana =J26/(K26*L26)^(1/2).

U ćeliji E59 zapisana je formula = 1-M26/L26.

U ćeliji E61 zapisana je formula = 1-N26/L26.

U ćeliji E63 zapisana je formula = 1-O26/L26.

Analiza rezultata proračuna pokazuje da kvadratna aproksimacija najbolje opisuje eksperimentalne podatke.

Dijagram algoritma

Riža. 1. Dijagram algoritma za računski program.

5. Izračun u MathCadu

Linearna regresija

· linija (x, y) - vektor dva elementa (b, a) koeficijenti linearne regresije b+ax;

· x - vektor podataka realnog argumenta;

· y je vektor stvarnih vrijednosti podataka iste veličine.

Slika 2.

Polinomska regresija znači aproksimaciju podataka (x1, y1) polinomom k-tog stupnja. Kada je k=i, polinom je ravna linija, kada je k=2 to je parabola, kada je k=3 to je kubna parabola itd. . U pravilu, u praksi k<5.

· regresija (x,y,k) - vektor koeficijenata za konstruiranje polinomske regresije podataka;

· interp (s,x,y,t) - rezultat polinomske regresije;

· s=regresija(x,y,k);

· x je vektor podataka o stvarnom argumentu, čiji su elementi raspoređeni u rastućem redoslijedu;

· y je vektor stvarnih vrijednosti podataka iste veličine;

· k - stupanj regresijskog polinoma (pozitivan cijeli broj);

· t - vrijednost argumenta regresijskog polinoma.

Slika 3

Osim navedenih, u Mathcad je ugrađeno još nekoliko vrsta regresije s tri parametra, čija se implementacija donekle razlikuje od gore navedenih opcija regresije po tome što je za njih, osim niza podataka, potrebno navesti neke početne vrijednosti. koeficijenata a, b, c. Upotrijebite odgovarajuću vrstu regresije ako imate dobru predodžbu o tome koja vrsta ovisnosti opisuje vaš skup podataka. Kada vrsta regresije ne odražava dobro niz podataka, rezultat je često nezadovoljavajući, pa čak i vrlo različit ovisno o izboru početnih vrijednosti. Svaka od funkcija proizvodi vektor preciznih parametara a, b, c.

Rezultati dobiveni pomoću funkcije LINEST

Pogledajmo svrhu funkcije LINEST.

Ova funkcija koristi najmanje kvadrate za izračun ravne linije koja najbolje odgovara dostupnim podacima.

Funkcija vraća niz koji opisuje rezultirajući redak. Jednadžba za ravnu liniju je:

M1x1 + m2x2 + ... + b ili y = mx + b,

tablični algoritam Microsoftov softver

gdje je zavisna vrijednost y funkcija nezavisne vrijednosti x. Vrijednosti m su koeficijenti koji odgovaraju svakoj nezavisnoj varijabli x, a b je konstanta. Imajte na umu da y, x i m mogu biti vektori.

Za dobivanje rezultata potrebno je izraditi tabelarnu formulu koja će zauzimati 5 redaka i 2 stupca. Taj se interval može nalaziti bilo gdje na radnom listu. Tijekom tog intervala morate unijeti funkciju LINEST.

Kao rezultat, sve ćelije intervala A65:B69 trebaju biti popunjene (kao što je prikazano u tablici 9).

Tablica 9.



Objasnimo namjenu nekih veličina koje se nalaze u tablici 9.

Vrijednosti koje se nalaze u ćelijama A65 i B65 karakteriziraju nagib odnosno pomak - koeficijent determinacije - F-opažena vrijednost - broj stupnjeva slobode - regresijski zbroj kvadrata - rezidualni zbroj kvadrata.

Prikaz rezultata u obliku grafikona

Riža. 4. Linearni aproksimacijski graf

Riža. 5. Graf kvadratne aproksimacije

Riža. 6. Eksponencijalni fiting graf

zaključke

Izvucimo zaključke na temelju rezultata dobivenih podataka.

Analiza rezultata proračuna pokazuje da kvadratna aproksimacija najbolje opisuje eksperimentalne podatke, jer linija trenda za to najtočnije odražava ponašanje funkcije u ovom području.

Uspoređujući rezultate dobivene pomoću funkcije LINEST, vidimo da se oni u potpunosti podudaraju s gore izvedenim izračunima. To znači da su izračuni točni.

Rezultati dobiveni pomoću programa MathCad u potpunosti se podudaraju s gore navedenim vrijednostima. To ukazuje na točnost izračuna.

Bibliografija

1 B.P. Demidovich, I.A. Kesten. Osnove računalne matematike. M: Državna naklada fizikalne i matematičke literature.

2 Računarstvo: udžbenik, ur. prof. N.V. Makarova. M: Financije i statistika, 2007.

3 Računarstvo: Radionica računalne tehnologije, ur. prof. N.V. Makarova. M: Financije i statistika, 2010.

4 V.B. Komyagin. Programiranje u Excelu korištenjem Visual Basica. M: Radio i komunikacije, 2007.

5 N. Nicole, R. Albrecht. Excel. Proračunske tablice. M: Ed. "ECOM", 2008.

6 Upute za izradu kolegija iz računarstva (za dopisne studente svih specijalnosti), ur. Zhurova G. N., Sankt-Peterburški državni hidrološki institut (TU), 2011.

Što nalazi najširu primjenu u raznim područjima znanosti i praktične djelatnosti. To može biti fizika, kemija, biologija, ekonomija, sociologija, psihologija i tako dalje i tako dalje. Voljom sudbine, često se moram baviti gospodarstvom, pa ću vam danas organizirati putovanje u nevjerojatnu zemlju zvanu Ekonometrija=) ...Kako ne želiš?! Tamo je jako dobro - samo se trebate odlučiti! ...Ali ono što vjerojatno sigurno želite je naučiti kako rješavati probleme metoda najmanjih kvadrata. A posebno marljivi čitatelji naučit će ih riješiti ne samo točno, već i VRLO BRZO ;-) Ali prvo opća izjava problema+ popratni primjer:

Proučavajmo pokazatelje u određenom predmetnom području koji imaju kvantitativni izraz. U isto vrijeme, postoji svaki razlog za vjerovanje da pokazatelj ovisi o pokazatelju. Ova pretpostavka može biti ili znanstvena hipoteza ili temeljena na osnovnom zdravom razumu. Ostavimo, međutim, znanost po strani i istražimo ukusnija područja – naime, trgovine mješovitom robom. Označimo sa:

– maloprodajna površina trgovine mješovitom robom, m2,
– godišnji promet trgovine mješovitom robom, milijun rubalja.

Sasvim je jasno da što je trgovina veća, to će u većini slučajeva biti veći njen promet.

Pretpostavimo da nakon promatranja/pokusa/izračunavanja/plesa uz tamburu imamo na raspolaganju brojčane podatke:

Sa trgovinama mješovitom robom mislim da je sve jasno: - ovo je površina 1. trgovine, - njen godišnji promet, - površina 2. trgovine, - njen godišnji promet itd. Usput, uopće nije potrebno imati pristup povjerljivim materijalima - prilično točna procjena trgovinskog prometa može se dobiti pomoću matematička statistika. No, nemojmo se ometati, tečaj komercijalne špijunaže već je plaćen =)

Tablični podaci također se mogu napisati u obliku točaka i prikazati u poznatom obliku Kartezijanski sustav .

Odgovorimo na važno pitanje: Koliko bodova je potrebno za kvalitetan studij?

Što veće, to bolje. Minimalni prihvatljivi set sastoji se od 5-6 bodova. Osim toga, kada je količina podataka mala, "anomalni" rezultati se ne mogu uključiti u uzorak. Tako, na primjer, mala elitna trgovina može zaraditi redove veličine više od "svojih kolega", čime se iskrivljuje opći obrazac koji trebate pronaći!

Vrlo jednostavno rečeno, moramo odabrati funkciju, raspored koja prolazi što bliže točkama . Ova funkcija se zove aproksimirajući (aproksimacija - aproksimacija) ili teorijska funkcija . Općenito govoreći, ovdje se odmah pojavljuje očiti "takmičar" - polinom visokog stupnja, čiji graf prolazi kroz SVE točke. Ali ova je opcija komplicirana i često jednostavno netočna. (budući da će se grafikon cijelo vrijeme "petljati" i slabo odražavati glavni trend).

Dakle, tražena funkcija mora biti vrlo jednostavna i istovremeno adekvatno odražavati ovisnost. Kao što možete pogoditi, jedna od metoda za pronalaženje takvih funkcija je poziv metoda najmanjih kvadrata. Prvo, pogledajmo njegovu bit općenito. Neka neka funkcija aproksimira eksperimentalne podatke:


Kako procijeniti točnost ove aproksimacije? Izračunajmo i razlike (odstupanja) između eksperimentalnih i funkcionalnih vrijednosti (proučavamo crtež). Prva pomisao koja pada na pamet je procijeniti koliki je zbroj, no problem je što razlike mogu biti negativne (Na primjer, ) a odstupanja kao rezultat takvog zbrajanja međusobno će se poništiti. Stoga, kao procjenu točnosti aproksimacije, moli se uzeti zbroj moduli odstupanja:

ili sažeto: (u slučaju da netko ne zna: – ovo je ikona zbroja, i – pomoćna varijabla “brojača”, koja ima vrijednosti od 1 do ).

Aproksimacijom eksperimentalnih točaka s različitim funkcijama dobit ćemo različite vrijednosti, a očito, gdje je taj zbroj manji, ta je funkcija točnija.

Takva metoda postoji i zove se metoda najmanjeg modula. Međutim, u praksi je postalo mnogo raširenije metoda najmanjih kvadrata, u kojem se moguće negativne vrijednosti eliminiraju ne modulom, već kvadratiranjem odstupanja:

, nakon čega se pokušava odabrati takva funkcija da je zbroj kvadrata odstupanja bila što manja. Zapravo, odatle dolazi naziv metode.

A sada se vraćamo na još jednu važnu točku: kao što je gore navedeno, odabrana funkcija bi trebala biti prilično jednostavna - ali postoji i mnogo takvih funkcija: linearni , hiperboličan, eksponencijalni, logaritamski, kvadratni itd. I, naravno, ovdje bih odmah želio "smanjiti polje djelovanja". Koju klasu funkcija trebam odabrati za istraživanje? Primitivna, ali učinkovita tehnika:

– Najlakši način je prikazati bodove na crtežu i analizirati njihov položaj. Ako imaju tendenciju da trče u ravnoj liniji, onda biste trebali tražiti jednadžba pravca s optimalnim vrijednostima i . Drugim riječima, zadatak je pronaći TAKVE koeficijente da zbroj kvadrata odstupanja bude najmanji.

Ako se točke nalaze, na primjer, duž hiperbola, onda je očito jasno da će linearna funkcija dati lošu aproksimaciju. U ovom slučaju tražimo "najpovoljnije" koeficijente za jednadžbu hiperbole – one koje daju najmanji zbroj kvadrata .

Sada imajte na umu da u oba slučaja govorimo o funkcije dviju varijabli, čiji su argumenti traženi parametri ovisnosti:

I u biti trebamo riješiti standardni problem - pronaći minimalna funkcija dviju varijabli.

Sjetimo se našeg primjera: pretpostavimo da se točke "pohrane" nalaze u ravnoj liniji i postoji svaki razlog vjerovati da linearna ovisnost promet od prodajnog prostora. Nađimo TAKVE koeficijente “a” i “be” takve da zbroj kvadrata odstupanja bio najmanji. Sve je kao i obično - prvo Parcijalne derivacije 1. reda. Prema pravilo linearnosti Možete razlikovati točno ispod ikone zbroja:

Ako želite koristiti ove informacije za esej ili seminarski rad, bit ću vam vrlo zahvalan na poveznici u popisu izvora; ovako detaljne izračune naći ćete na nekoliko mjesta:

Kreirajmo standardni sustav:

Svaku jednadžbu smanjujemo za "dva" i dodatno "rastavljamo" zbrojeve:

Bilješka : samostalno analizirati zašto se “a” i “be” mogu izbaciti izvan ikone zbroja. Usput, formalno se to može učiniti sa zbrojem

Prepišimo sustav u "primijenjenom" obliku:

nakon čega se počinje pojavljivati ​​algoritam za rješavanje našeg problema:

Znamo li koordinate točaka? Znamo. Iznosi možemo li ga pronaći? Lako. Napravimo najjednostavnije sustav dviju linearnih jednadžbi s dvije nepoznanice("a" i "biti"). Sustav rješavamo npr. Cramerova metoda, uslijed čega dobivamo stacionarnu točku. Provjeravanje dovoljan uvjet za ekstrem, možemo potvrditi da je u ovom trenutku funkcija doseže točno minimum. Provjera uključuje dodatne izračune i stoga ćemo je ostaviti iza scene (po potrebi se može vidjeti okvir koji nedostaje). Izvodimo konačni zaključak:

Funkcija najbolji način (barem u usporedbi s bilo kojom drugom linearnom funkcijom) približava eksperimentalne točke . Grubo govoreći, njegov graf prolazi što je moguće bliže tim točkama. U tradiciji ekonometrija naziva se i rezultirajuća aproksimirajuća funkcija jednadžba uparene linearne regresije .

Problem koji se razmatra je od velike praktične važnosti. U našoj primjernoj situaciji, jednadžba omogućuje vam da predvidite koji trgovinski promet ("Igrek") trgovina će imati jednu ili drugu vrijednost prodajnog prostora (jedno ili ono značenje "x"). Da, rezultirajuća prognoza bit će samo prognoza, ali će se u mnogim slučajevima pokazati prilično točnom.

Analizirat ću samo jedan problem s "pravim" brojevima, jer u njemu nema poteškoća - svi izračuni su na razini školskog programa za 7.-8. U 95 posto slučajeva od vas će se tražiti da pronađete samo linearnu funkciju, no na samom kraju članka pokazat ću da nije ništa teže pronaći jednadžbe optimalne hiperbole, eksponencijalne i nekih drugih funkcija.

Zapravo, sve što ostaje je podijeliti obećane dobrote - kako biste naučili rješavati takve primjere ne samo točno, već i brzo. Pažljivo proučavamo standard:

Zadatak

Kao rezultat proučavanja odnosa između dva pokazatelja, dobiveni su sljedeći parovi brojeva:

Koristeći metodu najmanjih kvadrata, pronađite linearnu funkciju koja najbolje aproksimira empirijsku (iskusan) podaci. Napravite crtež na kojem ćete konstruirati eksperimentalne točke i graf aproksimacijske funkcije u kartezijskom pravokutnom koordinatnom sustavu . Pronađite zbroj kvadrata odstupanja između empirijskih i teoretskih vrijednosti. Saznajte bi li značajka bila bolja (sa stajališta metode najmanjih kvadrata) približiti eksperimentalne točke.

Imajte na umu da su značenja "x" prirodna, a ovo ima karakteristično smisleno značenje, o kojem ću govoriti malo kasnije; ali oni, naravno, mogu biti i frakcijski. Osim toga, ovisno o sadržaju određenog zadatka, i vrijednosti "X" i "igra" mogu biti potpuno ili djelomično negativne. Pa, dobili smo “bezlični” zadatak i počinjemo ga riješenje:

Koeficijente optimalne funkcije nalazimo kao rješenje sustava:

Radi kompaktnijeg bilježenja varijablu “brojač” možemo izostaviti jer je već jasno da se zbrajanje provodi od 1 do .

Pogodnije je izračunati potrebne količine u tabličnom obliku:


Izračuni se mogu provesti na mikrokalkulatoru, ali mnogo je bolje koristiti Excel - i brže i bez pogrešaka; pogledajte kratki video:

Dakle, dobivamo sljedeće sustav:

Ovdje možete pomnožiti drugu jednadžbu s 3 i oduzmite 2. od 1. jednadžbe član po član. Ali to je sreća - u praksi sustavi često nisu dar, au takvim slučajevima štedi Cramerova metoda:
, što znači da sustav ima jedinstveno rješenje.

Provjerimo. Razumijem da ne želite, ali zašto preskakati pogreške tamo gdje ih se apsolutno ne može propustiti? Zamijenimo pronađeno rješenje u lijevu stranu svake jednadžbe sustava:

Dobivene su desne strane odgovarajućih jednadžbi, što znači da je sustav ispravno riješen.

Dakle, željena aproksimativna funkcija: – od sve linearne funkcije Ona je ta koja najbolje približava eksperimentalne podatke.

Za razliku od ravno ovisnost prometa trgovine o njezinoj površini, utvrđena ovisnost je obrnuti (princip “što više, to manje”), a tu činjenicu odmah otkriva negativ nagib. Funkcija govori nam da se povećanjem određenog pokazatelja za 1 jedinicu smanjuje vrijednost ovisnog pokazatelja prosjek za 0,65 jedinica. Kako kažu, što je cijena heljde veća, to se manje prodaje.

Da bismo iscrtali graf aproksimacijske funkcije, pronalazimo njezine dvije vrijednosti:

i izvršite crtež:


Konstruirana pravac zove se linija trenda (naime, linearna linija trenda, tj. u općem slučaju, trend nije nužno ravna linija). Svima je poznat izraz “biti u trendu” i mislim da ovaj termin ne treba dodatno komentirati.

Izračunajmo zbroj kvadrata odstupanja između empirijskih i teorijskih vrijednosti. Geometrijski, to je zbroj kvadrata duljina segmenata "maline". (dva su toliko mala da se i ne vide).

Sažmimo izračune u tablicu:


Opet, mogu se napraviti ručno; za svaki slučaj, dat ću primjer za 1. točku:

ali puno je učinkovitije to učiniti na već poznati način:

Još jednom ponavljamo: Koje je značenje dobivenog rezultata? Iz sve linearne funkcije y funkcija indikator je najmanji, odnosno u svojoj obitelji najbolja je aproksimacija. I ovdje, usput, posljednje pitanje problema nije slučajno: što ako je predložena eksponencijalna funkcija bi li bilo bolje približiti eksperimentalne točke?

Nađimo odgovarajući zbroj kvadrata odstupanja - da ih razlikujemo, označit ću ih slovom "epsilon". Tehnika je potpuno ista:


I opet, za svaki slučaj, izračuni za 1. točku:

U Excelu koristimo standardnu ​​funkciju EXP (sintaksu možete pronaći u Excel pomoći).

Zaključak: , što znači da eksponencijalna funkcija lošije aproksimira eksperimentalne točke nego ravna linija .

Ali ovdje treba napomenuti da je "gore". ne znači još, što nije u redu. Sada sam napravio graf ove eksponencijalne funkcije - i on također prolazi blizu točaka - toliko da je bez analitičkog istraživanja teško reći koja je funkcija točnija.

Time završavam rješenje i vraćam se na pitanje prirodnih vrijednosti argumenta. U raznim studijama, obično ekonomskim ili sociološkim, prirodni "X" koriste se za numeriranje mjeseci, godina ili drugih jednakih vremenskih intervala. Razmotrimo, na primjer, sljedeći problem.

Ja sam matematičar i programer. Najveći skok u mojoj karijeri bio je kada sam naučio reći: "Ne razumijem ništa!" Sada me nije sram reći svjetlu znanosti da mi drži predavanje, da ne razumijem što mi on, svjetionik, govori. I jako je teško. Da, priznati svoje neznanje je teško i neugodno. Tko voli priznati da ne zna osnove nečega? Zbog svoje profesije moram biti na velikom broju prezentacija i predavanja na kojima, priznajem, u velikoj većini slučajeva želim spavati jer ništa ne razumijem. Ali ne razumijem jer veliki problem trenutne situacije u znanosti leži u matematici. Pretpostavlja se da su svi slušatelji upoznati s apsolutno svim područjima matematike (što je apsurdno). Sramotno je priznati da ne znate što je derivat (o čemu je riječ malo kasnije).

Ali naučio sam reći da ne znam što je množenje. Da, ne znam što je subalgebra nad Liejevom algebrom. Da, ne znam zašto su kvadratne jednadžbe potrebne u životu. Usput, ako ste sigurni da znate, onda imamo o čemu razgovarati! Matematika je niz trikova. Matematičari pokušavaju zbuniti i zastrašiti javnost; gdje nema zabune, nema ugleda, nema autoriteta. Da, prestižno je govoriti što apstraktnijim jezikom, što je potpuna besmislica.

Znate li što je derivat? Najvjerojatnije ćete mi reći o granici omjera razlike. Na prvoj godini matematike i mehanike na St. Petersburg State University, Viktor Petrovich Khavin mi je rekao odlučan derivacija kao koeficijent prvog člana Taylorovog niza funkcije u točki (ovo je bila posebna gimnastika za određivanje Taylorovog niza bez derivacija). Dugo sam se smijao ovoj definiciji dok konačno nisam shvatio o čemu se radi. Derivacija nije ništa više od jednostavne mjere koliko je funkcija koju razlikujemo slična funkciji y=x, y=x^2, y=x^3.

Sada imam čast predavati studentima koji bojati se matematika. Ako se bojiš matematike, na istom smo putu. Čim pokušate pročitati neki tekst i čini vam se da je prekompliciran, onda znajte da je loše napisan. Tvrdim da ne postoji niti jedno područje matematike o kojem se ne može raspravljati "na prste" bez gubitka točnosti.

Zadatak za blisku budućnost: Zadao sam svojim studentima da razumiju što je linearni kvadratni regulator. Nemojte se sramiti, potrošite tri minute svog života i slijedite poveznicu. Ako ništa ne razumijete, onda smo na istom putu. Ni ja (profesionalni matematičar-programer) nisam ništa razumio. I uvjeravam vas da to možete shvatiti "na prste". U ovom trenutku ne znam o čemu se radi, ali uvjeravam vas da ćemo to moći otkriti.

Dakle, prvo predavanje koje ću održati svojim studentima nakon što mi užasnuti dotrče i kažu da je linearno-kvadratni regulator užasna stvar koju nikada u životu nećete savladati je metode najmanjih kvadrata. Možete li riješiti linearne jednadžbe? Ako čitate ovaj tekst, onda vrlo vjerojatno ne.

Dakle, date su dvije točke (x0, y0), (x1, y1), na primjer, (1,1) i (3,2), zadatak je pronaći jednadžbu pravca koji prolazi kroz te dvije točke:

ilustracija

Ova linija bi trebala imati jednadžbu poput sljedeće:

Ovdje su nam alfa i beta nepoznate, ali dvije točke ove linije su poznate:

Ovu jednadžbu možemo napisati u matričnom obliku:

Ovdje treba napraviti lirsku digresiju: ​​što je matrica? Matrica nije ništa više od dvodimenzionalnog niza. Ovo je način pohranjivanja podataka; ne bi mu se trebala pridavati nikakva daljnja značenja. O nama točno ovisi kako ćemo interpretirati određenu matricu. Povremeno ću ga tumačiti kao linearno preslikavanje, povremeno kao kvadratni oblik, a ponekad jednostavno kao skup vektora. Sve će to biti razjašnjeno u kontekstu.

Zamijenimo konkretne matrice njihovim simboličkim prikazom:

Tada se (alfa, beta) može lako pronaći:

Konkretnije za naše prethodne podatke:

Što dovodi do sljedeće jednadžbe pravca koji prolazi kroz točke (1,1) i (3,2):

Dobro, ovdje je sve jasno. Nađimo jednadžbu pravca koji prolazi tri točke: (x0,y0), (x1,y1) i (x2,y2):

Oh-oh-oh, ali imamo tri jednadžbe za dvije nepoznanice! Standardni matematičar će reći da rješenja nema. Što će reći programer? I prvo će prepisati prethodni sustav jednadžbi u sljedećem obliku:

U našem slučaju vektori i, j, b su trodimenzionalni, stoga (u općem slučaju) nema rješenja za ovaj sustav. Svaki vektor (alfa\*i + beta\*j) leži u ravnini razapetoj vektorima (i, j). Ako b ne pripada ovoj ravnini, tada rješenja nema (u jednadžbi se ne može postići jednakost). Što uraditi? Tražimo kompromis. Označimo sa e(alfa, beta) koliko točno nismo postigli jednakost:

Pokušat ćemo minimizirati ovu grešku:

Zašto kvadrat?

Ne tražimo samo minimum norme, nego minimum kvadrata norme. Zašto? Sama minimalna točka koincidira, a kvadrat daje glatku funkciju (kvadratnu funkciju argumenata (alfa, beta)), dok jednostavno duljina daje funkciju stošca, nediferencijabilnu u minimalnoj točki. Brr. Kvadrat je praktičniji.

Očito, greška je minimizirana kada vektor e okomito na ravninu koju vektori premošćuju ja I j.

Ilustracija

Drugim riječima: tražimo ravnu liniju takvu da je zbroj kvadrata duljina udaljenosti od svih točaka do te prave minimalan:

AŽURIRANJE: Ovdje imam problem, udaljenost do ravne crte treba mjeriti okomito, a ne ortogonalnom projekcijom. Ovaj komentator je u pravu.

Ilustracija

Potpuno drugim riječima (pažljivo, loše formalizirano, ali mora biti jasno): uzimamo sve moguće linije između svih parova točaka i tražimo prosječnu liniju između svih:

Ilustracija

Drugo objašnjenje je jednostavno: pričvrstimo oprugu između svih podatkovnih točaka (ovdje ih imamo tri) i ravne linije koju tražimo, a prava linija stanja ravnoteže je upravo ono što tražimo.

Minimalni kvadratni oblik

Dakle, dat je ovaj vektor b i ravnina prevučena vektorima stupaca matrice A(u ovom slučaju (x0,x1,x2) i (1,1,1)), tražimo vektor e s minimalnim kvadratom duljine. Očito je minimum ostvariv samo za vektor e, okomito na ravninu razapetu vektorima stupaca matrice A:

Drugim riječima, tražimo vektor x=(alfa, beta) takav da je:

Dopustite da vas podsjetim da je ovaj vektor x=(alpha, beta) minimum kvadratne funkcije ||e(alpha, beta)||^2:

Ovdje bi bilo korisno zapamtiti da se matrica može tumačiti i kao kvadratni oblik, na primjer, matrica identiteta ((1,0),(0,1)) može se tumačiti kao funkcija x^2 + y^ 2:

kvadratni oblik

Sva ova gimnastika poznata je pod nazivom linearna regresija.

Laplaceova jednadžba s Dirichletovim rubnim uvjetom

Sada najjednostavniji pravi zadatak: postoji određena trokutasta površina, potrebno ju je izravnati. Na primjer, učitajmo model mog lica:

Izvorni commit je dostupan. Kako bih smanjio vanjske ovisnosti, uzeo sam kod svog softverskog renderera koji je već na Habréu. Za rješavanje linearnog sustava koristim OpenNL, ovo je odličan alat za rješavanje problema, koji je, međutim, vrlo teško instalirati: morate kopirati dvije datoteke (.h+.c) u mapu s vašim projektom. Sva izravnavanja se izvode sa sljedećim kodom:

Za (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&lice = lica[i]; za (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

Koordinate X, Y i Z su odvojive, ja ih zasebno glačam. To jest, rješavam tri sustava linearnih jednadžbi, svaki s brojem varijabli jednakim broju vrhova u mom modelu. Prvih n redaka matrice A ima samo jednu 1 po retku, a prvih n redaka vektora b imaju izvorne koordinate modela. Odnosno, vezujem oprugu između novog položaja tjemena i starog položaja tjemena - novi se ne smiju previše udaljavati od starih.

Svi sljedeći redovi matrice A (faces.size()*3 = broj bridova svih trokuta u mreži) imaju jedno pojavljivanje 1 i jedno pojavljivanje -1, pri čemu vektor b ima nula komponenti nasuprot. To znači da sam stavio oprugu na svaki rub naše trokutaste mreže: svi rubovi pokušavaju dobiti isti vrh kao početnu i završnu točku.

Još jednom: svi vrhovi su varijable, i ne mogu se pomaknuti daleko od svog prvobitnog položaja, ali u isto vrijeme pokušavaju postati slični jedni drugima.

Evo rezultata:

Sve bi bilo u redu, model je stvarno izglađen, ali se odmaknuo od originalnog ruba. Promijenimo malo kod:

Za (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

U našoj matrici A, za vrhove koji su na rubu, ne dodajem red iz kategorije v_i = verts[i][d], već 1000*v_i = 1000*verts[i][d]. Što to mijenja? I ovo mijenja naš kvadratni oblik pogreške. Sada jedno odstupanje od vrha na rubu neće koštati jednu jedinicu, kao prije, već 1000*1000 jedinica. To jest, objesili smo jaču oprugu na krajnje vrhove, rješenje će radije jače istegnuti druge. Evo rezultata:

Udvostručimo snagu opruge između vrhova:
nlKoeficijent(lice[ j ], 2); nlKoeficijent(lice[(j+1)%3], -2);

Logično je da je površina postala glatkija:

A sada još sto puta jače:

Što je to? Zamislimo da smo umočili žičani prsten u sapunicu. Kao rezultat toga, dobiveni sapunski film će pokušati imati što je moguće najmanju zakrivljenost, dodirujući granicu - naš žičani prsten. To je upravo ono što smo dobili popravljajući rub i tražeći glatku površinu iznutra. Čestitamo, upravo smo riješili Laplaceovu jednadžbu s Dirichletovim rubnim uvjetima. Zvuči super? Ali u stvarnosti, samo trebate riješiti jedan sustav linearnih jednadžbi.

Poissonova jednadžba

Sjetimo se još jednog cool imena.

Recimo da imam ovakvu sliku:

Svima izgleda dobro, ali meni se stolica ne sviđa.

Sliku ću prepoloviti:



I ja ću izabrati stolicu svojim rukama:

Zatim ću sve što je bijelo u maski povući na lijevu stranu slike, a istovremeno ću kroz cijelu sliku reći da razlika između dva susjedna piksela treba biti jednaka razlici između dva susjedna piksela na desnoj strani. slika:

Za (int i=0; i

Evo rezultata:

Primjer iz života

Namjerno nisam napravio ulizane rezultate, jer... Samo sam htio pokazati kako točno možete primijeniti metode najmanjih kvadrata, ovo je kod za obuku. Sada ću navesti primjer iz života:

Imam nekoliko fotografija uzoraka tkanina poput ovih:

Moj zadatak je napraviti bešavne teksture od fotografija ove kvalitete. Za početak, (automatski) tražim uzorak koji se ponavlja:

Ako izrežem ovaj četverokut ravno, tada se zbog iskrivljenja rubovi neće spojiti, evo primjera uzorka koji se ponavlja četiri puta:

Skriveni tekst

Evo fragmenta gdje je šav jasno vidljiv:

Stoga neću rezati po ravnoj liniji, evo linije rezanja:

Skriveni tekst

I evo uzorka koji se ponavlja četiri puta:

Skriveni tekst

I dio toga da bude jasnije:

Već je bolje, rez nije išao u ravnoj liniji, izbjegavajući sve vrste kovrča, ali šav je i dalje vidljiv zbog neravnomjernog osvjetljenja na izvornoj fotografiji. Ovdje u pomoć dolazi metoda najmanjih kvadrata za Poissonovu jednadžbu. Evo konačnog rezultata nakon izravnavanja rasvjete:

Tekstura je ispala savršeno besprijekorna, a sve to automatski s fotografije vrlo osrednje kvalitete. Ne bojte se matematike, tražite jednostavna objašnjenja i bit ćete sretni u inženjerstvu.

Nakon niveliranja dobivamo funkciju sljedećeg oblika: g (x) = x + 1 3 + 1 .

Te podatke možemo aproksimirati koristeći linearni odnos y = a x + b izračunavanjem odgovarajućih parametara. Da bismo to učinili, morat ćemo primijeniti takozvanu metodu najmanjih kvadrata. Također ćete morati napraviti crtež kako biste provjerili koja linija će najbolje uskladiti eksperimentalne podatke.

Što je točno OLS (metoda najmanjih kvadrata)

Glavna stvar koju trebamo učiniti je pronaći takve koeficijente linearne ovisnosti pri kojima će vrijednost funkcije dviju varijabli F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 biti najmanji. Drugim riječima, za određene vrijednosti a i b, zbroj kvadratnih odstupanja prikazanih podataka od rezultirajuće ravne linije imat će minimalnu vrijednost. Ovo je značenje metode najmanjih kvadrata. Sve što trebamo učiniti da bismo riješili primjer je pronaći ekstremum funkcije dviju varijabli.

Kako izvesti formule za izračun koeficijenata

Da biste izveli formule za izračun koeficijenata, potrebno je izraditi i riješiti sustav jednadžbi s dvije varijable. Da bismo to učinili, izračunavamo parcijalne derivacije izraza F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 u odnosu na a i b i izjednačavamo ih s 0.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

Za rješavanje sustava jednadžbi možete koristiti bilo koje metode, na primjer, supstituciju ili Cramerovu metodu. Kao rezultat, trebali bismo imati formule koje se mogu koristiti za izračunavanje koeficijenata metodom najmanjih kvadrata.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

Izračunali smo vrijednosti varijabli pri kojima funkcija
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 će uzeti minimalnu vrijednost. U trećem paragrafu ćemo dokazati zašto je to baš tako.

Ovo je primjena metode najmanjih kvadrata u praksi. Njegova formula, koja se koristi za pronalaženje parametra a, uključuje ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2, kao i parametar
n – označava količinu eksperimentalnih podataka. Savjetujemo vam da izračunate svaki iznos zasebno. Vrijednost koeficijenta b izračunava se odmah nakon a.

Vratimo se izvornom primjeru.

Primjer 1

Ovdje imamo n jednako pet. Kako bismo lakše izračunali potrebne iznose uključene u formule koeficijenata, ispunimo tablicu.

i = 1 i=2 i=3 i=4 i=5 ∑ i = 1 5
x i 0 1 2 4 5 12
y i 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

Riješenje

Četvrti redak uključuje podatke dobivene množenjem vrijednosti iz drugog reda s vrijednostima trećeg za svaki pojedinačni tj. U petom retku nalaze se podaci iz drugog na kvadrat. Posljednji stupac prikazuje zbrojeve vrijednosti pojedinih redaka.

Upotrijebimo metodu najmanjih kvadrata da izračunamo koeficijente a i b koji su nam potrebni. Da biste to učinili, zamijenite potrebne vrijednosti iz posljednjeg stupca i izračunajte iznose:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33, 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Ispada da će tražena aproksimirajuća ravna linija izgledati kao y = 0, 165 x + 2, 184. Sada moramo odrediti koja linija će bolje približiti podatke - g (x) = x + 1 3 + 1 ili 0, 165 x + 2, 184. Procijenimo metodom najmanjih kvadrata.

Da bismo izračunali pogrešku, trebamo pronaći zbroj kvadrata odstupanja podataka od ravnih linija σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 i σ 2 = ∑ i = 1 n (y i - g (x i)) 2, minimalna vrijednost će odgovarati prikladnijem retku.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0,096

Odgovor: budući da je σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0,165 x + 2,184.

Metoda najmanjih kvadrata jasno je prikazana na grafičkom prikazu. Crvena linija označava ravnu liniju g (x) = x + 1 3 + 1, plava linija označava y = 0, 165 x + 2, 184. Izvorni podaci označeni su ružičastim točkama.

Objasnimo zašto su potrebne upravo takve aproksimacije.

Mogu se koristiti u zadacima koji zahtijevaju izglađivanje podataka, kao i u onima u kojima se podaci moraju interpolirati ili ekstrapolirati. Na primjer, u problemu koji je gore razmotren, može se pronaći vrijednost promatrane veličine y na x = 3 ili na x = 6. Takvim smo primjerima posvetili poseban članak.

Dokaz OLS metode

Da bi funkcija poprimila minimalnu vrijednost kada se izračunaju a i b, potrebno je da u danoj točki matrica kvadratnog oblika diferencijala funkcije oblika F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 je pozitivno određeno. Pokažimo vam kako bi to trebalo izgledati.

Primjer 2

Imamo diferencijal drugog reda sljedećeg oblika:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2 b

Riješenje

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

Drugim riječima, možemo to zapisati ovako: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

Dobili smo matricu kvadratnog oblika M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

U ovom slučaju, vrijednosti pojedinih elemenata neće se mijenjati ovisno o a i b. Je li ova matrica pozitivno određena? Da bismo odgovorili na ovo pitanje, provjerimo jesu li njegovi kutni minori pozitivni.

Izračunavamo kutni minor prvog reda: 2 ∑ i = 1 n (x i) 2 > 0 . Budući da se točke x i ne poklapaju, nejednakost je stroga. To ćemo imati na umu u daljnjim proračunima.

Izračunavamo kutni minor drugog reda:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

Nakon toga nastavljamo s dokazivanjem nejednakosti n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 koristeći matematičku indukciju.

  1. Provjerimo vrijedi li ova nejednakost za proizvoljan n. Uzmimo 2 i izračunajmo:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Dobili smo ispravnu jednakost (ako se vrijednosti x 1 i x 2 ne podudaraju).

  1. Pretpostavimo da će ova nejednakost vrijediti za n, tj. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – točno.
  2. Sada ćemo dokazati valjanost za n + 1, tj. da je (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, ako je n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Računamo:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1) - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

Izraz u vitičastim zagradama bit će veći od 0 (na temelju onoga što smo pretpostavili u koraku 2), a preostali članovi bit će veći od 0, jer su svi kvadrati brojeva. Nejednakost smo dokazali.

Odgovor: pronađeni a i b će odgovarati najmanjoj vrijednosti funkcije F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, što znači da su to traženi parametri metode najmanjih kvadrata. (LSM).

Ako primijetite grešku u tekstu, označite je i pritisnite Ctrl+Enter

NASTAVNI RAD

Aproksimacija funkcije metodom najmanjih kvadrata


Uvod

empirijska mathcad aproksimacija

Svrha kolegija je produbljivanje znanja iz informatike, razvijanje i učvršćivanje vještina rada s tabličnim procesorom Microsoft Excel i MathCAD. Njihova uporaba za rješavanje problema korištenjem računala iz predmetnog područja povezanog s istraživanjem.

U svakom su zadatku formulirani uvjeti problema, početni podaci, obrazac za izdavanje rezultata, naznačene su glavne matematičke ovisnosti za rješavanje problema.Kontrolni izračun omogućuje provjeru ispravnosti rada programa.

Koncept aproksimacije je približan izraz bilo kojeg matematičkog objekta (na primjer, brojeva ili funkcija) kroz druge koji su jednostavniji, praktičniji za korištenje ili jednostavno poznatiji. U znanstvenom istraživanju aproksimacija se koristi za opisivanje, analizu, generalizaciju i daljnju upotrebu empirijskih rezultata.

Kao što je poznato, između veličina može postojati egzaktna (funkcionalna) veza, kada jedna određena vrijednost odgovara jednoj vrijednosti argumenta, i manje precizna (korelacijska) veza, kada jedna određena vrijednost argumenta odgovara približnoj vrijednosti ili određeni skup funkcijskih vrijednosti, u jednoj ili drugoj mjeri bliskih jedna drugoj. Kada provodite znanstveno istraživanje, obrađujete rezultate promatranja ili eksperimenta, obično se morate pozabaviti drugom opcijom. Pri proučavanju kvantitativnih ovisnosti različitih pokazatelja, čije se vrijednosti određuju empirijski, u pravilu postoji određena varijabilnost. Dijelom je određen heterogenošću proučavanih objekata nežive, a posebice žive prirode, a dijelom je određen pogreškom opažanja i kvantitativne obrade materijala. Posljednju komponentu nije moguće uvijek u potpunosti eliminirati, već je jedino moguće minimizirati pažljivim odabirom odgovarajuće istraživačke metode i pažljivim radom.

Stručnjaci iz područja automatizacije tehnoloških procesa i proizvodnje bave se velikom količinom eksperimentalnih podataka za čiju obradu se koristi računalo. Izvorni podaci i dobiveni rezultati proračuna mogu se prikazati u tabličnom obliku korištenjem tabličnih procesora (proračunskih tablica) i posebno programa Excel. Rad na kolegiju iz informatike omogućuje studentu učvršćivanje i razvijanje vještina korištenja osnovnih računalnih tehnologija pri rješavanju problema iz područja profesionalne djelatnosti - sustav računalne algebre iz klase sustava računalno potpomognutog projektiranja, usmjeren na pripremu interaktivnih dokumenata s izračune i vizualnu podršku, jednostavan je za korištenje i primjenu za timski rad.


1. Opće informacije


Vrlo često, osobito pri analizi empirijskih podataka, postoji potreba da se eksplicitno pronađe funkcionalni odnos između veličina xI na, koji se dobivaju kao rezultat mjerenja.

U analitičkoj studiji odnosa između dviju veličina x i y, provodi se niz promatranja, a rezultat je tablica vrijednosti:


xx1 x1 xjaxnyy1 g1 gjaYn

Ova se tablica obično dobiva kao rezultat nekih pokusa u kojima x,(neovisna vrijednost) postavlja eksperimentator, i y,dobivenih kao rezultat iskustva. Stoga ove vrijednosti y,nazvat ćemo ih empirijskim ili eksperimentalnim vrijednostima.

Postoji funkcionalni odnos između veličina x i y, ali je njegov analitički oblik obično nepoznat, pa se postavlja praktično važan zadatak - pronaći empirijsku formulu


y =f (x; a 1, a 2,…, am ), (1)


(Gdje a1 , a2 ,…,am- parametri), čije su vrijednosti na x = x,vjerojatno će se malo razlikovati od eksperimentalnih vrijednosti y, (i = 1,2,…, P).

Obično označavaju klasu funkcija (na primjer, skup linearnih, potencijskih, eksponencijalnih itd.) iz kojih je odabrana funkcija f(x), a zatim se određuju najbolje vrijednosti parametara.

Ako zamijenimo original x,tada dobivamo teorijske vrijednosti

YTja=f (xja; a 1, a 2……am) , Gdje ja = 1,2,…, n.


Razlike gjaT- gja, nazivaju se odstupanja i predstavljaju vertikalne udaljenosti od točaka Mjana graf empirijske funkcije.

Prema metodi najmanjih kvadrata najbolji koeficijenti a1 , a2 ,…,amone za koje se uzima u obzir zbroj kvadrata odstupanja pronađene empirijske funkcije od zadanih vrijednosti funkcije



će biti minimalan.

Objasnimo geometrijsko značenje metode najmanjih kvadrata.

Svaki par brojeva ( xja, gja) iz izvorne tablice određuje točku Mjana površini XOY.Korištenje formule (1) za različite vrijednosti koeficijenata a1 , a2 ,…,ammožete konstruirati niz krivulja koje su grafovi funkcije (1). Zadatak je odrediti koeficijente a1 , a2 ,…,amna način da zbroj kvadrata okomitih udaljenosti od točaka Mja (xja, gja) prije nego je graf funkcije (1) bio najmanji (slika 1).



Konstrukcija empirijske formule sastoji se od dvije faze: pojašnjavanje općeg oblika te formule i određivanje njezinih najboljih parametara.

Ako je priroda odnosa između tih veličina x i g, onda je tip empirijske ovisnosti proizvoljan. Prednost se daje jednostavnim formulama s dobrom točnošću. Uspješan odabir empirijske formule uvelike ovisi o znanju istraživača u predmetnom području, pomoću kojeg može naznačiti klasu funkcija iz teorijskih razmatranja. Od velike je važnosti prikaz dobivenih podataka u kartezijevim ili posebnim koordinatnim sustavima (polulogaritamski, logaritamski itd.). Iz položaja točaka možete približno pogoditi opći oblik ovisnosti utvrđivanjem sličnosti između izgrađenog grafikona i uzoraka poznatih krivulja.

Određivanje najboljih koeficijenata a1 , a2,…, amuključeni u empirijsku formulu proizvode se dobro poznatim analitičkim metodama.

Da bismo pronašli skup koeficijenata a1 , a2 …..am, koje daju minimum funkcije S definirane formulom (2), koristimo nužan uvjet za ekstrem funkcije više varijabli - jednakost parcijalnih derivacija nuli.

Kao rezultat toga, dobivamo normalan sustav za određivanje koeficijenata aja(i = 1,2,…, m):



Dakle, pronalaženje koeficijenata ajasvodi na sustav rješavanja (3). Ovaj sustav je pojednostavljen ako je empirijska formula (1) linearna s obzirom na parametre aja, tada će sustav (3) biti linearan.


1.1 Linearna ovisnost


Specifični oblik sustava (3) ovisi o tome iz koje klase empirijskih formula tražimo ovisnost (1). U slučaju linearne ovisnosti y = a1 + a2 xsustav (3) će imati oblik:


Ovaj linearni sustav može se riješiti bilo kojom poznatom metodom (Gaussova metoda, jednostavne iteracije, Cramerove formule).


1.2 Kvadratna ovisnost


U slučaju kvadratne ovisnosti y = a1 + a2 x+a3x 2sustav (3) će imati oblik:



1.3 Eksponencijalna ovisnost


U nekim slučajevima se kao empirijska formula uzima funkcija u kojoj nesigurni koeficijenti ulaze nelinearno. U ovom slučaju ponekad se problem može linearizirati, tj. svesti na linearno. Takve ovisnosti uključuju eksponencijalnu ovisnost


y = a1 *ea2x (6)


gdje 1I a 2, nesigurni koeficijenti.

Linearizacija se postiže logaritmiranjem jednakosti (6), nakon čega se dobiva relacija

ln y = ln a 1+a 2x (7)


Označimo ln nai ln axprema tome kroz tI c, tada se ovisnost (6) može napisati u obliku t = a1 + a2 x, što nam omogućuje primjenu formula (4) sa zamjenom a1 na cI naja na tja


1.4 Elementi teorije korelacije


Grafikon obnovljene funkcionalne ovisnosti y(x)prema rezultatima mjerenja (x ja, naja),i = 1,2, K, nnaziva se regresijska krivulja. Za provjeru slaganja konstruirane regresijske krivulje s eksperimentalnim rezultatima obično se uvode sljedeće numeričke karakteristike: koeficijent korelacije (linearna ovisnost), omjer korelacije i koeficijent determinacije. U tom slučaju rezultati se obično grupiraju i prikazuju u obliku korelacijske tablice. Svaka ćelija ove tablice prikazuje brojeve ni J - ti parovi (x, y), čije komponente spadaju u odgovarajuće intervale grupiranja za svaku varijablu. Pod pretpostavkom da su duljine intervala grupiranja (za svaku varijablu) jednake jedna drugoj, odaberite središta x ja(odnosno naja) ovih intervala i brojeva ni J- kao osnova za izračune.

Koeficijent korelacije je mjera linearnog odnosa između ovisnih slučajnih varijabli: on pokazuje koliko dobro, u prosjeku, jedna od varijabli može biti predstavljena kao linearna funkcija druge.

Koeficijent korelacije izračunava se pomoću formule:


gdje su i aritmetička sredina x I na.

Koeficijent korelacije između slučajnih varijabli u apsolutnoj vrijednosti ne prelazi 1. Što je bliže |p| do 1, što je bliži linearni odnos između x i u.

U slučaju nelinearne korelacije, uvjetne prosječne vrijednosti nalaze se u blizini zakrivljene linije. U ovom slučaju preporuča se koristiti omjer korelacije kao karakteristiku jakosti veze, čija interpretacija ne ovisi o vrsti ovisnosti koja se proučava.

Omjer korelacije izračunava se pomoću formule:



Gdje nja = , nf= , a brojnik karakterizira disperziju uvjetnih sredina y, o apsolutnoj sredini g.

Stalno. Jednakost = 0 odgovara nekoreliranim slučajnim varijablama; = 1 ako i samo ako postoji točna funkcionalna veza između g i x. U slučaju linearne ovisnosti g od x, omjer korelacije podudara se s kvadratom koeficijenta korelacije. Veličina - ? 2 koristi se kao pokazatelj regresijskog odstupanja od linearnog.

Omjer korelacije je mjera korelacijskog odnosa g S x u bilo kojem obliku, ali ne može dati ideju o stupnju bliskosti empirijskih podataka posebnom obliku. Da bismo saznali koliko točno izgrađena krivulja odražava empirijske podatke, uvodi se još jedna karakteristika - koeficijent determinacije.

Da bismo ga opisali, razmotrimo sljedeće količine. - ukupni zbroj kvadrata, gdje je prosječna vrijednost.

Možemo dokazati sljedeću jednakost

Prvi član jednak je Sres = i naziva se rezidualni zbroj kvadrata. Karakterizira odstupanje eksperimentalnog od teorijskog.

Drugi član jednak je Sreg = 2 i naziva se regresijski zbroj kvadrata i karakterizira širenje podataka.

Očito je sljedeća jednakost: S pun = S ost + S reg.

Koeficijent determinizma određuje se formulom:



Što je rezidualni zbroj kvadrata manji u odnosu na ukupni zbroj kvadrata, to je veća vrijednost koeficijenta determinizma r2 , koji pokazuje koliko dobro jednadžba dobivena regresijskom analizom objašnjava odnose između varijabli. Ako je jednak 1, tada postoji potpuna korelacija s modelom, tj. nema razlike između stvarnih i procijenjenih vrijednosti y. U suprotnom slučaju, ako je koeficijent determinizma 0, tada je regresijska jednadžba neuspješna u predviđanju vrijednosti y

Koeficijent determinizma uvijek ne prelazi omjer korelacije. U slučaju kada je jednakost zadovoljena r 2 = tada možemo pretpostaviti da konstruirana empirijska formula najtočnije odražava empirijske podatke.


2. Izjava problema


1. Koristeći metodu najmanjih kvadrata, aproksimirajte funkciju danu u tablici

a) polinom prvog stupnja;

b) polinom drugog stupnja;

c) eksponencijalna ovisnost.

Za svaku ovisnost izračunajte koeficijent determinizma.

Izračunajte koeficijent korelacije (samo u slučaju a).

Za svaku ovisnost nacrtajte liniju trenda.

Pomoću funkcije LINEST izračunajte numeričke karakteristike ovisnosti o.

Usporedite svoje izračune s rezultatima dobivenim pomoću funkcije LINEST.

Zaključite koja od dobivenih formula najbolje aproksimira funkciju.

Napišite program na jednom od programskih jezika i usporedite rezultate izračuna s gore dobivenim.


3. Početni podaci


Funkcija je dana na slici 1.



4. Izračunavanje aproksimacija u Excel tabličnom procesoru


Za izračune preporučljivo je koristiti tablični procesor Microsoft Excel. I rasporedite podatke kao što je prikazano na slici 2.



Da bismo to učinili unosimo:

· u ćelije A6:A30 unosimo vrijednosti xi .

· u ćelije B6:B30 unosimo vrijednosti ui .

· u ćeliju C6 unesite formulu =A6^ 2.

· Ova se formula kopira u ćelije C7:C30.

· u ćeliju D6 unesite formulu =A6*B6.

· Ova se formula kopira u ćelije D7:D30.

· U ćeliju F6 upisujemo formulu =A6^4.

· Ova se formula kopira u ćelije F7:F30.

· U ćeliju G6 unosimo formulu =A6^2*B6.

· Ova se formula kopira u ćelije G7:G30.

· U ćeliju H6 unesite formulu =LN(B6).

· Ova se formula kopira u ćelije H7:H30.

· u ćeliju I6 unesite formulu =A6*LN(B6).

· Ova formula se kopira u ćelije I7:I30. Sljedeće korake izvodimo pomoću automatskog zbrajanja

· u ćeliju A33 unesite formulu =SUM (A6:A30).

· u ćeliju B33 unesite formulu =SUM (B6:B30).

· u ćeliju C33 unesite formulu =SUM (C6:C30).

· u ćeliju D33 unesite formulu =SUM (D6:D30).

· u ćeliju E33 unesite formulu =SUM (E6:E30).

· u ćeliju F33 unesite formulu =SUM (F6:F30).

· U ćeliju G33 unesite formulu =SUM (G6:G30).

· U ćeliju H33 unesite formulu =SUM (H6:H30).

· u ćeliju I33 unesite formulu =SUM (I6:I30).

Aproksimirajmo funkciju y = f(x) linearna funkcija y = a1 + a2x. Za određivanje koeficijenata a 1i a 2Koristimo sustav (4). Koristeći zbrojeve tablice 2, koji se nalaze u ćelijama A33, B33, C33 i D33, zapisujemo sustav (4) u obliku



rješavanjem kojeg dobivamo a 1= -24,7164 i a2 = 11,63183

Dakle, linearna aproksimacija ima oblik y= -24,7164 + 11,63183x (12)

Sustav (11) riješen je pomoću programa Microsoft Excel. Rezultati su prikazani na slici 3:



U tablici u ćelijama A38:B39 zapisana je formula (=MOBR (A35:B36)). Ćelije E38:E39 sadrže formulu (=MULTIPLE (A38:B39, C35:C36)).


Zatim aproksimiramo funkciju y = f(x) kvadratnom funkcijom y = a1 + a2 x+a3 x2. Za određivanje koeficijenata a 1, a 2i a 3Koristimo sustav (5). Koristeći zbrojeve tablice 2, koji se nalaze u ćelijama A33, B33, C33, D33, E33, F33 i G33, zapisujemo sustav (5) u obliku:



Nakon što smo riješili koji, dobivamo a 1= 1,580946, a 2= -0,60819 i a3 = 0,954171 (14)

Dakle, kvadratna aproksimacija ima oblik:

y = 1,580946 -0,60819x +0,954171 x2

Sustav (13) riješen je pomoću programa Microsoft Excel. Rezultati su prikazani na slici 4.



U tablici u ćelijama A46:C48 zapisana je formula (=MOBR (A41:C43)). Ćelije F46:F48 sadrže formulu (=VIŠESTRUKO (A41:C43, D46:D48)).

Sada aproksimirajmo funkciju y = f(x) eksponencijalna funkcija y = a1 ea2x. Za određivanje koeficijenata a1 I a2 logaritmirajmo vrijednosti gjai koristeći zbrojeve tablice 2, koji se nalaze u ćelijama A26, C26, H26 i I26, dobivamo sustav:



Gdje s = ln(a1 ).

Nakon što smo riješili sustav (10) nalazimo c =0,506435, a2 = 0.409819.

Nakon potenciranja dobivamo a1 = 1,659365.

Dakle, eksponencijalna aproksimacija ima oblik y = 1,659365*e0,4098194x

Sustav (15) riješen je pomoću programa Microsoft Excel. Rezultati su prikazani na slici 5.


U tablici u ćelijama A55:B56 zapisana je formula (=MOBR (A51:B52)). U ćelijama E54:E56 zapisana je formula (=VIŠESTRUKO (A51:B52, C51:C52)). Ćelija E56 sadrži formulu =EXP(E54).

Izračunajmo aritmetičku sredinu x i y pomoću formula:



Rezultati proračuna x i gpomoću programa Microsoft Excel prikazani su na slici 6.



Ćelija B58 sadrži formulu =A33/25. Ćelija B59 sadrži formulu =B33/25.

tablica 2


Objasnimo kako se sastavlja tablica na slici 7.

Ćelije A6:A33 i B6:B33 već su popunjene (vidi sliku 2).

· u ćeliju J6 unesite formulu =(A6-$B$58)*(B6-$B$59).

· Ova se formula kopira u ćelije J7:J30.

· u ćeliju K6 unesite formulu =(A6-$B$58)^ 2.

· Ova se formula kopira u ćelije K7:K30.

· U ćeliju L6 unosimo formulu =(B1-$B$59)^2.

· Ova se formula kopira u ćelije L7:L30.

· u ćeliju M6 upisujemo formulu =($E$38+$E$39*A6-B6)^2.

· Ova se formula kopira u ćelije M7:M30.

· u ćeliju N6 upisujemo formulu =($F$46 +$F$47*A6 +$F$48*A6 L6-B6)^2.

· Ova se formula kopira u ćelije N7:N30.

· u ćeliju O6 unesite formulu =($E$56*EXP ($E$55*A6) - B6)^2.

· Ova formula se kopira u ćelije O7:O30.

Sljedeće korake izvodimo pomoću automatskog zbrajanja.

· u ćeliju J33 unesite formulu =CYMM (J6:J30).

· U ćeliju K33 upisujemo formulu =SUM (K6:K30).

· u ćeliju L33 unesite formulu =CYMM (L6:L30).

· U ćeliju M33 upisujemo formulu =SUM (M6:M30).

· u ćeliju N33 unesite formulu =SUM (N6:N30).

· u ćeliju O33 unesite formulu =SUM (06:030).

Izračunajmo sada koeficijent korelacije pomoću formule (8) (samo za linearnu aproksimaciju) i koeficijent determinacije pomoću formule (10). Rezultati izračuna u programu Microsoft Excel prikazani su na slici 7.



U tablici 8, u ćeliji B61 formula je zapisana =J33/(K33*L33^(1/2). U ćeliji B62 formula je zapisana =1 - M33/L33. U ćeliji B63 formula je zapisana =1 - N33 /L33 U ćeliji B64 formula je zapisana formula =1 - O33/L33.

Analiza rezultata proračuna pokazuje da kvadratna aproksimacija najbolje opisuje eksperimentalne podatke.


4.1 Iscrtavanje grafikona u Excelu


Odaberite ćelije A1:A25, zatim idite na Čarobnjak za grafikone. Odaberimo dijagram raspršenosti. Nakon što je grafikon konstruiran, desnom tipkom miša kliknite liniju grafikona i odaberite dodaj liniju trenda (linearnu, eksponencijalnu, potenciju i polinom drugog stupnja).

Linearni aproksimacijski graf


Kvadratni aproksimacijski graf


Eksponencijalni fiting graf.


5. Aproksimacija funkcije pomoću MathCAD-a


Aproksimacija podataka uzimajući u obzir njihove statističke parametre spada u probleme regresije. Obično nastaju prilikom obrade eksperimentalnih podataka dobivenih kao rezultat mjerenja procesa ili fizikalnih pojava koje su statističke prirode (kao što su mjerenja u radiometriji i nuklearnoj geofizici), ili pri visokoj razini interferencije (šum). Zadatak regresijske analize je odabrati matematičke formule koje najbolje opisuju eksperimentalne podatke.


.1 Linearna regresija


Linearna regresija u sustavu Mathcad izvodi se pomoću vektora argumenata xi čitanja Y funkcije:

presretanje (x, y)- izračunava parametar A1 , vertikalni pomak regresijske linije (vidi sliku)

nagib (x, y)- izračunava parametar a2 , nagib regresijske linije (vidi sliku)

y(x) = a1+a2*x


Funkcija ispravno (y, y(x))izračunava Pearsonov koeficijent korelacije.Što je bliže 1, što točnije obrađeni podaci odgovaraju linearnom odnosu (vidi sliku)

.2 Polinomska regresija


Jednodimenzionalna polinomska regresija s proizvoljnim stupnjem n polinoma i s proizvoljnim koordinatama uzoraka u Mathcadu se izvodi pomoću funkcija:

regresija (x, y, n)- izračunava vektor S,koji sadrži koeficijente aipolinom n th stupanj;

Vrijednosti koeficijenata aimože se izdvojiti iz vektora Sfunkcija podmatrica(S, 3, duljina(S) - 1, 0, 0).

Dobivene vrijednosti koeficijenata koristimo u regresijskoj jednadžbi


y(x) = a1+a2*x+a3*x2 (vidi sliku)

.3 Nelinearna regresija


Za jednostavne standardne aproksimacijske formule postoji niz nelinearnih regresijskih funkcija u kojima se parametri funkcije odabiru programom Mathcad.

To uključuje funkciju eksfit (x, y, s),koji vraća vektor koji sadrži koeficijente a1, a2I a3eksponencijalna funkcija

y(x) = a1 ^exp (a2x) + a3.V vektor Sunose se početne vrijednosti koeficijenata a1, a2I a3prva aproksimacija.


Zaključak


Analiza rezultata proračuna pokazuje da linearna aproksimacija najbolje opisuje eksperimentalne podatke.

Rezultati dobiveni pomoću programa MathCAD u potpunosti se podudaraju s vrijednostima dobivenim pomoću programa Excel. To ukazuje na točnost izračuna.


Bibliografija

  1. Informatika: Udžbenik / Ured. prof. N.V. Makarova. M.: Financije i statistika 2007
  2. Informatika: Radionica računalne tehnologije / Ed. ur. prof. N.V. Makarova. M Financije i statistika, 2011.
  3. N.S. Piskunov. Diferencijalni i integralni račun, 2010. (monografija).
  4. Informatika, aproksimacija najmanjih kvadrata, smjernice, St. Petersburg, 2009.
Podučavanje

Trebate pomoć u proučavanju teme?

Naši stručnjaci savjetovat će vam ili pružiti usluge podučavanja o temama koje vas zanimaju.
Pošaljite svoju prijavu naznačite temu upravo sada kako biste saznali o mogućnosti dobivanja konzultacija.

Učitavam...Učitavam...