Метод на най-малките квадрати в Excel. Регресионен анализ

КУРСОВА РАБОТА

дисциплина: Информатика

Тема: Апроксимация на функция по метода на най-малките квадрати

Въведение

1. Постановка на проблема

2. Формули за изчисление

Изчисление с помощта на таблици, направени с помощта на Microsoft Excel

Диаграма на алгоритъма

Изчисление в MathCad

Резултати, получени с помощта на линейната функция

Представяне на резултатите под формата на графики

Въведение

Целта на курсовата работа е да задълбочи познанията по компютърни науки, да развие и затвърди умения за работа с процесора за електронни таблици Microsoft Excel и софтуерния продукт MathCAD и използването им за решаване на задачи с компютър от предметна област, свързана с научни изследвания.

Апроксимацията (от латинското "approximare" - "да се приближавам") ​​е приблизително изразяване на всякакви математически обекти (например числа или функции) чрез други, които са по-прости, по-удобни за използване или просто по-известни. В научните изследвания апроксимацията се използва за описване, анализиране, обобщаване и по-нататъшно използване на емпирични резултати.

Както е известно, може да има точна (функционална) връзка между количествата, когато една конкретна стойност съответства на една стойност на аргумента, и по-малко точна (корелационна) връзка, когато една конкретна стойност на аргумента съответства на приблизителна стойност или определен набор от функционални стойности, в една или друга степен близки една до друга. Когато провеждате научни изследвания, обработвате резултатите от наблюдение или експеримент, обикновено трябва да се справите с втория вариант.

При изучаване на количествените зависимости на различни показатели, чиито стойности се определят емпирично, като правило има известна променливост. Отчасти се определя от разнородността на изследваните обекти на неживата и особено от живата природа и отчасти се определя от грешката на наблюдението и количествената обработка на материалите. Последният компонент не винаги може да бъде напълно елиминиран, той може да бъде сведен до минимум чрез внимателен избор на адекватен метод на изследване и внимателна работа. Следователно, когато се извършва всякаква изследователска работа, възниква проблемът с идентифицирането на истинската природа на зависимостта на изследваните показатели, в една или друга степен, маскирани от неотчитането на променливостта: стойности. За тази цел се използва апроксимация - приблизително описание на корелационната зависимост на променливите чрез подходящо уравнение на функционалната зависимост, което предава основната тенденция на зависимостта (или нейната "тенденция").

При избора на приближение трябва да се изхожда от конкретния проблем на изследването. Обикновено колкото по-просто е уравнението, използвано за приближение, толкова по-приблизително е полученото описание на връзката. Ето защо е важно да се прочете колко значими и какво причинява отклоненията на конкретни стойности от резултантната тенденция. Когато се описва зависимостта на емпирично определени стойности, може да се постигне много по-голяма точност чрез използване на някои по-сложни, многопараметрични уравнения. Въпреки това, няма смисъл да се стремим да предаваме случайни отклонения на стойностите в конкретни серии от емпирични данни с максимална точност. Много по-важно е да се схване общата закономерност, която в случая най-логично и с приемлива точност се изразява именно чрез двупараметричното уравнение на степенна функция. По този начин, когато избира метод на приближение, изследователят винаги прави компромис: той решава до каква степен в този случай е препоръчително и целесъобразно да се „пожертват“ детайлите и съответно как най-общо трябва да се изрази зависимостта на сравняваните променливи. Наред с идентифицирането на модели, маскирани от случайни отклонения на емпирични данни от общия модел, апроксимацията също така позволява да се решат много други важни проблеми: формализиране на намерената зависимост; намерете неизвестни стойности на зависимата променлива чрез интерполация или, ако е подходящо, екстраполация.

Във всяка задача са формулирани условията на задачата, изходните данни, формата за издаване на резултати и са посочени основните математически зависимости за решаване на задачата. В съответствие с метода за решаване на задачата е разработен алгоритъм за решение, който е представен в графичен вид.

1. Постановка на проблема

1. Използвайки метода на най-малките квадрати, приближете функцията, дадена в таблицата:

а) полином от първа степен ;

б) полином от втора степен;

в) експоненциална зависимост.

За всяка зависимост изчислете коефициента на детерминизъм.

Изчислете коефициента на корелация (само в случай а).

За всяка зависимост начертайте линия на тенденция.

С помощта на функцията LINEST изчислете числените характеристики на зависимостта от.

Сравнете вашите изчисления с резултатите, получени с помощта на функцията LINEST.

Направете заключение коя от получените формули най-добре приближава функцията.

Напишете програма на един от езиците за програмиране и сравнете резултатите от изчисленията с получените по-горе.

Вариант 3. Функцията е дадена в таблицата. 1.

Маса 1.


2. Формули за изчисление

Често, когато се анализират емпирични данни, има нужда да се намери функционална зависимост между величините x и y, които се получават в резултат на опит или измервания.

Xi (независима стойност) се задава от експериментатора, а yi, наречени емпирични или експериментални стойности, се получава в резултат на експеримента.

Аналитичната форма на съществуващата функционална връзка между величините x и y обикновено е неизвестна, така че възниква практически важна задача - да се намери емпирична формула

, (1)

(където са параметрите), чиито стойности биха се различавали малко от експерименталните стойности.

Според метода на най-малките квадрати най-добрите коефициенти са тези, за които сумата от квадратните отклонения на намерената емпирична функция от дадените стойности на функцията ще бъде минимална.

Използвайки необходимото условие за екстремума на функция на няколко променливи - равенството на частните производни на нула, намираме набор от коефициенти, които осигуряват минимума на функцията, определена с формула (2), и получаваме нормална система за определяне на коефициентите :

(3)

Така намирането на коефициентите се свежда до решаване на система (3).

Видът на системата (3) зависи от класа емпирични формули, от които търсим зависимост (1). В случай на линейна зависимост системата (3) ще приеме формата:

(4)

В случай на квадратична зависимост системата (3) ще приеме формата:

(5)

В някои случаи като емпирична формула се приема функция, в която неопределените коефициенти влизат нелинейно. В този случай понякога проблемът може да бъде линеаризиран, т.е. намали до линейно. Такива зависимости включват експоненциалната зависимост

където a1 и a2 са недефинирани коефициенти.

Линеаризацията се постига чрез вземане на логаритъм на равенство (6), след което се получава отношението

(7)

Нека означим и съответно с и , тогава зависимостта (6) може да бъде записана във вида , което ни позволява да приложим формули (4) със замяна на a1 с и с .

Графиката на реконструираната функционална зависимост y(x) въз основа на резултатите от измерването (xi, yi), i=1,2,…,n се нарича регресионна крива. За да се провери съответствието на построената регресионна крива с експерименталните резултати, обикновено се въвеждат следните числени характеристики: коефициент на корелация (линейна зависимост), корелационно отношение и коефициент на детерминация.

Коефициентът на корелация е мярка за линейната връзка между зависимите случайни променливи: той показва колко добре средно една от променливите може да бъде представена като линейна функция на другата.

Коефициентът на корелация се изчислява по формулата:

(8)

(9)

където е средноаритметичната стойност на x, y, съответно.

Коефициентът на корелация между случайните променливи по абсолютна стойност не надвишава 1. Колкото по-близо е до 1, толкова по-тясна е линейната връзка между x и y.

В случай на нелинейна корелация, условните средни стойности са разположени близо до кривата линия. В този случай се препоръчва да се използва корелационно съотношение като характеристика на силата на връзката, чието тълкуване не зависи от вида на изследваната зависимост.

Коефициентът на корелация се изчислява по формулата:

(10)

Където а числителят характеризира дисперсията на условните средни около безусловната средна.

Винаги. Равенство = съответства на произволни некорелирани стойности; = ако и само ако има точна функционална връзка между x и y. При линейна зависимост на y от x съотношението на корелация съвпада с квадрата на коефициента на корелация. Стойността се използва като индикатор за отклонението на регресията от линейната.

Коефициентът на корелация е мярка за корелацията между y и x във всякаква форма, но не може да даде представа за степента на приближаване на емпиричните данни до специална форма. За да разберете колко точно построената крива отразява емпиричните данни, се въвежда друга характеристика - коефициентът на детерминация.

Коефициентът на детерминизъм се определя по формулата:

където Sres = - остатъчна сума от квадрати, характеризираща отклонението на експерименталните данни от теоретичните total - обща сума от квадрати, където средната стойност е yi.

- регресионна сума от квадрати, характеризиращи разпространението на данните.

Колкото по-малка е остатъчната сума на квадратите в сравнение с общата сума на квадратите, толкова по-голям е коефициентът на определяне, r2, който измерва колко добре регресионното уравнение обяснява връзките между променливите. Ако е равно на 1, тогава има пълна корелация с модела, т.е. няма разлика между действителните и прогнозните стойности на y. В обратния случай, ако коефициентът на определяне е 0, тогава регресионното уравнение е неуспешно при прогнозиране на стойностите на y.

Коефициентът на детерминизъм винаги не надвишава съотношението на корелация. В случай, че равенството е изпълнено, можем да приемем, че построената емпирична формула най-точно отразява емпиричните данни.

3. Изчисляване с помощта на таблици, направени с помощта на Microsoft Excel

За извършване на изчисления е препоръчително да подредите данните във формата на таблица 2, като използвате процесора за електронни таблици Microsoft Excel.

таблица 2












Нека обясним как се съставя Таблица 2.

Стъпка 1. В клетки A1: A25 въвеждаме стойностите xi.

Стъпка 2. В клетки B1:B25 въвеждаме стойностите на yi.

Стъпка 3. В клетка C1 въведете формулата = A1^2.

Стъпка 4. Тази формула се копира в клетки C1:C25.

Стъпка 5. В клетка D1 въведете формулата = A1 * B1.

Стъпка 6. Тази формула се копира в клетки D1:D25.

Стъпка 7. В клетка F1 въведете формулата = A1^4.

Стъпка 8. Тази формула се копира в клетки F1:F25.

Стъпка 9. В клетка G1 въведете формулата = A1^2*B1.

Стъпка 10. Тази формула се копира в клетки G1:G25.

Стъпка 11. В клетка H1 въведете формулата = LN(B1).

Стъпка 12. Тази формула се копира в клетки H1:H25.

Стъпка 13. В клетка I1 въведете формулата = A1*LN(B1).

Стъпка 14. Тази формула се копира в клетки I1:I25.

Извършваме следващите стъпки, като използваме автоматично сумиране S.

Стъпка 15. В клетка A26 въведете формулата = SUM(A1:A25).

Стъпка 16. В клетка B26 въведете формулата = SUM(B1:B25).

Стъпка 17. В клетка C26 въведете формулата = SUM(C1:C25).

Стъпка 18. В клетка D26 въведете формулата = SUM(D1:D25).

Стъпка 19. В клетка E26 въведете формулата = SUM(E1:E25).

Стъпка 20. В клетка F26 въведете формулата = SUM(F1:F25).

Стъпка 21. В клетка G26 въведете формулата = SUM(G1:G25).

Стъпка 22. В клетка H26 въведете формулата = SUM(H1:H25).

Стъпка 23. В клетка I26 въведете формулата = SUM(I1:I25).

Нека апроксимираме функцията с линейна функция. За определяне на коефициентите ще използваме система (4). Използвайки сумите от таблица 2, разположени в клетки A26, B26, C26 и D26, записваме система (4) във формата

(11)

решавайки което, получаваме И .

Системата е решена с помощта на метода на Крамер. Същността на която е следната. Да разгледаме система от n алгебрични линейни уравнения с n неизвестни:

(12)

Детерминантата на системата е детерминантата на системната матрица:

(13)

Нека означим - детерминантата, която се получава от детерминантата на системата Δ чрез заместване на j-тата колона с колоната

Така линейното приближение има формата

Решаваме система (11) с помощта на Microsoft Excel. Резултатите са представени в таблица 3.

Таблица 3











обратна матрица






В Таблица 3, в клетки A32:B33 е записана формулата (=MOBR(A28:B29)).

В клетки E32:E33 е записана формулата (=MULTIPLE(A32:B33),(C28:C29)).

След това апроксимираме функцията с квадратична функция . За определяне на коефициентите a1, a2 и a3 използваме система (5). Използвайки сумите от таблица 2, разположени в клетки A26, B26, C26, D26, E26, F26, G26, записваме система (5) във формата

(16)

решавайки което, получаваме a1=10.663624, И

По този начин квадратичното приближение има формата

Решаваме система (16) с помощта на Microsoft Excel. Резултатите са представени в таблица 4.

Таблица 4














обратна матрица







В таблица 4 в клетки A41:C43 е записана формулата (=MOBR(A36:C38)).

В клетки F41:F43 е записана формулата (=MULTIPLE(A41:C43),(D36:D38)).

Сега нека апроксимираме функцията с експоненциална функция. За да определим коефициентите и, вземаме логаритъма на стойностите и използвайки сумите от таблица 2, разположени в клетки A26, C26, H26 и I26, получаваме системата

(18)

След като решихме система (18), получаваме и .

След потенциране получаваме.

По този начин експоненциалното приближение има формата

Решаваме система (18) с помощта на Microsoft Excel. Резултатите са представени в таблица 5.

Таблица 5











обратна матрица




В клетки A50:B51 е записана формулата (=MOBR(A46:B47)).

В клетки E49:E50 е записана формулата (=MULTIPLE(A50:B51),(C46:C47)).

В клетка E51 е записана формулата =EXP(E49).

Нека изчислим средноаритметичното по формулите:

Резултатите от изчисленията с помощта на Microsoft Excel са представени в таблица 6.

Таблица 6



В клетка B54 е записана формулата = A26/25.

В клетка B55 е записана формулата = B26/25

Таблица 7


Стъпка 1. В клетка J1 въведете формулата = (A1-$B$54)*(B1-$B$55).

Стъпка 2. Тази формула се копира в клетки J2:J25.

Стъпка 3. В клетка K1 въведете формулата = (A1-$B$54)^2.

Стъпка 4. Тази формула се копира в клетки k2:K25.

Стъпка 5. В клетка L1 въведете формулата = (B1-$B$55)^2.

Стъпка 6. Тази формула се копира в клетки L2:L25.

Стъпка 7. В клетка M1 въведете формулата = ($E$32+$E$33*A1-B1)^2.

Стъпка 8. Тази формула се копира в клетки M2:M25.

Стъпка 9. В клетка N1 въведете формулата = ($F$41+$F$42*A1+$F$43*A1^2-B1)^2.

Стъпка 10. Тази формула се копира в клетки N2:N25.

Стъпка 11. В клетка O1 въведете формулата = ($E$51*EXP($E$50*A1)-B1)^2.

Стъпка 12. Тази формула се копира в клетки O2:O25.

Извършваме следващите стъпки с помощта на автоматично сумиране S.

Стъпка 13. В клетка J26 въведете формулата = SUM(J1:J25).

Стъпка 14. В клетка K26 въведете формулата = SUM(K1:K25).

Стъпка 15. В клетка L26 въведете формулата = CUM(L1:L25).

Стъпка 16. В клетка M26 въведете формулата = SUM(M1:M25).

Стъпка 17. В клетка N26 въведете формулата = SUM(N1:N25).

Стъпка 18. В клетка O26 въведете формулата = SUM(O1:O25).

Сега нека изчислим коефициента на корелация, използвайки формула (8) (само за линейно приближение) и коефициента на детерминация, използвайки формула (10). Резултатите от изчисленията с помощта на Microsoft Excel са представени в таблица 8.

Таблица 8


Коефициент на корелация

Коефициент на детерминизъм (линейно приближение)



Коефициент на детерминизъм (квадратично приближение)



Коефициент на детерминизъм (експоненциално приближение)



В клетка E57 формулата е написана =J26/(K26*L26)^(1/2).

В клетка E59 е записана формулата = 1-M26/L26.

В клетка E61 е записана формулата = 1-N26/L26.

В клетка E63 е записана формулата = 1-O26/L26.

Анализът на резултатите от изчисленията показва, че квадратичното приближение най-добре описва експерименталните данни.

Диаграма на алгоритъма

Ориз. 1. Алгоритъмна диаграма за изчислителната програма.

5. Изчисляване в MathCad

Линейна регресия

· линия (x, y) - вектор от два елемента (b, a) коефициенти на линейна регресия b+ax;

· x - вектор на реални аргументни данни;

· y е вектор от реални стойности на данни с еднакъв размер.

Фигура 2.

Полиномиалната регресия означава апроксимиране на данните (x1, y1) с полином от степен k. За k=i полиномът е права линия, за k=2 - парабола, за k=3 - кубична парабола и т.н. По правило на практика к<5.

· regress (x,y,k) - вектор от коефициенти за построяване на полиномна регресия на данни;

· interp (s,x,y,t) - резултатът от полиномна регресия;

· s=регресия(x,y,k);

· x е вектор от реални аргументни данни, чиито елементи са подредени във възходящ ред;

· y е вектор от реални стойности на данни с еднакъв размер;

· k - степен на регресионен полином (цяло положително число);

· t - стойността на аргумента на регресионния полином.

Фигура 3

В допълнение към обсъдените, в Mathcad са вградени още няколко типа трипараметрична регресия; тяхното изпълнение се различава донякъде от горните опции за регресия, тъй като за тях, в допълнение към масива от данни, е необходимо да се уточнят някои начални стойности на коефициентите a, b, c. Използвайте подходящия тип регресия, ако имате добра представа какъв вид зависимост описва вашия набор от данни. Когато даден тип регресия не отразява добре последователност от данни, резултатът често е незадоволителен и дори много различен в зависимост от избора на начални стойности. Всяка от функциите произвежда вектор от прецизирани параметри a, b, c.

Резултати, получени с помощта на функцията LINEST

Нека да разгледаме целта на функцията LINEST.

Тази функция използва най-малките квадрати, за да изчисли правата линия, която най-добре отговаря на наличните данни.

Функцията връща масив, който описва получения ред. Уравнението за права линия е:

M1x1 + m2x2 + ... + b или y = mx + b,

таблица алгоритъм софтуер на microsoft

където зависимата стойност y е функция на независимата стойност x. Стойностите на m са коефициентите, съответстващи на всяка независима променлива x, а b е константа. Обърнете внимание, че y, x и m могат да бъдат вектори.

За да получите резултатите, трябва да създадете таблична формула, която ще заема 5 реда и 2 колони. Този интервал може да се намира навсякъде в работния лист. През този интервал трябва да въведете функцията LINEST.

В резултат на това всички клетки от интервала A65:B69 трябва да бъдат запълнени (както е показано в таблица 9).

Таблица 9.



Нека обясним предназначението на някои от количествата, разположени в таблица 9.

Стойностите, разположени в клетки A65 и B65, характеризират съответно наклона и отместването - коефициент на детерминация - F-наблюдавана стойност - брой степени на свобода - регресионна сума от квадрати - остатъчна сума от квадрати.

Представяне на резултатите под формата на графики

Ориз. 4. Линейна апроксимационна графика

Ориз. 5. Квадратна апроксимационна графика

Ориз. 6. Графика за експоненциално напасване

заключения

Нека направим изводи въз основа на резултатите от получените данни.

Анализът на резултатите от изчисленията показва, че квадратичното приближение най-добре описва експерименталните данни, т.к. тренд линията за него най-точно отразява поведението на функцията в тази област.

Сравнявайки резултатите, получени с помощта на функцията LINEST, виждаме, че те напълно съвпадат с извършените по-горе изчисления. Това показва, че изчисленията са правилни.

Резултатите, получени с помощта на програмата MathCad, напълно съвпадат със стойностите, дадени по-горе. Това показва точността на изчисленията.

Библиография

1 B.P. Демидович, И.А. Кестеняво. Основи на изчислителната математика. М: Държавно издателство за физико-математическа литература.

2 Информатика: Учебник, изд. проф. Н.В. Макарова. М: Финанси и статистика, 2007 г.

3 Информатика: Уъркшоп по компютърни технологии, изд. проф. Н.В. Макарова. М: Финанси и статистика, 2010.

4 V.B. Комягин. Програмиране в Excel с помощта на Visual Basic. М: Радио и комуникация, 2007.

5 Н. Никол, Р. Албрехт. Excel. Електронни таблици. М: Изд. "ЕКОМ", 2008г.

6 Указания за изпълнение на курсова работа по компютърни науки (за задочни студенти от всички специалности), изд. Журова Г. Н., Държавен хидрологичен институт в Санкт Петербург (ТУ), 2011 г.

Което намира най-широко приложение в различни области на науката и практическата дейност. Това може да бъде физика, химия, биология, икономика, социология, психология и така нататък и така нататък. По волята на съдбата често ми се налага да се справям с икономиката и затова днес ще организирам за вас пътуване до една невероятна страна, наречена Иконометрия=) ...Как да не искаш?! Там е много добре - просто трябва да вземете решение! ...Но това, което вероятно определено искате, е да се научите как да решавате проблеми метод на най-малките квадрати. И особено прилежните читатели ще се научат да ги решават не само точно, но и МНОГО БЪРЗО ;-) Но първо общо изложение на проблема+ придружаващ пример:

Нека да изследваме показатели в определена предметна област, които имат количествено изражение. В същото време има всички основания да се смята, че индикаторът зависи от индикатора. Това предположение може да бъде или научна хипотеза, или да се основава на основен здрав разум. Да оставим науката настрана обаче и да разгледаме по-апетитните области – а именно хранителните магазини. Да означим с:

– търговска площ на магазин за хранителни стоки, кв.м.,
– годишен оборот на магазин за хранителни стоки, милиона рубли.

Абсолютно ясно е, че колкото по-голяма е площта на магазина, толкова по-голям в повечето случаи ще бъде неговият оборот.

Да предположим, че след извършване на наблюдения/експерименти/изчисления/танци с тамбура имаме на разположение числени данни:

С магазините за хранителни стоки мисля, че всичко е ясно: - това е площта на 1-ви магазин, - годишният му оборот, - площта на 2-ри магазин, - годишният му оборот и т.н. Между другото, изобщо не е необходимо да имате достъп до класифицирани материали - доста точна оценка на търговския оборот може да се получи с помощта на математическа статистика. Но нека не се разсейваме, курсът по търговски шпионаж вече е платен =)

Табличните данни също могат да бъдат записани под формата на точки и изобразени в познатата форма Декартова система .

Да отговорим на един важен въпрос: Колко точки са необходими за качествено изследване?

Колкото по-голям, толкова по-добре. Минималният приемлив набор се състои от 5-6 точки. Освен това, когато количеството данни е малко, „аномалните“ резултати не могат да бъдат включени в извадката. Така например малък елитен магазин може да спечели порядъци повече от „колегите си“, като по този начин изкриви общия модел, който трябва да намерите!

Казано много просто, трябва да изберем функция, графиккойто минава възможно най-близо до точките . Тази функция се нарича приближаващ (приближение - приближение)или теоретична функция . Най-общо казано, тук веднага се появява очевиден „претендент“ - полином с висока степен, чиято графика минава през ВСИЧКИ точки. Но тази опция е сложна и често просто неправилна. (тъй като графиката ще се „върти“ през цялото време и ще отразява слабо основната тенденция).

По този начин търсената функция трябва да бъде доста проста и в същото време адекватно да отразява зависимостта. Както може би се досещате, един от методите за намиране на такива функции се нарича метод на най-малките квадрати. Първо, нека да разгледаме неговата същност в общи линии. Нека някаква функция апроксимира експериментални данни:


Как да оценим точността на това приближение? Нека изчислим и разликите (отклоненията) между експерименталните и функционалните стойности (изучаваме чертежа). Първата мисъл, която идва на ум, е да преценим колко голяма е сумата, но проблемът е, че разликите могат да бъдат отрицателни (Например, ) и отклоненията в резултат на такова сумиране ще се компенсират взаимно. Следователно, като оценка на точността на приближението, е необходимо да се вземе сумата модулиотклонения:

или свито: (ако някой не знае: – това е иконата на сумата и – спомагателна променлива „брояч“, която приема стойности от 1 до ).

Чрез приближаване на експериментални точки с различни функции, ще получим различни стойности и очевидно, когато тази сума е по-малка, тази функция е по-точна.

Такъв метод съществува и се нарича метод на най-малък модул. На практика обаче той стана много по-разпространен метод на най-малките квадрати, при които възможните отрицателни стойности се елиминират не от модула, а чрез квадратиране на отклоненията:

, след което усилията са насочени към избор на функция, така че сумата на квадратите на отклоненията беше възможно най-малък. Всъщност от тук идва и името на метода.

И сега се връщаме към друг важен момент: както беше отбелязано по-горе, избраната функция трябва да е доста проста - но има и много такива функции: линеен , хиперболичен, експоненциален, логаритмичен, квадратна и т.н. И, разбира се, тук веднага бих искал да „намаля сферата на дейност“. Кой клас функции да избера за изследване? Примитивна, но ефективна техника:

– Най-лесният начин е да изобразите точки върху чертежа и анализирайте местоположението им. Ако те са склонни да се движат по права линия, тогава трябва да потърсите уравнение на права с оптимални стойности и . С други думи, задачата е да се намерят ТАКИВА коефициенти, така че сумата на квадратите на отклоненията да е най-малка.

Ако точките са разположени, например, по хипербола, тогава очевидно е ясно, че линейната функция ще даде лошо приближение. В този случай ние търсим най-„благоприятните“ коефициенти за уравнението на хипербола – тези, които дават минималния сбор от квадрати .

Сега имайте предвид, че и в двата случая говорим за функции на две променливи, чиито аргументи са търсени параметри на зависимост:

И по същество трябва да решим стандартен проблем - намери минимална функция на две променливи.

Нека си спомним нашия пример: да предположим, че точките на „магазин“ обикновено са разположени в права линия и има всички основания да се смята, че линейна зависимостоборот от търговски площи. Нека намерим ТАКИВА коефициенти “a” и “be”, така че сумата от квадратите на отклоненията беше най-малкият. Всичко е както обикновено - първо Частични производни от 1-ви ред. Според правило за линейностМожете да разграничите точно под иконата за сума:

Ако искате да използвате тази информация за есе или курсова работа, ще бъда много благодарен за връзката в списъка с източници; такива подробни изчисления ще намерите на няколко места:

Нека създадем стандартна система:

Ние намаляваме всяко уравнение с „две“ и в допълнение „разбиваме“ сумите:

Забележка : независимо анализирайте защо „a“ и „be“ могат да бъдат извадени отвъд иконата за сума. Между другото, формално това може да стане със сумата

Нека пренапишем системата в „приложна“ форма:

след което алгоритъмът за решаване на нашия проблем започва да се появява:

Знаем ли координатите на точките? Ние знаем. суми можем ли да го намерим? Лесно. Нека направим най-простото система от две линейни уравнения с две неизвестни(„а“ и „бъди“). Решаваме системата, напр. Методът на Крамер, в резултат на което получаваме неподвижна точка. Проверка достатъчно условие за екстремум, можем да проверим, че в този момент функцията достига точно минимум. Проверката включва допълнителни изчисления и затова ще я оставим зад кулисите (при необходимост може да се види липсващата рамка). Правим окончателното заключение:

функция по най-добрия начин (поне в сравнение с всяка друга линейна функция)сближава експерименталните точки . Грубо казано, неговата графика минава възможно най-близо до тези точки. В традицията иконометрияполучената апроксимираща функция също се нарича сдвоено уравнение на линейна регресия .

Разглежданият проблем е от голямо практическо значение. В нашата примерна ситуация, ур. ви позволява да предвидите какъв търговски оборот ("Игрек")магазинът ще има при една или друга стойност на търговската площ (едно или друго значение на "х"). Да, получената прогноза ще бъде само прогноза, но в много случаи ще се окаже доста точна.

Ще анализирам само един проблем с „реални“ числа, тъй като в него няма трудности - всички изчисления са на нивото на училищната програма за 7-8 клас. В 95 процента от случаите ще бъдете помолени да намерите само линейна функция, но в самия край на статията ще покажа, че не е по-трудно да намерите уравненията на оптималната хипербола, експоненциалната и някои други функции.

Всъщност остава само да раздадете обещаните лакомства - за да се научите да решавате подобни примери не само точно, но и бързо. Ние внимателно изучаваме стандарта:

Задача

В резултат на изследване на връзката между два показателя бяха получени следните двойки числа:

Използвайки метода на най-малките квадрати, намерете линейната функция, която най-добре приближава емпиричната (опитен)данни. Направете чертеж, върху който да построите експериментални точки и графика на апроксимиращата функция в декартова правоъгълна координатна система . Намерете сумата от квадратите на отклоненията между емпиричните и теоретичните стойности. Разберете дали функцията би била по-добра (от гледна точка на метода на най-малките квадрати)доближете експерименталните точки.

Моля, обърнете внимание, че значенията на „x“ са естествени и това има характерно смислово значение, за което ще говоря малко по-късно; но те, разбира се, могат да бъдат и дробни. Освен това, в зависимост от съдържанието на конкретна задача, стойностите на „X“ и „игра“ могат да бъдат напълно или частично отрицателни. Е, дадена ни е „безлична“ задача и започваме решение:

Намираме коефициентите на оптималната функция като решение на системата:

С цел по-компактен запис, променливата „брояч“ може да бъде пропусната, тъй като вече е ясно, че сумирането се извършва от 1 до .

По-удобно е да се изчислят необходимите количества в таблична форма:


Изчисленията могат да се извършват на микрокалкулатор, но е много по-добре да използвате Excel - както по-бързо, така и без грешки; вижте кратко видео:

Така получаваме следното система:

Тук можете да умножите второто уравнение по 3 и извадете 2-то от 1-вото уравнение член по член. Но това е късмет - на практика системите често не са подарък и в такива случаи спестява Методът на Крамер:
, което означава, че системата има уникално решение.

Да проверим. Разбирам, че не искате, но защо да пропускате грешки, когато те абсолютно не могат да бъдат пропуснати? Нека заместим намереното решение в лявата част на всяко уравнение на системата:

Получават се десните части на съответните уравнения, което означава, че системата е решена правилно.

Така желаната апроксимираща функция: – от всички линейни функцииТя е тази, която най-добре приближава експерименталните данни.

За разлика от прав зависимост на оборота на магазина от неговата площ, установената зависимост е обратен (принцип "колкото повече, толкова по-малко"), и този факт веднага се разкрива от негатива наклон. функция ни казва, че с увеличаване на определен показател с 1 единица, стойността на зависимия показател намалява средно аритметичнос 0,65 единици. Както се казва, колкото по-висока е цената на елдата, толкова по-малко се продава.

За да начертаем графиката на апроксимиращата функция, намираме нейните две стойности:

и изпълнете чертежа:


Построената права се нарича тренд линия (а именно линейна линия на тенденция, т.е. в общия случай тенденцията не е непременно права линия). Всеки е запознат с израза „да бъдеш в тенденция“ и смятам, че този термин не се нуждае от допълнителни коментари.

Нека изчислим сумата на квадратите на отклоненията между емпирични и теоретични стойности. Геометрично това е сумата от квадратите на дължините на сегментите „малина“. (две от които са толкова малки, че дори не се виждат).

Нека обобщим изчисленията в таблица:


Отново могат да се направят ръчно, за всеки случай ще дам пример за 1-ва точка:

но е много по-ефективно да го направите по вече познатия начин:

Повтаряме още веднъж: Какъв е смисълът на получения резултат?от всички линейни функции y функция индикаторът е най-малкият, тоест в своето семейство той е най-доброто приближение. И тук, между другото, последният въпрос на проблема не е случаен: какво ще стане, ако предложената експоненциална функция би ли било по-добре да сближим експерименталните точки?

Нека намерим съответната сума от квадратни отклонения - за да ги различим, ще ги обознача с буквата "епсилон". Техниката е абсолютно същата:


И отново, за всеки случай, изчисленията за 1-ва точка:

В Excel използваме стандартната функция EXP (синтаксисът може да бъде намерен в помощта на Excel).

Заключение: , което означава, че експоненциалната функция приближава експерименталните точки по-лошо от права линия .

Но тук трябва да се отбележи, че "по-лошо" е още не означава, Какво не е наред. Сега построих графика на тази експоненциална функция - и тя също минава близо до точките - толкова много, че без аналитични изследвания е трудно да се каже коя функция е по-точна.

Това завършва решението и се връщам към въпроса за естествените стойности на аргумента. В различни изследвания, обикновено икономически или социологически, естествените „X“ се използват за номериране на месеци, години или други равни интервали от време. Помислете например за следния проблем.

Аз съм математик и програмист. Най-големият скок, който направих в кариерата си, беше, когато се научих да казвам: "Не разбирам нищо!"Сега не ме е срам да кажа на светилото на науката, че ми чете лекция, че не разбирам какво ми говори той, светилото. И е много трудно. Да, да признаеш невежеството си е трудно и неудобно. Кой обича да признава, че не знае основите на нещо? Поради професията ми се налага да присъствам на голям брой презентации и лекции, където, признавам си, в по-голямата част от случаите искам да спя, защото нищо не разбирам. Но не разбирам, защото огромният проблем на настоящата ситуация в науката се крие в математиката. Предполага се, че всички слушатели са запознати с абсолютно всички области на математиката (което е абсурдно). Признаването, че не знаете какво е производно (ще говорим за това какво е малко по-късно), е срамно.

Но се научих да казвам, че не знам какво е умножение. Да, не знам какво е подалгебра върху алгебра на Лъжа. Да, не знам защо са необходими квадратни уравнения в живота. Между другото, ако сте сигурни, че знаете, тогава имаме за какво да говорим! Математиката е поредица от трикове. Математиците се опитват да объркат и сплашат обществеността; където няма объркване, няма репутация, няма авторитет. Да, престижно е да се говори на възможно най-абстрактен език, което е пълна глупост.

Знаете ли какво е производно? Най-вероятно ще ми кажете за границата на съотношението на разликата. В първата година по математика и механика в Санкт Петербургския държавен университет Виктор Петрович Хавин ми каза определенпроизводна като коефициент на първия член от реда на Тейлър на функцията в точка (това беше отделна гимнастика за определяне на реда на Тейлър без производни). Дълго време се смях на това определение, докато накрая разбрах за какво става дума. Производната не е нищо повече от проста мярка за това колко подобна е функцията, която диференцираме, с функцията y=x, y=x^2, y=x^3.

Сега имам честта да изнасям лекции на студенти, които страхувам сематематика. Ако те е страх от математиката, ние сме на същия път. Щом се опитате да прочетете някакъв текст и ви се струва, че е прекалено сложен, знайте, че е лошо написан. Твърдя, че няма нито една област на математиката, която да не може да се обсъжда „на пръсти“, без да се губи точност.

Задача за близкото бъдеще: Възложих на моите ученици да разберат какво е линеен квадратичен регулатор. Не се срамувайте, отделете три минути от живота си и последвайте връзката. Ако не разбирате нещо, значи сме на същия път. И аз (професионален математик-програмист) нищо не разбрах. И ви уверявам, че можете да разберете това „на пръстите си“. В момента не знам какво е, но ви уверявам, че ще успеем да го разберем.

И така, първата лекция, която ще изнеса на моите студенти, след като дотичат при мен ужасени и кажат, че линейно-квадратичният регулатор е ужасно нещо, което никога няма да овладеете в живота си, е методи на най-малките квадрати. Можете ли да решавате линейни уравнения? Ако четете този текст, най-вероятно не.

И така, при дадени две точки (x0, y0), (x1, y1), например (1,1) и (3,2), задачата е да се намери уравнението на правата, минаваща през тези две точки:

илюстрация

Този ред трябва да има уравнение като следното:

Тук алфа и бета са неизвестни за нас, но две точки от тази линия са известни:

Можем да напишем това уравнение в матрична форма:

Тук трябва да направим едно лирично отклонение: какво е матрица? Матрицата не е нищо повече от двуизмерен масив. Това е начин за съхраняване на данни; не трябва да му се придават други значения. От нас зависи как точно да интерпретираме дадена матрица. Периодично ще го тълкувам като линейно картографиране, периодично като квадратна форма, а понякога просто като набор от вектори. Всичко това ще бъде изяснено в контекста.

Нека заменим конкретните матрици с тяхното символно представяне:

Тогава (алфа, бета) могат лесно да бъдат намерени:

По-конкретно за нашите предишни данни:

Което води до следното уравнение на правата, минаваща през точките (1,1) и (3,2):

Добре, тук всичко е ясно. Нека намерим уравнението на правата, минаваща през нея триточки: (x0,y0), (x1,y1) и (x2,y2):

О-о-о, но имаме три уравнения за две неизвестни! Един стандартен математик ще каже, че няма решение. Какво ще каже програмистът? И той първо ще пренапише предишната система от уравнения в следната форма:

В нашия случай векторите i, j, b са триизмерни, следователно (в общия случай) няма решение на тази система. Всеки вектор (алфа\*i + бета\*j) лежи в равнината, обхваната от векторите (i, j). Ако b не принадлежи на тази равнина, тогава няма решение (не може да се постигне равенство в уравнението). Какво да правя? Да потърсим компромис. Нека означим с e(алфа, бета)колко точно не сме постигнали равенство:

И ние ще се опитаме да минимизираме тази грешка:

Защо квадрат?

Ние търсим не просто минимума на нормата, а минимума на квадрата на нормата. Защо? Самата минимална точка съвпада и квадратът дава гладка функция (квадратична функция на аргументите (алфа, бета)), докато просто дължината дава конусовидна функция, недиференцируема в минималната точка. брр. Квадратът е по-удобен.

Очевидно грешката е сведена до минимум, когато векторът дортогонална на равнината, обхваната от векторите азИ й.

Илюстрация

С други думи: търсим права линия, така че сумата от квадратите на дължините на разстоянията от всички точки до тази права линия да е минимална:

АКТУАЛИЗАЦИЯ: Имам проблем тук, разстоянието до правата линия трябва да се измерва вертикално, а не чрез ортогонална проекция. Този коментатор е прав.

Илюстрация

С напълно различни думи (внимателно, зле формализирани, но трябва да е ясно): вземаме всички възможни линии между всички двойки точки и търсим средната линия между всички:

Илюстрация

Друго обяснение е просто: прикрепяме пружина между всички точки от данни (тук имаме три) и правата линия, която търсим, и правата линия на равновесното състояние е точно това, което търсим.

Минимална квадратна форма

И така, даден е този вектор bи равнина, обхваната от колонните вектори на матрицата А(в този случай (x0,x1,x2) и (1,1,1)), ние търсим вектора дс минимална квадратна дължина. Очевидно минимумът е постижим само за вектора д, ортогонална на равнината, обхваната от колонните вектори на матрицата А:

С други думи, ние търсим вектор x=(алфа, бета), така че:

Нека ви напомня, че този вектор x=(алфа, бета) е минимумът на квадратичната функция ||e(алфа, бета)||^2:

Тук би било полезно да запомните, че матрицата може да се интерпретира и като квадратна форма, например матрицата на идентичност ((1,0),(0,1)) може да се интерпретира като функция x^2 + y^ 2:

квадратна форма

Цялата тази гимнастика е известна под името линейна регресия.

Уравнение на Лаплас с гранично условие на Дирихле

Сега най-простата истинска задача: има определена триъгълна повърхност, необходимо е да я изгладите. Например, нека заредим модел на моето лице:

Оригиналният ангажимент е наличен. За да минимизирам външните зависимости, взех кода на моя софтуерен рендер, който вече е на Habré. За решаване на линейна система използвам OpenNL, това е отличен солвър, който обаче е много труден за инсталиране: трябва да копирате два файла (.h+.c) в папката с вашия проект. Цялото изглаждане се извършва със следния код:

За (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&лице = лица[i]; за (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

Координатите X, Y и Z са разделими, изглаждам ги отделно. Тоест решавам три системи от линейни уравнения, всяка с брой променливи, равен на броя на върховете в моя модел. Първите n реда на матрица A имат само едно 1 на ред, а първите n реда на вектор b имат координатите на оригиналния модел. Тоест връзвам пружина между новата позиция на върха и старата позиция на върха - новите не трябва да се отдалечават много от старите.

Всички следващи редове на матрица A (faces.size()*3 = брой ръбове на всички триъгълници в мрежата) имат едно появяване на 1 и едно появяване на -1, като векторът b има нулеви противоположни компоненти. Това означава, че поставям пружина на всеки ръб на нашата триъгълна мрежа: всички ръбове се опитват да получат същия връх като тяхната начална и крайна точка.

Още веднъж: всички върхове са променливи и не могат да се движат далеч от първоначалната си позиция, но в същото време се опитват да станат подобни един на друг.

Ето резултата:

Всичко би било наред, моделът наистина е изгладен, но се е отдалечил от първоначалния си ръб. Нека променим малко кода:

За (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

В нашата матрица A, за върховете, които са на ръба, добавям не ред от категорията v_i = verts[i][d], а 1000*v_i = 1000*verts[i][d]. Какво променя? И това променя нашата квадратична форма на грешка. Сега едно отклонение от върха на ръба ще струва не една единица, както преди, а 1000*1000 единици. Тоест, окачихме по-силна пружина на крайните върхове, решението ще предпочете да опъне останалите по-силно. Ето резултата:

Нека удвоим силата на пружината между върховете:
nlКоефициент(лице[j], 2); nlКоефициент(лице[(j+1)%3], -2);

Логично е, че повърхността е станала по-гладка:

И сега дори сто пъти по-силен:

Какво е това? Представете си, че сме потопили телеен пръстен в сапунена вода. В резултат на това полученият сапунен филм ще се опита да има възможно най-малко кривина, докосвайки границата - нашия телеен пръстен. Точно това получихме, като фиксирахме границата и поискахме гладка повърхност отвътре. Поздравления, току-що решихме уравнението на Лаплас с гранични условия на Дирихле. Звучи яко? Но в действителност просто трябва да решите една система от линейни уравнения.

Уравнение на Поасон

Нека си спомним още едно готино име.

Да приемем, че имам изображение като това:

Изглежда добре на всички, но столът не ми харесва.

Ще разполовя снимката:



И ще избера стол с ръцете си:

След това ще дръпна всичко, което е бяло в маската в лявата част на картината, и в същото време в цялата картина ще кажа, че разликата между два съседни пиксела трябва да е равна на разликата между два съседни пиксела отдясно снимка:

За (int i=0; i

Ето резултата:

Пример от живота

Нарочно не направих облизани резултати, защото... Просто исках да покажа как точно можете да приложите методите на най-малките квадрати, това е код за обучение. Сега ще дам пример от живота:

Имам няколко снимки на мостри на тъкани като тази:

Моята задача е да правя безпроблемни текстури от снимки с такова качество. За начало търся (автоматично) повтарящ се модел:

Ако изрежа този четириъгълник направо, тогава поради изкривяване краищата няма да се срещнат, ето пример за модел, повторен четири пъти:

Скрит текст

Ето фрагмент, където шевът е ясно видим:

Затова няма да режа по права линия, ето линията на рязане:

Скрит текст

И ето модел, повторен четири пъти:

Скрит текст

И фрагмент от него, за да стане по-ясно:

Вече е по-добре, разрезът не вървеше по права линия, избягвайки всякакви къдрици, но шевът все още се вижда поради неравномерното осветление на оригиналната снимка. Тук на помощ идва методът на най-малките квадрати за уравнението на Поасон. Ето и крайния резултат след изравняване на осветлението:

Текстурата се оказа идеално безпроблемна и всичко това автоматично от снимка с много посредствено качество. Не се страхувайте от математиката, търсете прости обяснения и ще бъдете щастливи в инженерството.

След изравняване получаваме функция от следния вид: g (x) = x + 1 3 + 1 .

Можем да апроксимираме тези данни, като използваме линейната зависимост y = a x + b чрез изчисляване на съответните параметри. За да направим това, ще трябва да приложим така наречения метод на най-малките квадрати. Ще трябва също да направите чертеж, за да проверите коя линия ще подравни най-добре експерименталните данни.

Какво точно е OLS (метод на най-малките квадрати)

Основното, което трябва да направим, е да намерим такива коефициенти на линейна зависимост, при които стойността на функцията на две променливи F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 ще бъде най-малък. С други думи, за определени стойности на a и b, сумата от квадратните отклонения на представените данни от получената права линия ще има минимална стойност. Това е смисълът на метода на най-малките квадрати. Всичко, което трябва да направим, за да решим примера, е да намерим екстремума на функцията на две променливи.

Как да изведем формули за изчисляване на коефициентите

За да изведете формули за изчисляване на коефициентите, трябва да създадете и решите система от уравнения с две променливи. За да направим това, ние изчисляваме частните производни на израза F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 по отношение на a и b и ги приравняваме към 0.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

За да решите система от уравнения, можете да използвате всякакви методи, например заместване или метод на Крамер. В резултат на това трябва да имаме формули, които могат да се използват за изчисляване на коефициенти чрез метода на най-малките квадрати.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

Изчислихме стойностите на променливите, при които функцията
F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 ще приеме минималната стойност. В трети параграф ще докажем защо е точно така.

Това е приложението на метода на най-малките квадрати на практика. Неговата формула, която се използва за намиране на параметъра a, включва ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2, както и параметъра
n – обозначава количеството експериментални данни. Съветваме ви да изчислявате всяка сума поотделно. Стойността на коефициента b се изчислява непосредствено след a.

Да се ​​върнем към оригиналния пример.

Пример 1

Тук имаме n равно на пет. За да направим по-удобно изчисляването на необходимите суми, включени във формулите на коефициента, нека попълним таблицата.

i = 1 i=2 i=3 i=4 i=5 ∑ i = 1 5
x i 0 1 2 4 5 12
y i 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

Решение

Четвъртият ред включва данните, получени чрез умножаване на стойностите от втория ред по стойностите на третия за всеки отделен i. Петият ред съдържа данните от втория, на квадрат. Последната колона показва сумите на стойностите на отделните редове.

Нека използваме метода на най-малките квадрати, за да изчислим коефициентите a и b, от които се нуждаем. За да направите това, заменете необходимите стойности от последната колона и изчислете сумите:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33, 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Оказва се, че необходимата апроксимираща права линия ще изглежда като y = 0, 165 x + 2, 184. Сега трябва да определим кой ред ще приближи по-добре данните - g (x) = x + 1 3 + 1 или 0, 165 x + 2, 184. Нека оценим с помощта на метода на най-малките квадрати.

За да изчислим грешката, трябва да намерим сумата от квадратите на отклоненията на данните от правите линии σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 и σ 2 = ∑ i = 1 n (y i - g (x i)) 2, минималната стойност ще съответства на по-подходящ ред.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0,096

Отговор:тъй като σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0,165 x + 2,184.

Методът на най-малките квадрати е ясно показан на графичната илюстрация. Червената линия маркира правата линия g (x) = x + 1 3 + 1, синята линия маркира y = 0, 165 x + 2, 184. Оригиналните данни са обозначени с розови точки.

Нека обясним защо са необходими точно приближения от този тип.

Те могат да се използват в задачи, които изискват изглаждане на данни, както и в такива, при които данните трябва да бъдат интерполирани или екстраполирани. Например, в проблема, обсъден по-горе, може да се намери стойността на наблюдаваното количество y при x = 3 или при x = 6. На такива примери сме посветили отделна статия.

Доказателство за метода OLS

За да може функцията да приеме минимална стойност, когато се изчисляват a и b, е необходимо в дадена точка матрицата на квадратичната форма на диференциала на функцията под формата F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 е положително определено. Нека ви покажем как трябва да изглежда.

Пример 2

Имаме диференциал от втори ред от следната форма:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2 б

Решение

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

С други думи, можем да го запишем така: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

Получихме матрица с квадратична форма M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

В този случай стойностите на отделните елементи няма да се променят в зависимост от a и b. Тази матрица положително определена ли е? За да отговорим на този въпрос, нека проверим дали неговите ъглови минори са положителни.

Изчисляваме ъгловия минор от първи ред: 2 ∑ i = 1 n (x i) 2 > 0 . Тъй като точките x i не съвпадат, неравенството е строго. Ще имаме това предвид при по-нататъшни изчисления.

Изчисляваме второстепенния ъглов минор:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

След това пристъпваме към доказване на неравенството n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 с помощта на математическа индукция.

  1. Нека проверим дали това неравенство е валидно за произволно n. Нека вземем 2 и изчислим:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Получихме правилно равенство (ако стойностите x 1 и x 2 не съвпадат).

  1. Нека направим предположението, че това неравенство ще бъде вярно за n, т.е. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – вярно.
  2. Сега ще докажем валидността за n + 1, т.е. че (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, ако n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Изчисляваме:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1) - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

Изразът, ограден във фигурни скоби, ще бъде по-голям от 0 (въз основа на това, което предположихме в стъпка 2), а останалите членове ще бъдат по-големи от 0, тъй като всички те са квадрати от числа. Доказахме неравенството.

Отговор:намерените a и b ще съответстват на най-малката стойност на функцията F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, което означава, че те са необходимите параметри на метода на най-малките квадрати (LSM).

Ако забележите грешка в текста, моля, маркирайте я и натиснете Ctrl+Enter

КУРСОВА РАБОТА

Апроксимация на функция чрез метода на най-малките квадрати


Въведение

емпирично приближение на mathcad

Целта на курсовата работа е да задълбочи знанията по компютърни науки, да развие и консолидира умения за работа с процесора за електронни таблици Microsoft Excel и MathCAD. Използването им за решаване на проблеми с помощта на компютър от предметна област, свързана с изследване.

Във всяка задача са формулирани условията на проблема, изходните данни, формата за издаване на резултати, посочени са основните математически зависимости за решаване на проблема Контролното изчисление ви позволява да проверите правилната работа на програмата.

Концепцията за приближение е приблизителен израз на всякакви математически обекти (например числа или функции) чрез други, които са по-прости, по-удобни за използване или просто по-известни. В научните изследвания апроксимацията се използва за описване, анализиране, обобщаване и по-нататъшно използване на емпирични резултати.

Както е известно, може да има точна (функционална) връзка между количествата, когато една конкретна стойност съответства на една стойност на аргумента, и по-малко точна (корелационна) връзка, когато една конкретна стойност на аргумента съответства на приблизителна стойност или определен набор от функционални стойности, в една или друга степен близки една до друга. Когато провеждате научни изследвания, обработвате резултатите от наблюдение или експеримент, обикновено трябва да се справите с втория вариант. При изучаване на количествените зависимости на различни показатели, чиито стойности се определят емпирично, като правило има известна променливост. Отчасти се определя от разнородността на изследваните обекти на неживата и особено от живата природа и отчасти се определя от грешката на наблюдението и количествената обработка на материалите. Последният компонент не винаги може да бъде напълно елиминиран, той може да бъде сведен до минимум чрез внимателен избор на адекватен метод на изследване и внимателна работа.

Специалистите в областта на автоматизацията на технологичните процеси и производството работят с голям обем от експериментални данни, за чиято обработка се използва компютър. Изходните данни и получените резултати от изчисленията могат да бъдат представени в табличен вид с помощта на процесори за електронни таблици (електронни таблици) и по-специално Excel. Курсовата работа по компютърни науки позволява на студентите да консолидират и развиват умения за използване на основни компютърни технологии при решаване на проблеми в областта на професионалната дейност - система за компютърна алгебра от класа на системите за автоматизирано проектиране, фокусирана върху подготовката на интерактивни документи с изчисления и визуална поддръжка, е лесен за използване и се прилага за работа в екип.


1. Главна информация


Много често, особено когато се анализират емпирични данни, има нужда да се намери изрично функционална връзка между количествата хИ при, които се получават в резултат на измервания.

При аналитично изследване на връзката между две величини x и y се правят поредица от наблюдения и резултатът е таблица със стойности:


xx1 х1 хазхнyy1 г1 газYн

Тази таблица обикновено се получава в резултат на някои експерименти, в които х,(независима стойност) се задава от експериментатора и y,получени в резултат на опит. Следователно тези стойности y,ще ги наречем емпирични или експериментални стойности.

Между величините x и y има функционална връзка, но нейната аналитична форма обикновено е неизвестна, така че възниква практически важна задача - да се намери емпиричната формула


y =f (x; a 12,…, съм ), (1)


(Където а1 2 ,…,ам- параметри), стойностите на които при x = x,вероятно ще се различава малко от експерименталните стойности y, (i = 1,2,…, П).

Обикновено посочвайте класа функции (например набор от линейни, степенни, експоненциални и т.н.), от които е избрана функцията f(x), след което се определят най-добрите стойности на параметрите.

Ако заменим оригинала х,тогава получаваме теоретични стойности

YTаз= f (хаз; а 12……ам) , Където аз = 1,2,…, н.


Разлики газT- газ, се наричат ​​отклонения и представляват вертикални разстояния от точки Мазкъм графиката на емпиричната функция.

Според метода на най-малките квадрати най-добрите коефициенти а1 2 ,…,амтези, за които се разглежда сумата от квадратите на отклоненията на намерената емпирична функция от зададените стойности на функцията



ще бъде минимален.

Нека обясним геометричния смисъл на метода на най-малките квадрати.

Всяка двойка числа ( хаз, газ) от изходната таблица определя точката Мазна повърхността XOY.Използване на формула (1) за различни стойности на коефициентите а1 2 ,…,амможете да конструирате поредица от криви, които са графики на функция (1). Задачата е да се определят коефициентите а1 2 ,…,ампо такъв начин, че сумата от квадратите на вертикалните разстояния от точките Маз (хаз, газ) преди графиката на функция (1) да е най-малката (фиг. 1).



Изграждането на емпирична формула се състои от два етапа: изясняване на общия вид на тази формула и определяне на нейните най-добри параметри.

Ако естеството на връзката между тези величини x и г, тогава видът на емпиричната зависимост е произволен. Предпочитание се дава на прости формули с добра точност. Успешният избор на емпирична формула до голяма степен зависи от познанията на изследователя в предметната област, използвайки които той може да посочи класа функции от теоретични съображения. От голямо значение е представянето на получените данни в декартови или специални координатни системи (полулогаритмични, логаритмични и др.). От позицията на точките можете приблизително да познаете общата форма на зависимостта, като установите приликата между построената графика и проби от известни криви.

Определяне на най-добрите коефициенти а1 2,…, амвключени в емпиричната формула се произвеждат чрез добре известни аналитични методи.

За да се намери набор от коефициенти а1 2 …..ам, които доставят минимума на функцията S, дефинирана с формула (2), използваме необходимото условие за екстремума на функция на няколко променливи - равенството на частните производни на нула.

В резултат на това получаваме нормална система за определяне на коефициентите ааз(i = 1,2,…, м):



По този начин намирането на коефициентите аазсвежда до решаваща система (3). Тази система е опростена, ако емпиричната формула (1) е линейна по отношение на параметрите ааз, тогава системата (3) ще бъде линейна.


1.1 Линейна зависимост


Конкретната форма на системата (3) зависи от това от кой клас емпирични формули търсим зависимост (1). При линейна зависимост y = a1 + а2 хсистема (3) ще приеме формата:


Тази линейна система може да бъде решена по всеки известен метод (метод на Гаус, прости итерации, формули на Крамер).


1.2 Квадратна зависимост


При квадратична зависимост y = a1 + а2 x+a3х 2система (3) ще приеме формата:



1.3 Експоненциална зависимост


В някои случаи като емпирична формула се приема функция, в която неопределените коефициенти влизат нелинейно. В този случай понякога проблемът може да бъде линеаризиран, т.е. намали до линейно. Такива зависимости включват експоненциалната зависимост


y = a1 a2x (6)


къде 1И а 2, несигурни коефициенти.

Линеаризацията се постига чрез вземане на логаритъм на равенство (6), след което се получава отношението

ln y = ln a 1+а 2х (7)


Нека означим ln прии л.н ахсъответно чрез TИ ° С, то зависимостта (6) може да бъде записана във вида t = а1 + а2 х, което ни позволява да приложим формули (4) със замяната а1 На ° СИ приазНа Tаз


1.4 Елементи на корелационната теория


Графика на възстановената функционална зависимост y(x)според резултатите от измерването (x аз, приаз),i = 1,2, K, ннаречена регресионна крива. За да се провери съответствието на построената регресионна крива с експерименталните резултати, обикновено се въвеждат следните числени характеристики: коефициент на корелация (линейна зависимост), корелационно отношение и коефициент на детерминация. В този случай резултатите обикновено се групират и представят под формата на корелационна таблица. Всяка клетка от тази таблица показва числата нiJ - тези двойки (x, y), чиито компоненти попадат в съответните интервали за групиране за всяка променлива. Ако приемем, че дължините на интервалите на групиране (за всяка променлива) са равни една на друга, изберете центрове x аз(съответно приаз) от тези интервали и числа нiJ- като основа за изчисления.

Коефициентът на корелация е мярка за линейната връзка между зависимите случайни променливи: той показва колко добре средно една от променливите може да бъде представена като линейна функция на другата.

Коефициентът на корелация се изчислява по формулата:


където и са съответно средноаритметичното хИ при.

Коефициентът на корелация между случайните променливи по абсолютна стойност не надвишава 1. Колкото по-близо е |p| до 1, толкова по-тясна е линейната връзка между x и u.

В случай на нелинейна корелация, условните средни стойности са разположени близо до кривата линия. В този случай се препоръчва да се използва корелационно съотношение като характеристика на силата на връзката, чието тълкуване не зависи от вида на изследваната зависимост.

Коефициентът на корелация се изчислява по формулата:



Където наз = , нf= , а числителят характеризира дисперсията на условните средни y,относно абсолютната средна стойност г.

Винаги. Равенство = 0 съответства на некорелирани случайни променливи; = 1 ако и само ако има точна функционална връзка между ги х. При линейна зависимост гна x корелационното отношение съвпада с квадрата на корелационния коефициент. величина - ? 2 се използва като индикатор за регресионно отклонение от линейно.

Коефициентът на корелация е мярка за корелационната връзка гс хпод всякаква форма, но не може да даде представа за степента на близост на емпиричните данни до специална форма. За да разберете колко точно построената крива отразява емпиричните данни, се въвежда друга характеристика - коефициентът на детерминация.

За да го опишете, разгледайте следните количества. - обща сума на квадратите, където е средната стойност.

Можем да докажем следното равенство

Първият член е равен на Sres = и се нарича остатъчна сума от квадрати. Характеризира отклонението на експерименталното от теоретичното.

Вторият член е равен на Sreg = 2 и се нарича регресионна сума на квадратите и характеризира разпространението на данните.

Очевидно е вярно следното равенство: S пълен = С ост + С рег.

Коефициентът на детерминизъм се определя по формулата:



Колкото по-малка е остатъчната сума на квадратите в сравнение с общата сума на квадратите, толкова по-голяма е стойността на коефициента на детерминизъм r2 , което показва колко добре уравнението, получено чрез регресионен анализ, обяснява връзките между променливите. Ако е равно на 1, тогава има пълна корелация с модела, т.е. няма разлика между действителните и прогнозните стойности на y. В обратния случай, ако коефициентът на детерминизъм е 0, тогава регресионното уравнение е неуспешно при прогнозиране на стойностите на y

Коефициентът на детерминизъм винаги не надвишава съотношението на корелация. В случай, че равенството е изпълнено r 2 = тогава можем да приемем, че построената емпирична формула най-точно отразява емпиричните данни.


2. Постановка на проблема


1. Използвайки метода на най-малките квадрати, апроксимирайте функцията, дадена в таблицата

а) полином от първа степен;

б) полином от втора степен;

в) експоненциална зависимост.

За всяка зависимост изчислете коефициента на детерминизъм.

Изчислете коефициента на корелация (само в случай а).

За всяка зависимост начертайте линия на тенденция.

С помощта на функцията LINEST изчислете числените характеристики на зависимостта от.

Сравнете вашите изчисления с резултатите, получени с помощта на функцията LINEST.

Направете заключение коя от получените формули най-добре приближава функцията.

Напишете програма на един от езиците за програмиране и сравнете резултатите от изчисленията с получените по-горе.


3. Изходни данни


Функцията е дадена на фигура 1.



4. Изчисляване на приближения в табличния процесор Excel


За извършване на изчисления е препоръчително да използвате процесора за електронни таблици Microsoft Excel. И подредете данните, както е показано на фигура 2.



За целта въвеждаме:

· в клетки A6:A30 въвеждаме стойностите xi .

· в клетки B6:B30 въвеждаме стойностите на уi .

· в клетка C6 въведете формулата =A6^ 2.

· Тази формула се копира в клетки C7:C30.

· в клетка D6 въведете формулата =A6*B6.

· Тази формула се копира в клетки D7:D30.

· В клетка F6 въвеждаме формулата =A6^4.

· Тази формула се копира в клетки F7:F30.

· В клетка G6 въвеждаме формулата =A6^2*B6.

· Тази формула се копира в клетки G7:G30.

· В клетка H6 въведете формулата =LN(B6).

· Тази формула се копира в клетки H7:H30.

· в клетка I6 въведете формулата =A6*LN(B6).

· Тази формула се копира в клетки I7:I30. Извършваме следващите стъпки с помощта на автоматично сумиране

· в клетка A33 въведете формулата =SUM (A6:A30).

· в клетка B33 въведете формулата =SUM (B6:B30).

· в клетка C33 въведете формулата =SUM (C6:C30).

· в клетка D33 въведете формулата =SUM (D6:D30).

· в клетка E33 въведете формулата =SUM (E6:E30).

· в клетка F33 въведете формулата =SUM (F6:F30).

· В клетка G33 въведете формулата =SUM (G6:G30).

· В клетка H33 въведете формулата =SUM (H6:H30).

· в клетка I33 въведете формулата =SUM (I6:I30).

Нека апроксимираме функцията y = f(x) линейна функция y = a1 + а2х. За определяне на коефициентите a 1и а 2Нека използваме система (4). Използвайки сумите от таблица 2, разположени в клетки A33, B33, C33 и D33, записваме система (4) във формата



решавайки което получаваме a 1= -24,7164 и a2 = 11,63183

Така линейното приближение има формата y= -24,7164 + 11,63183x (12)

Система (11) беше решена с помощта на Microsoft Excel. Резултатите са представени на фигура 3:



В таблицата в клетки A38:B39 е записана формулата (=MOBR (A35:B36)). Клетки E38:E39 съдържат формулата (=МНОГО (A38:B39, C35:C36)).


След това приближаваме функцията y = f(x) чрез квадратична функция y = a1 + а2 x+a3 х2. За определяне на коефициентите a 12и а 3Нека използваме система (5). Използвайки сумите от таблица 2, разположени в клетки A33, B33, C33, D33, E33, F33 и G33, записваме система (5) във формата:



След като решим кое, получаваме a 1= 1,580946,а 2= -0,60819 и a3 = 0,954171 (14)

Така квадратичното приближение има формата:

y = 1,580946 -0,60819x +0,954171 x2

Система (13) беше решена с помощта на Microsoft Excel. Резултатите са представени на фигура 4.



В таблицата в клетки A46:C48 е записана формулата (=MOBR (A41:C43)). Клетки F46:F48 съдържат формулата (=МНОГО (A41:C43, D46:D48)).

Сега нека приближим функцията y = f(x) експоненциална функция y = a1 дa2x. За определяне на коефициентите а1 И а2 нека логаритмуваме стойностите гази използвайки сумите от таблица 2, разположени в клетки A26, C26, H26 и I26, получаваме системата:



Където с = ln(a1 ).

След като решихме система (10), намираме c =0,506435, а2 = 0.409819.

След потенциране получаваме a1 = 1,659365.

По този начин експоненциалното приближение има формата y = 1,659365*e0,4098194x

Система (15) беше решена с помощта на Microsoft Excel. Резултатите са представени на фигура 5.


В таблицата в клетки A55:B56 е записана формулата (=MOBR (A51:B52)). В клетки E54:E56 е записана формулата (=МНОЖЕСТВО (A51:B52, C51:C52)). Клетка E56 съдържа формулата =EXP(E54).

Нека изчислим средноаритметичното на x и y по формулите:



Резултати от изчислението x и гс помощта на Microsoft Excel са представени на фигура 6.



Клетка B58 съдържа формулата =A33/25. Клетка B59 съдържа формулата =B33/25.

таблица 2


Нека обясним как се компилира таблицата на фигура 7.

Клетките A6:A33 и B6:B33 вече са попълнени (вижте Фигура 2).

· в клетка J6 въведете формулата =(A6-$B$58)*(B6-$B$59).

· Тази формула се копира в клетки J7:J30.

· в клетка K6 въведете формулата =(A6-$B$58)^ 2.

· Тази формула се копира в клетки K7:K30.

· В клетка L6 въвеждаме формулата =(B1-$B$59)^2.

· Тази формула се копира в клетки L7:L30.

· в клетка M6 въвеждаме формулата =($E$38+$E$39*A6-B6)^2.

· Тази формула се копира в клетки M7:M30.

· в клетка N6 въвеждаме формулата =($F$46 +$F$47*A6 +$F$48*A6 L6-B6)^2.

· Тази формула се копира в клетки N7:N30.

· в клетка O6 въведете формулата =($E$56*EXP ($E$55*A6) - B6)^2.

· Тази формула се копира в клетки O7:O30.

Извършваме следващите стъпки с помощта на автоматично сумиране.

· в клетка J33 въведете формулата =CYMM (J6:J30).

· В клетка K33 въвеждаме формулата =SUM (K6:K30).

· в клетка L33 въведете формулата =CYMM (L6:L30).

· В клетка M33 въвеждаме формулата =SUM (M6:M30).

· в клетка N33 въведете формулата =SUM (N6:N30).

· в клетка O33 въведете формулата =SUM (06:030).

Сега нека изчислим коефициента на корелация, използвайки формула (8) (само за линейно приближение) и коефициента на детерминация, използвайки формула (10). Резултатите от изчисленията с помощта на Microsoft Excel са представени на фигура 7.



В таблица 8, в клетка B61 формулата е написана =J33/(K33*L33^(1/2). В клетка B62 формулата е написана =1 - M33/L33. В клетка B63 формулата е написана =1 - N33 /L33 В клетка B64 формулата е записана формула =1 - O33/L33.

Анализът на резултатите от изчисленията показва, че квадратичното приближение най-добре описва експерименталните данни.


4.1 Изграждане на графики в Excel


Изберете клетки A1:A25, след което отидете на съветника за диаграми. Нека изберем диаграма на разсейване. След като диаграмата е конструирана, щракнете с десния бутон върху линията на графиката и изберете добавяне на тренд линия (съответно линейна, експоненциална, степенна и полиномна от втора степен).

Линейна апроксимационна графика


Квадратична апроксимационна графика


Графика за експоненциално напасване.


5. Апроксимация на функция с помощта на MathCAD


Апроксимацията на данни, като се вземат предвид техните статистически параметри, принадлежи към проблемите на регресията. Те обикновено възникват при обработката на експериментални данни, получени в резултат на измервания на процеси или физични явления със статистически характер (като измервания в радиометрията и ядрената геофизика), или при високо ниво на смущения (шум). Задачата на регресионния анализ е да избере математически формули, които най-добре описват експерименталните данни.


.1 Линейна регресия


Линейната регресия в системата Mathcad се извършва с помощта на аргументни вектори хи четения Yфункции:

прихващане (x, y)- изчислява параметъра А1 , вертикално изместване на регресионната линия (виж фигурата)

наклон (x, y)- изчислява параметъра а2 , наклон на регресионната линия (виж фигурата)

y(x) = a1+a2*x


функция кор (y, y(x))изчислява Коефициент на корелация на Пиърсън.Колкото по-близо е до 1, толкова по-точно обработените данни съответстват на линейната връзка (вижте фигурата)

.2 Полиномиална регресия


Едномерна полиномна регресия с произволна степен n на полинома и с произволни координати на проби в Mathcad се изпълнява от функциите:

регресия (x, y, n)- изчислява вектора С,който съдържа коефициентите aiполином нта степен;

Стойности на коефициента aiмогат да бъдат извлечени от вектора Сфункция подматрица (S, 3, дължина (S) - 1, 0, 0).

Използваме получените стойности на коефициента в регресионното уравнение


y(x) = a1+a2*x+a3*x2 (виж снимката)

.3 Нелинейна регресия


За прости стандартни формули за приближение са предоставени редица нелинейни регресионни функции, в които параметрите на функцията се избират от програмата Mathcad.

Те включват функцията expfit (x, y, s),който връща вектор, съдържащ коефициентите а1, а2И a3експоненциална функция

y(x) = a1 ^exp (a2x) + a3.V вектор Свъвеждат се първоначалните стойности на коефициентите а1, а2И a3първо приближение.


Заключение


Анализът на резултатите от изчисленията показва, че линейното приближение най-добре описва експерименталните данни.

Резултатите, получени с помощта на програмата MathCAD, напълно съвпадат със стойностите, получени с помощта на Excel. Това показва точността на изчисленията.


Библиография

  1. Информатика: Учебник / Изд. проф. Н.В. Макарова. М.: Финанси и статистика 2007
  2. Информатика: Семинар по компютърни технологии / Изд. Изд. проф. Н.В. Макарова. М Финанси и статистика, 2011.
  3. Н.С. Пискунов. Диференциално и интегрално смятане, 2010.
  4. Информатика, апроксимация на най-малките квадрати, насоки, Санкт Петербург, 2009 г.
Обучение

Нуждаете се от помощ при изучаване на тема?

Нашите специалисти ще съветват или предоставят услуги за обучение по теми, които ви интересуват.
Изпратете вашата кандидатурапосочване на темата точно сега, за да разберете за възможността за получаване на консултация.

Зареждане...Зареждане...