Méthode des moindres carrés dans Excel. Analyse de régression

TRAVAIL DE COURS

discipline : Informatique

Sujet : approximation de fonctions par la méthode des moindres carrés

Introduction

1. Énoncé du problème

2. Formules de calcul

Calcul à l'aide de tableaux réalisés à l'aide de Microsoft Excel

Diagramme d'algorithme

Calcul dans MathCad

Résultats obtenus à l'aide de la fonction Linéaire

Présentation des résultats sous forme de graphiques

Introduction

Le but du cours est d'approfondir les connaissances en informatique, de développer et de consolider les compétences nécessaires pour travailler avec le tableur Microsoft Excel et le logiciel MathCAD et de les utiliser pour résoudre des problèmes à l'aide d'un ordinateur dans un domaine lié à la recherche.

L'approximation (du latin "approximare" - "se rapprocher") est une expression approximative de tout objet mathématique (par exemple, des nombres ou des fonctions) à travers d'autres plus simples, plus pratiques à utiliser ou simplement mieux connus. Dans la recherche scientifique, l'approximation est utilisée pour décrire, analyser, généraliser et utiliser davantage des résultats empiriques.

Comme on le sait, il peut y avoir une connexion (fonctionnelle) exacte entre les quantités, lorsqu'une valeur spécifique correspond à une valeur de l'argument, et une connexion (de corrélation) moins précise, lorsqu'une valeur spécifique de l'argument correspond à une valeur approximative ou un certain ensemble de valeurs de fonction, à un degré ou à un autre proches les unes des autres. Lorsque vous effectuez des recherches scientifiques, traitez les résultats d'une observation ou d'une expérience, vous devez généralement faire face à la deuxième option.

Lors de l'étude des dépendances quantitatives de divers indicateurs, dont les valeurs sont déterminées empiriquement, il existe en règle générale une certaine variabilité. Elle est en partie déterminée par l'hétérogénéité des objets étudiés de nature inanimée et, surtout, vivante, et en partie elle est déterminée par l'erreur d'observation et de traitement quantitatif des matériaux. Le dernier élément ne peut pas toujours être complètement éliminé ; il ne peut être minimisé que par une sélection minutieuse d'une méthode de recherche adéquate et un travail minutieux. Ainsi, lors de la réalisation de tout travail de recherche, se pose le problème d'identifier la véritable nature de la dépendance des indicateurs étudiés, tel ou tel degré masqué par la non-prise en compte de la variabilité : les valeurs. À cette fin, une approximation est utilisée - une description approximative de la dépendance de corrélation des variables par une équation de dépendance fonctionnelle appropriée qui traduit la tendance principale de la dépendance (ou sa « tendance »).

Lors du choix d’une approximation, il faut partir du problème de recherche spécifique. Généralement, plus l’équation utilisée pour l’approximation est simple, plus la description de la relation qui en résulte est approximative. Par conséquent, il est important de lire dans quelle mesure et quelles sont les causes des écarts de valeurs spécifiques par rapport à la tendance résultante. Lors de la description de la dépendance de valeurs déterminées empiriquement, une précision bien plus grande peut être obtenue en utilisant une équation multiparamétrique plus complexe. Cependant, il ne sert à rien de s'efforcer de transmettre avec une précision maximale les écarts aléatoires de valeurs dans des séries spécifiques de données empiriques. Il est bien plus important de saisir le schéma général qui, dans ce cas, est exprimé de la manière la plus logique et avec une précision acceptable précisément par l'équation à deux paramètres d'une fonction puissance. Ainsi, lors du choix d'une méthode d'approximation, le chercheur fait toujours un compromis : il décide dans quelle mesure dans ce cas il est conseillé et approprié de « sacrifier » les détails et, par conséquent, dans quelle mesure la dépendance des variables comparées doit être généralement exprimée. Outre l'identification de modèles masqués par des écarts aléatoires de données empiriques par rapport au modèle général, l'approximation permet également de résoudre de nombreux autres problèmes importants : formaliser la dépendance trouvée ; trouver les valeurs inconnues de la variable dépendante par interpolation ou, le cas échéant, extrapolation.

Dans chaque tâche, les conditions du problème, les données initiales, le formulaire de délivrance des résultats sont formulés et les principales dépendances mathématiques pour résoudre le problème sont indiquées. Conformément à la méthode de résolution du problème, un algorithme de solution est développé, présenté sous forme graphique.

1. Énoncé du problème

1. En utilisant la méthode des moindres carrés, approximez la fonction donnée dans le tableau :

a) un polynôme du premier degré ;

b) un polynôme du deuxième degré ;

c) dépendance exponentielle.

Pour chaque dépendance, calculez le coefficient de déterminisme.

Calculez le coefficient de corrélation (uniquement dans le cas a).

Pour chaque dépendance, tracez une ligne de tendance.

À l'aide de la fonction LINEST, calculez les caractéristiques numériques de la dépendance.

Comparez vos calculs avec les résultats obtenus à l'aide de la fonction LINEST.

Déterminez laquelle des formules résultantes se rapproche le mieux de la fonction.

Écrivez un programme dans l'un des langages de programmation et comparez les résultats des calculs avec ceux obtenus ci-dessus.

Option 3. La fonction est donnée dans le tableau. 1.

Tableau 1.


2. Formules de calcul

Souvent, lors de l'analyse de données empiriques, il est nécessaire de trouver une relation fonctionnelle entre les quantités x et y, obtenues à la suite d'une expérience ou de mesures.

Xi (valeur indépendante) est défini par l'expérimentateur, et yi, appelées valeurs empiriques ou expérimentales, est obtenu à la suite d'une expérience.

La forme analytique de la relation fonctionnelle existant entre les quantités x et y est généralement inconnue, donc une tâche pratiquement importante se pose : trouver une formule empirique

, (1)

(où sont les paramètres), dont les valeurs différaient peu des valeurs expérimentales.

Selon la méthode des moindres carrés, les meilleurs coefficients sont ceux pour lesquels la somme des écarts carrés de la fonction empirique trouvée par rapport aux valeurs de fonction données sera minime.

En utilisant la condition nécessaire pour l'extremum d'une fonction de plusieurs variables - l'égalité des dérivées partielles à zéro, on trouve un ensemble de coefficients qui fournissent le minimum de la fonction définie par la formule (2) et obtenons un système normal de détermination des coefficients :

(3)

Ainsi, trouver les coefficients se réduit à résoudre le système (3).

Le type de système (3) dépend de la classe de formules empiriques à partir de laquelle on recherche la dépendance (1). Dans le cas d'une dépendance linéaire, le système (3) prendra la forme :

(4)

Dans le cas d'une dépendance quadratique, le système (3) prendra la forme :

(5)

Dans certains cas, une fonction dans laquelle les coefficients incertains entrent de manière non linéaire est considérée comme une formule empirique. Dans ce cas, le problème peut parfois être linéarisé, c'est-à-dire réduire à linéaire. Ces dépendances incluent la dépendance exponentielle

où a1 et a2 sont des coefficients indéfinis.

La linéarisation est obtenue en prenant le logarithme d'égalité (6), après quoi on obtient la relation

(7)

Notons et respectivement par et , alors la dépendance (6) peut s'écrire sous la forme , ce qui permet d'appliquer les formules (4) en remplaçant a1 par et par .

Le graphique de la dépendance fonctionnelle reconstruite y(x) à partir des résultats de mesure (xi, yi), i=1,2,…,n est appelé courbe de régression. Pour vérifier l'accord de la courbe de régression construite avec les résultats expérimentaux, les caractéristiques numériques suivantes sont généralement introduites : coefficient de corrélation (dépendance linéaire), rapport de corrélation et coefficient de détermination.

Le coefficient de corrélation est une mesure de la relation linéaire entre les variables aléatoires dépendantes : il montre dans quelle mesure, en moyenne, l'une des variables peut être représentée comme une fonction linéaire de l'autre.

Le coefficient de corrélation est calculé à l'aide de la formule :

(8)

(9)

où est la moyenne arithmétique de x, y, respectivement.

Le coefficient de corrélation entre variables aléatoires en valeur absolue ne dépasse pas 1. Plus la relation linéaire entre x et y est proche de 1.

Dans le cas d'une corrélation non linéaire, les valeurs moyennes conditionnelles sont situées à proximité de la ligne courbe. Dans ce cas, il est recommandé d'utiliser comme caractéristique de la force de la connexion un rapport de corrélation dont l'interprétation ne dépend pas du type de dépendance étudié.

Le rapport de corrélation est calculé à l'aide de la formule :

(10)

et le numérateur caractérise la dispersion des moyennes conditionnelles autour de la moyenne inconditionnelle.

Toujours. Égalité = correspond à des valeurs aléatoires non corrélées ; = si et seulement s'il existe une connexion fonctionnelle exacte entre x et y. Dans le cas d'une dépendance linéaire de y sur x, le rapport de corrélation coïncide avec le carré du coefficient de corrélation. La valeur est utilisée comme indicateur de l’écart de la régression par rapport au linéaire.

Le rapport de corrélation est une mesure de la corrélation entre y et x sous quelque forme que ce soit, mais ne peut pas donner une idée du degré de proximité des données empiriques avec une forme particulière. Pour savoir avec quelle précision la courbe construite reflète les données empiriques, une autre caractéristique est introduite - le coefficient de détermination.

Le coefficient de déterminisme est déterminé par la formule :

où Sres = - somme des carrés résiduelle, caractérisant l'écart des données expérimentales par rapport aux données théoriques total - somme totale des carrés, où la valeur moyenne est yi.

- somme des carrés de régression caractérisant la diffusion des données.

Plus la somme des carrés résiduelle est petite par rapport à la somme totale des carrés, plus le coefficient de détermination, r2, qui mesure dans quelle mesure l'équation de régression explique les relations entre les variables. S'il est égal à 1, alors il existe une corrélation complète avec le modèle, c'est-à-dire il n'y a aucune différence entre les valeurs réelles et estimées de y. Dans le cas contraire, si le coefficient de détermination est 0, alors l'équation de régression ne parvient pas à prédire les valeurs de y.

Le coefficient de déterminisme ne dépasse toujours pas le rapport de corrélation. Dans le cas où l'égalité est satisfaite, nous pouvons supposer que la formule empirique construite reflète le plus fidèlement les données empiriques.

3. Calcul à l'aide de tableaux réalisés à l'aide de Microsoft Excel

Pour effectuer les calculs, il est conseillé de disposer les données sous forme de tableau 2, à l'aide du tableur Microsoft Excel.

Tableau 2












Expliquons comment le tableau 2 est compilé.

Étape 1. Dans les cellules A1:A25, nous entrons les valeurs xi.

Étape 2. Dans les cellules B1:B25, nous entrons les valeurs de yi.

Étape 3. Dans la cellule C1, entrez la formule = A1^2.

Étape 4. Cette formule est copiée dans les cellules C1:C25.

Étape 5. Dans la cellule D1, entrez la formule = A1 * B1.

Étape 6. Cette formule est copiée dans les cellules D1:D25.

Étape 7. Dans la cellule F1, entrez la formule = A1^4.

Étape 8. Cette formule est copiée dans les cellules F1:F25.

Étape 9. Dans la cellule G1, entrez la formule = A1^2*B1.

Étape 10. Cette formule est copiée dans les cellules G1:G25.

Étape 11. Dans la cellule H1, entrez la formule = LN(B1).

Étape 12. Cette formule est copiée dans les cellules H1:H25.

Étape 13. Dans la cellule I1, entrez la formule = A1*LN(B1).

Étape 14. Cette formule est copiée dans les cellules I1:I25.

Nous effectuons les étapes suivantes en utilisant la sommation automatique S.

Étape 15. Dans la cellule A26, entrez la formule = SUM(A1:A25).

Étape 16. Dans la cellule B26, entrez la formule = SUM(B1:B25).

Étape 17. Dans la cellule C26, entrez la formule = SUM(C1:C25).

Étape 18. Dans la cellule D26, entrez la formule = SUM(D1:D25).

Étape 19. Dans la cellule E26, entrez la formule = SUM(E1:E25).

Étape 20. Dans la cellule F26, entrez la formule = SUM(F1:F25).

Étape 21. Dans la cellule G26, entrez la formule = SUM(G1:G25).

Étape 22. Dans la cellule H26, entrez la formule = SUM(H1:H25).

Étape 23. Dans la cellule I26, entrez la formule = SUM(I1:I25).

Rapprochons la fonction avec une fonction linéaire. Pour déterminer les coefficients et nous utiliserons le système (4). En utilisant les totaux du tableau 2, situés dans les cellules A26, B26, C26 et D26, nous écrivons le système (4) sous la forme

(11)

en résolvant cela, nous obtenons Et .

Le système a été résolu grâce à la méthode de Cramer. Dont l'essence est la suivante. Considérons un système de n équations linéaires algébriques à n inconnues :

(12)

Le déterminant du système est le déterminant de la matrice du système :

(13)

Notons - le déterminant qui est obtenu à partir du déterminant du système Δ en remplaçant la j-ème colonne par la colonne

Ainsi, l’approximation linéaire a la forme

Nous résolvons le système (11) à l'aide de Microsoft Excel. Les résultats sont présentés dans le tableau 3.

Tableau 3











matrice inverse






Dans le tableau 3, dans les cellules A32:B33, la formule est écrite (=MOBR(A28:B29)).

Dans les cellules E32:E33, la formule est écrite (=MULTIPLE(A32:B33),(C28:C29)).

Ensuite, nous approximons la fonction avec une fonction quadratique . Pour déterminer les coefficients a1, a2 et a3, on utilise le système (5). En utilisant les totaux du tableau 2, situés dans les cellules A26, B26, C26, D26, E26, F26, G26, on écrit le système (5) sous la forme

(16)

en résolvant cela, nous obtenons a1=10,663624, Et

Ainsi, l’approximation quadratique a la forme

Nous résolvons le système (16) en utilisant Microsoft Excel. Les résultats sont présentés dans le tableau 4.

Tableau 4














matrice inverse







Dans le tableau 4, dans les cellules A41:C43, la formule est écrite (=MOBR(A36:C38)).

Dans les cellules F41:F43, la formule est écrite (=MULTIPLE(A41:C43),(D36:D38)).

Approchons maintenant la fonction avec une fonction exponentielle. Pour déterminer les coefficients et, on prend le logarithme des valeurs et, en utilisant les totaux du tableau 2, situés dans les cellules A26, C26, H26 et I26, on obtient le système

(18)

Après avoir résolu le système (18), nous obtenons et .

Après potentialisation, nous obtenons .

Ainsi, l’approximation exponentielle a la forme

Nous résolvons le système (18) en utilisant Microsoft Excel. Les résultats sont présentés dans le tableau 5.

Tableau 5











matrice inverse




Dans les cellules A50:B51, la formule est écrite (=MOBR(A46:B47)).

Dans les cellules E49:E50, la formule est écrite (=MULTIPLE(A50:B51),(C46:C47)).

Dans la cellule E51, la formule =EXP(E49) est écrite.

Calculons la moyenne arithmétique à l'aide des formules :

Les résultats des calculs utilisant Microsoft Excel sont présentés dans le tableau 6.

Tableau 6



Dans la cellule B54, la formule = A26/25 est écrite.

Dans la cellule B55 la formule s'écrit = B26/25

Tableau 7


Étape 1. Dans la cellule J1, entrez la formule = (A1-$B$54)*(B1-$B$55).

Étape 2. Cette formule est copiée dans les cellules J2:J25.

Étape 3. Dans la cellule K1, entrez la formule = (A1-$B$54)^2.

Étape 4. Cette formule est copiée dans les cellules k2:K25.

Étape 5. Dans la cellule L1, entrez la formule = (B1-$B$55)^2.

Étape 6. Cette formule est copiée dans les cellules L2:L25.

Étape 7. Dans la cellule M1, entrez la formule = ($E$32+$E$33*A1-B1)^2.

Étape 8. Cette formule est copiée dans les cellules M2 : M25.

Étape 9. Dans la cellule N1, entrez la formule = ($F$41+$F$42*A1+$F$43*A1^2-B1)^2.

Étape 10. Cette formule est copiée dans les cellules N2 : N25.

Étape 11. Dans la cellule O1, entrez la formule = ($E$51*EXP($E$50*A1)-B1)^2.

Étape 12. Cette formule est copiée dans les cellules O2:O25.

Nous effectuons les étapes suivantes en utilisant la sommation automatique S.

Étape 13. Dans la cellule J26, entrez la formule = SUM(J1:J25).

Étape 14. Dans la cellule K26, entrez la formule = SUM(K1:K25).

Étape 15. Dans la cellule L26, entrez la formule = CUM(L1:L25).

Étape 16. Dans la cellule M26, entrez la formule = SUM(M1:M25).

Étape 17. Dans la cellule N26, entrez la formule = SUM(N1:N25).

Étape 18. Dans la cellule O26, entrez la formule = SUM(O1:O25).

Calculons maintenant le coefficient de corrélation à l'aide de la formule (8) (uniquement pour l'approximation linéaire) et le coefficient de détermination à l'aide de la formule (10). Les résultats des calculs utilisant Microsoft Excel sont présentés dans le tableau 8.

Tableau 8


Coefficient de corrélation

Coefficient de déterminisme (approximation linéaire)



Coefficient de déterminisme (approximation quadratique)



Coefficient de déterminisme (approximation exponentielle)



Dans la cellule E57, la formule s'écrit =J26/(K26*L26)^(1/2).

Dans la cellule E59, la formule = 1-M26/L26 est écrite.

Dans la cellule E61, la formule = 1-N26/L26 est écrite.

Dans la cellule E63, la formule = 1-O26/L26 est écrite.

L'analyse des résultats de calcul montre que l'approximation quadratique décrit le mieux les données expérimentales.

Diagramme d'algorithme

Riz. 1. Schéma algorithmique du programme de calcul.

5. Calcul dans MathCad

Régression linéaire

· ligne (x, y) - vecteur de deux éléments (b, a) coefficients de régression linéaire b+ax ;

· x - vecteur de données d'argument réel ;

· y est un vecteur de valeurs de données réelles de même taille.

Figure 2.

La régression polynomiale signifie approximer les données (x1, y1) avec un polynôme du kième degré. Pour k=i, le polynôme est une ligne droite, pour k=2 - une parabole, pour k=3 - une parabole cubique, etc. En règle générale, en pratique k<5.

· régression (x,y,k) - vecteur de coefficients pour construire une régression polynomiale des données ;

· interp (s,x,y,t) - le résultat de la régression polynomiale ;

· s=régression(x,y,k);

· x est un vecteur de données d'arguments réels, dont les éléments sont classés par ordre croissant ;

· y est un vecteur de valeurs de données réelles de même taille ;

· k - degré de polynôme de régression (entier positif) ;

· t - la valeur de l'argument du polynôme de régression.

figure 3

En plus de ceux évoqués, plusieurs autres types de régression à trois paramètres sont intégrés à Mathcad ; leur mise en œuvre diffère quelque peu des options de régression ci-dessus dans la mesure où pour elles, en plus du tableau de données, il est nécessaire de spécifier certaines valeurs initiales ​​des coefficients a, b, c. Utilisez le type de régression approprié si vous avez une bonne idée du type de dépendance qui décrit votre ensemble de données. Lorsqu’un type de régression ne reflète pas bien une séquence de données, le résultat est souvent peu satisfaisant et même très différent selon le choix des valeurs initiales. Chacune des fonctions produit un vecteur de paramètres raffinés a, b, c.

Résultats obtenus à l'aide de la fonction LINEST

Regardons le but de la fonction LINEST.

Cette fonction utilise les moindres carrés pour calculer la droite qui correspond le mieux aux données disponibles.

La fonction renvoie un tableau qui décrit la ligne résultante. L'équation d'une droite est :

M1x1 + m2x2 + ... + b ou y = mx + b,

algorithme de table logiciel Microsoft

où la valeur dépendante y est fonction de la valeur indépendante x. Les valeurs de m sont les coefficients correspondant à chaque variable indépendante x, et b est une constante. Notez que y, x et m peuvent être des vecteurs.

Pour obtenir les résultats, vous devez créer une formule tabulaire qui occupera 5 lignes et 2 colonnes. Cet intervalle peut être situé n'importe où sur la feuille de calcul. Pendant cet intervalle, vous devez entrer la fonction LINEST.

En conséquence, toutes les cellules de l'intervalle A65:B69 doivent être remplies (comme indiqué dans le tableau 9).

Tableau 9.



Expliquons le but de certaines des quantités situées dans le tableau 9.

Les valeurs situées dans les cellules A65 et B65 caractérisent respectivement la pente et le décalage. - coefficient de détermination. - Valeur F observée. - nombre de degrés de liberté. - somme des carrés de régression. - somme des carrés résiduelle.

Présentation des résultats sous forme de graphiques

Riz. 4. Graphique d'approximation linéaire

Riz. 5. Graphique d'approximation quadratique

Riz. 6. Graphique d'ajustement exponentiel

conclusions

Tirons des conclusions sur la base des résultats des données obtenues.

L'analyse des résultats de calcul montre que l'approximation quadratique décrit le mieux les données expérimentales, car la ligne de tendance reflète le plus précisément le comportement de la fonction dans ce domaine.

En comparant les résultats obtenus à l'aide de la fonction LINEST, on constate qu'ils coïncident complètement avec les calculs effectués ci-dessus. Cela indique que les calculs sont corrects.

Les résultats obtenus à l'aide du programme MathCad coïncident tout à fait avec les valeurs​​données ci-dessus. Cela indique l'exactitude des calculs.

Bibliographie

1 P.B. Demidovitch, I.A. Bordeaux. Fondamentaux des mathématiques computationnelles. M : Maison d'édition d'État de littérature physique et mathématique.

2 Informatique : Manuel, éd. prof. N.V. Makarova. M : Finances et Statistiques, 2007.

3 Informatique : Atelier sur la technologie informatique, éd. prof. N.V. Makarova. M : Finances et Statistiques, 2010.

4 V.B. Komiaguine. Programmation sous Excel en utilisant Visual Basic. M : Radio et communication, 2007.

5 N. Nicole, R. Albrecht. Exceller. Feuilles de calcul. M : Éd. "ECOM", 2008.

6 Lignes directrices pour suivre des cours en informatique (pour les étudiants par correspondance de toutes spécialités), éd. Zhurova G. N., Institut hydrologique d'État (TU) de Saint-Pétersbourg, 2011.

Qui trouve l'application la plus large dans divers domaines de la science et de l'activité pratique. Cela peut être la physique, la chimie, la biologie, l’économie, la sociologie, la psychologie, etc. Par la volonté du destin, je dois souvent m'occuper de l'économie, et c'est pourquoi aujourd'hui je vais organiser pour vous un voyage dans un pays étonnant appelé Économétrie=) ...Comment peux-tu ne pas en vouloir ?! C'est très bien là-bas, il faut juste se décider ! ...Mais ce que vous voulez probablement, c'est apprendre à résoudre des problèmes méthode des moindres carrés. Et les lecteurs particulièrement assidus apprendront à les résoudre non seulement avec précision, mais aussi TRÈS RAPIDEMENT ;-) Mais d'abord énoncé général du problème+ exemple d'accompagnement :

Étudions les indicateurs dans un certain domaine qui ont une expression quantitative. En même temps, il y a tout lieu de croire que l'indicateur dépend de l'indicateur. Cette hypothèse peut être soit une hypothèse scientifique, soit être fondée sur le bon sens. Laissons cependant la science de côté et explorons des domaines plus appétissants, à savoir les épiceries. Notons par :

– surface commerciale d'une épicerie, m²,
– chiffre d'affaires annuel d'une épicerie, millions de roubles.

Il est tout à fait clair que plus la surface du magasin est grande, plus son chiffre d'affaires sera important dans la plupart des cas.

Supposons qu'après avoir effectué des observations/expériences/calculs/danses avec un tambourin nous disposions de données numériques :

Avec les épiceries, je pense que tout est clair : - c'est la superficie du 1er magasin, - son chiffre d'affaires annuel, - la superficie du 2ème magasin, - son chiffre d'affaires annuel, etc. À propos, il n'est pas du tout nécessaire d'avoir accès à des documents classifiés - une évaluation assez précise du chiffre d'affaires commercial peut être obtenue au moyen de statistiques mathématiques. Cependant ne nous laissons pas distraire, le cours d'espionnage commercial est déjà payant =)

Les données tabulaires peuvent également être écrites sous forme de points et représentées sous la forme familière Système cartésien .

Répondons à une question importante : Combien de points faut-il pour une étude qualitative ?

Le plus gros le meilleur. L'ensemble minimum acceptable se compose de 5 à 6 points. De plus, lorsque la quantité de données est faible, les résultats « anormaux » ne peuvent pas être inclus dans l’échantillon. Ainsi, par exemple, un petit magasin d'élite peut gagner des ordres de grandeur supérieurs à ceux de « ses collègues », faussant ainsi le modèle général que vous devez trouver !

Pour faire simple, nous devons sélectionner une fonction, calendrier qui passe au plus près des points . Cette fonction est appelée rapprochement (approximation - approximation) ou fonction théorique . D'une manière générale, un « concurrent » évident apparaît immédiatement ici : un polynôme de haut degré dont le graphique passe par TOUS les points. Mais cette option est compliquée et souvent tout simplement incorrecte. (puisque le graphique « bouclera » tout le temps et reflétera mal la tendance principale).

Ainsi, la fonction recherchée doit être assez simple et en même temps refléter adéquatement la dépendance. Comme vous pouvez le deviner, l'une des méthodes permettant de trouver de telles fonctions s'appelle méthode des moindres carrés. Tout d’abord, examinons son essence en termes généraux. Soit une fonction approximant les données expérimentales :


Comment évaluer la précision de cette approximation ? Calculons également les différences (écarts) entre les valeurs expérimentales et fonctionnelles (on étudie le dessin). La première pensée qui nous vient à l’esprit est d’estimer le montant de la somme, mais le problème est que les différences peuvent être négatives. (Par exemple, ) et les écarts résultant d’une telle sommation s’annuleront. Par conséquent, comme estimation de la précision de l’approximation, il convient de prendre la somme modulesécarts :

ou effondré : (au cas où quelqu'un ne le saurait pas : – c'est l'icône de somme, et – une variable auxiliaire « compteur », qui prend des valeurs de 1 à ).

En rapprochant des points expérimentaux avec différentes fonctions, nous obtiendrons des valeurs différentes, et évidemment, là où cette somme est plus petite, cette fonction est plus précise.

Une telle méthode existe et elle s'appelle méthode du moindre module. Cependant, dans la pratique, cette pratique est devenue beaucoup plus répandue. méthode des moindres carrés, dans lequel d'éventuelles valeurs négatives sont éliminées non pas par le module, mais en mettant au carré les écarts :

, après quoi les efforts visent à sélectionner une fonction telle que la somme des écarts au carré était aussi petit que possible. En fait, c’est de là que vient le nom de la méthode.

Et maintenant, nous revenons à un autre point important : comme indiqué ci-dessus, la fonction sélectionnée doit être assez simple - mais il existe également de nombreuses fonctions de ce type : linéaire , hyperbolique, exponentiel, logarithmique, quadratique etc. Et bien sûr, je voudrais ici immédiatement « réduire le champ d’activité ». Quelle classe de fonctions dois-je choisir pour la recherche ? Une technique primitive mais efficace :

– Le moyen le plus simple est de représenter des points sur le dessin et analyser leur emplacement. S'ils ont tendance à courir en ligne droite, vous devriez alors rechercher équation d'une droite avec des valeurs optimales et . En d'autres termes, la tâche consiste à trouver TELS coefficients afin que la somme des écarts carrés soit la plus petite.

Si les points sont situés, par exemple, le long hyperbole, alors il est évidemment clair que la fonction linéaire donnera une mauvaise approximation. Dans ce cas, nous recherchons les coefficients les plus « favorables » pour l'équation de l'hyperbole – ceux qui donnent la somme minimale des carrés .

Notez maintenant que dans les deux cas nous parlons de fonctions de deux variables, dont les arguments sont paramètres de dépendance recherchés:

Et essentiellement, nous devons résoudre un problème standard : trouver fonction minimale de deux variables.

Rappelons notre exemple : supposons que les points « magasins » aient tendance à être situés en ligne droite et il y a tout lieu de croire que dépendance linéaire chiffre d'affaires de l'espace de vente au détail. Trouvons TELS coefficients « a » et « be » tels que la somme des écarts au carré était le plus petit. Tout est comme d'habitude - d'abord Dérivées partielles du 1er ordre. Selon règle de linéarité Vous pouvez différencier juste sous l’icône somme :

Si vous souhaitez utiliser ces informations pour un essai ou une dissertation, je vous serai très reconnaissant pour le lien dans la liste des sources ; vous trouverez de tels calculs détaillés à quelques endroits :

Créons un système standard :

On réduit chaque équation par « deux » et, en plus, on « décompose » les sommes :

Note : analyser indépendamment pourquoi « a » et « être » peuvent être supprimés au-delà de l'icône de somme. Soit dit en passant, cela peut formellement être fait avec la somme

Réécrivons le système sous forme « appliquée » :

après quoi l'algorithme pour résoudre notre problème commence à émerger :

Connaissons-nous les coordonnées des points ? Nous savons. Les montants peut-on le trouver ? Facilement. Faisons le plus simple système de deux équations linéaires à deux inconnues(« un » et « être »). Nous résolvons le système, par exemple, La méthode de Cramer, grâce à quoi nous obtenons un point stationnaire. Vérification condition suffisante pour un extremum, on peut vérifier qu'à ce stade la fonction atteint exactement le minimum. Le contrôle implique des calculs supplémentaires et nous le laisserons donc en coulisses (si nécessaire, le cadre manquant peut être visualisé). Nous tirons la conclusion finale :

Fonction la meilleure façon (au moins par rapport à toute autre fonction linéaire) rapproche les points expérimentaux . Grosso modo, son graphique passe le plus près possible de ces points. Dans la tradition économétrie la fonction d'approximation résultante est également appelée équation de régression linéaire appariée .

Le problème à l'étude est d'une grande importance pratique. Dans notre exemple de situation, l’équation. vous permet de prédire quel chiffre d'affaires ("Igrec") le magasin aura à l'une ou l'autre valeur de la surface de vente (l’une ou l’autre signification de « x »). Oui, la prévision qui en résultera ne sera qu’une prévision, mais dans de nombreux cas, elle s’avérera assez précise.

Je n'analyserai qu'un seul problème avec des nombres « réels », car il ne présente aucune difficulté - tous les calculs sont au niveau du programme scolaire de la 7e à la 8e année. Dans 95 pour cent des cas, il vous sera demandé de trouver simplement une fonction linéaire, mais à la toute fin de l'article je montrerai qu'il n'est plus difficile de trouver les équations de l'hyperbole optimale, de l'exponentielle et de quelques autres fonctions.

En fait, il ne reste plus qu'à distribuer les cadeaux promis - afin que vous puissiez apprendre à résoudre de tels exemples non seulement avec précision, mais aussi rapidement. Nous étudions attentivement la norme :

Tâche

À la suite de l'étude de la relation entre deux indicateurs, les paires de nombres suivantes ont été obtenues :

À l’aide de la méthode des moindres carrés, trouvez la fonction linéaire qui se rapproche le mieux de la valeur empirique. (expérimenté) données. Faire un dessin sur lequel construire des points expérimentaux et un graphique de la fonction d'approximation dans un système de coordonnées rectangulaires cartésiennes . Trouvez la somme des carrés des écarts entre les valeurs empiriques et théoriques. Découvrez si la fonctionnalité serait meilleure (du point de vue de la méthode des moindres carrés) rapprocher les points expérimentaux.

Veuillez noter que les significations « x » sont naturelles, et cela a une signification significative caractéristique, dont je parlerai un peu plus tard ; mais ils peuvent bien sûr aussi être fractionnaires. De plus, selon le contenu d'une tâche particulière, les valeurs « X » et « jeu » peuvent être totalement ou partiellement négatives. Eh bien, on nous a confié une tâche « sans visage », et nous la commençons solution:

On trouve les coefficients de la fonction optimale comme solution du système :

Dans le but d'un enregistrement plus compact, la variable « compteur » peut être omise, car il est déjà clair que la sommation s'effectue de 1 à .

Il est plus pratique de calculer les montants requis sous forme de tableau :


Les calculs peuvent être effectués sur une microcalculatrice, mais il est bien préférable d'utiliser Excel - à la fois plus rapide et sans erreurs ; regardez une courte vidéo :

Ainsi, nous obtenons ce qui suit système:

Ici, vous pouvez multiplier la deuxième équation par 3 et soustraire la 2ème de la 1ère équation terme par terme. Mais c'est une chance - dans la pratique, les systèmes ne sont souvent pas un cadeau, et dans de tels cas, cela permet d'économiser La méthode de Cramer:
, ce qui signifie que le système a une solution unique.

Allons vérifier. Je comprends que vous ne le vouliez pas, mais pourquoi sauter les erreurs là où elles ne peuvent absolument pas être manquées ? Remplaçons la solution trouvée dans le côté gauche de chaque équation du système :

Les membres droits des équations correspondantes sont obtenus, ce qui signifie que le système est résolu correctement.

Ainsi, la fonction d’approximation recherchée : – de toutes les fonctions linéaires C'est elle qui se rapproche le mieux des données expérimentales.

Contrairement à droit dépendance du chiffre d'affaires du magasin à sa superficie, la dépendance trouvée est inverse (principe « plus, moins »), et ce fait est immédiatement révélé par le négatif pente. Fonction nous dit qu'avec une augmentation d'un certain indicateur de 1 unité, la valeur de l'indicateur dépendant diminue moyenne de 0,65 unités. Comme on dit, plus le prix du sarrasin est élevé, moins il est vendu.

Pour tracer le graphique de la fonction d'approximation, on retrouve ses deux valeurs :

et exécutez le dessin :


La droite construite s’appelle ligne de tendance (à savoir une ligne de tendance linéaire, c'est à dire que dans le cas général, une tendance n'est pas forcément une ligne droite). Tout le monde connaît l’expression « être à la mode » et je pense que ce terme n’a pas besoin de commentaires supplémentaires.

Calculons la somme des écarts au carré entre valeurs empiriques et théoriques. Géométriquement, c'est la somme des carrés des longueurs des segments « framboise » (dont deux sont si petits qu'ils ne sont même pas visibles).

Résumons les calculs dans un tableau :


Encore une fois, ils peuvent être effectués manuellement ; au cas où, je vais donner un exemple pour le 1er point :

mais il est bien plus efficace de le faire de la manière déjà connue :

Nous répétons encore une fois : Quelle est la signification du résultat obtenu ? Depuis toutes les fonctions linéaires fonction y l'indicateur est le plus petit, c'est-à-dire que dans sa famille c'est la meilleure approximation. Et ici, d'ailleurs, la dernière question du problème n'est pas fortuite : et si la fonction exponentielle proposée vaudrait-il mieux rapprocher les points expérimentaux ?

Trouvons la somme correspondante des écarts au carré - pour les distinguer, je les désignerai par la lettre « epsilon ». La technique est exactement la même :


Et encore, au cas où, les calculs pour le 1er point :

Dans Excel, nous utilisons la fonction standard EXP. (la syntaxe peut être trouvée dans l'aide d'Excel).

Conclusion: , ce qui signifie que la fonction exponentielle se rapproche moins bien des points expérimentaux qu'une ligne droite .

Mais ici, il convient de noter que « pire » est ça ne veut pas dire encore, ce qui est faux. Maintenant, j'ai construit un graphique de cette fonction exponentielle - et elle passe également à proximité des points - à tel point que sans recherche analytique, il est difficile de dire quelle fonction est la plus précise.

Ceci conclut la solution, et je reviens à la question des valeurs naturelles de l'argument. Dans diverses études, généralement économiques ou sociologiques, les « X » naturels sont utilisés pour numéroter les mois, les années ou d’autres intervalles de temps égaux. Considérons, par exemple, le problème suivant.

Je suis mathématicien et programmeur. Le plus grand pas que j'ai fait dans ma carrière a été lorsque j'ai appris à dire : "Je ne comprends rien!" Maintenant, je n'ai pas honte de dire au sommité de la science qu'il me donne une conférence, que je ne comprends pas ce que lui, le sommité, me dit. Et c'est très difficile. Oui, admettre son ignorance est difficile et embarrassant. Qui aime admettre qu’il ne connaît pas les bases de quelque chose ? De par mon métier, je dois assister à un grand nombre de présentations et de conférences, où, je l'avoue, dans la grande majorité des cas j'ai envie de dormir parce que je ne comprends rien. Mais je ne comprends pas, car l’énorme problème de la situation actuelle de la science réside dans les mathématiques. Cela suppose que tous les auditeurs connaissent absolument tous les domaines des mathématiques (ce qui est absurde). Admettre qu’on ne sait pas ce qu’est un dérivé (nous parlerons de ce que c’est un peu plus tard) est honteux.

Mais j'ai appris à dire que je ne sais pas ce qu'est la multiplication. Oui, je ne sais pas ce qu'est une sous-algèbre sur une algèbre de Lie. Oui, je ne sais pas pourquoi les équations quadratiques sont nécessaires dans la vie. Au fait, si vous êtes sûr de le savoir, alors nous avons de quoi parler ! Les mathématiques sont une série d'astuces. Les mathématiciens tentent de semer la confusion et d'intimider le public ; là où il n’y a pas de confusion, il n’y a pas de réputation, pas d’autorité. Oui, il est prestigieux de parler dans un langage aussi abstrait que possible, ce qui est un non-sens complet.

Savez-vous ce qu'est un dérivé ? Très probablement, vous me parlerez de la limite du rapport de différence. En première année de mathématiques et de mécanique à l'Université d'État de Saint-Pétersbourg, Viktor Petrovich Khavin m'a dit déterminé dérivée comme coefficient du premier terme de la série de Taylor de la fonction en un point (c'était une gymnastique distincte pour déterminer la série de Taylor sans dérivées). J'ai longtemps ri de cette définition jusqu'à ce que je comprenne enfin de quoi il s'agissait. La dérivée n'est rien de plus qu'une simple mesure de la similitude de la fonction que nous différencions avec la fonction y=x, y=x^2, y=x^3.

J'ai maintenant l'honneur de donner des conférences à des étudiants qui effrayé mathématiques. Si vous avez peur des mathématiques, nous sommes sur le même chemin. Dès que vous essayez de lire un texte et qu’il vous semble que c’est trop compliqué, sachez qu’il est mal écrit. J'affirme qu'il n'y a pas un seul domaine des mathématiques qui ne puisse être discuté « sur les doigts » sans perdre en précision.

Devoir pour le futur proche : J'ai demandé à mes étudiants de comprendre ce qu'est un régulateur quadratique linéaire. Ne soyez pas timide, passez trois minutes de votre vie et suivez le lien. Si vous ne comprenez rien, alors nous sommes sur le même chemin. Moi (un mathématicien-programmeur professionnel) je n’ai rien compris non plus. Et je vous assure que vous pouvez le comprendre « sur vos doigts ». Pour le moment, je ne sais pas ce que c'est, mais je vous assure que nous pourrons le découvrir.

Ainsi, la première conférence que je vais donner à mes étudiants après qu'ils soient venus me voir avec horreur et m'aient dit qu'un régulateur linéaire-quadratique est une chose terrible que vous ne maîtriserez jamais de votre vie est méthodes des moindres carrés. Pouvez-vous résoudre des équations linéaires ? Si vous lisez ce texte, ce n’est probablement pas le cas.

Ainsi, étant donné deux points (x0, y0), (x1, y1), par exemple (1,1) et (3,2), la tâche est de trouver l'équation de la droite passant par ces deux points :

illustration

Cette ligne devrait avoir une équation comme la suivante :

Ici alpha et bêta nous sont inconnus, mais deux points de cette droite sont connus :

On peut écrire cette équation sous forme matricielle :

Il convient ici de faire une digression lyrique : qu'est-ce qu'une matrice ? Une matrice n'est rien de plus qu'un tableau à deux dimensions. Il s’agit d’une manière de stocker des données ; aucune autre signification ne doit y être attachée. Cela dépend de nous exactement comment interpréter une certaine matrice. Périodiquement, je l'interpréterai comme une application linéaire, périodiquement comme une forme quadratique, et parfois simplement comme un ensemble de vecteurs. Tout cela sera clarifié dans son contexte.

Remplaçons les matrices concrètes par leur représentation symbolique :

Ensuite (alpha, bêta) peut être facilement trouvé :

Plus spécifiquement pour nos données précédentes :

Ce qui conduit à l'équation suivante de la droite passant par les points (1,1) et (3,2) :

D'accord, tout est clair ici. Trouvons l'équation de la droite passant par trois points : (x0,y0), (x1,y1) et (x2,y2) :

Oh-oh-oh, mais nous avons trois équations pour deux inconnues ! Un mathématicien standard dira qu’il n’y a pas de solution. Que dira le programmeur ? Et il va d’abord réécrire le système d’équations précédent sous la forme suivante :

Dans notre cas, les vecteurs i, j, b sont tridimensionnels, donc (dans le cas général) il n'y a pas de solution à ce système. Tout vecteur (alpha\*i + beta\*j) se trouve dans le plan couvert par les vecteurs (i, j). Si b n’appartient pas à ce plan, alors il n’y a pas de solution (l’égalité ne peut pas être obtenue dans l’équation). Ce qu'il faut faire? Cherchons un compromis. Notons par e(alpha, bêta) exactement jusqu'où nous n'avons pas atteint l'égalité :

Et nous allons essayer de minimiser cette erreur :

Pourquoi carré ?

Nous ne recherchons pas seulement le minimum de la norme, mais le minimum du carré de la norme. Pourquoi? Le point minimum lui-même coïncide, et le carré donne une fonction lisse (une fonction quadratique des arguments (alpha, bêta)), tandis que simplement la longueur donne une fonction en forme de cône, non différentiable au point minimum. Brr. Un carré est plus pratique.

Évidemment, l’erreur est minimisée lorsque le vecteur e orthogonal au plan couvert par les vecteurs je Et j.

Illustration

Autrement dit : on cherche une droite telle que la somme des carrés des longueurs des distances de tous les points à cette droite soit minimale :

MISE À JOUR : j'ai un problème ici, la distance à la ligne droite doit être mesurée verticalement, et non par projection orthogonale. Ce commentateur a raison.

Illustration

En termes complètement différents (soigneusement, mal formalisés, mais cela devrait être clair) : nous prenons toutes les lignes possibles entre toutes les paires de points et cherchons la ligne moyenne entre tous :

Illustration

Une autre explication est simple : nous attachons un ressort entre tous les points de données (ici nous en avons trois) et la droite que nous recherchons, et la droite de l’état d’équilibre est exactement ce que nous recherchons.

Forme quadratique minimale

Donc étant donné ce vecteur b et un plan engendré par les vecteurs colonnes de la matrice UN(dans ce cas (x0,x1,x2) et (1,1,1)), on cherche le vecteur e avec un carré minimum de longueur. Évidemment, le minimum n'est atteignable que pour le vecteur e, orthogonal au plan engendré par les vecteurs colonnes de la matrice UN:

Autrement dit, on recherche un vecteur x=(alpha, beta) tel que :

Je vous rappelle que ce vecteur x=(alpha, beta) est le minimum de la fonction quadratique ||e(alpha, beta)||^2 :

Ici, il serait utile de rappeler que la matrice peut également être interprétée comme une forme quadratique, par exemple, la matrice identité ((1,0),(0,1)) peut être interprétée comme une fonction x^2 + y^ 2 :

forme quadratique

Toute cette gymnastique est connue sous le nom de régression linéaire.

Équation de Laplace avec condition aux limites de Dirichlet

Maintenant la vraie tâche la plus simple : il y a une certaine surface triangulée, il faut la lisser. Par exemple, chargeons un modèle de mon visage :

Le commit original est disponible. Pour minimiser les dépendances externes, j'ai repris le code de mon logiciel de rendu, déjà sur Habré. Pour résoudre un système linéaire, j'utilise OpenNL, c'est un excellent solveur, mais qui est très difficile à installer : vous devez copier deux fichiers (.h+.c) dans le dossier avec votre projet. Tout lissage se fait avec le code suivant :

Pour (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = visages[i]; pour (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

Les coordonnées X, Y et Z sont séparables, je les lisse séparément. Autrement dit, je résous trois systèmes d'équations linéaires, chacun avec un nombre de variables égal au nombre de sommets de mon modèle. Les n premières lignes de la matrice A n'ont qu'un seul 1 par ligne et les n premières lignes du vecteur b ont les coordonnées du modèle d'origine. C'est-à-dire que j'attache un ressort entre la nouvelle position du sommet et l'ancienne position du sommet - les nouvelles ne doivent pas s'éloigner trop des anciennes.

Toutes les lignes suivantes de la matrice A (faces.size()*3 = nombre d'arêtes de tous les triangles du maillage) ont une occurrence de 1 et une occurrence de -1, le vecteur b ayant zéro composante opposée. Cela signifie que je mets un ressort sur chaque bord de notre maillage triangulaire : tous les bords essaient d'avoir le même sommet comme point de départ et d'arrivée.

Encore une fois : tous les sommets sont variables, et ils ne peuvent pas s'éloigner de leur position d'origine, mais en même temps ils essaient de devenir similaires les uns aux autres.

Voici le résultat :

Tout irait bien, le modèle est vraiment lissé, mais il s'est éloigné de son bord d'origine. Modifions un peu le code :

Pour (int i=0; je<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

Dans notre matrice A, pour les sommets qui sont sur l'arête, j'ajoute non pas une ligne de la catégorie v_i = verts[i][d], mais 1000*v_i = 1000*verts[i][d]. Qu'est-ce que ça change ? Et cela change notre forme quadratique d’erreur. Désormais, un seul écart du haut au bord ne coûtera plus une unité, comme auparavant, mais 1 000 x 1 000 unités. C'est-à-dire que nous avons accroché un ressort plus fort aux sommets extrêmes, la solution préférera étirer les autres plus fortement. Voici le résultat :

Doublons la force du ressort entre les sommets :
nlCoefficient(face[ j ], 2); nlCoefficient(face[(j+1)%3], -2);

Il est logique que la surface soit devenue plus lisse :

Et maintenant encore cent fois plus fort :

Qu'est-ce que c'est? Imaginez que nous ayons plongé un anneau métallique dans de l'eau savonneuse. En conséquence, le film de savon obtenu tentera d'avoir le moins de courbure possible, touchant la bordure - notre anneau métallique. C'est exactement ce que nous avons obtenu en fixant la bordure et en demandant une surface lisse à l'intérieur. Félicitations, nous venons de résoudre l'équation de Laplace avec les conditions aux limites de Dirichlet. Cela paraît bien? Mais en réalité, il suffit de résoudre un seul système d’équations linéaires.

L'équation de Poisson

Souvenons-nous d'un autre nom sympa.

Disons que j'ai une image comme celle-ci :

Ça a l’air bien pour tout le monde, mais je n’aime pas la chaise.

Je vais couper l'image en deux :



Et je sélectionnerai une chaise avec mes mains :

Ensuite, je tirerai tout ce qui est blanc dans le masque vers la gauche de l'image, et en même temps tout au long de l'image, je dirai que la différence entre deux pixels voisins doit être égale à la différence entre deux pixels voisins de droite. image:

Pour (int i=0; je

Voici le résultat :

Exemple tiré de la vie

Je n'ai volontairement pas fait de résultats léchés, parce que... Je voulais juste montrer comment exactement vous pouvez appliquer les méthodes des moindres carrés, c'est un code de formation. Permettez-moi maintenant de donner un exemple tiré de la vie :

J'ai un certain nombre de photographies d'échantillons de tissus comme celui-ci :

Ma tâche est de créer des textures homogènes à partir de photographies de cette qualité. Pour commencer, je recherche (automatiquement) un motif répétitif :

Si je coupe ce quadrilatère tout droit, alors à cause de la distorsion, les bords ne se rejoindront pas, voici un exemple de motif répété quatre fois :

Texte masqué

Voici un fragment où la couture est bien visible :

Je ne couperai donc pas selon une ligne droite, voici la ligne de coupe :

Texte masqué

Et voici un schéma répété quatre fois :

Texte masqué

Et un fragment pour que ce soit plus clair :

C'est déjà mieux, la coupe n'est pas allée en ligne droite, évitant toutes sortes de boucles, mais la couture est toujours visible en raison de l'éclairage irrégulier de la photo originale. C'est ici que la méthode des moindres carrés de l'équation de Poisson vient à la rescousse. Voici le résultat final après nivellement de l'éclairage :

La texture s'est avérée parfaitement homogène, et tout cela automatiquement à partir d'une photo de qualité très médiocre. N'ayez pas peur des mathématiques, cherchez des explications simples et vous serez heureux en ingénierie.

Après nivellement, on obtient une fonction de la forme suivante : g (x) = x + 1 3 + 1 .

Nous pouvons approximer ces données en utilisant la relation linéaire y = a x + b en calculant les paramètres correspondants. Pour ce faire, nous devrons appliquer la méthode dite des moindres carrés. Vous devrez également faire un dessin pour vérifier quelle ligne alignera le mieux les données expérimentales.

Qu'est-ce que l'OLS exactement (méthode des moindres carrés)

La principale chose que nous devons faire est de trouver de tels coefficients de dépendance linéaire auxquels la valeur de la fonction de deux variables F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 sera la le plus petit. En d'autres termes, pour certaines valeurs de a et b, la somme des carrés des écarts des données présentées par rapport à la droite résultante aura une valeur minimale. C’est le sens de la méthode des moindres carrés. Tout ce que nous devons faire pour résoudre l’exemple est de trouver l’extremum de la fonction de deux variables.

Comment dériver des formules pour calculer les coefficients

Afin de dériver des formules de calcul des coefficients, vous devez créer et résoudre un système d'équations à deux variables. Pour ce faire, nous calculons les dérivées partielles de l'expression F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 par rapport à a et b et les assimilons à 0.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

Pour résoudre un système d'équations, vous pouvez utiliser n'importe quelle méthode, par exemple la substitution ou la méthode de Cramer. En conséquence, nous devrions disposer de formules permettant de calculer des coefficients en utilisant la méthode des moindres carrés.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

Nous avons calculé les valeurs des variables auxquelles la fonction
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 prendra la valeur minimale. Dans le troisième paragraphe, nous prouverons pourquoi il en est exactement ainsi.

Il s’agit de l’application pratique de la méthode des moindres carrés. Sa formule, qui permet de trouver le paramètre a, comprend ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2, ainsi que le paramètre
n – il désigne la quantité de données expérimentales. Nous vous conseillons de calculer chaque montant séparément. La valeur du coefficient b est calculée immédiatement après a.

Revenons à l'exemple original.

Exemple 1

Ici, nous avons n égal à cinq. Pour faciliter le calcul des montants requis inclus dans les formules de coefficients, remplissons le tableau.

je = 1 je = 2 je = 3 je = 4 je = 5 ∑ je = 1 5
x je 0 1 2 4 5 12
et je 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x je y je 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x je 2 0 1 4 16 25 46

Solution

La quatrième ligne comprend les données obtenues en multipliant les valeurs de la deuxième ligne par les valeurs de la troisième pour chaque individu i. La cinquième ligne contient les données de la deuxième, au carré. La dernière colonne affiche les sommes des valeurs des lignes individuelles.

Utilisons la méthode des moindres carrés pour calculer les coefficients a et b dont nous avons besoin. Pour ce faire, remplacez les valeurs requises de la dernière colonne et calculez les montants :

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33, 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - une 12 5 ⇒ une ≈ 0, 165 b ≈ 2, 184

Il s'avère que la ligne droite d'approximation requise ressemblera à y = 0, 165 x + 2, 184. Nous devons maintenant déterminer quelle ligne se rapprochera le mieux des données - g (x) = x + 1 3 + 1 ou 0, 165 x + 2, 184. Estimons en utilisant la méthode des moindres carrés.

Pour calculer l'erreur, nous devons trouver la somme des écarts carrés des données par rapport aux droites σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 et σ 2 = ∑ i = 1 n (y i - g (x i)) 2, la valeur minimale correspondra à une ligne plus adaptée.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0,096

Répondre: puisque σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0,165 x + 2,184.

La méthode des moindres carrés est clairement illustrée dans l’illustration graphique. La ligne rouge marque la droite g (x) = x + 1 3 + 1, la ligne bleue marque y = 0, 165 x + 2, 184. Les données originales sont indiquées par des points roses.

Expliquons pourquoi exactement des approximations de ce type sont nécessaires.

Ils peuvent être utilisés dans des tâches nécessitant un lissage des données, ainsi que dans celles où les données doivent être interpolées ou extrapolées. Par exemple, dans le problème discuté ci-dessus, on pourrait trouver la valeur de la quantité observée y à x = 3 ou à x = 6. Nous avons consacré un article séparé à de tels exemples.

Preuve de la méthode OLS

Pour que la fonction prenne une valeur minimale lors du calcul de a et b, il faut qu'en un point donné la matrice de la forme quadratique du différentiel de la fonction de la forme F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 est défini positif. Montrons à quoi cela devrait ressembler.

Exemple 2

On a une différentielle du second ordre de la forme suivante :

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2 b

Solution

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x je δ b = 2 ∑ je = 1 n x je δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ je = 1 n (1) = 2 n

En d'autres termes, nous pouvons l'écrire ainsi : d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

Nous avons obtenu une matrice de forme quadratique M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

Dans ce cas, les valeurs des éléments individuels ne changeront pas en fonction de a et b . Cette matrice est-elle positive définie ? Pour répondre à cette question, vérifions si ses mineurs angulaires sont positifs.

On calcule le mineur angulaire du premier ordre : 2 ∑ i = 1 n (x i) 2 > 0 . Puisque les points x i ne coïncident pas, l'inégalité est stricte. Nous garderons cela à l’esprit dans les calculs ultérieurs.

On calcule le mineur angulaire du deuxième ordre :

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

Après cela, nous prouvons l'inégalité n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 en utilisant l'induction mathématique.

  1. Vérifions si cette inégalité est valable pour un n arbitraire. Prenons 2 et calculons :

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x1 + x2 2 > 0

Nous avons obtenu une égalité correcte (si les valeurs x 1 et x 2 ne coïncident pas).

  1. Faisons l'hypothèse que cette inégalité sera vraie pour n, c'est-à-dire n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – vrai.
  2. Nous allons maintenant prouver la validité pour n + 1, c'est-à-dire que (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, si n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

On calcule :

(n + 1) ∑ je = 1 n + 1 (x je) 2 - ∑ je = 1 n + 1 x je 2 = = (n + 1) ∑ je = 1 n (x je) 2 + x n + 1 2 - ∑ je = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1 - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

L'expression entre accolades sera supérieure à 0 (d'après ce que nous avons supposé à l'étape 2), et les termes restants seront supérieurs à 0, car ce sont tous des carrés de nombres. Nous avons prouvé l'inégalité.

Répondre: les a et b trouvés correspondront à la plus petite valeur de la fonction F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, ce qui signifie qu'ils sont les paramètres requis de la méthode des moindres carrés (LSM).

Si vous remarquez une erreur dans le texte, veuillez la surligner et appuyer sur Ctrl+Entrée

TRAVAIL DE COURS

approximation de fonction par la méthode des moindres carrés


Introduction

approximation empirique Mathcad

Le but du cours est d'approfondir les connaissances en informatique, de développer et de consolider les compétences nécessaires pour travailler avec le tableur Microsoft Excel et MathCAD. Les utiliser pour résoudre des problèmes à l’aide d’un ordinateur dans un domaine lié à la recherche.

Dans chaque tâche, les conditions du problème, les données initiales, le formulaire d'émission des résultats sont formulés, les principales dépendances mathématiques pour résoudre le problème sont indiquées. Le calcul de contrôle permet de vérifier le bon fonctionnement du programme.

Le concept d'approximation est une expression approximative de tout objet mathématique (par exemple, des nombres ou des fonctions) à travers d'autres plus simples, plus pratiques à utiliser ou simplement mieux connus. Dans la recherche scientifique, l'approximation est utilisée pour décrire, analyser, généraliser et utiliser davantage des résultats empiriques.

Comme on le sait, il peut y avoir une connexion (fonctionnelle) exacte entre les quantités, lorsqu'une valeur spécifique correspond à une valeur de l'argument, et une connexion (de corrélation) moins précise, lorsqu'une valeur spécifique de l'argument correspond à une valeur approximative ou un certain ensemble de valeurs de fonction, à un degré ou à un autre proches les unes des autres. Lorsque vous effectuez des recherches scientifiques, traitez les résultats d'une observation ou d'une expérience, vous devez généralement faire face à la deuxième option. Lors de l'étude des dépendances quantitatives de divers indicateurs, dont les valeurs sont déterminées empiriquement, il existe en règle générale une certaine variabilité. Elle est en partie déterminée par l'hétérogénéité des objets étudiés de nature inanimée et, surtout, vivante, et est en partie déterminée par l'erreur d'observation et de traitement quantitatif des matériaux. Le dernier élément ne peut pas toujours être complètement éliminé ; il ne peut être minimisé que par une sélection minutieuse d'une méthode de recherche adéquate et un travail minutieux.

Les spécialistes dans le domaine de l'automatisation des processus technologiques et de la production traitent un grand volume de données expérimentales, pour le traitement desquelles un ordinateur est utilisé. Les données sources et les résultats de calcul obtenus peuvent être présentés sous forme de tableau à l'aide de tableurs (feuilles de calcul) et notamment Excel. Les travaux de cours en informatique permettent à l'étudiant de consolider et de développer des compétences utilisant les technologies informatiques de base lors de la résolution de problèmes dans le domaine de l'activité professionnelle. - un système de calcul formel de la classe des systèmes de conception assistée par ordinateur, axé sur la préparation de documents interactifs avec calculs et support visuel, est facile à utiliser et à appliquer pour le travail d'équipe.


1. informations générales


Très souvent, notamment lors de l'analyse de données empiriques, il est nécessaire de trouver explicitement une relation fonctionnelle entre les quantités XEt à, qui sont obtenus à la suite de mesures.

Dans une étude analytique de la relation entre deux quantités x et y, une série d'observations est faite et le résultat est un tableau de valeurs :


xx1 X1 XjeXnaaa1 oui1 ouijeOuin

Ce tableau est généralement obtenu à la suite de certaines expériences dans lesquelles X,(valeur indépendante) est définie par l'expérimentateur, et oui,obtenu grâce à l'expérience. Donc ces valeurs oui,nous les appellerons valeurs empiriques ou expérimentales.

Il existe une relation fonctionnelle entre les quantités x et y, mais sa forme analytique est généralement inconnue, donc une tâche pratiquement importante se pose : trouver la formule empirique


y =F (x; un 1,un 2,…, suis ), (1)


(Où un1 , un2 ,…,unm- paramètres), dont les valeurs à x = x,différerait probablement peu des valeurs expérimentales y, (je = 1,2,…, P).

Indiquez généralement la classe de fonctions (par exemple, un ensemble de fonctions linéaires, de puissance, exponentielles, etc.) parmi lesquelles la fonction est sélectionnée f(x), puis les meilleures valeurs de paramètres sont déterminées.

Si nous remplaçons l'original X,alors on obtient des valeurs théoriques

OuiTje= f (Xje; un 1,un 2……unm) , Où je = 1,2,…, n.


Différences ouijeT- ouije, sont appelés écarts et représentent les distances verticales des points Mjeau graphique de la fonction empirique.

Selon la méthode des moindres carrés, les meilleurs coefficients un1 , un2 ,…,unmceux pour lesquels la somme des écarts carrés de la fonction empirique trouvée par rapport aux valeurs de fonction données est prise en compte



sera minime.

Expliquons la signification géométrique de la méthode des moindres carrés.

Chaque paire de nombres ( Xje, ouije) de la table source détermine le point Mjeen surface XOY.Utilisation de la formule (1) pour différentes valeurs des coefficients un1 , un2 ,…,unmvous pouvez construire une série de courbes qui sont des graphiques de la fonction (1). La tâche est de déterminer les coefficients un1 , un2 ,…,unmde telle sorte que la somme des carrés des distances verticales des points Mje (Xje, ouije) avant que le graphique de la fonction (1) ne soit le plus petit (Fig. 1).



La construction d'une formule empirique comprend deux étapes : clarifier la forme générale de cette formule et déterminer ses meilleurs paramètres.

Si la nature de la relation entre ces quantités x et oui, alors le type de dépendance empirique est arbitraire. La préférence est donnée aux formules simples avec une bonne précision. Le choix réussi d’une formule empirique dépend en grande partie des connaissances du chercheur dans le domaine, grâce auxquelles il peut indiquer la classe de fonctions à partir de considérations théoriques. La représentation des données obtenues dans des systèmes de coordonnées cartésiens ou spéciaux (semi-logarithmiques, logarithmiques, etc.) est d'une grande importance. A partir de la position des points, on peut deviner approximativement la forme générale de la dépendance en établissant la similitude entre le graphique construit et des échantillons de courbes connues.

Déterminer les meilleures cotes un1 , un2,…, unminclus dans la formule empirique sont produits par des méthodes analytiques bien connues.

Afin de trouver un ensemble de coefficients un1 , un2 …..unm, qui délivrent le minimum de la fonction S définie par la formule (2), on utilise la condition nécessaire à l'extremum d'une fonction de plusieurs variables - l'égalité des dérivées partielles à zéro.

En conséquence, nous obtenons un système normal de détermination des coefficients unje(je = 1,2,…, m):



Ainsi, trouver les coefficients unjese réduit au système de résolution (3). Ce système est simplifié si la formule empirique (1) est linéaire par rapport aux paramètres unje, alors le système (3) sera linéaire.


1.1 Dépendance linéaire


La forme spécifique du système (3) dépend de la classe de formules empiriques à partir de laquelle nous recherchons la dépendance (1). En cas de dépendance linéaire y = une1 +un2 Xle système (3) prendra la forme :


Ce système linéaire peut être résolu par toute méthode connue (méthode de Gauss, itérations simples, formules de Cramer).


1.2 Dépendance quadratique


En cas de dépendance quadratique y = une1 +un2 x+a3X 2le système (3) prendra la forme :



1.3 Dépendance exponentielle


Dans certains cas, une fonction dans laquelle les coefficients incertains entrent de manière non linéaire est considérée comme une formule empirique. Dans ce cas, le problème peut parfois être linéarisé, c'est-à-dire réduire à linéaire. Ces dépendances incluent la dépendance exponentielle


y = une1 *ea2x (6)


où un 1Et un 2, coefficients incertains.

La linéarisation est obtenue en prenant le logarithme d'égalité (6), après quoi on obtient la relation

ln y = ln a 1+un 2X (7)


Notons ln àet ln unXen conséquence à travers tEt c, alors la dépendance (6) peut s'écrire sous la forme t = une1 +un2 X, ce qui permet d'appliquer les formules (4) avec le remplacement un1 sur cEt àje sur tje


1.4 Éléments de théorie des corrélations


Graphique de dépendance fonctionnelle restaurée y(x)selon les résultats de mesure (x je, àje),je = 1,2, K, nappelée courbe de régression. Pour vérifier l'accord de la courbe de régression construite avec les résultats expérimentaux, les caractéristiques numériques suivantes sont généralement introduites : coefficient de corrélation (dépendance linéaire), rapport de corrélation et coefficient de détermination. Dans ce cas, les résultats sont généralement regroupés et présentés sous forme de tableau de corrélation. Chaque cellule de ce tableau montre les chiffres njeJ - ces paires (x, y), dont les composants tombent dans les intervalles de regroupement appropriés pour chaque variable. En supposant que les longueurs des intervalles de regroupement (pour chaque variable) sont égales les unes aux autres, sélectionnez les centres x je(respectivement àje) de ces intervalles et nombres njeJ- comme base de calcul.

Le coefficient de corrélation est une mesure de la relation linéaire entre les variables aléatoires dépendantes : il montre dans quelle mesure, en moyenne, l'une des variables peut être représentée comme une fonction linéaire de l'autre.

Le coefficient de corrélation est calculé à l'aide de la formule :


où et sont respectivement la moyenne arithmétique X Et à.

Le coefficient de corrélation entre variables aléatoires en valeur absolue ne dépasse pas 1. Plus |p| à 1, plus la relation linéaire entre x et toi.

Dans le cas d'une corrélation non linéaire, les valeurs moyennes conditionnelles sont situées à proximité de la ligne courbe. Dans ce cas, il est recommandé d'utiliser comme caractéristique de la force de la connexion un rapport de corrélation dont l'interprétation ne dépend pas du type de dépendance étudié.

Le rapport de corrélation est calculé à l'aide de la formule :



nje = , nF= , et le numérateur caractérise la dispersion des moyennes conditionnelles oui,à propos de la moyenne absolue oui.

Toujours. Égalité = 0 correspond à des variables aléatoires non corrélées ; = 1 si et seulement s'il existe une connexion fonctionnelle exacte entre oui et X. En cas de dépendance linéaire oui de x, le rapport de corrélation coïncide avec le carré du coefficient de corrélation. Ordre de grandeur - ? 2 est utilisé comme indicateur de l’écart de régression par rapport au linéaire.

Le rapport de corrélation est une mesure de la relation de corrélation oui Avec X sous quelque forme que ce soit, mais ne peut donner une idée du degré de proximité des données empiriques avec une forme particulière. Pour savoir avec quelle précision la courbe construite reflète les données empiriques, une autre caractéristique est introduite - le coefficient de détermination.

Pour le décrire, considérons les quantités suivantes. - somme totale des carrés, où est la valeur moyenne.

On peut prouver l'égalité suivante

Le premier terme est égal à Sres = et est appelé somme des carrés résiduelle. Il caractérise l'écart entre l'expérimental et le théorique.

Le deuxième terme est égal à Sreg = 2 et est appelé somme des carrés de régression et caractérise la répartition des données.

Évidemment, l’égalité suivante est vraie : S plein = S est + S rég.

Le coefficient de déterminisme est déterminé par la formule :



Plus la somme des carrés résiduelle est petite par rapport à la somme des carrés totale, plus la valeur du coefficient de déterminisme est grande. r2 , qui montre dans quelle mesure l'équation produite par l'analyse de régression explique les relations entre les variables. S'il est égal à 1, alors il existe une corrélation complète avec le modèle, c'est-à-dire il n'y a aucune différence entre les valeurs réelles et estimées de y. Dans le cas contraire, si le coefficient de déterminisme est 0, alors l'équation de régression ne parvient pas à prédire les valeurs de y

Le coefficient de déterminisme ne dépasse toujours pas le rapport de corrélation. Dans le cas où l'égalité est satisfaite r 2 = alors nous pouvons supposer que la formule empirique construite reflète le plus fidèlement les données empiriques.


2. Énoncé du problème


1. En utilisant la méthode des moindres carrés, approximez la fonction donnée dans le tableau

a) un polynôme du premier degré ;

b) un polynôme du deuxième degré ;

c) dépendance exponentielle.

Pour chaque dépendance, calculez le coefficient de déterminisme.

Calculez le coefficient de corrélation (uniquement dans le cas a).

Pour chaque dépendance, tracez une ligne de tendance.

À l'aide de la fonction LINEST, calculez les caractéristiques numériques de la dépendance.

Comparez vos calculs avec les résultats obtenus à l'aide de la fonction LINEST.

Déterminez laquelle des formules résultantes se rapproche le mieux de la fonction.

Écrivez un programme dans l'un des langages de programmation et comparez les résultats des calculs avec ceux obtenus ci-dessus.


3. Données initiales


La fonction est donnée dans la figure 1.



4. Calcul des approximations dans le tableur Excel


Pour effectuer les calculs, il est conseillé d'utiliser le tableur Microsoft Excel. Et organisez les données comme indiqué dans la figure 2.



Pour ce faire, nous entrons :

· dans les cellules A6:A30 nous entrons les valeurs xi .

· dans les cellules B6:B30 nous entrons les valeurs de уi .

· dans la cellule C6, entrez la formule =A6^ 2.

· Cette formule est copiée dans les cellules C7:C30.

· dans la cellule D6, entrez la formule =A6*B6.

· Cette formule est copiée dans les cellules D7:D30.

· Dans la cellule F6, nous entrons la formule =A6^4.

· Cette formule est copiée dans les cellules F7:F30.

· Dans la cellule G6, nous entrons la formule =A6^2*B6.

· Cette formule est copiée dans les cellules G7:G30.

· Dans la cellule H6, entrez la formule =LN(B6).

· Cette formule est copiée dans les cellules H7:H30.

· dans la cellule I6, entrez la formule =A6*LN(B6).

· Cette formule est copiée dans les cellules I7:I30. Nous effectuons les étapes suivantes en utilisant la sommation automatique

· dans la cellule A33, entrez la formule =SUM (A6:A30).

· dans la cellule B33, entrez la formule =SUM (B6:B30).

· dans la cellule C33, entrez la formule =SUM (C6:C30).

· dans la cellule D33, entrez la formule =SUM (D6:D30).

· dans la cellule E33, entrez la formule = SOMME (E6: E30).

· dans la cellule F33, entrez la formule =SUM (F6:F30).

· Dans la cellule G33, entrez la formule =SUM (G6:G30).

· Dans la cellule H33, entrez la formule =SUM (H6:H30).

· dans la cellule I33, entrez la formule =SUM (I6:I30).

Rapprochons la fonction y = f(x) fonction linéaire y = une1 +un2X. Pour déterminer les coefficients a 1et un 2Utilisons le système (4). En utilisant les totaux du tableau 2, situés dans les cellules A33, B33, C33 et D33, on écrit le système (4) sous la forme



en résolvant ce que nous obtenons un 1= -24,7164 et a2 = 11,63183

Ainsi, l’approximation linéaire a la forme y= -24,7164 + 11,63183x (12)

Le système (11) a été résolu à l'aide de Microsoft Excel. Les résultats sont présentés dans la figure 3 :



Dans le tableau des cellules A38:B39, la formule est écrite (=MOBR (A35:B36)). Les cellules E38:E39 contiennent la formule (=MULTIPLE (A38:B39, C35:C36)).


Nous approchons ensuite la fonction y = f(x) par une fonction quadratique y = une1 +un2 x+a3 X2. Pour déterminer les coefficients a 1,un 2et un 3Utilisons le système (5). A l'aide des totaux du tableau 2, situés dans les cellules A33, B33, C33, D33, E33, F33 et G33, on écrit le système (5) sous la forme :



Après avoir résolu lequel, nous obtenons un 1= 1,580946,a 2= -0,60819 et a3 = 0,954171 (14)

Ainsi, l’approximation quadratique a la forme :

y = 1,580946 -0,60819x +0,954171x2

Le système (13) a été résolu à l'aide de Microsoft Excel. Les résultats sont présentés dans la figure 4.



Dans le tableau des cellules A46:C48, la formule est écrite (=MOBR (A41:C43)). Les cellules F46:F48 contiennent la formule (=MULTIPLE (A41:C43, D46:D48)).

Rapprochons maintenant la fonction y = f(x) fonction exponentielle y = une1 ea2x. Pour déterminer les coefficients un1 Et un2 logarithmonons les valeurs ouijeet en utilisant les totaux du tableau 2, situés dans les cellules A26, C26, H26 et I26, on obtient le système :



с = ln(une1 ).

Après avoir résolu le système (10), nous trouvons c =0,506435, a2 = 0.409819.

Après potentialisation on obtient a1 = 1,659365.

Ainsi, l’approximation exponentielle a la forme y = 1,659365*e0,4098194x

Le système (15) a été résolu à l'aide de Microsoft Excel. Les résultats sont présentés dans la figure 5.


Dans le tableau des cellules A55:B56, la formule est écrite (=MOBR (A51:B52)). Dans les cellules E54:E56, la formule est écrite (=MULTIPLE (A51:B52, C51:C52)). La cellule E56 contient la formule =EXP(E54).

Calculons la moyenne arithmétique de x et y à l'aide des formules :



Résultats du calcul x et ouiutilisant Microsoft Excel sont présentés dans la figure 6.



La cellule B58 contient la formule =A33/25. La cellule B59 contient la formule =B33/25.

Tableau 2


Expliquons comment le tableau de la figure 7 est compilé.

Les cellules A6:A33 et B6:B33 sont déjà remplies (voir Figure 2).

· dans la cellule J6, entrez la formule =(A6-$B$58)*(B6-$B$59).

· Cette formule est copiée dans les cellules J7:J30.

· dans la cellule K6, entrez la formule =(A6-$B$58)^ 2.

· Cette formule est copiée dans les cellules K7:K30.

· Dans la cellule L6, nous entrons la formule =(B1-$B$59)^2.

· Cette formule est copiée dans les cellules L7:L30.

· dans la cellule M6, nous entrons la formule =($E$38+$E$39*A6-B6)^2.

· Cette formule est copiée dans les cellules M7:M30.

· dans la cellule N6, nous entrons la formule =($F$46 +$F$47*A6 +$F$48*A6 L6-B6)^2.

· Cette formule est copiée dans les cellules N7:N30.

· dans la cellule O6, entrez la formule =($E$56*EXP ($E$55*A6) - B6)^2.

· Cette formule est copiée dans les cellules O7:O30.

Nous effectuons les étapes suivantes en utilisant la sommation automatique.

· dans la cellule J33, entrez la formule =CYMM (J6:J30).

· Dans la cellule K33, nous entrons la formule =SUM (K6:K30).

· dans la cellule L33, entrez la formule =CYMM (L6:L30).

· Dans la cellule M33, nous entrons la formule =SUM (M6:M30).

· dans la cellule N33, entrez la formule =SUM (N6:N30).

· dans la cellule O33, entrez la formule = SUM (06:030).

Calculons maintenant le coefficient de corrélation à l'aide de la formule (8) (uniquement pour l'approximation linéaire) et le coefficient de détermination à l'aide de la formule (10). Les résultats des calculs utilisant Microsoft Excel sont présentés dans la figure 7.



Dans le tableau 8, dans la cellule B61, la formule s'écrit =J33/(K33*L33^(1/2). Dans la cellule B62, la formule s'écrit =1 - M33/L33. Dans la cellule B63, la formule s'écrit =1 - N33 /L33. Dans la cellule B64, la formule s'écrit formule =1 - O33/L33.

L'analyse des résultats de calcul montre que l'approximation quadratique décrit le mieux les données expérimentales.


4.1 Tracer des graphiques dans Excel


Sélectionnez les cellules A1: A25, puis accédez à l'assistant graphique. Choisissons un nuage de points. Une fois le graphique construit, cliquez avec le bouton droit sur la ligne du graphique et sélectionnez Ajouter une ligne de tendance (linéaire, exponentielle, puissance et polynôme du deuxième degré, respectivement).

Graphique d'approximation linéaire


Graphique d'approximation quadratique


Graphique d'ajustement exponentiel.


5. approximation de fonction à l'aide de MathCAD


L'approximation des données en tenant compte de leurs paramètres statistiques appartient aux problèmes de régression. Ils surviennent généralement lors du traitement de données expérimentales obtenues à partir de mesures de processus ou de phénomènes physiques de nature statistique (comme les mesures en radiométrie et géophysique nucléaire), ou à un niveau d'interférence élevé (bruit). La tâche de l'analyse de régression est de sélectionner les formules mathématiques qui décrivent le mieux les données expérimentales.


.1 Régression linéaire


La régression linéaire dans le système Mathcad est effectuée à l'aide de vecteurs d'arguments Xet lectures Oui les fonctions:

intercepter (x, y)- calcule le paramètre UN1 , déplacement vertical de la droite de régression (voir figure)

pente (x, y)- calcule le paramètre un2 , pente de la droite de régression (voir figure)

y(x) = a1+a2*x


Fonction corr (y, y(x))calcule Coefficient de corrélation de Pearson.Plus il est proche de 1, plus les données traitées correspondent avec précision à la relation linéaire (voir figure)

.2 Régression polynomiale


La régression polynomiale unidimensionnelle avec un degré n arbitraire du polynôme et avec des coordonnées arbitraires d'échantillons dans Mathcad est effectuée par les fonctions :

régression (x, y, n)- calcule le vecteur S,qui contient les coefficients aipolynôme nème degré;

Valeurs des coefficients aipeut être extrait du vecteur Sfonction sous-matrice(S, 3, longueur(S) - 1, 0, 0).

Nous utilisons les valeurs de coefficient obtenues dans l'équation de régression


y(x) = a1+a2*x+a3*x2 (voir l'image)

.3 Régression non linéaire


Pour les formules d'approximation standard simples, un certain nombre de fonctions de régression non linéaire sont fournies, dans lesquelles les paramètres de fonction sont sélectionnés par le programme Mathcad.

Ceux-ci incluent la fonction expfit (x, y, s),qui renvoie un vecteur contenant les coefficients a1, a2Et a3fonction exponentielle

y(x) = a1 ^exp (a2x) + a3.V vecteur Sles valeurs initiales des coefficients sont renseignées a1, a2Et a3première approximation.


Conclusion


L'analyse des résultats de calcul montre que l'approximation linéaire décrit le mieux les données expérimentales.

Les résultats obtenus à l'aide du programme MathCAD coïncident complètement avec les valeurs obtenues à l'aide d'Excel. Cela indique l'exactitude des calculs.


Bibliographie

  1. Informatique : Manuel / Ed. prof. N.V. Makarova. M. : Finances et Statistiques 2007
  2. Informatique : Atelier sur la technologie informatique / Ed. Éd. prof. N.V. Makarova. M Finances et Statistiques, 2011.
  3. N.-É. Piskounov. Calcul différentiel et intégral, 2010.
  4. Informatique, approximation des moindres carrés, lignes directrices, Saint-Pétersbourg, 2009.
Tutorat

Besoin d'aide pour étudier un sujet ?

Nos spécialistes vous conseilleront ou fourniront des services de tutorat sur des sujets qui vous intéressent.
Soumettez votre candidature en indiquant le sujet dès maintenant pour connaître la possibilité d'obtenir une consultation.

Chargement...Chargement...