Excel의 최소제곱법. 회귀 분석

코스 작업

학문: 컴퓨터 과학

주제: 최소제곱법을 사용한 함수 근사

소개

1. 문제의 진술

2. 계산식

Microsoft Excel을 사용하여 만든 테이블을 사용한 계산

알고리즘 다이어그램

MathCad에서의 계산

선형 함수를 사용하여 얻은 결과

결과를 그래프 형태로 표현

소개

이 과정의 목적은 컴퓨터 과학에 대한 지식을 심화시키고, Microsoft Excel 스프레드시트 프로세서 및 MathCAD 소프트웨어 제품을 사용하여 작업하는 기술을 개발 및 통합하고, 이를 사용하여 연구 관련 주제 영역에서 컴퓨터를 사용하여 문제를 해결하는 것입니다.

근사(라틴어 "근사" - "가까워지다"에서 유래)는 더 간단하고, 사용하기 더 편리하거나, 단순히 더 잘 알려진 다른 수학적 대상(예: 숫자 또는 함수)을 대략적으로 표현한 것입니다. 과학 연구에서 근사치는 경험적 결과를 설명, 분석, 일반화하고 추가로 사용하는 데 사용됩니다.

알려진 바와 같이, 하나의 특정 값이 하나의 인수 값에 해당할 때 양 사이에는 정확한(기능적) 연결이 있을 수 있고, 인수의 하나의 특정 값이 대략적인 값에 해당할 때 덜 정확한(상관) 연결이 있을 수 있습니다. 특정 기능 값 세트가 어느 정도 서로 가깝습니다. 과학 연구를 수행하거나 관찰 또는 실험 결과를 처리할 때 일반적으로 두 번째 옵션을 다루어야 합니다.

경험적으로 결정되는 다양한 지표의 양적 의존성을 연구할 때 일반적으로 약간의 변동성이 있습니다. 부분적으로는 무생물, 특히 살아있는 자연의 연구 대상의 이질성에 의해 결정되며 부분적으로는 관찰 오류와 재료의 정량적 처리에 의해 결정됩니다. 마지막 구성 요소를 항상 완전히 제거할 수는 없으며 적절한 연구 방법을 신중하게 선택하고 주의 깊게 작업해야만 최소화할 수 있습니다. 따라서 연구 작업을 수행할 때 연구된 지표의 종속성의 실제 성격을 식별하는 문제가 발생합니다. 즉, 변동성 값을 고려하지 않아 가려진 정도입니다. 이를 위해 근사가 사용됩니다. 즉, 종속성의 주요 경향(또는 해당 "경향")을 전달하는 적절한 함수 종속 방정식에 의한 변수의 상관 종속성에 대한 대략적인 설명입니다.

근사치를 선택할 때 특정 연구 문제부터 진행해야 합니다. 일반적으로 근사에 사용되는 방정식이 단순할수록 관계에 대한 결과 설명이 더 근사해집니다. 따라서 결과 추세에서 특정 값의 편차가 얼마나 중요하고 원인이 무엇인지 읽는 것이 중요합니다. 경험적으로 결정된 값의 의존성을 설명할 때 좀 더 복잡한 다중 매개변수 방정식을 사용하면 훨씬 더 높은 정확도를 얻을 수 있습니다. 그러나 특정 일련의 경험적 데이터 값의 무작위 편차를 최대 정확도로 전달하려고 노력하는 것은 의미가 없습니다. 일반적인 패턴을 파악하는 것이 훨씬 더 중요합니다. 이 경우에는 전력 함수의 2-매개변수 방정식으로 정확하게 표현되어 가장 논리적이고 허용 가능한 정확도로 표현됩니다. 따라서 근사 방법을 선택할 때 연구원은 항상 타협을 합니다. 이 경우 세부 사항을 "희생"하는 것이 어느 정도 권장되고 적절한지, 따라서 비교 변수의 종속성을 얼마나 일반적으로 표현해야 하는지를 결정합니다. 일반 패턴에서 경험적 데이터의 무작위 편차로 가려진 패턴을 식별하는 것과 함께 근사법을 사용하면 다른 많은 중요한 문제를 해결할 수도 있습니다. 발견된 종속성을 공식화합니다. 보간 또는 적절한 경우 외삽을 통해 종속 변수의 알 수 없는 값을 찾습니다.

각 작업에는 문제의 조건, 초기 데이터, 결과 발행 형식이 공식화되고 문제 해결을 위한 주요 수학적 종속성이 표시됩니다. 문제 해결 방법에 따라 솔루션 알고리즘이 개발되어 그래픽 형식으로 표시됩니다.

1. 문제의 진술

1. 최소 제곱법을 사용하여 표에 제공된 함수를 대략적으로 계산합니다.

a) 1차 다항식 ;

b) 2차 다항식;

c) 지수 의존성.

각 종속성에 대해 결정성 계수를 계산합니다.

상관계수를 계산합니다(a의 경우에만).

각 종속성에 대해 추세선을 그립니다.

LINEST 함수를 사용하여 종속성의 수치적 특성을 계산합니다.

계산을 LINEST 함수를 사용하여 얻은 결과와 비교하십시오.

결과 공식 중 함수에 가장 가까운 것이 무엇인지 결론을 내리세요.

프로그래밍 언어 중 하나로 프로그램을 작성하고 계산 결과를 위에서 얻은 결과와 비교하십시오.

옵션 3. 기능은 표에 나와 있습니다. 1.

1 번 테이블.


2. 계산식

경험적 데이터를 분석할 때 경험이나 측정의 결과로 얻은 양 x와 y 사이의 함수적 관계를 찾아야 하는 경우가 종종 있습니다.

Xi(독립적인 값)는 실험자가 설정하고, 실험의 결과로 경험적 또는 실험적 값이라고 불리는 yi를 얻습니다.

수량 x와 y 사이에 존재하는 함수 관계의 분석 형식은 일반적으로 알려져 있지 않으므로 실제로 중요한 작업이 발생합니다. 즉, 실험식을 찾는 것입니다.

, (1)

(매개변수는 어디에 있습니까?) 그 값은 실험값과 거의 다르지 않습니다.

최소 제곱법에 따르면, 가장 좋은 계수는 주어진 함수 값에서 발견된 경험적 함수의 제곱 편차의 합이 최소가 되는 계수입니다.

여러 변수의 함수 극값에 필요한 조건(부분 도함수가 0과 동일함)을 사용하여 공식 (2)에 의해 정의된 함수의 최소값을 제공하는 계수 세트를 찾고 계수를 결정하기 위한 일반 시스템을 얻습니다. :

(3)

따라서 계수를 찾는 것은 시스템(3)을 푸는 것으로 축소됩니다.

시스템(3)의 유형은 우리가 종속성(1)을 찾고 있는 실험식의 클래스에 따라 달라집니다. 선형 의존성의 경우 시스템 (3)은 다음과 같은 형식을 취합니다.

(4)

2차 의존성의 경우 시스템 (3)은 다음과 같은 형식을 취합니다.

(5)

어떤 경우에는 불확실한 계수가 비선형적으로 들어가는 함수를 경험식으로 취하기도 한다. 이 경우 문제가 선형화될 수 있는 경우도 있습니다. 선형으로 줄입니다. 이러한 종속성은 지수 종속성을 포함합니다.

여기서 a1과 a2는 정의되지 않은 계수입니다.

선형화는 평등의 로그(6)를 취함으로써 달성되며, 그 후 우리는 관계를 얻습니다.

(7)

을 각각 과 로 표시하면 종속성 (6)은 다음과 같은 형식으로 작성될 수 있습니다. 이를 통해 a1을 으로 대체하여 수식 (4)를 적용할 수 있습니다.

측정 결과(xi, yi), i=1,2,…,n을 기반으로 재구성된 함수 의존성 y(x)의 그래프를 회귀 곡선이라고 합니다. 구성된 회귀 곡선과 실험 결과의 일치를 확인하기 위해 일반적으로 상관 계수(선형 의존성), 상관 비율 및 결정 계수와 같은 수치 특성이 도입됩니다.

상관 계수는 종속 확률 변수 사이의 선형 관계를 측정한 것입니다. 이는 평균적으로 변수 중 하나가 다른 변수의 선형 함수로 얼마나 잘 표현될 수 있는지를 보여줍니다.

상관 계수는 다음 공식을 사용하여 계산됩니다.

(8)

(9)

각각 x, y의 산술 평균은 어디에 있습니까?

절대값에서 확률변수 간의 상관계수는 1을 초과하지 않습니다. 1에 가까울수록 x와 y 사이의 선형 관계가 더 가까워집니다.

비선형 상관관계의 경우 조건부 평균값은 곡선 근처에 위치합니다. 이 경우 연결 강도의 특성으로 상관 비율을 사용하는 것이 좋습니다. 이 해석은 연구되는 종속 유형에 의존하지 않습니다.

상관 비율은 다음 공식을 사용하여 계산됩니다.

(10)

어디 분자는 무조건 평균을 중심으로 조건부 평균이 분산되는 특성을 나타냅니다.

언제나. 평등 = 상관되지 않은 무작위 값에 해당합니다. = x와 y 사이에 정확한 기능적 연결이 있는 경우에만 해당됩니다. x에 대한 y의 선형 의존성의 경우 상관 비율은 상관 계수의 제곱과 일치합니다. 이 값은 선형 회귀 분석의 편차를 나타내는 지표로 사용됩니다.

상관 비율은 어떤 형태로든 y와 x 사이의 상관 관계를 측정한 것이지만, 경험적 데이터가 특수한 형태로 근사하는 정도에 대한 아이디어를 제공할 수는 없습니다. 구성된 곡선이 경험적 데이터를 얼마나 정확하게 반영하는지 확인하기 위해 결정 계수라는 또 다른 특성이 도입됩니다.

결정성 계수는 ​​다음 공식에 의해 결정됩니다.

여기서 Sres = - 잔차 제곱합(이론적 데이터와 실험 데이터의 편차를 나타냄) total - 평균값이 yi인 총 제곱합.

- 데이터의 확산을 특징으로 하는 회귀 제곱합입니다.

총 제곱합에 비해 잔차 제곱합이 작을수록 회귀 방정식이 변수 간의 관계를 얼마나 잘 설명하는지 측정하는 결정 계수 r2가 커집니다. 1과 같으면 모델과 완전한 상관관계가 있는 것입니다. y의 실제 값과 추정 값 사이에는 차이가 없습니다. 반대의 경우 결정계수가 0이면 회귀식은 y값을 예측하는데 실패하게 된다.

결정성 계수는 ​​항상 상관 비율을 초과하지 않습니다. 동등성이 만족되는 경우 구성된 경험식이 경험적 데이터를 가장 정확하게 반영한다고 가정할 수 있습니다.

3. Microsoft Excel을 사용하여 만든 테이블을 이용한 계산

계산을 수행하려면 Microsoft Excel 스프레드시트 프로세서를 사용하여 표 2 형식으로 데이터를 정렬하는 것이 좋습니다.

표 2












표 2가 어떻게 컴파일되는지 설명하겠습니다.

1단계. A1:A25 셀에 xi 값을 입력합니다.

2단계. B1:B25 셀에 yi 값을 입력합니다.

3단계. C1 셀에 수식 = A1^2를 입력합니다.

4단계. 이 수식은 C1:C25 셀에 복사됩니다.

5단계. D1 셀에 수식 = A1 * B1을 입력합니다.

6단계. 이 수식은 D1:D25 셀에 복사됩니다.

7단계. F1 셀에 수식 = A1^4를 입력합니다.

8단계. 이 수식은 F1:F25 셀에 복사됩니다.

9단계. G1 셀에 수식 = A1^2*B1을 입력합니다.

10단계. 이 수식은 G1:G25 셀에 복사됩니다.

11단계. H1 셀에 수식 = LN(B1)을 입력합니다.

12단계. 이 수식은 H1:H25 셀에 복사됩니다.

13단계. 셀 I1에 수식 = A1*LN(B1)을 입력합니다.

14단계. 이 수식은 I1:I25 셀에 복사됩니다.

자동 합산 S를 사용하여 후속 단계를 수행합니다.

15단계. 셀 A26에 수식 = SUM(A1:A25)을 입력합니다.

16단계. 셀 B26에 수식 = SUM(B1:B25)을 입력합니다.

17단계. 셀 C26에 수식 = SUM(C1:C25)을 입력합니다.

18단계. D26 셀에 수식 = SUM(D1:D25)을 입력합니다.

19단계. 셀 E26에 수식 = SUM(E1:E25)을 입력합니다.

20단계. F26 셀에 수식 = SUM(F1:F25)을 입력합니다.

21단계. 셀 G26에 수식 = SUM(G1:G25)을 입력합니다.

22단계. H26 셀에 수식 = SUM(H1:H25)을 입력합니다.

23단계. 셀 I26에 수식 = SUM(I1:I25)을 입력합니다.

선형 함수로 함수를 근사해 보겠습니다. 계수를 결정하기 위해 시스템 (4)를 사용합니다. 셀 A26, B26, C26 및 D26에 있는 표 2의 합계를 사용하여 시스템 (4)를 다음 형식으로 작성합니다.

(11)

우리가 얻는 것을 해결하면 그리고 .

시스템은 Cramer의 방법을 사용하여 해결되었습니다. 그 본질은 다음과 같습니다. n개의 미지수를 갖는 n개의 대수 선형 방정식 시스템을 생각해 보세요.

(12)

시스템의 행렬식은 시스템 행렬의 행렬식입니다.

(13)

j번째 열을 열로 대체하여 시스템 Δ의 행렬식에서 얻은 행렬식을 나타냅니다.

따라서 선형 근사는 다음과 같은 형식을 갖습니다.

Microsoft Excel을 사용하여 시스템 (11)을 해결합니다. 결과는 표 3에 제시되어 있습니다.

표 3











역행렬






표 3의 셀 A32:B33에는 수식이 기록됩니다(=MOBR(A28:B29)).

E32:E33 셀에 수식이 작성됩니다(=MULTIPLE(A32:B33),(C28:C29)).

다음으로, 이차 함수로 함수를 근사화합니다. . 계수 a1, a2 및 a3을 결정하기 위해 시스템 (5)를 사용합니다. 셀 A26, B26, C26, D26, E26, F26, G26에 있는 표 2의 합계를 사용하여 시스템 (5)를 다음 형식으로 작성합니다.

(16)

이를 해결하면 a1=10.663624를 얻습니다. 그리고

따라서 이차 근사는 다음과 같은 형식을 갖습니다.

Microsoft Excel을 사용하여 시스템 (16)을 해결합니다. 결과는 표 4에 제시되어 있다.

표 4














역행렬







표 4의 셀 A41:C43에는 수식이 작성됩니다(=MOBR(A36:C38)).

F41:F43 셀에 수식이 작성됩니다(=MULTIPLE(A41:C43),(D36:D38)).

이제 지수 함수로 함수를 근사해 보겠습니다. 계수를 결정하고 값의 로그를 취하고 셀 A26, C26, H26 및 I26에 있는 표 2의 합계를 사용하여 시스템을 얻습니다.

(18)

시스템 (18)을 풀면 과 를 얻습니다.

강화 후에 우리는 .

따라서 지수 근사는 다음과 같은 형식을 갖습니다.

Microsoft Excel을 사용하여 시스템 (18)을 해결합니다. 결과는 표 5에 제시되어 있다.

표 5











역행렬




A50:B51 셀에 수식이 작성됩니다(=MOBR(A46:B47)).

E49:E50 셀에 수식이 작성됩니다(=MULTIPLE(A50:B51),(C46:C47)).

셀 E51에는 수식 =EXP(E49)가 기록됩니다.

다음 공식을 사용하여 산술 평균을 계산해 보겠습니다.

Microsoft Excel을 사용한 계산 결과는 표 6에 나와 있습니다.

표 6



셀 B54에는 수식 = A26/25가 기록됩니다.

셀 B55에 수식은 = B26/25로 작성됩니다.

표 7


1단계. J1 셀에 수식 = (A1-$B$54)*(B1-$B$55)를 입력합니다.

2단계. 이 수식은 J2:J25 셀에 복사됩니다.

3단계. K1 셀에 수식 = (A1-$B$54)^2를 입력합니다.

4단계. 이 수식은 k2:K25 셀에 복사됩니다.

5단계. L1 셀에 수식 = (B1-$B$55)^2를 입력합니다.

6단계. 이 수식은 L2:L25 셀에 복사됩니다.

7단계. M1 셀에 수식 = ($E$32+$E$33*A1-B1)^2를 입력합니다.

8단계. 이 수식은 M2:M25 셀에 복사됩니다.

9단계. 셀 N1에 수식 = ($F$41+$F$42*A1+$F$43*A1^2-B1)^2를 입력합니다.

10단계. 이 수식은 N2:N25 셀에 복사됩니다.

11단계. 셀 O1에 수식 = ($E$51*EXP($E$50*A1)-B1)^2를 입력합니다.

12단계. 이 수식은 O2:O25 셀에 복사됩니다.

자동 합산 S를 사용하여 후속 단계를 수행합니다.

13단계. J26 셀에 수식 = SUM(J1:J25)을 입력합니다.

14단계. K26 셀에 수식 = SUM(K1:K25)을 입력합니다.

15단계. L26 셀에 수식 = CUM(L1:L25)을 입력합니다.

16단계. M26 셀에 수식 = SUM(M1:M25)을 입력합니다.

17단계. 셀 N26에 수식 = SUM(N1:N25)을 입력합니다.

18단계. 셀 O26에 수식 = SUM(O1:O25)을 입력합니다.

이제 공식 (8)(선형 근사에만 해당)을 사용하여 상관 계수를 계산하고 공식 (10)을 사용하여 결정성 계수를 계산해 보겠습니다. Microsoft Excel을 사용한 계산 결과는 표 8에 나와 있습니다.

표 8


상관 계수

결정성 계수(선형 근사)



결정성 계수(2차 근사)



결정성 계수(지수 근사)



셀 E57에서 수식은 =J26/(K26*L26)^(1/2)로 작성됩니다.

셀 E59에는 수식 = 1-M26/L26이 기록됩니다.

셀 E61에는 수식 = 1-N26/L26이 기록됩니다.

셀 E63에는 수식 = 1-O26/L26이 기록됩니다.

계산 결과를 분석하면 2차 근사치가 실험 데이터를 가장 잘 설명하는 것으로 나타났습니다.

알고리즘 다이어그램

쌀. 1. 계산 프로그램의 알고리즘 다이어그램.

5. MathCad에서의 계산

선형 회귀

· 선(x, y) - 두 요소의 벡터(b, a) 선형 회귀 계수 b+ax;

· x - 실수 인수 데이터의 벡터;

· y는 동일한 크기의 실제 데이터 값으로 구성된 벡터입니다.

그림 2.

다항식 회귀란 데이터(x1, y1)를 k차 다항식으로 근사하는 것을 의미하며, k=i일 때 다항식은 직선, k=2일 때 포물선, k=3일 때 3차 포물선 등이 됩니다. . 일반적으로 실제로는 k<5.

· regress (x,y,k) - 데이터의 다항식 회귀를 구성하기 위한 계수 벡터입니다.

· interp (s,x,y,t) - 다항식 회귀의 결과;

· s=회귀(x,y,k);

· x는 요소가 오름차순으로 정렬된 실수 인수 데이터의 벡터입니다.

· y는 동일한 크기의 실제 데이터 값으로 구성된 벡터입니다.

· k - 회귀 다항식의 정도(양의 정수);

· t - 회귀 다항식의 인수 값.

그림 3

논의된 것 외에도 몇 가지 더 많은 유형의 3개 매개변수 회귀가 Mathcad에 내장되어 있습니다. 해당 구현은 데이터 배열 외에도 몇 가지 초기 값을 지정해야 한다는 점에서 위의 회귀 옵션과 다소 다릅니다. 계수 a, b, c 중. 데이터 세트를 설명하는 종속성이 어떤 종류인지 잘 알고 있다면 적절한 유형의 회귀를 사용하세요. 회귀 유형이 일련의 데이터를 잘 반영하지 못하는 경우 결과가 만족스럽지 못한 경우가 많으며 초기 값의 선택에 따라 매우 다른 경우도 있습니다. 각 함수는 정제된 매개변수 a, b, c의 벡터를 생성합니다.

LINEST 함수를 사용하여 얻은 결과

LINEST 함수의 목적을 살펴보겠습니다.

이 기능은 최소 제곱을 사용하여 사용 가능한 데이터에 가장 적합한 직선을 계산합니다.

이 함수는 결과 라인을 설명하는 배열을 반환합니다. 직선의 방정식은 다음과 같습니다.

M1x1 + m2x2 + ... + b 또는 y = mx + b,

테이블 알고리즘 마이크로소프트 소프트웨어

여기서 종속 값 y는 독립 값 x의 함수입니다. m의 값은 각 독립변수 x에 대응하는 계수이고, b는 상수이다. y, x, m은 벡터일 수 있습니다.

결과를 얻으려면 5개의 행과 2개의 열을 차지하는 표 형식 수식을 만들어야 합니다. 이 간격은 워크시트의 어느 위치에나 위치할 수 있습니다. 이 간격 동안 LINEST 함수를 입력해야 합니다.

결과적으로 A65:B69 간격의 모든 셀이 채워져야 합니다(표 9 참조).

표 9.



표 9에 있는 일부 수량의 목적을 설명하겠습니다.

셀 A65 및 B65에 있는 값은 각각 기울기와 이동을 나타냅니다. - 결정 계수 - F 관측 값 - 자유도 - 회귀 제곱합 - 잔차 제곱합

결과를 그래프 형태로 표현

쌀. 4. 선형 근사 그래프

쌀. 5. 2차 근사 그래프

쌀. 6. 지수 피팅 그래프

결론

얻은 데이터 결과를 바탕으로 결론을 도출해 보겠습니다.

계산 결과를 분석하면 2차 근사치가 실험 데이터를 가장 잘 설명하는 것으로 나타났습니다. 이에 대한 추세선은 이 영역의 함수 동작을 가장 정확하게 반영합니다.

LINEST 함수를 사용하여 얻은 결과를 비교해 보면 위에서 수행한 계산과 완전히 일치하는 것을 알 수 있습니다. 이는 계산이 정확하다는 것을 나타냅니다.

MathCad 프로그램을 사용하여 얻은 결과는 위에 제공된 값과 완전히 일치합니다. 이는 계산의 정확성을 나타냅니다.

서지

1B.P. 데미도비치, I.A. 적갈색. 계산 수학의 기초. 남: 주립 물리 및 수학 문학 출판사입니다.

2 컴퓨터 과학: 교과서, 에디션. 교수 N.V. 마카로바. 남: 재정과 통계, 2007.

3 컴퓨터 과학: 컴퓨터 기술에 관한 워크샵, ed. 교수 N.V. 마카로바. 남: 재정과 통계, 2010.

4 V.B. Komyagin. Visual Basic을 사용하여 Excel에서 프로그래밍합니다. 남: 라디오와 통신, 2007.

5 N. 니콜, R. 알브레히트. 뛰어나다. 스프레드시트. 남: 에드. "ECOM", 2008.

6 컴퓨터 과학 교과 과정 완료를 위한 지침(모든 전문 분야의 통신 학생용), ed. Zhurova G. N., 상트페테르부르크 주립 수문학 연구소(TU), 2011.

다양한 과학 및 실제 활동 분야에서 가장 폭넓게 적용됩니다. 이는 물리학, 화학, 생물학, 경제학, 사회학, 심리학 등이 될 수 있습니다. 운명의 뜻에 따라 경제 문제를 자주 다루어야하므로 오늘은 여러분을 위해라는 놀라운 나라로의 여행을 준비하겠습니다. 계량경제학=) ...어떻게 원하지 않을 수 있나요?! 그곳은 아주 좋습니다. 결정만 하면 됩니다! ...하지만 당신이 확실히 원하는 것은 문제 해결 방법을 배우는 것입니다. 최소제곱법. 특히 부지런한 독자들은 이 문제를 정확할 뿐만 아니라 매우 빠르게 푸는 방법을 배울 것입니다 ;-) 하지만 먼저 문제에 대한 일반적인 진술+ 동반 예시:

정량적으로 표현되는 특정 주제 영역의 지표를 연구해 보겠습니다. 동시에 지표가 지표에 따라 다르다고 믿을 만한 모든 이유가 있습니다. 이 가정은 과학적 가설일 수도 있고 기본적인 상식에 기초할 수도 있습니다. 그러나 과학은 제쳐두고 좀 더 맛있는 분야, 즉 식료품점을 살펴보겠습니다. 다음으로 나타내자:

– 식료품 점의 소매 면적, 평방 미터,
– 식료품점의 연간 매출액은 백만 루블입니다.

매장 면적이 클수록 대부분의 경우 매출이 더 커진다는 것은 분명합니다.

탬버린을 가지고 관찰/실험/계산/춤을 수행한 후 마음대로 사용할 수 있는 수치 데이터가 있다고 가정해 보겠습니다.

식료품 점의 경우 모든 것이 명확하다고 생각합니다. - 이것은 첫 번째 매장의 영역, - 연간 매출액, - 두 번째 매장의 영역, - 연간 매출액 등입니다. 그건 그렇고, 기밀 자료에 접근하는 것이 전혀 필요하지 않습니다. 무역 회전율에 대한 상당히 정확한 평가는 다음을 통해 얻을 수 있습니다. 수학적 통계. 하지만 산만해지지 마세요. 상업 스파이 과정은 이미 지불되었습니다 =)

표 형식의 데이터는 점 형태로 작성되고 친숙한 형태로 표시될 수도 있습니다. 데카르트 시스템 .

중요한 질문에 답해 보겠습니다. 질적 연구에는 몇 점이 필요한가요?

클수록 좋습니다. 최소 허용 세트는 5-6점으로 구성됩니다. 또한, 데이터의 양이 적을 경우 '비정상적인' 결과는 표본에 포함될 수 없습니다. 예를 들어 소규모 엘리트 매장은 "동료"보다 더 많은 수익을 얻을 수 있으므로 찾아야 할 일반적인 패턴이 왜곡됩니다!

아주 간단하게 말하면, 기능을 선택해야 합니다. 일정지점에 최대한 가깝게 통과합니다. . 이 함수는 근사치 (근사 - 근사)또는 이론적 기능 . 일반적으로 말하면 여기에는 명백한 "경쟁자"가 즉시 나타납니다. 그래프가 모든 지점을 통과하는 고차 다항식입니다. 그러나 이 옵션은 복잡하고 흔히 잘못된 경우가 많습니다. (그래프가 항상 "루프"되고 주요 추세를 제대로 반영하지 못하기 때문).

따라서 구하는 함수는 매우 단순해야 하며 동시에 종속성을 적절하게 반영해야 합니다. 짐작할 수 있듯이 이러한 함수를 찾는 방법 중 하나는 다음과 같습니다. 최소제곱법. 먼저, 그 본질을 일반적인 용어로 살펴 보겠습니다. 일부 함수를 실험 데이터에 가깝게 만듭니다.


이 근사치의 정확성을 어떻게 평가하나요? 실험값과 기능값 간의 차이(편차)도 계산해 보겠습니다. (우리는 그림을 연구합니다). 가장 먼저 떠오르는 생각은 합이 얼마나 큰지 추정해 보는 것인데, 문제는 그 차이가 음수가 될 수 있다는 것이다. (예를 들어, ) 그러한 합산의 결과로 발생하는 편차는 서로 상쇄됩니다. 따라서 근사의 정확성을 추정하기 위해 다음과 같은 합계를 구해야 합니다. 모듈편차:

또는 축소됨: (아무도 모르는 경우: – 이것은 합계 아이콘이고 – 1에서 까지의 값을 취하는 보조 "카운터" 변수).

서로 다른 함수를 사용하여 실험 점을 근사함으로써 서로 다른 값을 얻을 수 있으며, 분명히 이 합이 더 작은 경우 해당 함수가 더 정확합니다.

그러한 방법이 존재하며 이를 호출합니다. 최소 모듈러스 방법. 그러나 실제로는 훨씬 더 널리 퍼졌습니다. 최소제곱법, 가능한 음수 값은 모듈에 의해 제거되지 않고 편차를 제곱하여 제거됩니다.

, 그 후에는 편차 제곱의 합이 다음과 같은 함수를 선택하는 데 노력을 기울입니다. 최대한 작았습니다. 실제로 메소드의 이름은 여기서 유래되었습니다.

이제 또 다른 중요한 점으로 돌아갑니다. 위에서 언급했듯이 선택한 기능은 매우 간단해야 하지만 그러한 기능도 많이 있습니다. 선의 , 쌍곡선, 지수, 대수적, 이차 등. 그리고 물론 여기서는 즉시 "활동 분야를 축소"하고 싶습니다. 연구를 위해 어떤 기능 클래스를 선택해야 합니까? 원시적이지만 효과적인 기술:

– 가장 쉬운 방법은 점을 묘사하는 것입니다 도면에서 위치를 분석합니다. 직선으로 달리는 경향이 있다면 다음을 찾아야 합니다. 선의 방정식 최적의 값과 . 즉, 작업은 편차 제곱의 합이 가장 작도록 이러한 계수를 찾는 것입니다.

예를 들어 포인트가 다음과 같이 위치한 경우 과장법, 그러면 선형 함수가 잘못된 근사치를 제공한다는 것이 명백히 분명해집니다. 이 경우, 우리는 쌍곡선 방정식에 대해 가장 "유리한" 계수를 찾고 있습니다. – 최소 제곱합을 제공하는 것 .

이제 두 경우 모두에 대해 이야기하고 있습니다. 두 변수의 함수, 그 인수는 다음과 같습니다. 검색된 종속성 매개변수:

그리고 본질적으로 우리는 표준 문제를 해결해야 합니다. 두 변수의 최소 함수.

우리의 예를 기억해 봅시다. "저장" 지점이 직선에 위치하는 경향이 있고 그렇게 믿을 만한 모든 이유가 있다고 가정합니다. 선형 의존성소매 공간의 매출. 제곱 편차의 합이 되도록 계수 "a"와 "be"를 찾아봅시다. 가장 작았습니다. 모든 것이 평소와 같습니다. 먼저 1차 부분도함수. 에 따르면 선형성 규칙합계 아이콘 바로 아래에서 구분할 수 있습니다.

이 정보를 에세이나 기말 보고서에 사용하고 싶다면 출처 목록에 있는 링크를 알려주시면 매우 감사하겠습니다. 이러한 자세한 계산은 다음과 같은 곳에서 찾을 수 있습니다.

표준 시스템을 만들어 보겠습니다.

우리는 각 방정식을 "2"만큼 줄이고 합계를 "나누습니다".

메모 : 합계 아이콘 너머에 'a'와 'be'가 나올 수 있는 이유를 독립적으로 분석합니다. 그건 그렇고, 공식적으로 이것은 합계로 수행 될 수 있습니다

시스템을 "적용된" 형식으로 다시 작성해 보겠습니다.

그 후 문제를 해결하기 위한 알고리즘이 나타나기 시작합니다.

점의 좌표를 알고 있나요? 우린 알아. 금액 우리가 그걸 찾을 수 있을까? 용이하게. 가장 간단하게 만들어보자 두 개의 미지수로 구성된 두 선형 방정식의 시스템(“a”와 “be”). 예를 들어 우리는 시스템을 해결합니다. 크레이머의 방법, 그 결과 고정점을 얻습니다. 확인 중 극한의 충분조건, 이 시점에서 함수가 다음과 같은지 확인할 수 있습니다. 정확히 도달하다 최저한의. 확인에는 추가 계산이 포함되므로 뒤에서 설명하겠습니다. (필요한 경우 누락된 프레임을 볼 수 있습니다). 우리는 최종 결론을 내립니다.

기능 가장 좋은 방법 (적어도 다른 선형 함수와 비교하면)실험 포인트를 더 가깝게 만듭니다 . 대략적으로 말하면 그래프는 이러한 지점에 최대한 가깝게 전달됩니다. 전통적으로 계량 경제학결과 근사 함수도 호출됩니다. 쌍을 이루는 선형 회귀 방정식 .

고려중인 문제는 실질적으로 매우 중요합니다. 우리의 예시 상황에서 Eq. 거래 회전율을 예측할 수 있습니다. ("이그렉")매장은 판매 지역의 하나 또는 다른 가치를 갖습니다. (“x”의 하나 또는 다른 의미). 예, 결과 예측은 단지 예측일 뿐이지만 많은 경우 상당히 정확할 것입니다.

어려움이 없기 때문에 "실제"숫자로 한 가지 문제만 분석하겠습니다. 모든 계산은 7-8 학년 학교 커리큘럼 수준입니다. 95%의 경우 선형 함수만 찾으라는 메시지가 표시되지만 기사 끝 부분에서는 최적의 쌍곡선, 지수 및 기타 함수의 방정식을 찾는 것이 더 이상 어렵지 않음을 보여줍니다.

실제로 남은 것은 약속된 상품을 배포하는 것뿐입니다. 이를 통해 그러한 예를 정확하고 신속하게 해결하는 방법을 배울 수 있습니다. 우리는 표준을 신중하게 연구합니다.

두 지표 사이의 관계를 연구한 결과 다음과 같은 숫자 쌍이 얻어졌습니다.

최소제곱법을 사용하여 경험적 방정식에 가장 가까운 선형 함수를 찾습니다. (경험이 있음)데이터. 실험점을 구성하기 위한 그림과 데카르트 직각 좌표계의 근사 함수 그래프를 작성합니다. . 경험적 값과 이론적 값 사이의 제곱 편차의 합을 구합니다. 기능이 더 좋아질지 알아보세요 (최소제곱법의 관점에서)실험 포인트를 더 가까이 가져옵니다.

"x" 의미는 자연스럽고 이것은 나중에 조금 이야기할 특징적인 의미를 가지고 있다는 점에 유의하십시오. 그러나 물론 분수일 수도 있습니다. 또한 특정 작업의 내용에 따라 "X" 값과 "게임" 값 모두 완전히 또는 부분적으로 음수가 될 수 있습니다. 글쎄요, 우리는 "얼굴 없는" 임무를 받았고, 그것을 시작합니다 해결책:

우리는 시스템에 대한 해로서 최적 함수의 계수를 찾습니다.

보다 간결한 기록을 위해 "counter" 변수는 생략할 수 있습니다. 왜냐하면 합산이 1부터 까지 수행된다는 것이 이미 분명하기 때문입니다.

필요한 금액을 표 형식으로 계산하는 것이 더 편리합니다.


계산은 마이크로 계산기로 수행할 수 있지만 Excel을 사용하는 것이 훨씬 더 낫습니다. 더 빠르고 오류도 없습니다. 짧은 비디오 보기:

따라서 우리는 다음을 얻습니다. 체계:

여기서 두 번째 방정식에 3을 곱할 수 있습니다. 항별로 첫 번째 방정식 항에서 2항을 뺍니다.. 그러나 이것은 행운입니다. 실제로 시스템은 종종 선물이 아니며 이러한 경우 비용이 절약됩니다. 크레이머의 방법:
이는 시스템에 고유한 솔루션이 있음을 의미합니다.

점검 해보자. 당신이 원하지 않는다는 것은 이해하지만, 절대로 놓칠 수 없는 오류를 건너뛰는 이유는 무엇입니까? 찾은 해를 시스템의 각 방정식의 왼쪽에 대체해 보겠습니다.

해당 방정식의 우변이 구해지며 이는 시스템이 올바르게 풀렸다는 것을 의미합니다.

따라서 원하는 근사 함수는 다음과 같습니다. – 모든 선형 함수실험 데이터에 가장 가까운 사람은 바로 그녀입니다.

같지 않은 똑바로 해당 지역에 대한 매장 매출의 의존성, 발견된 의존성은 다음과 같습니다. 뒤집다 (원칙은 "많을수록, 적을수록"), 그리고 이 사실은 부정적인 측면에서 즉시 드러납니다. 경사. 기능 특정 지표가 1 단위 증가하면 종속 지표의 값이 감소한다는 것을 나타냅니다. 평균 0.65 단위로. 메밀 가격이 높을수록 판매량이 줄어든다고 합니다.

근사 함수의 그래프를 그리기 위해 두 가지 값을 찾습니다.

그리고 그림을 실행합니다:


구성된 직선을 이라고 합니다. 추세선 (즉, 선형 추세선, 즉 일반적인 경우 추세가 반드시 직선일 필요는 없습니다.). 트렌드에 빠지다라는 표현은 다들 익숙하실 텐데요, 이 표현에는 더 이상의 설명이 필요 없을 것 같습니다.

편차 제곱의 합을 계산해 봅시다 경험적 가치와 이론적 가치 사이. 기하학적으로 이는 "라즈베리" 세그먼트 길이의 제곱의 합입니다. (그 중 두 개는 너무 작아서 보이지도 않습니다).

계산을 표로 요약해 보겠습니다.


다시 말하지만, 수동으로 수행할 수도 있습니다. 만약을 대비해 첫 번째 항목에 대한 예를 들어 보겠습니다.

그러나 이미 알려진 방법으로 수행하는 것이 훨씬 더 효과적입니다.

우리는 다시 한번 반복합니다: 얻은 결과의 의미는 무엇입니까?에서 모든 선형 함수 y 함수 지표는 가장 작습니다. 즉, 해당 계열에서 가장 좋은 근사치입니다. 그런데 여기서 문제의 마지막 질문은 우연이 아닙니다. 제안된 지수 함수가 실험 포인트를 더 가까이 가져가는 것이 더 좋을까요?

해당 제곱 편차의 합을 찾아 보겠습니다. 구별하기 위해 문자 "엡실론"으로 표시하겠습니다. 기술은 정확히 동일합니다.


그리고 혹시라도 첫 번째 점에 대한 계산은 다음과 같습니다.

Excel에서는 표준 함수를 사용합니다. 경험치 (구문은 Excel 도움말에서 찾을 수 있습니다).

결론: , 이는 지수 함수가 직선보다 더 나쁜 실험 점에 근접함을 의미합니다. .

그러나 여기서는 "더 나쁘다"는 점에 유의해야 합니다. 아직은 그런 뜻이 아니야, 뭐가 잘못 되었 니. 이제 나는 이 지수 함수의 그래프를 만들었습니다. 또한 이 그래프는 두 점에 가깝게 전달됩니다. - 너무 많아서 분석 연구 없이는 어떤 기능이 더 정확한지 말하기가 어렵습니다.

이것으로 해결책이 끝나고 논증의 자연적 가치에 대한 질문으로 돌아갑니다. 다양한 연구에서는 일반적으로 경제적 또는 사회학적 자연적 "X"를 사용하여 월, 연도 또는 기타 동일한 시간 간격을 계산합니다. 예를 들어 다음 문제를 생각해 보세요.

저는 수학자이자 프로그래머입니다. 내 경력에서 내가 이룬 가장 큰 도약은 다음과 같은 말을 배웠을 때였습니다. "나는 아무것도 이해하지 못한다!"이제 나는 과학의 권위자에게 그가 나에게 강의를 하고 있으며 그가 나에게 말하는 것을 이해하지 못한다고 말하는 것이 부끄럽지 않습니다. 그리고 그것은 매우 어렵습니다. 그렇습니다. 자신의 무지를 인정하는 것은 어렵고 당혹스러운 일입니다. 자신이 어떤 것의 기본을 모른다는 것을 인정하고 싶어하는 사람이 누가 있겠습니까? 내 직업 때문에 나는 많은 프레젠테이션과 강의에 참석해야 하는데, 대부분의 경우 아무것도 이해하지 못하기 때문에 자고 싶다는 것을 인정합니다. 하지만 현재 과학 상황의 가장 큰 문제는 수학에 있기 때문에 이해가 되지 않습니다. 이는 모든 청취자가 절대적으로 수학의 모든 영역에 익숙하다고 가정합니다(이것은 터무니없는 일입니다). 파생상품이 무엇인지 모른다는 사실을 인정하는 것은(조금 나중에 이야기하겠습니다) 부끄러운 일입니다.

하지만 나는 곱셈이 무엇인지 모른다고 말하는 법을 배웠습니다. 예, 저는 거짓말 대수에 대한 부분대수가 무엇인지 모르겠습니다. 네, 인생에서 왜 이차 방정식이 필요한지 모르겠습니다. 그건 그렇고, 당신이 알고 있다고 확신한다면 우리가 이야기 할 것이 있습니다! 수학은 트릭의 연속이다. 수학자들은 대중을 혼란스럽게 하고 위협하려고 노력합니다. 혼란이 없는 곳에는 평판도 권위도 없습니다. 예, 가능한 한 추상적인 언어로 말하는 것은 명예로운 일입니다. 이는 완전히 말도 안되는 일입니다.

파생상품이 무엇인지 아시나요? 아마도 당신은 차이 비율의 한계에 대해 말해 줄 것입니다. 상트페테르부르크 주립대학교 수학과 기계과 1학년 때 빅토르 페트로비치 카빈(Viktor Petrovich Khavin)이 나에게 이렇게 말했습니다. 단호한한 점에서 함수의 테일러 급수 첫 번째 항의 계수로 미분합니다(이것은 미분 없이 테일러 급수를 결정하기 위한 별도의 체조였습니다). 나는 그것이 무엇인지 마침내 이해할 때까지 오랫동안 이 정의를 비웃었습니다. 도함수는 우리가 미분하는 함수가 y=x, y=x^2, y=x^3 함수와 얼마나 유사한지를 나타내는 간단한 척도에 지나지 않습니다.

나는 이제 다음과 같은 학생들에게 강의하는 영광을 누렸습니다. 두려워하는수학. 수학을 두려워한다면 우리도 같은 길을 가고 있습니다. 일부 텍스트를 읽으려고 할 때 그것이 지나치게 복잡해 보이면 그 텍스트가 제대로 작성되지 않았음을 아십시오. 나는 정확성을 잃지 않고 "손가락으로"논의할 수 없는 수학 영역은 단 하나도 없다고 주장합니다.

가까운 미래를 위한 과제: 저는 학생들에게 선형 2차 조절기가 무엇인지 이해하도록 배정했습니다. 부끄러워하지 말고 인생의 3분을 투자해 링크를 따라가보세요. 아무것도 이해하지 못한다면 우리는 같은 길을 가고 있는 것입니다. 나 (전문 수학자이자 프로그래머)도 아무것도 이해하지 못했습니다. 그리고 나는 이것을 "당신의 손가락"으로 알아낼 수 있다고 확신합니다. 지금은 그것이 무엇인지 모르지만 우리가 그것을 알아낼 수 있을 것이라고 확신합니다.

그래서 학생들이 겁에 질려 나에게 달려와 선형-2차 조정기는 평생 절대 마스터하지 못할 끔찍한 것이라고 말한 후 내가 학생들에게 줄 첫 번째 강의는 다음과 같습니다. 최소제곱법. 선형 방정식을 풀 수 있나요? 이 글을 읽고 있다면 그렇지 않을 가능성이 높습니다.

따라서 두 점 (x0, y0), (x1, y1), 예를 들어 (1,1) 및 (3,2)가 주어지면 이 두 점을 통과하는 선의 방정식을 찾는 것이 과제입니다.

삽화

이 줄에는 다음과 같은 방정식이 있어야 합니다.

여기서 알파와 베타는 우리에게 알려지지 않았지만 이 선의 두 가지 점은 알려져 있습니다.

이 방정식을 행렬 형식으로 작성할 수 있습니다.

여기서 우리는 서정적인 여담을 만들어야 합니다. 행렬이란 무엇입니까? 행렬은 2차원 배열에 지나지 않습니다. 이는 데이터를 저장하는 방법이므로 더 이상의 의미를 부여해서는 안 됩니다. 특정 행렬을 어떻게 해석하는지는 우리에게 달려 있습니다. 주기적으로 나는 그것을 선형 매핑으로 해석하고, 주기적으로 이차 형태로, 때로는 단순히 벡터 집합으로 해석할 것입니다. 이것은 모두 문맥에 따라 명확해질 것입니다.

구체적인 행렬을 기호 표현으로 바꾸겠습니다.

그런 다음 (알파, 베타)를 쉽게 찾을 수 있습니다.

이전 데이터에 대해 더 구체적으로 설명하면 다음과 같습니다.

점 (1,1)과 (3,2)를 통과하는 선의 방정식은 다음과 같습니다.

좋아요, 여기서는 모든 것이 명확합니다. 지나는 선의 방정식을 구해보자 포인트: (x0,y0), (x1,y1) 및 (x2,y2):

오오오, 하지만 두 개의 미지수에 대한 세 개의 방정식이 있습니다! 표준 수학자라면 해결책이 없다고 말할 것입니다. 프로그래머는 뭐라고 말할까요? 그리고 그는 먼저 이전 방정식 시스템을 다음 형식으로 다시 작성할 것입니다.

우리의 경우, 벡터 i, j, b는 3차원이므로 (일반적인 경우) 이 시스템에 대한 해결책은 없습니다. 모든 벡터(alpha\*i + beta\*j)는 벡터(i, j)가 걸쳐 있는 평면에 있습니다. b가 이 평면에 속하지 않으면 해가 없습니다(방정식에서 동일성을 얻을 수 없습니다). 무엇을 해야 할까요? 타협점을 찾아보자. 다음으로 나타내자 e(알파, 베타)정확히 우리가 평등을 얼마나 달성하지 못했는지:

그리고 우리는 이 오류를 최소화하려고 노력할 것입니다:

왜 정사각형인가?

우리는 노름의 최소값뿐만 아니라 노름 제곱의 최소값도 찾고 있습니다. 왜? 최소점 자체가 일치하고 정사각형은 매끄러운 함수(인수(알파, 베타)의 2차 함수)를 제공하는 반면, 단순히 길이는 최소점에서 미분할 수 없는 원뿔 모양의 함수를 제공합니다. brr. 사각형이 더 편리합니다.

분명히 벡터를 사용하면 오류가 최소화됩니다. 이자형벡터에 의해 확장된 평면에 직교 그리고 제이.

삽화

즉, 모든 점에서 이 직선까지 거리의 제곱 길이의 합이 최소가 되는 직선을 찾고 있습니다.

업데이트: 여기에 문제가 있습니다. 직선까지의 거리는 직교 투영이 아닌 수직으로 측정해야 합니다. 이 평론가의 말이 맞습니다.

삽화

완전히 다른 말로 하면(신중하게 형식화되지는 않았지만 명확해야 함) 모든 점 쌍 사이에 가능한 모든 선을 취하고 모든 점 사이의 평균 선을 찾습니다.

삽화

또 다른 설명은 간단합니다. 모든 데이터 포인트(여기에는 3개가 있음)와 우리가 찾고 있는 직선 사이에 스프링을 연결하고 평형 상태의 직선이 바로 우리가 찾고 있는 것입니다.

최소 이차 형태

따라서 이 벡터가 주어지면 행렬의 열 벡터에 의해 확장되는 평면 (이 경우 (x0,x1,x2) 및 (1,1,1)) 벡터를 찾고 있습니다. 이자형길이의 최소 제곱으로. 분명히 최소값은 벡터에 대해서만 달성 가능합니다. 이자형, 행렬의 열 벡터에 의해 확장된 평면에 직교 :

즉, 우리는 다음과 같은 벡터 x=(alpha, beta)를 찾고 있습니다.

이 벡터 x=(alpha, beta)는 2차 함수 ||e(alpha, beta)||^2의 최소값이라는 점을 상기시켜 드리겠습니다.

여기서 행렬은 2차 형식으로도 해석될 수 있다는 점을 기억하는 것이 유용할 것입니다. 예를 들어 단위 행렬((1,0),(0,1))은 x^2 + y^ 함수로 해석될 수 있습니다. 2:

이차 형태

이 모든 체조는 선형 회귀라는 이름으로 알려져 있습니다.

Dirichlet 경계 조건을 사용한 Laplace 방정식

이제 가장 간단한 실제 작업은 특정 삼각형 표면이 있으므로 이를 부드럽게 하는 것입니다. 예를 들어 내 얼굴 모델을 로드해 보겠습니다.

원본 커밋을 사용할 수 있습니다. 외부 종속성을 최소화하기 위해 이미 Habré에 있는 소프트웨어 렌더러의 코드를 사용했습니다. 선형 시스템을 해결하기 위해 저는 OpenNL을 사용합니다. 이것은 훌륭한 솔버이지만 설치가 매우 어렵습니다. 프로젝트가 있는 폴더에 두 개의 파일(.h+.c)을 복사해야 합니다. 모든 스무딩은 다음 코드로 수행됩니다.

(int d=0; d의 경우<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&얼굴 = 얼굴[i]; for (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X, Y, Z 좌표는 분리 가능하므로 별도로 스무딩합니다. 즉, 나는 모델의 정점 수와 동일한 수의 변수를 갖는 세 가지 선형 방정식 시스템을 푼다. 행렬 A의 처음 n개 행은 행당 1개만 갖고, 벡터 b의 처음 n개 행은 원래 모델 좌표를 갖습니다. 즉, 정점의 새 위치와 정점의 이전 위치 사이에 스프링을 연결합니다. 새 정점이 이전 정점에서 너무 멀리 이동해서는 안 됩니다.

행렬 A의 모든 후속 행(faces.size()*3 = 메시에 있는 모든 삼각형의 가장자리 수)은 1이 한 번 발생하고 -1이 한 번 발생하며, 벡터 b에는 반대되는 구성 요소가 0개 있습니다. 이는 삼각형 메시의 각 가장자리에 스프링을 배치한다는 의미입니다. 모든 가장자리는 시작점과 끝점과 동일한 정점을 얻으려고 합니다.

다시 한 번 말씀드리지만, 모든 정점은 변수이며 원래 위치에서 멀리 이동할 수는 없지만 동시에 서로 유사해지려고 노력합니다.

결과는 다음과 같습니다.

모든 것이 괜찮을 것입니다. 모델은 정말 매끄러워졌지만 원래 가장자리에서 멀어졌습니다. 코드를 조금 변경해 보겠습니다.

(int i=0; i의 경우<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

행렬 A에서 가장자리에 있는 정점에 대해 v_i = verts[i][d] 범주의 행을 추가하지 않고 1000*v_i = 1000*verts[i][d]를 추가합니다. 무엇이 바뀌나요? 그리고 이것은 오류의 이차 형태를 변경합니다. 이제 가장자리 상단에서 단일 편차가 발생하면 이전처럼 1단위가 아니라 1000*1000단위의 비용이 발생합니다. 즉, 우리는 맨 끝 꼭지점에 더 강한 스프링을 걸었고, 솔루션은 다른 꼭지점을 더 강하게 늘리는 것을 선호할 것입니다. 결과는 다음과 같습니다.

꼭지점 사이의 스프링 강도를 두 배로 늘려 보겠습니다.
nlCoefficient(면[ j ], 2); nlCoefficient(면[(j+1)%3], -2);

표면이 더 매끄러워졌다는 것은 논리적입니다.

이제 훨씬 더 강력해졌습니다.

이게 뭔가요? 와이어 링을 비눗물에 담갔다고 상상해 보세요. 결과적으로 결과 비누 필름은 가능한 한 최소한의 곡률을 가지려고 노력하여 경계선, 즉 와이어 링에 닿습니다. 이것이 바로 우리가 테두리를 고정하고 내부의 매끄러운 표면을 요구함으로써 얻은 것입니다. 축하합니다. 우리는 Dirichlet 경계 조건을 사용하여 Laplace 방정식을 풀었습니다. 멋진데? 그러나 실제로는 하나의 선형 방정식 시스템만 풀면 됩니다.

포아송 방정식

또 다른 멋진 이름을 기억합시다.

다음과 같은 이미지가 있다고 가정해 보겠습니다.

누구에게나 좋아 보이지만 나는 의자가 마음에 들지 않습니다.

사진을 반으로 자르겠습니다.



그리고 내 손으로 의자를 선택하겠습니다.

그런 다음 마스크의 흰색인 모든 항목을 그림의 왼쪽으로 끌어당기는 동시에 그림 전체에서 인접한 두 픽셀 간의 차이는 오른쪽의 인접한 두 픽셀 간의 차이와 같아야 한다고 말합니다. 그림:

(int i=0; i의 경우

결과는 다음과 같습니다.

삶의 예

일부러 엉성한 결과를 내지는 않았기 때문에... 저는 단지 최소제곱법을 정확히 어떻게 적용할 수 있는지 보여주고 싶었습니다. 이것이 훈련 코드입니다. 이제 삶의 예를 들어 보겠습니다.

다음과 같은 직물 샘플 사진이 많이 있습니다.

내 임무는 이 품질의 사진에서 매끄러운 질감을 만드는 것입니다. 시작하려면 (자동으로) 반복되는 패턴을 찾습니다.

이 사변형을 직선으로 자르면 왜곡으로 인해 가장자리가 만나지 않게 됩니다. 다음은 4번 반복되는 패턴의 예입니다.

숨겨진 텍스트

솔기가 명확하게 보이는 부분은 다음과 같습니다.

따라서 나는 직선을 따라 자르지 않을 것입니다. 절단 선은 다음과 같습니다.

숨겨진 텍스트

그리고 여기 4번 반복되는 패턴이 있습니다:

숨겨진 텍스트

좀 더 명확하게 설명하자면 다음과 같습니다.

이미 더 좋았습니다. 컷이 직선으로 진행되지 않아 모든 종류의 컬을 피했지만 원본 사진의 조명이 고르지 않아 이음새가 여전히 보입니다. 이것이 바로 포아송 방정식의 최소 제곱법이 구출되는 곳입니다. 조명을 평준화한 후의 최종 결과는 다음과 같습니다.

질감은 완벽하게 매끄럽게 나타났으며 이 모든 것은 매우 평범한 품질의 사진에서 자동으로 이루어졌습니다. 수학을 두려워하지 말고, 간단한 설명을 찾아보세요. 그러면 공학에 행복해질 것입니다.

평준화 후 다음 형식의 함수를 얻습니다. g (x) = x + 1 3 + 1 .

해당 매개변수를 계산하여 선형 관계 y = a x + b를 사용하여 이 데이터를 근사화할 수 있습니다. 이를 위해서는 소위 최소제곱법을 적용해야 합니다. 또한 실험 데이터에 가장 잘 맞는 선을 확인하기 위해 도면을 만들어야 합니다.

OLS(최소제곱법)란 정확히 무엇입니까?

우리가 해야 할 가장 중요한 일은 두 변수 F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2의 함수 값이 되는 선형 의존성 계수를 찾는 것입니다. 가장 작은. 즉, a와 b의 특정 값에 대해 결과 직선에서 제시된 데이터의 제곱 편차의 합은 최소값을 갖습니다. 이것이 최소제곱법의 의미입니다. 예제를 풀기 위해 우리가 해야 할 일은 두 변수 함수의 극값을 찾는 것뿐입니다.

계수 계산 공식을 도출하는 방법

계수를 계산하기 위한 공식을 도출하려면 두 개의 변수가 있는 연립방정식을 만들고 풀어야 합니다. 이를 위해 a와 b에 대해 F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 표현식의 편도함수를 계산하고 이를 0과 동일시합니다.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a ∑ i = 1n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

방정식 시스템을 풀려면 대체 방법이나 Cramer의 방법과 같은 모든 방법을 사용할 수 있습니다. 결과적으로 최소제곱법을 사용하여 계수를 계산하는 데 사용할 수 있는 공식이 있어야 합니다.

n ∑ i = 1n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1n y i - a ∑ i = 1 n x i n

우리는 함수가 적용되는 변수의 값을 계산했습니다.
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 는 최소값을 취합니다. 세 번째 단락에서 우리는 이것이 정확히 왜 그런지 증명할 것입니다.

이것은 실제로 최소제곱법을 적용한 것입니다. 매개변수 a를 찾는 데 사용되는 공식에는 ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2 및 매개변수가 포함됩니다.
n – 실험 데이터의 양을 나타냅니다. 각 금액을 별도로 계산하는 것이 좋습니다. 계수 b의 값은 a 바로 다음에 계산됩니다.

원래의 예로 돌아가 보겠습니다.

실시예 1

여기서 n은 5입니다. 계수 공식에 포함된 필요한 양을 보다 편리하게 계산할 수 있도록 표를 작성해 보겠습니다.

나는 = 1 나는=2 나는=3 나는=4 나는=5 ∑ 나는 = 1 5
x 나는 0 1 2 4 5 12
응 나 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x 나는 y 나는 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x 나는 2 0 1 4 16 25 46

해결책

네 번째 행에는 두 번째 행의 값에 각 개인 i의 세 번째 행 값을 곱하여 얻은 데이터가 포함됩니다. 다섯 번째 줄에는 두 번째 제곱의 데이터가 포함됩니다. 마지막 열에는 개별 행 값의 합계가 표시됩니다.

최소제곱법을 사용하여 필요한 계수 a와 b를 계산해 보겠습니다. 이렇게하려면 마지막 열에서 필요한 값을 대체하고 금액을 계산하십시오.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33, 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≒ 0, 165 b ≒ 2, 184

필요한 근사 직선은 y = 0, 165 x + 2, 184와 같습니다. 이제 어느 선이 데이터에 더 잘 근접하는지 결정해야 합니다. g(x) = x + 1 3 + 1 또는 0, 165 x + 2, 184. 최소제곱법을 사용하여 추정해 보겠습니다.

오류를 계산하려면 직선 σ 1 = ∑ i = 1 n (y i - (a x i + bi i)) 2 및 σ 2 = ∑ i = 1 n (y i)에서 데이터의 제곱 편차의 합을 찾아야 합니다. - g (x i)) 2, 최소값은 더 적합한 라인에 해당합니다.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ∑ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ∑ 0.096

답변:σ 1 이후< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0.165 x + 2.184.

최소 제곱법은 그래픽 그림에 명확하게 표시되어 있습니다. 빨간색 선은 직선 g(x) = x + 1 3 + 1을 표시하고, 파란색 선은 y = 0, 165 x + 2, 184를 표시합니다. 원본 데이터는 분홍색 점으로 표시됩니다.

이 유형의 정확한 근사치가 필요한 이유를 설명하겠습니다.

데이터 평활화가 필요한 작업뿐만 아니라 데이터를 보간하거나 외삽해야 하는 작업에도 사용할 수 있습니다. 예를 들어 위에서 논의한 문제에서 x = 3 또는 x = 6에서 관측된 양 y의 값을 찾을 수 있습니다. 우리는 그러한 예에 대해 별도의 기사를 썼습니다.

OLS 방법의 증명

a와 b를 계산할 때 함수가 최소값을 취하려면 주어진 지점에서 F (a, b) 형식의 함수 미분의 2차 형식 행렬이 필요합니다 = ∑ i = 1n (y i - (a x i + b)) 2는 양의 정부호입니다. 어떻게 보이는지 보여드리겠습니다.

실시예 2

다음과 같은 형식의 2차 미분이 있습니다.

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2B

해결책

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1n (1) = 2n

즉, 다음과 같이 쓸 수 있습니다: d 2 F (a ; b) = 2 ∑ i = 1 n (xi) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

우리는 2차 형태의 행렬 M = 2 ∑ i = 1 n (xi) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n 을 얻었습니다.

이 경우, a와 b에 따라 개별 요소의 값은 변하지 않습니다. 이 행렬은 양의 정부호 행렬입니까? 이 질문에 답하기 위해 각도 마이너가 양수인지 확인해 보겠습니다.

우리는 1차 단소 각도를 계산합니다: 2 ∑ i = 1 n (x i) 2 > 0 . 점 x i가 일치하지 않으므로 부등식은 엄격합니다. 우리는 향후 계산에서 이 점을 염두에 둘 것입니다.

2차 각도 마이너를 계산합니다.

d e t (M) = 2 ∑ i = 1 n (xi) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (xi) 2 - ∑ i = 1 n x i 2

그 후, 수학적 귀납법을 사용하여 부등식 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0을 증명합니다.

  1. 이 부등식이 임의의 n에 유효한지 확인해 보겠습니다. 2를 취하고 계산해 봅시다:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

우리는 올바른 평등을 얻었습니다 (x 1과 x 2 값이 일치하지 않는 경우).

  1. 이 부등식이 n에 대해 참이라고 가정해 보겠습니다. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – 참입니다.
  2. 이제 우리는 n + 1에 대한 타당성을 증명할 것입니다. (n + 1) ∑ i = 1 n + 1 (xi) 2 - ∑ i = 1 n + 1 x i 2 > 0, 만약 n ∑ i = 1 n (xi) 2 - ∑ i = 1 n x i 2 > 0 .

우리는 다음을 계산합니다:

(n + 1) ∑ i = 1 n + 1 (xi) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (xi) 2 + x n + 1 2 - ∑ i = 1n x i + x n + 1 2 = = n ∑ i = 1 n (xi) 2 + n x n + 1 2 + ∑ i = 1 n (xi) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 xn + 1 ∑ i = 1n x i + xn + 1 2 = = ∑ i = 1 n (xi) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1n x i + ∑ i = 1 n (xi) 2 = = ∑ i = 1 n (xi) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + xn + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (xi) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1 - x 2) 2 + . . . + (xn - 1 - xn) 2 > 0

중괄호로 묶인 표현식은 0보다 크고(2단계에서 가정한 내용에 따라) 나머지 항은 모두 숫자의 제곱이므로 0보다 큽니다. 우리는 불평등을 증명했습니다.

답변:발견된 a와 b는 함수 F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2의 가장 작은 값에 해당합니다. 이는 최소 제곱법의 필수 매개변수임을 의미합니다. (LSM).

텍스트에 오류가 있으면 강조 표시하고 Ctrl+Enter를 누르세요.

코스 작업

최소제곱법을 사용한 함수 근사


소개

경험적 Mathcad 근사

이 과정의 목적은 컴퓨터 과학에 대한 지식을 심화하고 Microsoft Excel 및 MathCAD 스프레드시트 프로세서 작업 기술을 개발 및 통합하는 것입니다. 연구와 관련된 주제 분야의 컴퓨터를 사용하여 문제를 해결하는 데 사용합니다.

각 작업에는 문제의 조건, 초기 데이터, 결과 발행 형식이 공식화되고 문제 해결을 위한 주요 수학적 종속성이 표시되며 제어 계산을 통해 프로그램의 올바른 작동을 확인할 수 있습니다.

근사의 개념은 더 간단하고, 사용하기 더 편리하거나, 단순히 더 잘 알려진 다른 수학적 개체(예: 숫자 또는 함수)를 대략적으로 표현하는 것입니다. 과학 연구에서 근사치는 경험적 결과를 설명, 분석, 일반화하고 추가로 사용하는 데 사용됩니다.

알려진 바와 같이, 하나의 특정 값이 하나의 인수 값에 해당할 때 양 사이에는 정확한(기능적) 연결이 있을 수 있고, 인수의 하나의 특정 값이 대략적인 값에 해당할 때 덜 정확한(상관) 연결이 있을 수 있습니다. 특정 기능 값 세트가 어느 정도 서로 가깝습니다. 과학 연구를 수행하거나 관찰 또는 실험 결과를 처리할 때 일반적으로 두 번째 옵션을 다루어야 합니다. 경험적으로 결정되는 다양한 지표의 양적 의존성을 연구할 때 일반적으로 약간의 변동성이 있습니다. 부분적으로는 무생물, 특히 살아있는 자연의 연구 대상의 이질성에 의해 결정되며, 부분적으로는 관찰 오류 및 재료의 정량적 처리에 의해 결정됩니다. 마지막 구성 요소를 항상 완전히 제거할 수는 없으며 적절한 연구 방법을 신중하게 선택하고 주의 깊게 작업해야만 최소화할 수 있습니다.

기술 프로세스 및 생산 자동화 분야의 전문가는 컴퓨터를 사용하여 처리하는 대량의 실험 데이터를 다룹니다. 소스 데이터와 얻은 계산 결과는 스프레드시트 프로세서(스프레드시트), 특히 Excel을 사용하여 표 형식으로 표시할 수 있습니다. 컴퓨터 과학 교과 과정을 통해 학생은 전문 활동 분야의 문제를 해결할 때 기본 컴퓨터 기술을 사용하여 기술을 통합하고 개발할 수 있습니다. - 컴퓨터 지원 설계 시스템 수업의 컴퓨터 대수학 시스템, 대화형 문서 준비에 중점 계산 및 시각적 지원은 사용하기 쉽고 팀워크에 적용됩니다.


1. 일반 정보


특히 경험적 데이터를 분석할 때 수량 간의 기능적 관계를 명시적으로 찾아야 하는 경우가 매우 많습니다. 엑스그리고 ~에, 이는 측정 결과로 얻어집니다.

두 수량 x와 y 사이의 관계에 대한 분석적 연구에서 일련의 관찰이 이루어지고 그 결과는 값 테이블입니다.


더블 엑스1 엑스1 엑스엑스N1 와이1 와이와이N

이 표는 일반적으로 다음과 같은 몇 가지 실험의 결과로 얻어집니다. 엑스,(독립적인 값)은 실험자가 설정하며, 와이,경험의 결과로 얻은 것. 그러므로 이 값들은 와이,우리는 이를 경험적 또는 실험적 값이라고 부를 것입니다.

양 x와 y 사이에는 함수적 관계가 있지만 그 분석 형식은 일반적으로 알려져 있지 않으므로 실제로 중요한 작업이 발생합니다. 즉, 실험식을 찾는 것입니다.


와이 =에프 (x;a 1,ㅏ 2,…, 오전 ), (1)


(어디 1 ,ㅏ2 ,…, ㅏ- 매개변수), 그 값은 x = x,아마도 실험값과 거의 다를 것입니다. y, (나는 = 1,2,…, 피).

일반적으로 함수가 선택되는 함수 클래스(예: 선형, 거듭제곱, 지수 등)를 나타냅니다. 에프엑스(f(x)), 최적의 매개변수 값이 결정됩니다.

원본으로 대체한다면 엑스,그런 다음 이론적 값을 얻습니다.

와이=f (엑스; ㅏ 1,ㅏ 2……) , 어디 나 = 1,2,…, N.


차이점 와이- y, 편차라고 하며 점으로부터의 수직 거리를 나타냅니다. 경험적 함수의 그래프.

최소제곱법에 따르면 가장 좋은 계수는 1 ,ㅏ2 ,…, ㅏ주어진 함수 값에서 발견된 경험적 함수의 제곱 편차의 합이 고려되는 것



최소화될 것입니다.

최소제곱법의 기하학적 의미를 설명해보자.

각 숫자 쌍( 엑스, 와이) 소스 테이블의 포인트를 결정합니다. 표면에 XOY.다양한 계수 값에 대해 공식 (1) 사용 1 ,ㅏ2 ,…, ㅏ함수 (1)의 그래프인 일련의 곡선을 구성할 수 있습니다. 임무는 계수를 결정하는 것입니다. 1 ,ㅏ2 ,…, ㅏ점으로부터의 수직 거리의 제곱의 합이 되는 방식으로 (엑스, 와이) 함수 (1)의 그래프 이전에 가장 작았습니다 (그림 1).



경험적 공식의 구성은 두 단계, 즉 이 공식의 일반적인 형식을 명확하게 하고 최적의 매개변수를 결정하는 단계로 구성됩니다.

이 수량 x와 사이의 관계의 성격이 와이, 경험적 의존성의 유형은 임의적입니다. 정확도가 좋은 간단한 공식이 선호됩니다. 경험적 공식의 성공적인 선택은 주로 주제 영역에 대한 연구자의 지식에 달려 있으며, 이를 사용하여 이론적 고려 사항에서 함수 클래스를 나타낼 수 있습니다. 얻은 데이터를 데카르트 또는 특수 좌표계(반로그, 로그 등)로 표현하는 것이 매우 중요합니다. 점의 위치에서 구성된 그래프와 알려진 곡선 샘플 간의 유사성을 설정하여 종속성의 일반적인 형태를 대략적으로 추측할 수 있습니다.

최고의 확률 결정 1 ,ㅏ2,…, 실험식에 포함된 실험식은 잘 알려진 분석 방법에 의해 생성됩니다.

계수 집합을 찾기 위해 1 ,ㅏ2 …..ㅏ, 식 (2)에 의해 정의된 함수 S의 최소값을 제공하는 경우 여러 변수의 함수 극값에 필요한 조건, 즉 부분 도함수의 0과 동일성을 사용합니다.

결과적으로 우리는 계수를 결정하는 일반적인 시스템을 얻습니다. (나 = 1,2,…, 중):



따라서 계수를 구하면 해결 시스템(3)으로 축소됩니다. 실험식 (1)이 매개변수에 대해 선형인 경우 이 시스템은 단순화됩니다. 이면 시스템 (3)은 선형이 됩니다.


1.1 선형 의존성


시스템(3)의 특정 형태는 우리가 종속성(1)을 찾고 있는 경험식의 클래스에 따라 달라집니다. 선형 의존성의 경우 와이=아1 + 에2 엑스시스템 (3)은 다음과 같은 형식을 취합니다.


이 선형 시스템은 알려진 방법(가우스 방법, 단순 반복, Cramer 공식)으로 풀 수 있습니다.


1.2 2차 의존성


2차 의존성의 경우 와이=아1 + 에2 x+a3엑스 2시스템 (3)은 다음과 같은 형식을 취합니다.



1.3 지수 의존성


어떤 경우에는 불확실한 계수가 비선형적으로 들어가는 함수를 경험식으로 취하기도 한다. 이 경우 문제가 선형화될 수 있는 경우도 있습니다. 선형으로 줄입니다. 이러한 종속성은 지수 종속성을 포함합니다.


와이=아1 *이자형a2x (6)


어디서 1그리고 2, 불확실한 계수.

선형화는 평등의 로그(6)를 취함으로써 달성되며, 그 후 우리는 관계를 얻습니다.

ln y = ln a 1+a 2엑스 (7)


ln으로 나타내자 ~에그리고 ln 엑스그에 따라 그리고 , 종속성 (6)은 다음과 같은 형식으로 작성될 수 있습니다. 티 = 에이1 + 에2 엑스, 이를 통해 대체를 통해 공식 (4)를 적용할 수 있습니다. 1 ~에 그리고 ~에~에


1.4 상관 이론의 요소


복원된 기능적 의존성 그래프 와이(엑스)측정 결과에 따라 (x , ~에),나는 = 1.2, K, N회귀곡선이라고 부른다. 구성된 회귀 곡선과 실험 결과의 일치를 확인하기 위해 일반적으로 상관 계수(선형 의존성), 상관 비율 및 결정 계수와 같은 수치 특성이 도입됩니다. 이 경우 결과는 일반적으로 그룹화되어 상관관계표 형식으로 표시됩니다. 이 표의 각 셀에는 숫자가 표시됩니다. N아이제이 - 그 쌍(x, 와이), 그 구성요소는 각 변수에 대해 적절한 그룹화 간격에 속합니다. (각 변수에 대한) 그룹화 구간의 길이가 서로 같다고 가정하고 중심 x를 선택합니다. (각기 ~에) 이 간격과 숫자 중 N아이제이- 계산의 기초로.

상관 계수는 종속 확률 변수 사이의 선형 관계를 측정한 것입니다. 이는 평균적으로 변수 중 하나가 다른 변수의 선형 함수로 얼마나 잘 표현될 수 있는지를 보여줍니다.

상관 계수는 다음 공식을 사용하여 계산됩니다.


여기서 , 및 는 각각 산술 평균입니다. 엑스그리고 ~에.

절대값의 확률변수 간의 상관계수는 1을 초과하지 않습니다. |p| 1에 가까울수록 x와 의 선형 관계가 더 가까워집니다. 유.

비선형 상관관계의 경우 조건부 평균값은 곡선 근처에 위치합니다. 이 경우 연결 강도의 특성으로 상관 비율을 사용하는 것이 좋습니다. 이 해석은 연구되는 종속 유형에 의존하지 않습니다.

상관 비율은 다음 공식을 사용하여 계산됩니다.



어디 N = , N에프= , 분자는 조건부 평균의 분산을 나타냅니다. 와이,절대평균에 대해서 와이.

언제나. 평등 = 0은 상관되지 않은 무작위 변수에 해당합니다. = 1 사이에 정확한 기능적 연결이 있는 경우에만 와이그리고 x. 선형 의존성의 경우 와이 x의 상관 비율은 상관 계수의 제곱과 일치합니다. 크기 - ? 2는 선형으로부터의 회귀 편차를 나타내는 지표로 사용됩니다.

상관 비율은 상관 관계의 척도입니다. 와이와 함께 엑스어떤 형태로든 경험적 데이터가 특수한 형태에 얼마나 가까운 지에 대한 아이디어를 제공할 수 없습니다. 구성된 곡선이 경험적 데이터를 얼마나 정확하게 반영하는지 확인하기 위해 결정 계수라는 또 다른 특성이 도입됩니다.

이를 설명하려면 다음 수량을 고려하십시오. - 총 제곱합, 여기서 는 평균값입니다.

우리는 다음과 같은 등식을 증명할 수 있습니다

첫 번째 항은 Sres =와 같으며 잔차 제곱합이라고 합니다. 이는 이론과 실험의 편차를 특징으로 합니다.

두 번째 항은 Sreg = 2와 같으며 회귀 제곱합이라고 하며 데이터의 확산을 나타냅니다.

분명히 다음과 같은 평등이 적용됩니다. S 전체 = 에스 오스트 + 에스 등록.

결정성 계수는 ​​다음 공식에 의해 결정됩니다.



총 제곱합에 비해 잔차 제곱합이 작을수록 결정성 계수의 값이 커집니다. 아르 자형2 , 회귀 분석으로 생성된 방정식이 변수 간의 관계를 얼마나 잘 설명하는지 보여줍니다. 1과 같으면 모델과 완전한 상관관계가 있는 것입니다. y의 실제 값과 추정 값 사이에는 차이가 없습니다. 반대의 경우 결정성 계수가 0이면 회귀 방정식은 y 값을 예측하는데 실패합니다.

결정성 계수는 ​​항상 상관 비율을 초과하지 않습니다. 동등성을 만족하는 경우 아르 자형 2 = 그러면 구성된 경험식이 경험적 데이터를 가장 정확하게 반영한다고 가정할 수 있습니다.


2. 문제의 진술


1. 최소제곱법을 사용하여 표에 주어진 함수를 근사화하십시오.

a) 1차 다항식;

b) 2차 다항식;

c) 지수 의존성.

각 종속성에 대해 결정성 계수를 계산합니다.

상관계수를 계산합니다(a의 경우에만).

각 종속성에 대해 추세선을 그립니다.

LINEST 함수를 사용하여 종속성의 수치적 특성을 계산합니다.

계산을 LINEST 함수를 사용하여 얻은 결과와 비교하십시오.

결과 공식 중 함수에 가장 가까운 것이 무엇인지 결론을 내리세요.

프로그래밍 언어 중 하나로 프로그램을 작성하고 계산 결과를 위에서 얻은 결과와 비교하십시오.


3. 초기 데이터


이 기능은 그림 1에 나와 있습니다.



4. Excel 스프레드시트 프로세서의 근사값 계산


계산을 수행하려면 Microsoft Excel 스프레드시트 프로세서를 사용하는 것이 좋습니다. 그리고 그림 2와 같이 데이터를 정렬합니다.



이를 위해 다음을 입력합니다.

· A6:A30 셀에 xi 값을 입력합니다. .

· B6:B30 셀에 уi 값을 입력합니다. .

· C6 셀에 =A6^ 수식을 입력하세요. 2.

· 이 수식은 C7:C30 셀에 복사됩니다.

· 셀 D6에 =A6*B6 수식을 입력합니다.

· 이 수식은 D7:D30 셀에 복사됩니다.

· 셀 F6에 =A6^4 수식을 입력합니다.

· 이 수식은 F7:F30 셀에 복사됩니다.

· 셀 G6에 =A6^2*B6 수식을 입력합니다.

· 이 수식은 G7:G30 셀에 복사됩니다.

· 셀 H6에 수식 =LN(B6)을 입력합니다.

· 이 수식은 H7:H30 셀에 복사됩니다.

· 셀 I6에 수식 =A6*LN(B6)을 입력합니다.

· 이 수식은 I7:I30 셀에 복사됩니다. 자동 합계를 사용하여 다음 단계를 수행합니다.

· 셀 A33에 수식 =SUM(A6:A30)을 입력합니다.

· B33 셀에 수식 =SUM(B6:B30)을 입력합니다.

· C33 셀에 =SUM(C6:C30) 수식을 입력합니다.

· D33 셀에 =SUM(D6:D30) 수식을 입력합니다.

· 셀 E33에 수식 =SUM(E6:E30)을 입력합니다.

· F33 셀에 =SUM(F6:F30) 수식을 입력합니다.

· 셀 G33에 수식 =SUM(G6:G30)을 입력합니다.

· H33 셀에 =SUM(H6:H30) 수식을 입력합니다.

· 셀 I33에 수식 =SUM(I6:I30)을 입력합니다.

함수를 근사화해보자 와이 = 에프(x) 선형 함수 와이=아1 + 에2엑스. 계수를 결정하려면 1그리고 2시스템 (4)를 사용해 봅시다. 셀 A33, B33, C33 및 D33에 있는 표 2의 합계를 사용하여 시스템 (4)를 다음 형식으로 작성합니다.



우리가 얻는 것을 해결 1= -24.7164 및 a2 = 11,63183

따라서 선형 근사는 다음과 같은 형식을 갖습니다. y= -24.7164 + 11.63183x (12)

시스템 (11)은 Microsoft Excel을 사용하여 해결되었습니다. 결과는 그림 3에 나와 있습니다.



표의 셀 A38:B39에는 수식이 작성됩니다(=MOBR (A35:B36)). 셀 E38:E39에는 수식(=MULTIPLE (A38:B39, C35:C36))이 포함되어 있습니다.


다음으로 함수를 근사화합니다. 와이 = 에프(x) 이차 함수로 와이=아1 + 에2 x+a3 엑스2. 계수를 결정하려면 1,ㅏ 2그리고 3시스템 (5)를 사용해 봅시다. 셀 A33, B33, C33, D33, E33, F33 및 G33에 있는 표 2의 합계를 사용하여 시스템 (5)를 다음 형식으로 작성합니다.



어느 것을 해결하면, 우리는 다음을 얻습니다: 1= 1.580946, 2= -0.60819 및 a3 = 0,954171 (14)

따라서 이차 근사의 형식은 다음과 같습니다.

y = 1.580946 -0.60819x +0.954171x2

시스템 (13)은 Microsoft Excel을 사용하여 해결되었습니다. 결과는 그림 4에 나와 있습니다.



표의 셀 A46:C48에는 수식이 작성됩니다(=MOBR (A41:C43)). 셀 F46:F48에는 수식(=MULTIPLE (A41:C43, D46:D48))이 포함되어 있습니다.

이제 함수를 근사화해 보겠습니다. 와이 = 에프(x) 지수함수 와이=아1 이자형a2x. 계수를 결정하려면 1 그리고 2 값을 로그로 나타내자 와이셀 A26, C26, H26 및 I26에 있는 표 2의 합계를 사용하여 다음 시스템을 얻습니다.



어디 с = ln(a1 ).

시스템 (10)을 해결하면 다음을 찾을 수 있습니다. c =0.506435,a2 = 0.409819.

강화 후에 우리는 a1을 얻습니다. = 1,659365.

따라서 지수 근사는 다음과 같은 형식을 갖습니다. y = 1.659365*e0.4098194x

시스템 (15)는 Microsoft Excel을 사용하여 해결되었습니다. 결과는 그림 5에 나와 있습니다.


표의 셀 A55:B56에는 수식이 작성됩니다(=MOBR (A51:B52)). E54:E56 셀에 수식이 작성됩니다(=MULTIPLE (A51:B52, C51:C52)). 셀 E56에는 수식 =EXP(E54)가 포함되어 있습니다.

다음 공식을 사용하여 x와 y의 산술 평균을 계산해 보겠습니다.



계산 결과 x 및 와이Microsoft Excel을 사용하는 방법은 그림 6에 나와 있습니다.



셀 B58에는 수식 =A33/25가 포함되어 있습니다. 셀 B59에는 수식 =B33/25가 포함되어 있습니다.

표 2


그림 7의 테이블이 어떻게 컴파일되는지 설명하겠습니다.

셀 A6:A33 및 B6:B33은 이미 채워져 있습니다(그림 2 참조).

· J6 셀에 =(A6-$B$58)*(B6-$B$59) 수식을 입력합니다.

· 이 수식은 J7:J30 셀에 복사됩니다.

· K6 셀에 =(A6-$B$58)^ 수식을 입력하세요. 2.

· 이 수식은 K7:K30 셀에 복사됩니다.

· L6 셀에 =(B1-$B$59)^2 수식을 입력합니다.

· 이 수식은 L7:L30 셀에 복사됩니다.

· M6 셀에 =($E$38+$E$39*A6-B6)^2 수식을 입력합니다.

· 이 수식은 M7:M30 셀에 복사됩니다.

· N6 셀에 =($F$46 +$F$47*A6 +$F$48*A6 L6-B6)^2 수식을 입력합니다.

· 이 수식은 N7:N30 셀에 복사됩니다.

· 셀 O6에 수식 =($E$56*EXP ($E$55*A6) - B6)^2를 입력합니다.

· 이 수식은 O7:O30 셀에 복사됩니다.

자동 합계를 사용하여 다음 단계를 수행합니다.

· J33 셀에 =CYMM (J6:J30) 수식을 입력합니다.

· K33 셀에 =SUM(K6:K30) 수식을 입력합니다.

· L33 셀에 =CYMM (L6:L30) 수식을 입력합니다.

· M33 셀에 =SUM(M6:M30) 수식을 입력합니다.

· N33 셀에 =SUM(N6:N30) 수식을 입력합니다.

· 셀 O33에 수식 =SUM(06:030)을 입력합니다.

이제 공식 (8)(선형 근사에만 해당)을 사용하여 상관 계수를 계산하고 공식 (10)을 사용하여 결정성 계수를 계산해 보겠습니다. Microsoft Excel을 사용한 계산 결과는 그림 7에 나와 있습니다.



표 8에서 셀 B61의 수식은 =J33/(K33*L33^(1/2)입니다. 셀 B62의 수식은 =1 - M33/L33입니다. 셀 B63의 수식은 =1 - N33입니다. /L33. 셀 B64에서 수식은 수식 =1 - O33/L33으로 작성됩니다.

계산 결과를 분석하면 2차 근사치가 실험 데이터를 가장 잘 설명하는 것으로 나타났습니다.


4.1 Excel에서 그래프 그리기


A1:A25 셀을 선택한 다음 차트 마법사로 이동합니다. 분산형 차트를 선택해 보겠습니다. 차트가 구성된 후 그래프 선을 마우스 오른쪽 버튼으로 클릭하고 추세선 추가(각각 선형, 지수, 거듭제곱 및 2차 다항식)를 선택합니다.

선형 근사 그래프


2차 근사 그래프


지수 피팅 그래프.


5. MathCAD를 이용한 함수 근사


통계적 매개변수를 고려한 데이터의 근사는 회귀 문제에 속합니다. 이는 일반적으로 본질적으로 통계적인 프로세스 또는 물리적 현상(예: 방사 측정법 및 핵 지구물리학 측정)의 측정 결과 또는 높은 수준의 간섭(소음)으로 얻은 실험 데이터를 처리할 때 발생합니다. 회귀 분석의 임무는 실험 데이터를 가장 잘 설명하는 수학 공식을 선택하는 것입니다.


.1 선형 회귀


Mathcad 시스템의 선형 회귀는 인수 벡터를 사용하여 수행됩니다. 엑스그리고 독서 와이기능:

절편(x, y)- 매개변수를 계산합니다. 1 , 회귀선의 수직 변위(그림 참조)

기울기(x, y)- 매개변수를 계산합니다. 2 , 회귀선의 기울기(그림 참조)

y(x) = a1+a2*x


기능 상관(y, y(x))계산하다 피어슨 상관 계수.그 사람이 가까울수록 1, 처리된 데이터가 선형 관계에 더 정확하게 일치할수록(그림 참조)

.2 다항식 회귀


Mathcad에서 임의의 다항식 차수 n과 임의의 샘플 좌표를 사용하는 1차원 다항식 회귀는 다음 함수에 의해 수행됩니다.

회귀(x, y, n)- 벡터를 계산합니다 에스,계수를 포함하는 일체 포함다항식 N학위;

계수 값 일체 포함벡터에서 추출할 수 있습니다. 에스기능 부분행렬(S, 3, 길이(S) - 1, 0, 0).

회귀 방정식에서 얻은 계수 값을 사용합니다.


y(x) = a1+a2*x+a3*x2 (사진 참조)

.3 비선형 회귀


간단한 표준 근사 공식의 경우 Mathcad 프로그램에서 함수 매개변수를 선택하는 다양한 비선형 회귀 함수가 제공됩니다.

여기에는 다음 기능이 포함됩니다. expfit (x, y, s),계수를 포함하는 벡터를 반환합니다. a1, a2그리고 a3지수 함수

y(x) = a1 ^exp (a2x) + a3.V 벡터 에스계수의 초기값이 입력됩니다. a1, a2그리고 a3첫 번째 근사치.


결론


계산 결과를 분석하면 선형 근사치가 실험 데이터를 가장 잘 설명하는 것으로 나타났습니다.

MathCAD 프로그램을 사용하여 얻은 결과는 Excel을 사용하여 얻은 값과 완전히 일치합니다. 이는 계산의 정확성을 나타냅니다.


서지

  1. 컴퓨터 과학: 교과서 / Ed. 교수 N.V. 마카로바. M.: 금융 및 통계 2007
  2. 정보학: 컴퓨터 기술에 관한 워크숍 / Ed. 에드. 교수 N.V. 마카로바. M 금융 및 통계, 2011.
  3. NS Piskunov. 미분 및 적분법, 2010.
  4. 컴퓨터 과학, 최소 제곱 근사, 지침, 상트페테르부르크, 2009.
튜터링

주제를 공부하는 데 도움이 필요하십니까?

우리의 전문가들은 귀하가 관심 있는 주제에 대해 조언하거나 개인교습 서비스를 제공할 것입니다.
신청서 제출지금 당장 주제를 표시하여 상담 가능성을 알아보세요.

로드 중...로드 중...