วิธีกำลังสองน้อยที่สุดใน Excel การวิเคราะห์การถดถอย

งานหลักสูตร

สาขาวิชา: วิทยาการคอมพิวเตอร์

หัวข้อ: การประมาณฟังก์ชันโดยใช้วิธีกำลังสองน้อยที่สุด

การแนะนำ

1. คำชี้แจงของปัญหา

2. สูตรการคำนวณ

การคำนวณโดยใช้ตารางที่สร้างโดยใช้ Microsoft Excel

แผนภาพอัลกอริทึม

การคำนวณใน MathCad

ผลลัพธ์ที่ได้โดยใช้ฟังก์ชันเชิงเส้น

การนำเสนอผลลัพธ์ในรูปแบบกราฟ

การแนะนำ

วัตถุประสงค์ของงานหลักสูตรนี้คือเพื่อเพิ่มพูนความรู้ในด้านวิทยาการคอมพิวเตอร์ พัฒนาและรวบรวมทักษะในการทำงานกับโปรเซสเซอร์สเปรดชีต Microsoft Excel และผลิตภัณฑ์ซอฟต์แวร์ MathCAD และใช้ทักษะเหล่านี้ในการแก้ปัญหาโดยใช้คอมพิวเตอร์จากสาขาวิชาที่เกี่ยวข้องกับการวิจัย

การประมาณ (จากภาษาละติน "approximare" - "to come near") เป็นการแสดงออกโดยประมาณของวัตถุทางคณิตศาสตร์ใดๆ (เช่น ตัวเลขหรือฟังก์ชัน) ผ่านวัตถุอื่นๆ ที่ง่ายกว่า สะดวกกว่าในการใช้งาน หรือรู้จักกันดีกว่า ในการวิจัยทางวิทยาศาสตร์ การประมาณใช้เพื่ออธิบาย วิเคราะห์ สรุป และใช้ผลลัพธ์เชิงประจักษ์ต่อไป

ดังที่ทราบกันดีว่า อาจมีการเชื่อมโยง (เชิงฟังก์ชัน) ที่แน่นอนระหว่างปริมาณ เมื่อค่าเฉพาะหนึ่งค่าสอดคล้องกับค่าหนึ่งของอาร์กิวเมนต์ และการเชื่อมต่อ (สหสัมพันธ์) ที่แม่นยำน้อยกว่า เมื่อค่าเฉพาะหนึ่งของอาร์กิวเมนต์สอดคล้องกับค่าประมาณหรือ ชุดของค่าฟังก์ชันบางค่าที่ใกล้เคียงกันในระดับหนึ่งหรืออีกระดับหนึ่ง เมื่อทำการวิจัยทางวิทยาศาสตร์ ประมวลผลผลการสังเกตหรือการทดลอง คุณมักจะต้องจัดการกับตัวเลือกที่สอง

เมื่อศึกษาการพึ่งพาเชิงปริมาณของตัวบ่งชี้ต่าง ๆ ค่าที่ถูกกำหนดเชิงประจักษ์ตามกฎแล้วจะมีความแปรปรวนอยู่บ้าง ส่วนหนึ่งถูกกำหนดโดยความหลากหลายของวัตถุที่ศึกษาซึ่งไม่มีชีวิตและโดยเฉพาะอย่างยิ่งธรรมชาติที่มีชีวิต และส่วนหนึ่งถูกกำหนดโดยข้อผิดพลาดของการสังเกตและการประมวลผลเชิงปริมาณของวัสดุ องค์ประกอบสุดท้ายไม่สามารถกำจัดออกไปได้ทั้งหมดเสมอไป สามารถลดขนาดลงได้โดยการเลือกวิธีการวิจัยที่เหมาะสมและการทำงานอย่างระมัดระวังอย่างระมัดระวังเท่านั้น ดังนั้นเมื่อทำการวิจัยใด ๆ ปัญหาเกิดขึ้นจากการระบุลักษณะที่แท้จริงของการพึ่งพาตัวบ่งชี้ที่ศึกษาระดับนี้หรือระดับนั้นที่ถูกปกปิดโดยความล้มเหลวในการพิจารณาความแปรปรวน: ค่านิยม เพื่อจุดประสงค์นี้ จะใช้การประมาณ - คำอธิบายโดยประมาณของการพึ่งพาสหสัมพันธ์ของตัวแปรโดยสมการการพึ่งพาฟังก์ชันที่เหมาะสมซึ่งสื่อถึงแนวโน้มหลักของการพึ่งพา (หรือ "แนวโน้ม")

ในการเลือกการประมาณค่า ควรดำเนินการจากปัญหาการวิจัยเฉพาะ โดยทั่วไป ยิ่งสมการที่ใช้สำหรับการประมาณง่ายขึ้นเท่าใด คำอธิบายผลลัพธ์ของความสัมพันธ์ก็จะยิ่งประมาณได้มากขึ้นเท่านั้น ดังนั้นจึงเป็นสิ่งสำคัญที่จะต้องอ่านความสำคัญและสาเหตุที่ทำให้เกิดการเบี่ยงเบนของค่าเฉพาะจากแนวโน้มผลลัพธ์ เมื่ออธิบายการขึ้นต่อกันของค่าที่กำหนดโดยเชิงประจักษ์ ความแม่นยำที่มากขึ้นสามารถทำได้โดยใช้สมการหลายพารามิเตอร์ที่ซับซ้อนยิ่งขึ้น อย่างไรก็ตามไม่มีประเด็นใดที่จะพยายามถ่ายทอดค่าเบี่ยงเบนแบบสุ่มของค่าในชุดข้อมูลเชิงประจักษ์เฉพาะด้วยความแม่นยำสูงสุด สิ่งสำคัญกว่ามากคือการเข้าใจรูปแบบทั่วไป ซึ่งในกรณีนี้เป็นไปตามตรรกะมากที่สุดและมีความแม่นยำที่ยอมรับได้ซึ่งแสดงออกมาอย่างแม่นยำด้วยสมการสองพารามิเตอร์ของฟังก์ชันกำลัง ดังนั้นเมื่อเลือกวิธีการประมาณค่า ผู้วิจัยมักจะประนีประนอมเสมอ: เขาตัดสินใจว่าในกรณีนี้จะเหมาะสมและเหมาะสมเพียงใดในการ "เสียสละ" รายละเอียด และด้วยเหตุนี้ โดยทั่วไปแล้วควรแสดงการพึ่งพาตัวแปรที่เปรียบเทียบอย่างไร นอกเหนือจากการระบุรูปแบบที่ถูกปกปิดโดยการเบี่ยงเบนแบบสุ่มของข้อมูลเชิงประจักษ์จากรูปแบบทั่วไปแล้ว การประมาณยังทำให้สามารถแก้ไขปัญหาสำคัญอื่นๆ อีกมากมายได้ เช่น ทำให้การพึ่งพาอาศัยกันที่พบเป็นแบบแผน ค้นหาค่าที่ไม่รู้จักของตัวแปรตามโดยการประมาณค่าหรือการคาดการณ์หากเหมาะสม

ในแต่ละงานจะมีการกำหนดเงื่อนไขของปัญหาข้อมูลเริ่มต้นแบบฟอร์มการออกผลลัพธ์และการพึ่งพาทางคณิตศาสตร์หลักสำหรับการแก้ปัญหา ตามวิธีการแก้ปัญหาจะมีการพัฒนาอัลกอริธึมการแก้ปัญหาซึ่งนำเสนอในรูปแบบกราฟิก

1. คำชี้แจงของปัญหา

1. ใช้วิธีกำลังสองน้อยที่สุด ประมาณฟังก์ชันที่กำหนดในตาราง:

ก) พหุนามของดีกรีแรก ;

b) พหุนามของดีกรีที่สอง

c) การพึ่งพาแบบเอ็กซ์โปเนนเชียล

สำหรับการพึ่งพาแต่ละครั้ง ให้คำนวณค่าสัมประสิทธิ์ของค่ากำหนด

คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ (เฉพาะกรณี ก)

สำหรับการขึ้นต่อกันแต่ละครั้ง ให้วาดเส้นแนวโน้ม

การใช้ฟังก์ชัน LINEST คำนวณลักษณะตัวเลขของการขึ้นต่อกัน

เปรียบเทียบการคำนวณของคุณกับผลลัพธ์ที่ได้รับโดยใช้ฟังก์ชัน LINEST

สรุปว่าสูตรใดที่ใกล้เคียงกับฟังก์ชันมากที่สุด

เขียนโปรแกรมในภาษาการเขียนโปรแกรมภาษาใดภาษาหนึ่งและเปรียบเทียบผลการคำนวณกับผลลัพธ์ข้างต้น

ตัวเลือกที่ 3 ฟังก์ชั่นถูกกำหนดไว้ในตาราง 1.

ตารางที่ 1.


2. สูตรการคำนวณ

บ่อยครั้ง เมื่อวิเคราะห์ข้อมูลเชิงประจักษ์ จำเป็นต้องค้นหาความสัมพันธ์เชิงฟังก์ชันระหว่างปริมาณ x และ y ซึ่งได้มาจากประสบการณ์หรือการวัดค่า

Xi (ค่าอิสระ) ถูกกำหนดโดยผู้ทดลอง และ yi ซึ่งเรียกว่าค่าเชิงประจักษ์หรือค่าการทดลองนั้นได้มาจากผลของการทดลอง

รูปแบบการวิเคราะห์ของความสัมพันธ์เชิงฟังก์ชันที่มีอยู่ระหว่างปริมาณ x และ y มักจะไม่เป็นที่รู้จักดังนั้นจึงมีงานที่สำคัญในทางปฏิบัติเกิดขึ้น - เพื่อค้นหาสูตรเชิงประจักษ์

, (1)

(พารามิเตอร์อยู่ที่ไหน) ซึ่งค่าจะแตกต่างจากค่าทดลองเล็กน้อย

ตามวิธีกำลังสองน้อยที่สุด ค่าสัมประสิทธิ์ที่ดีที่สุดคือค่าที่ผลรวมของการเบี่ยงเบนกำลังสองของฟังก์ชันเชิงประจักษ์ที่พบจากค่าฟังก์ชันที่กำหนดจะน้อยที่สุด

การใช้เงื่อนไขที่จำเป็นสำหรับฟังก์ชันสุดขั้วของตัวแปรหลายตัว - ความเท่าเทียมกันของอนุพันธ์บางส่วนเป็นศูนย์เราจะพบชุดของค่าสัมประสิทธิ์ที่ให้ค่าต่ำสุดของฟังก์ชันที่กำหนดโดยสูตร (2) และรับระบบปกติในการกำหนดค่าสัมประสิทธิ์ :

(3)

ดังนั้นการหาค่าสัมประสิทธิ์จึงลดลงเหลือเพียงระบบแก้โจทย์ (3)

ประเภทของระบบ (3) ขึ้นอยู่กับคลาสของสูตรเชิงประจักษ์ที่เรากำลังมองหาการพึ่งพา (1) ในกรณีของการพึ่งพาเชิงเส้น ระบบ (3) จะอยู่ในรูปแบบ:

(4)

ในกรณีของการพึ่งพากำลังสอง ระบบ (3) จะอยู่ในรูปแบบ:

(5)

ในบางกรณี ฟังก์ชันที่ค่าสัมประสิทธิ์ที่ไม่แน่นอนป้อนแบบไม่เชิงเส้นจะถือเป็นสูตรเชิงประจักษ์ ในกรณีนี้ บางครั้งปัญหาอาจทำให้เป็นเส้นตรงได้ เช่น ลดเป็นเส้นตรง การขึ้นต่อกันดังกล่าวรวมถึงการขึ้นต่อกันแบบเอ็กซ์โปเนนเชียล

โดยที่ a1 และ a2 เป็นสัมประสิทธิ์ที่ไม่ได้กำหนดไว้

การทำให้เป็นเส้นตรงทำได้โดยการหาลอการิทึมของความเท่าเทียมกัน (6) หลังจากนั้นเราจะได้ความสัมพันธ์

(7)

ให้เราแสดงและตามลำดับ โดย และ จากนั้นสามารถเขียนการพึ่งพา (6) ในรูปแบบ ซึ่งช่วยให้เราสามารถใช้สูตร (4) ด้วยการแทนที่ a1 ด้วย และ โดย .

กราฟของการพึ่งพาฟังก์ชันที่สร้างขึ้นใหม่ y(x) โดยอิงจากผลการวัด (xi, yi), i=1,2,…,n เรียกว่าเส้นโค้งการถดถอย ในการตรวจสอบข้อตกลงของเส้นโค้งการถดถอยที่สร้างขึ้นกับผลการทดลอง โดยทั่วไปจะแนะนำคุณลักษณะเชิงตัวเลขต่อไปนี้: สัมประสิทธิ์สหสัมพันธ์ (การพึ่งพาเชิงเส้น) อัตราส่วนสหสัมพันธ์ และสัมประสิทธิ์การกำหนด

ค่าสัมประสิทธิ์สหสัมพันธ์คือการวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่มตาม ซึ่งแสดงให้เห็นว่า โดยเฉลี่ยแล้ว ตัวแปรตัวหนึ่งสามารถแสดงเป็นฟังก์ชันเชิงเส้นของอีกตัวแปรหนึ่งได้ดีเพียงใด

ค่าสัมประสิทธิ์สหสัมพันธ์คำนวณโดยใช้สูตร:

(8)

(9)

โดยที่ค่าเฉลี่ยเลขคณิตของ x, y ตามลำดับคือที่ไหน

ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่มในค่าสัมบูรณ์จะต้องไม่เกิน 1 ยิ่งเข้าใกล้ 1 มากเท่าใด ความสัมพันธ์เชิงเส้นระหว่าง x และ y ยิ่งใกล้มากขึ้นเท่านั้น

ในกรณีที่มีความสัมพันธ์แบบไม่เชิงเส้น ค่าเฉลี่ยแบบมีเงื่อนไขจะอยู่ใกล้กับเส้นโค้ง ในกรณีนี้ขอแนะนำให้ใช้อัตราส่วนสหสัมพันธ์เป็นลักษณะของจุดแข็งของการเชื่อมต่อซึ่งการตีความไม่ได้ขึ้นอยู่กับประเภทของการพึ่งพาที่กำลังศึกษา

อัตราส่วนสหสัมพันธ์คำนวณโดยใช้สูตร:

(10)

ที่ไหน และตัวเศษจะแสดงลักษณะของการกระจายตัวของค่าเฉลี่ยแบบมีเงื่อนไขรอบๆ ค่าเฉลี่ยแบบไม่มีเงื่อนไข

เสมอ. ความเท่าเทียมกัน = สอดคล้องกับค่าสุ่มที่ไม่สัมพันธ์กัน = ก็ต่อเมื่อมีความเชื่อมโยงเชิงฟังก์ชันที่แน่นอนระหว่าง x และ y ในกรณีของการพึ่งพาเชิงเส้นของ y กับ x อัตราส่วนสหสัมพันธ์จะเกิดขึ้นพร้อมกับกำลังสองของสัมประสิทธิ์สหสัมพันธ์ ค่านี้ใช้เป็นตัวบ่งชี้ความเบี่ยงเบนของการถดถอยจากเส้นตรง

อัตราส่วนสหสัมพันธ์เป็นการวัดความสัมพันธ์ระหว่าง y และ x ในรูปแบบใด ๆ แต่ไม่สามารถให้แนวคิดเกี่ยวกับระดับการประมาณข้อมูลเชิงประจักษ์ในรูปแบบพิเศษได้ หากต้องการทราบว่าเส้นโค้งที่สร้างขึ้นสะท้อนข้อมูลเชิงประจักษ์ได้อย่างแม่นยำเพียงใด จึงมีการแนะนำคุณลักษณะอีกประการหนึ่ง นั่นคือสัมประสิทธิ์การกำหนด

ค่าสัมประสิทธิ์ระดับถูกกำหนดโดยสูตร:

โดยที่ Sres = - ผลรวมที่เหลือของกำลังสองซึ่งระบุลักษณะความเบี่ยงเบนของข้อมูลการทดลองจากข้อมูลทางทฤษฎี รวม - ผลรวมของกำลังสองทั้งหมดโดยที่ค่าเฉลี่ยคือ yi

- ผลรวมการถดถอยของกำลังสองที่แสดงลักษณะการแพร่กระจายของข้อมูล

ยิ่งผลรวมที่เหลือของกำลังสองน้อยกว่าเมื่อเปรียบเทียบกับผลรวมของกำลังสองทั้งหมด ค่าสัมประสิทธิ์การกำหนด r2 ก็จะยิ่งมากขึ้น ซึ่งจะวัดว่าสมการการถดถอยอธิบายความสัมพันธ์ระหว่างตัวแปรต่างๆ ได้ดีเพียงใด ถ้ามันเท่ากับ 1 แสดงว่ามีความสัมพันธ์อย่างสมบูรณ์กับแบบจำลองนั่นคือ ไม่มีความแตกต่างระหว่างค่าจริงและค่าประมาณของ y ในกรณีตรงกันข้ามหากค่าสัมประสิทธิ์การกำหนดเป็น 0 แสดงว่าสมการการถดถอยไม่สามารถทำนายค่าของ y ได้สำเร็จ

ค่าสัมประสิทธิ์ของการกำหนดจะต้องไม่เกินอัตราส่วนสหสัมพันธ์เสมอ ในกรณีที่เป็นไปตามความเท่าเทียมกัน เราสามารถสรุปได้ว่าสูตรเชิงประจักษ์ที่สร้างขึ้นสะท้อนข้อมูลเชิงประจักษ์ได้แม่นยำที่สุด

3. การคำนวณโดยใช้ตารางที่สร้างโดยใช้ Microsoft Excel

ในการคำนวณขอแนะนำให้จัดเรียงข้อมูลในรูปแบบของตารางที่ 2 โดยใช้ตัวประมวลผลสเปรดชีต Microsoft Excel

ตารางที่ 2












ให้เราอธิบายวิธีการรวบรวมตารางที่ 2

ขั้นตอนที่ 1 ในเซลล์ A1:A25 เราป้อนค่า xi

ขั้นตอนที่ 2 ในเซลล์ B1:B25 เราป้อนค่าของ yi

ขั้นตอนที่ 3 ในเซลล์ C1 ให้ป้อนสูตร = A1^2

ขั้นตอนที่ 4 สูตรนี้ถูกคัดลอกลงในเซลล์ C1:C25

ขั้นตอนที่ 5 ในเซลล์ D1 ป้อนสูตร = A1 * B1

ขั้นตอนที่ 6 สูตรนี้ถูกคัดลอกลงในเซลล์ D1:D25

ขั้นตอนที่ 7 ในเซลล์ F1 ให้ป้อนสูตร = A1^4

ขั้นตอนที่ 8 สูตรนี้ถูกคัดลอกลงในเซลล์ F1:F25

ขั้นตอนที่ 9 ในเซลล์ G1 ให้ป้อนสูตร = A1^2*B1

ขั้นตอนที่ 10 สูตรนี้คัดลอกลงในเซลล์ G1:G25

ขั้นตอนที่ 11 ในเซลล์ H1 ให้ป้อนสูตร = LN(B1)

ขั้นตอนที่ 12 สูตรนี้ถูกคัดลอกลงในเซลล์ H1:H25

ขั้นตอนที่ 13 ในเซลล์ I1 ให้ป้อนสูตร = A1*LN(B1)

ขั้นตอนที่ 14 สูตรนี้ถูกคัดลอกลงในเซลล์ I1:I25

เราดำเนินการขั้นตอนต่อไปโดยใช้การรวมอัตโนมัติ S

ขั้นตอนที่ 15 ในเซลล์ A26 ให้ป้อนสูตร = SUM(A1:A25)

ขั้นตอนที่ 16 ในเซลล์ B26 ให้ป้อนสูตร = SUM(B1:B25)

ขั้นตอนที่ 17 ในเซลล์ C26 ให้ป้อนสูตร = SUM(C1:C25)

ขั้นตอนที่ 18 ในเซลล์ D26 ให้ป้อนสูตร = SUM(D1:D25)

ขั้นตอนที่ 19 ในเซลล์ E26 ให้ป้อนสูตร = SUM(E1:E25)

ขั้นตอนที่ 20 ในเซลล์ F26 ให้ป้อนสูตร = SUM(F1:F25)

ขั้นตอนที่ 21 ในเซลล์ G26 ให้ป้อนสูตร = SUM(G1:G25)

ขั้นตอนที่ 22 ในเซลล์ H26 ให้ป้อนสูตร = SUM(H1:H25)

ขั้นตอนที่ 23 ในเซลล์ I26 ให้ป้อนสูตร = SUM(I1:I25)

ลองประมาณฟังก์ชันด้วยฟังก์ชันเชิงเส้นกัน เพื่อกำหนดค่าสัมประสิทธิ์และเราจะใช้ระบบ (4) ใช้ผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A26, B26, C26 และ D26 เราเขียนระบบ (4) ในรูปแบบ

(11)

การแก้ปัญหาที่เราได้รับ และ .

ระบบได้รับการแก้ไขโดยใช้วิธีของแครมเมอร์ โดยมีสาระสำคัญดังนี้ พิจารณาระบบสมการเชิงเส้นพีชคณิต n ที่ไม่มีค่าไม่ทราบ:

(12)

ดีเทอร์มิแนนต์ของระบบคือดีเทอร์มิแนนต์ของเมทริกซ์ระบบ:

(13)

ให้เราแสดงว่า - ดีเทอร์มิแนนต์ที่ได้รับจากดีเทอร์มิแนนต์ของระบบ Δ โดยการแทนที่คอลัมน์ j-th ด้วยคอลัมน์

ดังนั้นการประมาณเชิงเส้นจึงมีรูปแบบ

เราแก้ระบบ (11) โดยใช้ Microsoft Excel ผลลัพธ์แสดงไว้ในตารางที่ 3

ตารางที่ 3











เมทริกซ์ผกผัน






ในตารางที่ 3 ในเซลล์ A32:B33 สูตรจะถูกเขียน (=MOBR(A28:B29))

ในเซลล์ E32:E33 สูตรจะถูกเขียน (=MULTIPLE(A32:B33),(C28:C29))

ต่อไป เราจะประมาณฟังก์ชันด้วยฟังก์ชันกำลังสอง . เพื่อกำหนดค่าสัมประสิทธิ์ a1, a2 และ a3 เราใช้ระบบ (5) ใช้ผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A26, B26, C26, D26, E26, F26, G26 เราเขียนระบบ (5) ในรูปแบบ

(16)

แก้อันไหน เราจะได้ a1=10.663624 และ

ดังนั้นการประมาณกำลังสองจึงมีรูปแบบ

เราแก้ระบบ (16) โดยใช้ Microsoft Excel ผลลัพธ์แสดงไว้ในตารางที่ 4

ตารางที่ 4














เมทริกซ์ผกผัน







ในตารางที่ 4 ในเซลล์ A41:C43 มีการเขียนสูตร (=MOBR(A36:C38))

ในเซลล์ F41:F43 สูตรจะถูกเขียน (=MULTIPLE(A41:C43),(D36:D38))

ทีนี้ลองประมาณฟังก์ชันด้วยฟังก์ชันเลขชี้กำลังดู เพื่อกำหนดค่าสัมประสิทธิ์และเราหาลอการิทึมของค่าและเมื่อใช้ผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A26, C26, H26 และ I26 เราจะได้ระบบ

(18)

เมื่อแก้ระบบ (18) แล้ว เราก็จะได้ และ

หลังจากเสริมพลังเราจะได้รับ

ดังนั้นการประมาณเอ็กซ์โปเนนเชียลจึงมีรูปแบบ

เราแก้ระบบ (18) โดยใช้ Microsoft Excel ผลลัพธ์แสดงไว้ในตารางที่ 5

ตารางที่ 5











เมทริกซ์ผกผัน




ในเซลล์ A50:B51 สูตรจะถูกเขียน (=MOBR(A46:B47))

ในเซลล์ E49:E50 สูตรจะถูกเขียน (=MULTIPLE(A50:B51),(C46:C47))

ในเซลล์ E51 มีการเขียนสูตร =EXP(E49)

ลองคำนวณค่าเฉลี่ยเลขคณิตโดยใช้สูตร:

ผลการคำนวณโดยใช้ Microsoft Excel แสดงไว้ในตารางที่ 6

ตารางที่ 6



ในเซลล์ B54 มีการเขียนสูตร = A26/25

ในเซลล์ B55 มีการเขียนสูตร = B26/25

ตารางที่ 7


ขั้นตอนที่ 1 ในเซลล์ J1 ให้ป้อนสูตร = (A1-$B$54)*(B1-$B$55)

ขั้นตอนที่ 2 สูตรนี้ถูกคัดลอกลงในเซลล์ J2:J25

ขั้นตอนที่ 3 ในเซลล์ K1 ให้ป้อนสูตร = (A1-$B$54)^2

ขั้นตอนที่ 4 สูตรนี้ถูกคัดลอกลงในเซลล์ k2:K25

ขั้นตอนที่ 5 ในเซลล์ L1 ให้ป้อนสูตร = (B1-$B$55)^2

ขั้นตอนที่ 6 สูตรนี้ถูกคัดลอกลงในเซลล์ L2:L25

ขั้นตอนที่ 7 ในเซลล์ M1 ให้ป้อนสูตร = ($E$32+$E$33*A1-B1)^2

ขั้นตอนที่ 8 สูตรนี้คัดลอกลงในเซลล์ M2:M25

ขั้นตอนที่ 9 ในเซลล์ N1 ให้ป้อนสูตร = ($F$41+$F$42*A1+$F$43*A1^2-B1)^2

ขั้นตอนที่ 10 สูตรนี้ถูกคัดลอกลงในเซลล์ N2:N25

ขั้นตอนที่ 11 ในเซลล์ O1 ให้ป้อนสูตร = ($E$51*EXP($E$50*A1)-B1)^2

ขั้นตอนที่ 12 สูตรนี้คัดลอกลงในเซลล์ O2:O25

เราดำเนินการขั้นตอนต่อไปโดยใช้การรวมอัตโนมัติ S

ขั้นตอนที่ 13 ในเซลล์ J26 ให้ป้อนสูตร = SUM(J1:J25)

ขั้นตอนที่ 14 ในเซลล์ K26 ให้ป้อนสูตร = SUM(K1:K25)

ขั้นตอนที่ 15 ในเซลล์ L26 ให้ป้อนสูตร = CUM(L1:L25)

ขั้นตอนที่ 16 ในเซลล์ M26 ให้ป้อนสูตร = SUM(M1:M25)

ขั้นตอนที่ 17 ในเซลล์ N26 ให้ป้อนสูตร = SUM(N1:N25)

ขั้นตอนที่ 18 ในเซลล์ O26 ให้ป้อนสูตร = SUM(O1:O25)

ทีนี้ลองคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตร (8) (สำหรับการประมาณเชิงเส้นเท่านั้น) และค่าสัมประสิทธิ์การกำหนดโดยใช้สูตร (10) ผลลัพธ์การคำนวณโดยใช้ Microsoft Excel แสดงไว้ในตารางที่ 8

ตารางที่ 8


ค่าสัมประสิทธิ์สหสัมพันธ์

ค่าสัมประสิทธิ์ระดับ (การประมาณเชิงเส้น)



สัมประสิทธิ์การกำหนด (การประมาณกำลังสอง)



ค่าสัมประสิทธิ์ของการกำหนด (การประมาณแบบเอ็กซ์โปเนนเชียล)



ในเซลล์ E57 มีการเขียนสูตร =J26/(K26*L26)^(1/2)

ในเซลล์ E59 มีการเขียนสูตร = 1-M26/L26

ในเซลล์ E61 มีการเขียนสูตร = 1-N26/L26

ในเซลล์ E63 มีการเขียนสูตร = 1-O26/L26

การวิเคราะห์ผลการคำนวณแสดงให้เห็นว่าการประมาณกำลังสองอธิบายข้อมูลการทดลองได้ดีที่สุด

แผนภาพอัลกอริทึม

ข้าว. 1. แผนภาพอัลกอริทึมสำหรับโปรแกรมคำนวณ

5. การคำนวณใน MathCad

การถดถอยเชิงเส้น

· เส้นตรง (x, y) - เวกเตอร์ของสององค์ประกอบ (b, a) สัมประสิทธิ์การถดถอยเชิงเส้น b+ax;

· x - เวกเตอร์ของข้อมูลอาร์กิวเมนต์จริง

· y เป็นเวกเตอร์ของค่าข้อมูลจริงที่มีขนาดเท่ากัน

รูปที่ 2.

การถดถอยพหุนามหมายถึงการประมาณข้อมูล (x1, y1) ด้วยพหุนามดีกรีที่ k สำหรับ k=i พหุนามจะเป็นเส้นตรง สำหรับ k=2 คือพาราโบลา สำหรับ k=3 คือพาราโบลาลูกบาศก์ เป็นต้น ตามกฎแล้วในทางปฏิบัติ k<5.

· การถดถอย (x,y,k) - เวกเตอร์ของสัมประสิทธิ์สำหรับการสร้างการถดถอยพหุนามของข้อมูล

· interp (s,x,y,t) - ผลลัพธ์ของการถดถอยพหุนาม

· s=ถดถอย(x,y,k);

· x เป็นเวกเตอร์ของข้อมูลอาร์กิวเมนต์จริง องค์ประกอบต่างๆ ถูกจัดเรียงจากน้อยไปหามาก

· y เป็นเวกเตอร์ของค่าข้อมูลจริงที่มีขนาดเท่ากัน

· k - ระดับของพหุนามการถดถอย (จำนวนเต็มบวก)

· t - ค่าของการโต้แย้งของพหุนามการถดถอย

รูปที่ 3

นอกเหนือจากที่กล่าวถึงแล้ว Mathcad ยังมีการถดถอยสามพารามิเตอร์อีกหลายประเภท การใช้งานของพวกเขาค่อนข้างแตกต่างจากตัวเลือกการถดถอยข้างต้นสำหรับพวกเขา นอกเหนือจากอาร์เรย์ข้อมูลแล้ว จำเป็นต้องระบุค่าเริ่มต้นบางค่า ​ของค่าสัมประสิทธิ์ a, b, c ใช้ประเภทการถดถอยที่เหมาะสมหากคุณมีความคิดที่ดีว่าการขึ้นต่อกันแบบใดที่อธิบายชุดข้อมูลของคุณ เมื่อการถดถอยประเภทหนึ่งสะท้อนลำดับของข้อมูลได้ไม่ดีนัก ผลลัพธ์มักจะไม่เป็นที่น่าพอใจและอาจแตกต่างออกไปมาก ขึ้นอยู่กับการเลือกค่าเริ่มต้น แต่ละฟังก์ชันจะสร้างเวกเตอร์ของพารามิเตอร์ที่ปรับปรุงแล้ว a, b, c

ผลลัพธ์ที่ได้รับโดยใช้ฟังก์ชัน LINEST

มาดูจุดประสงค์ของฟังก์ชัน LINEST กัน

ฟังก์ชันนี้ใช้กำลังสองน้อยที่สุดในการคำนวณเส้นตรงที่เหมาะกับข้อมูลที่กำหนดมากที่สุด

ฟังก์ชันส่งคืนอาร์เรย์ที่อธิบายบรรทัดผลลัพธ์ สมการของเส้นตรงคือ:

M1x1 + m2x2 + ... + b หรือ y = mx + b,

ซอฟต์แวร์ไมโครซอฟต์อัลกอริธึมตาราง

โดยที่ค่าอิสระ y เป็นฟังก์ชันของค่าอิสระ x ค่าของ m คือสัมประสิทธิ์ที่สอดคล้องกับตัวแปรอิสระแต่ละตัว x และ b เป็นค่าคงที่ โปรดทราบว่า y, x และ m สามารถเป็นเวกเตอร์ได้

เพื่อให้ได้ผลลัพธ์ คุณต้องสร้างสูตรแบบตารางซึ่งมี 5 แถวและ 2 คอลัมน์ ช่วงเวลานี้สามารถอยู่ที่ใดก็ได้บนเวิร์กชีต ในระหว่างช่วงเวลานี้ คุณจะต้องเข้าสู่ฟังก์ชัน LINEST

ด้วยเหตุนี้ ควรเติมเซลล์ทั้งหมดในช่วง A65:B69 (ดังแสดงในตารางที่ 9)

ตารางที่ 9.



ให้เราอธิบายวัตถุประสงค์ของปริมาณบางส่วนที่อยู่ในตารางที่ 9

ค่าที่อยู่ในเซลล์ A65 และ B65 จะแสดงลักษณะของความชันและการเลื่อนตามลำดับ - สัมประสิทธิ์การกำหนด - ค่าที่สังเกตได้จาก F - จำนวนองศาอิสระ - ผลรวมการถดถอยของกำลังสอง - ผลรวมที่เหลือของกำลังสอง

การนำเสนอผลลัพธ์ในรูปแบบกราฟ

ข้าว. 4. กราฟการประมาณเชิงเส้น

ข้าว. 5. กราฟการประมาณกำลังสอง

ข้าว. 6. กราฟฟิตติ้งเอ็กซ์โปเนนเชียล

ข้อสรุป

ให้เราสรุปตามผลลัพธ์ของข้อมูลที่ได้รับ

การวิเคราะห์ผลการคำนวณแสดงให้เห็นว่าการประมาณกำลังสองอธิบายข้อมูลการทดลองได้ดีที่สุด เนื่องจาก เส้นแนวโน้มสะท้อนพฤติกรรมของฟังก์ชันในพื้นที่นี้ได้อย่างแม่นยำที่สุด

เมื่อเปรียบเทียบผลลัพธ์ที่ได้รับโดยใช้ฟังก์ชัน LINEST เราจะเห็นว่าผลลัพธ์ดังกล่าวตรงกับการคำนวณข้างต้นโดยสมบูรณ์ นี่แสดงว่าการคำนวณนั้นถูกต้อง

ผลลัพธ์ที่ได้รับโดยใช้โปรแกรม MathCad ตรงกับค่าที่ระบุข้างต้นโดยสมบูรณ์ สิ่งนี้บ่งบอกถึงความแม่นยำของการคำนวณ

บรรณานุกรม

1 บี.พี. เดมิโดวิช, ไอ.เอ. สีน้ำตาลแดง พื้นฐานของคณิตศาสตร์เชิงคำนวณ M: สำนักพิมพ์วรรณกรรมกายภาพและคณิตศาสตร์ของรัฐ

2 วิทยาการคอมพิวเตอร์: หนังสือเรียน, เอ็ด. ศาสตราจารย์ เอ็น.วี. มาคาโรวา. อ: การเงินและสถิติ, 2550.

3 วิทยาการคอมพิวเตอร์: การประชุมเชิงปฏิบัติการเกี่ยวกับเทคโนโลยีคอมพิวเตอร์ เอ็ด ศาสตราจารย์ เอ็น.วี. มาคาโรวา. อ: การเงินและสถิติ, 2553.

4 วี.บี. โคเมียกิน. การเขียนโปรแกรมใน Excel โดยใช้ Visual Basic อ: วิทยุและการสื่อสาร, 2550.

5 เอ็น. นิโคล, อาร์. อัลเบรชท์. เอ็กเซล สเปรดชีต ม: เอ็ด. “อีคอม”, 2551.

6 แนวปฏิบัติในการจบรายวิชาวิทยาการคอมพิวเตอร์ (สำหรับนักศึกษาวิชาโต้ตอบทุกสาขาวิชา) เอ็ด Zhurova G. N. , สถาบันอุทกวิทยาแห่งรัฐเซนต์ปีเตอร์สเบิร์ก (TU), 2554

ซึ่งพบการประยุกต์อย่างกว้างขวางที่สุดในสาขาวิทยาศาสตร์และกิจกรรมภาคปฏิบัติที่หลากหลาย นี่อาจจะเป็นฟิสิกส์ เคมี ชีววิทยา เศรษฐศาสตร์ สังคมวิทยา จิตวิทยา และอื่นๆ อีกมากมาย ตามความประสงค์ของโชคชะตาฉันมักจะต้องรับมือกับเศรษฐกิจดังนั้นวันนี้ฉันจะจัดทริปให้คุณไปยังประเทศที่น่าอัศจรรย์ที่เรียกว่า เศรษฐมิติ=) ...จะไม่อยากได้ได้ยังไง! ที่นั่นดีมาก คุณแค่ต้องตัดสินใจ! ...แต่สิ่งที่คุณอาจต้องการอย่างแน่นอนคือการเรียนรู้วิธีการแก้ปัญหา วิธีกำลังสองน้อยที่สุด. และโดยเฉพาะอย่างยิ่งผู้อ่านที่ขยันจะได้เรียนรู้ที่จะแก้ปัญหาเหล่านี้ไม่เพียง แต่ถูกต้อง แต่ยังเร็วมาก ;-) แต่ก่อนอื่น คำแถลงทั่วไปของปัญหา+ ตัวอย่างประกอบ:

ให้เราศึกษาตัวบ่งชี้ในสาขาวิชาเฉพาะที่มีการแสดงออกเชิงปริมาณ ในขณะเดียวกัน ก็มีเหตุผลทุกประการที่ทำให้เชื่อได้ว่าตัวบ่งชี้นั้นขึ้นอยู่กับตัวบ่งชี้นั้น สมมติฐานนี้สามารถเป็นได้ทั้งสมมติฐานทางวิทยาศาสตร์หรือตามสามัญสำนึกขั้นพื้นฐาน อย่างไรก็ตาม ทิ้งวิทยาศาสตร์ไปซะ แล้วมาสำรวจเรื่องน่ารับประทานอื่นๆ กันดีกว่า เช่น ร้านขายของชำ มาแสดงโดย:

– พื้นที่ค้าปลีกของร้านขายของชำ ตร.ม.
– มูลค่าการซื้อขายประจำปีของร้านขายของชำ, ล้านรูเบิล.

เป็นที่ชัดเจนอย่างยิ่งว่ายิ่งพื้นที่ร้านค้ามีขนาดใหญ่ขึ้น ในกรณีส่วนใหญ่มูลค่าการซื้อขายก็จะมากขึ้นตามไปด้วย

สมมติว่าหลังจากดำเนินการสังเกต/ทดลอง/คำนวณ/เต้นรำด้วยแทมโบรีน เราก็มีข้อมูลตัวเลขพร้อมใช้:

สำหรับร้านขายของชำ ฉันคิดว่าทุกอย่างชัดเจน: - นี่คือพื้นที่ของร้านที่ 1 - มูลค่าการซื้อขายประจำปี - พื้นที่ของร้านที่ 2 - มูลค่าการซื้อขายประจำปี ฯลฯ อย่างไรก็ตาม การเข้าถึงสื่อลับนั้นไม่จำเป็นเลย - การประเมินมูลค่าการค้าที่แม่นยำอย่างเป็นธรรมสามารถทำได้โดยใช้ สถิติทางคณิตศาสตร์. อย่างไรก็ตาม อย่าเพิ่งวอกแวก หลักสูตรจารกรรมเชิงพาณิชย์ได้รับค่าตอบแทนแล้ว =)

ข้อมูลแบบตารางสามารถเขียนในรูปแบบของจุดและแสดงในรูปแบบที่คุ้นเคยได้ ระบบคาร์ทีเซียน .

มาตอบคำถามสำคัญกัน: การศึกษาเชิงคุณภาพต้องใช้คะแนนกี่คะแนน?

ใหญ่กว่าดีกว่า. ชุดขั้นต่ำที่ยอมรับได้ประกอบด้วย 5-6 คะแนน นอกจากนี้ เมื่อข้อมูลมีน้อย ผลลัพธ์ที่ "ผิดปกติ" ก็ไม่สามารถรวมไว้ในตัวอย่างได้ ตัวอย่างเช่น ร้านค้าชั้นนำขนาดเล็กสามารถรับคำสั่งซื้อที่มีขนาดมากกว่า "เพื่อนร่วมงาน" ดังนั้นจึงบิดเบือนรูปแบบทั่วไปที่คุณต้องค้นหา!

พูดง่ายๆ ก็คือ เราต้องเลือกฟังก์ชัน กำหนดการซึ่งผ่านไปใกล้จุดมากที่สุด . ฟังก์ชันนี้เรียกว่า โดยประมาณ (การประมาณ - การประมาณ)หรือ ฟังก์ชันทางทฤษฎี . โดยทั่วไปแล้ว "คู่แข่ง" ที่ชัดเจนจะปรากฏขึ้นที่นี่ทันที - พหุนามระดับสูงซึ่งกราฟจะผ่านจุดทั้งหมด แต่ตัวเลือกนี้ซับซ้อนและมักจะไม่ถูกต้อง (เนื่องจากกราฟจะ “วนซ้ำ” ตลอดเวลาและสะท้อนแนวโน้มหลักได้ไม่ดี).

ดังนั้นฟังก์ชันที่ต้องการจะต้องค่อนข้างเรียบง่ายและในขณะเดียวกันก็สะท้อนถึงการพึ่งพาอย่างเพียงพอ ดังที่คุณอาจเดาได้ มีการเรียกวิธีหนึ่งในการค้นหาฟังก์ชันดังกล่าว วิธีกำลังสองน้อยที่สุด. ก่อนอื่นเรามาดูสาระสำคัญของมันในแง่ทั่วไปกันก่อน ให้ฟังก์ชันบางอย่างแสดงข้อมูลการทดลองโดยประมาณ:


จะประเมินความถูกต้องของการประมาณนี้ได้อย่างไร? ให้เราคำนวณความแตกต่าง (ส่วนเบี่ยงเบน) ระหว่างค่าการทดลองและค่าฟังก์ชันด้วย (เราศึกษาการวาดภาพ). ความคิดแรกที่เข้ามาในใจคือการประมาณว่าผลรวมจะมีขนาดใหญ่เพียงใด แต่ปัญหาคือความแตกต่างอาจเป็นลบได้ (ตัวอย่างเช่น, ) และการเบี่ยงเบนจากผลรวมดังกล่าวจะหักล้างกัน ดังนั้นในการประมาณความแม่นยำของการประมาณจึงขอผลรวม โมดูลการเบี่ยงเบน:

หรือยุบ: (เผื่อใครไม่รู้: – นี่คือไอคอนผลรวม และ – ตัวแปร “ตัวนับ” เสริม ซึ่งรับค่าตั้งแต่ 1 ถึง ).

โดยการประมาณคะแนนการทดลองที่มีฟังก์ชันต่างกัน เราจะได้ค่าที่แตกต่างกัน และแน่นอนว่าเมื่อผลรวมน้อยกว่า ฟังก์ชันนั้นก็จะแม่นยำมากขึ้น

มีวิธีการดังกล่าวอยู่และเรียกว่า วิธีโมดูลัสน้อยที่สุด. อย่างไรก็ตามในทางปฏิบัติก็มีแพร่หลายมากขึ้น วิธีกำลังสองน้อยที่สุดซึ่งค่าลบที่เป็นไปได้ไม่ได้ถูกกำจัดโดยโมดูล แต่โดยการยกกำลังสองส่วนเบี่ยงเบน:

หลังจากนั้นความพยายามมุ่งเป้าไปที่การเลือกฟังก์ชันดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสอง มีขนาดเล็กที่สุดเท่าที่จะเป็นไปได้ ที่จริงแล้วนี่คือที่มาของชื่อของวิธีการ

และตอนนี้เรากลับมาที่จุดสำคัญอื่น: ตามที่ระบุไว้ข้างต้นฟังก์ชั่นที่เลือกควรจะค่อนข้างง่าย - แต่ก็มีฟังก์ชั่นดังกล่าวมากมายเช่นกัน: เชิงเส้น , ซึ่งเกินความจริง, เอ็กซ์โปเนนเชียล, ลอการิทึม, กำลังสอง ฯลฯ และแน่นอนว่า ณ ที่นี้ ฉันต้องการ "ลดขอบเขตของกิจกรรม" ทันที ฉันควรเลือกฟังก์ชันประเภทใดเพื่อการวิจัย? เทคนิคดั้งเดิมแต่มีประสิทธิภาพ:

– วิธีที่ง่ายที่สุดคือการพรรณนาจุดต่างๆ บนภาพวาดและวิเคราะห์ตำแหน่งของพวกเขา หากมีแนวโน้มที่จะวิ่งเป็นเส้นตรง คุณก็ควรมองหา สมการของเส้น ด้วยค่าที่เหมาะสมที่สุดและ กล่าวอีกนัยหนึ่ง ภารกิจคือการหาค่าสัมประสิทธิ์ดังกล่าวเพื่อให้ผลรวมของการเบี่ยงเบนกำลังสองมีค่าน้อยที่สุด

หากจุดต่างๆ อยู่ เช่น ตามแนว อติพจน์เห็นได้ชัดว่าฟังก์ชันเชิงเส้นจะให้การประมาณที่ไม่ดี ในกรณีนี้ เรากำลังมองหาค่าสัมประสิทธิ์ที่ "เหมาะสม" ที่สุดสำหรับสมการไฮเปอร์โบลา – พวกที่ให้ผลรวมกำลังสองขั้นต่ำ .

โปรดทราบว่าในทั้งสองกรณีเรากำลังพูดถึง ฟังก์ชันของตัวแปรสองตัวซึ่งมีข้อโต้แย้งอยู่ ค้นหาพารามิเตอร์การพึ่งพา:

และโดยพื้นฐานแล้ว เราจำเป็นต้องแก้ปัญหามาตรฐาน - หา ฟังก์ชันขั้นต่ำของตัวแปรสองตัว.

ลองจำตัวอย่างของเรา: สมมติว่าจุด "ร้านค้า" มักจะอยู่ในแนวเส้นตรงและมีเหตุผลทุกประการที่เชื่อได้ว่า การพึ่งพาเชิงเส้นมูลค่าการซื้อขายจากพื้นที่ค้าปลีก ลองหาค่าสัมประสิทธิ์ "a" และ "be" ดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสอง มีขนาดเล็กที่สุด ทุกอย่างเป็นไปตามปกติ - ก่อนอื่น อนุพันธ์ย่อยอันดับ 1. ตาม กฎความเป็นเส้นตรงคุณสามารถแยกความแตกต่างได้ภายใต้ไอคอนผลรวม:

หากคุณต้องการใช้ข้อมูลนี้สำหรับเรียงความหรือภาคเรียน ฉันจะขอบคุณมากสำหรับลิงก์ในรายการแหล่งข้อมูล คุณจะพบการคำนวณโดยละเอียดดังกล่าวได้ในไม่กี่แห่ง:

มาสร้างระบบมาตรฐานกัน:

เราลดแต่ละสมการลง "สอง" และนอกจากนี้ "แยก" ผลรวม:

บันทึก : วิเคราะห์อย่างอิสระว่าเหตุใดจึงนำ "a" และ "be" ออกไปนอกเหนือจากไอคอนผลรวม อย่างไรก็ตาม อย่างเป็นทางการสามารถทำได้ด้วยผลรวม

มาเขียนระบบใหม่ในรูปแบบ "นำไปใช้":

หลังจากนั้นอัลกอริทึมในการแก้ปัญหาของเราก็เริ่มปรากฏ:

เรารู้พิกัดของจุดต่างๆ ไหม? พวกเรารู้. จำนวนเงิน เราจะหามันเจอไหม? อย่างง่ายดาย. มาทำให้ง่ายที่สุดกันดีกว่า ระบบสมการเชิงเส้นสองสมการในสองไม่ทราบ(“ก” และ “เป็น”) เราแก้ระบบ เช่น วิธีการของแครมเมอร์ซึ่งเป็นผลมาจากการที่เราได้จุดที่อยู่นิ่ง กำลังตรวจสอบ สภาพที่เพียงพอสำหรับสุดขั้วเราสามารถตรวจสอบได้ว่า ณ จุดนี้ฟังก์ชัน ถึงอย่างแน่นอน ขั้นต่ำ. การตรวจสอบเกี่ยวข้องกับการคำนวณเพิ่มเติม ดังนั้นเราจะละทิ้งการตรวจสอบไว้เบื้องหลัง (หากจำเป็นสามารถดูเฟรมที่หายไปได้). เราได้ข้อสรุปสุดท้าย:

การทำงาน วิธีที่ดีที่สุด (อย่างน้อยเมื่อเปรียบเทียบกับฟังก์ชันเชิงเส้นอื่นๆ)นำจุดทดลองเข้ามาใกล้ยิ่งขึ้น . หากพูดโดยคร่าวๆ กราฟของมันจะผ่านไปใกล้จุดเหล่านี้มากที่สุด ในประเพณี เศรษฐมิติฟังก์ชันการประมาณผลลัพธ์จะเรียกอีกอย่างว่า สมการถดถอยเชิงเส้นคู่ .

ปัญหาที่อยู่ระหว่างการพิจารณามีความสำคัญอย่างยิ่งในทางปฏิบัติ ในสถานการณ์ตัวอย่างของเรา สมการ ช่วยให้คุณสามารถคาดการณ์มูลค่าการซื้อขายได้ ("อิเกรก")ร้านค้าจะมีค่าพื้นที่ขายอย่างน้อยหนึ่งค่า (ความหมายอย่างใดอย่างหนึ่งของ “x”). ใช่ ผลการพยากรณ์จะเป็นเพียงการคาดการณ์เท่านั้น แต่ในหลายกรณีกลับกลายเป็นว่าค่อนข้างแม่นยำ

ฉันจะวิเคราะห์ปัญหาเดียวด้วยตัวเลข "จริง" เนื่องจากไม่มีปัญหาในนั้น - การคำนวณทั้งหมดอยู่ในระดับหลักสูตรของโรงเรียนชั้นประถมศึกษาปีที่ 7-8 ในกรณี 95 เปอร์เซ็นต์ คุณจะถูกขอให้ค้นหาฟังก์ชันเชิงเส้น แต่ในตอนท้ายของบทความ ผมจะแสดงให้เห็นว่าการค้นหาสมการของไฮเปอร์โบลา เลขชี้กำลัง และฟังก์ชันอื่นๆ ที่เหมาะสมที่สุดนั้นไม่ใช่เรื่องยากอีกต่อไป

ในความเป็นจริงสิ่งที่เหลืออยู่คือการแจกจ่ายสารพัดที่สัญญาไว้ - เพื่อให้คุณสามารถเรียนรู้ที่จะแก้ไขตัวอย่างดังกล่าวไม่เพียง แต่แม่นยำ แต่ยังรวดเร็วอีกด้วย เราศึกษามาตรฐานอย่างรอบคอบ:

งาน

จากการศึกษาความสัมพันธ์ระหว่างตัวชี้วัด 2 ตัว พบว่าได้ตัวเลขคู่ดังนี้

ใช้วิธีกำลังสองน้อยที่สุด หาฟังก์ชันเชิงเส้นที่ประมาณค่าเชิงประจักษ์ได้ดีที่สุด (มีประสบการณ์)ข้อมูล. เขียนแบบเพื่อสร้างจุดทดลองและกราฟของฟังก์ชันการประมาณในระบบพิกัดสี่เหลี่ยมคาร์ทีเซียน . ค้นหาผลรวมของการเบี่ยงเบนกำลังสองระหว่างค่าเชิงประจักษ์และค่าทางทฤษฎี ค้นหาว่าคุณสมบัติจะดีกว่านี้หรือไม่ (จากมุมมองของวิธีกำลังสองน้อยที่สุด)นำจุดทดลองเข้ามาใกล้ยิ่งขึ้น

โปรดทราบว่าความหมาย "x" เป็นไปตามธรรมชาติและนี่มีความหมายที่มีความหมายซึ่งฉันจะพูดถึงในภายหลัง แต่แน่นอนว่าพวกมันสามารถเป็นเศษส่วนได้เช่นกัน นอกจากนี้ขึ้นอยู่กับเนื้อหาของงานเฉพาะทั้งค่า "X" และ "เกม" อาจเป็นค่าลบทั้งหมดหรือบางส่วนก็ได้ เราได้รับภารกิจที่ "ไร้หน้า" และเราเริ่มต้นมันได้ สารละลาย:

เราค้นหาค่าสัมประสิทธิ์ของฟังก์ชันที่เหมาะสมที่สุดเป็นวิธีแก้ปัญหาของระบบ:

เพื่อวัตถุประสงค์ในการบันทึกที่มีขนาดกะทัดรัดมากขึ้น สามารถละเว้นตัวแปร "ตัวนับ" ได้ เนื่องจากเป็นที่แน่ชัดแล้วว่าการรวมจะดำเนินการตั้งแต่ 1 ถึง

สะดวกกว่าในการคำนวณจำนวนเงินที่ต้องการในรูปแบบตาราง:


การคำนวณสามารถทำได้ด้วยไมโครเครื่องคิดเลข แต่ควรใช้ Excel ดีกว่ามาก - ทั้งเร็วกว่าและไม่มีข้อผิดพลาด ดูวิดีโอสั้น ๆ:

ดังนั้นเราจึงได้สิ่งต่อไปนี้ ระบบ:

ที่นี่คุณสามารถคูณสมการที่สองด้วย 3 และ ลบอันที่ 2 จากเทอมของสมการที่ 1 ทีละเทอม. แต่นี่คือโชค - ในทางปฏิบัติ ระบบมักไม่ใช่ของขวัญ และในกรณีเช่นนี้จะช่วยประหยัดได้ วิธีการของแครมเมอร์:
ซึ่งหมายความว่าระบบมีวิธีแก้ปัญหาเฉพาะตัว

มาตรวจสอบกัน ฉันเข้าใจว่าคุณไม่ต้องการ แต่ทำไมต้องข้ามข้อผิดพลาดโดยที่ไม่ควรพลาดอย่างแน่นอน ให้เราแทนที่คำตอบที่พบทางด้านซ้ายของแต่ละสมการของระบบ:

จะได้ทางด้านขวาของสมการที่สอดคล้องกัน ซึ่งหมายความว่าระบบได้รับการแก้ไขอย่างถูกต้อง

ดังนั้นฟังก์ชันการประมาณที่ต้องการ: – จาก ฟังก์ชันเชิงเส้นทั้งหมดเธอคือผู้ที่ประมาณข้อมูลการทดลองได้ดีที่สุด

ไม่เหมือน ตรง การพึ่งพาการหมุนเวียนของร้านค้าในพื้นที่ การพึ่งพาที่พบคือ ย้อนกลับ (หลักการ “ยิ่งมาก ยิ่งน้อย”)และความจริงเรื่องนี้ก็ถูกเปิดเผยทันทีในแง่ลบ ความลาดชัน. การทำงาน บอกเราว่าเมื่อเพิ่มตัวบ่งชี้บางตัวขึ้น 1 หน่วย ค่าของตัวบ่งชี้ตามจะลดลง เฉลี่ยเพิ่มขึ้น 0.65 หน่วย อย่างที่พวกเขาพูดกันว่ายิ่งราคาบัควีทสูงเท่าไหร่ก็ยิ่งขายได้น้อยลงเท่านั้น

ในการพล็อตกราฟของฟังก์ชันการประมาณ เราจะพบค่าสองค่า:

และดำเนินการวาดภาพ:


เส้นตรงที่สร้างขึ้นเรียกว่า เส้นแนวโน้ม (กล่าวคือ เส้นแนวโน้มเชิงเส้น กล่าวคือ ในกรณีทั่วไป แนวโน้มไม่จำเป็นต้องเป็นเส้นตรง). ใครๆ ก็คุ้นเคยกับสำนวนที่ว่า “เป็นกระแส” และผมคิดว่าคำนี้ไม่ต้องการความคิดเห็นเพิ่มเติม

ลองคำนวณผลรวมของการเบี่ยงเบนกำลังสองกัน ระหว่างค่าเชิงประจักษ์และค่าทางทฤษฎี ในเชิงเรขาคณิต นี่คือผลรวมของกำลังสองของความยาวของส่วน "ราสเบอร์รี่" (สองอันมีขนาดเล็กมากจนมองไม่เห็นด้วยซ้ำ).

สรุปการคำนวณในตาราง:


อีกครั้ง สามารถทำได้ด้วยตนเอง ในกรณีนี้ ฉันจะยกตัวอย่างสำหรับประเด็นที่ 1:

แต่จะมีประสิทธิภาพมากกว่ามากหากทำด้วยวิธีที่ทราบอยู่แล้ว:

เราทำซ้ำอีกครั้ง: ความหมายของผลลัพธ์ที่ได้รับคืออะไร?จาก ฟังก์ชันเชิงเส้นทั้งหมดฟังก์ชัน y ตัวบ่งชี้นั้นเล็กที่สุดนั่นคือในตระกูลมันเป็นค่าประมาณที่ดีที่สุด และที่นี่ คำถามสุดท้ายของปัญหาไม่ใช่เรื่องบังเอิญ: จะเกิดอะไรขึ้นถ้าฟังก์ชันเอ็กซ์โปเนนเชียลที่เสนอมา จะดีกว่าไหมถ้านำจุดทดลองเข้ามาใกล้มากขึ้น?

มาหาผลรวมของการเบี่ยงเบนกำลังสองที่สอดคล้องกัน - เพื่อแยกแยะฉันจะเขียนแทนด้วยตัวอักษร "เอปไซลอน" เทคนิคเหมือนกันทุกประการ:


และอีกครั้ง ในกรณีนี้ การคำนวณสำหรับจุดที่ 1:

ใน Excel เราใช้ฟังก์ชันมาตรฐาน ประสบการณ์ (ไวยากรณ์สามารถพบได้ในวิธีใช้ Excel).

บทสรุป: ซึ่งหมายความว่าฟังก์ชันเลขชี้กำลังประมาณจุดทดลองที่แย่กว่าเส้นตรง .

แต่ที่นี่ควรสังเกตว่า "แย่กว่า" คือ ยังไม่ได้หมายความว่า, เกิดอะไรขึ้น. ตอนนี้ ฉันได้สร้างกราฟของฟังก์ชันเอ็กซ์โปเนนเชียลแล้ว และกราฟยังส่งผ่านใกล้กับจุดต่างๆ ด้วย - มากเสียจนหากไม่มีการวิจัยเชิงวิเคราะห์ก็ยากที่จะบอกว่าฟังก์ชันใดแม่นยำกว่า

นี่เป็นการสรุปวิธีแก้ปัญหาและฉันกลับไปสู่คำถามเกี่ยวกับคุณค่าตามธรรมชาติของการโต้แย้ง ในการศึกษาต่างๆ โดยทั่วไปแล้ว "X" ตามธรรมชาติทางเศรษฐกิจหรือสังคมวิทยาจะใช้เพื่อนับเดือน ปี หรือช่วงเวลาอื่นๆ ที่เท่ากัน ลองพิจารณาปัญหาต่อไปนี้เป็นตัวอย่าง

ฉันเป็นนักคณิตศาสตร์และโปรแกรมเมอร์ ก้าวกระโดดครั้งใหญ่ที่สุดในอาชีพการงานของฉันคือตอนที่ฉันเรียนรู้ที่จะพูดว่า: "ฉันไม่เข้าใจอะไรเลย!"ตอนนี้ฉันไม่ละอายที่จะบอกผู้ทรงคุณวุฒิด้านวิทยาศาสตร์ว่าเขากำลังบรรยายให้ฉันฟัง ฉันไม่เข้าใจว่าเขาซึ่งเป็นผู้ทรงคุณวุฒิกำลังบอกอะไรฉัน และมันยากมาก ใช่แล้ว การยอมรับความไม่รู้ของคุณเป็นเรื่องยากและน่าอาย ใครชอบยอมรับว่าเขาไม่รู้พื้นฐานของบางสิ่งบางอย่าง? เนื่องจากอาชีพของฉัน ฉันจึงต้องเข้าร่วมการนำเสนอและการบรรยายเป็นจำนวนมาก ซึ่งฉันยอมรับว่าในกรณีส่วนใหญ่ ฉันอยากนอนเพราะฉันไม่เข้าใจอะไรเลย แต่ฉันไม่เข้าใจเพราะปัญหาใหญ่ของสถานการณ์ทางวิทยาศาสตร์ในปัจจุบันอยู่ที่คณิตศาสตร์ ถือว่าผู้ฟังทุกคนคุ้นเคยกับคณิตศาสตร์ทุกด้านอย่างแน่นอน (ซึ่งไร้สาระ) การยอมรับว่าคุณไม่รู้ว่าอนุพันธ์คืออะไร (เราจะพูดถึงมันในภายหลัง) เป็นเรื่องน่าละอาย

แต่ฉันเรียนรู้ที่จะบอกว่า ฉันไม่รู้ว่าการคูณคืออะไร ใช่ ฉันไม่รู้ว่าพีชคณิตย่อยสำหรับพีชคณิตโกหกคืออะไร ใช่ ฉันไม่รู้ว่าทำไมชีวิตถึงต้องมีสมการกำลังสอง ยังไงก็ตามถ้าคุณแน่ใจว่าคุณรู้เรามีเรื่องต้องคุยกัน! คณิตศาสตร์เป็นชุดของเทคนิค นักคณิตศาสตร์พยายามสร้างความสับสนและข่มขู่สาธารณชน ที่ใดไม่สับสน ไม่มีชื่อเสียง ไม่มีอำนาจ ใช่ ถือเป็นเกียรติอย่างยิ่งที่จะพูดโดยใช้ภาษาที่เป็นนามธรรมมากที่สุดเท่าที่จะเป็นไปได้ ซึ่งถือเป็นเรื่องไร้สาระโดยสิ้นเชิง

คุณรู้หรือไม่ว่าอนุพันธ์คืออะไร? เป็นไปได้มากว่าคุณจะบอกฉันเกี่ยวกับขีดจำกัดของอัตราส่วนส่วนต่าง ในปีแรกของวิชาคณิตศาสตร์และกลศาสตร์ที่มหาวิทยาลัยแห่งรัฐเซนต์ปีเตอร์สเบิร์ก Viktor Petrovich Khavin บอกฉัน มุ่งมั่นอนุพันธ์เป็นค่าสัมประสิทธิ์ของเทอมแรกของอนุกรมเทย์เลอร์ของฟังก์ชัน ณ จุดหนึ่ง (นี่เป็นยิมนาสติกแยกต่างหากเพื่อกำหนดอนุกรมเทย์เลอร์ที่ไม่มีอนุพันธ์) ฉันหัวเราะกับคำจำกัดความนี้มานานจนในที่สุดฉันก็เข้าใจความหมายของมัน อนุพันธ์นั้นไม่มีอะไรมากไปกว่าการวัดง่ายๆ ว่าฟังก์ชันที่เราหาอนุพันธ์มีความคล้ายคลึงกับฟังก์ชัน y=x, y=x^2, y=x^3 แค่ไหน

ตอนนี้ผมได้รับเกียรติบรรยายให้กับนักศึกษาที่ เกรงกลัวคณิตศาสตร์. ถ้ากลัวคณิตเราก็ไปในทางเดียวกัน ทันทีที่คุณพยายามอ่านข้อความและดูเหมือนว่ามันซับซ้อนเกินไป จงรู้ว่ามันเขียนได้ไม่ดี ฉันยืนยันว่าไม่มีคณิตศาสตร์เพียงด้านเดียวที่ไม่สามารถพูดคุยแบบ "บนนิ้ว" ได้โดยไม่สูญเสียความแม่นยำ

งานมอบหมายสำหรับอนาคตอันใกล้นี้: ฉันมอบหมายให้นักเรียนเข้าใจว่าตัวควบคุมกำลังสองเชิงเส้นคืออะไร อย่าอาย ใช้เวลาสามนาทีในชีวิตของคุณแล้วไปตามลิงก์ หากคุณไม่เข้าใจอะไรเลยเราก็อยู่บนเส้นทางเดียวกัน ฉัน (นักคณิตศาสตร์-โปรแกรมเมอร์มืออาชีพ) ไม่เข้าใจอะไรเลยเช่นกัน และฉันรับรองกับคุณว่า คุณจะเข้าใจสิ่งนี้ได้ "ด้วยนิ้วของคุณ" ในขณะนี้ฉันไม่รู้ว่ามันคืออะไร แต่ฉันรับรองกับคุณว่าเราจะสามารถคิดออกได้

ดังนั้น การบรรยายครั้งแรกที่ฉันจะบรรยายให้กับนักเรียนของฉัน หลังจากที่พวกเขาวิ่งมาหาฉันด้วยความสยดสยองและบอกว่าตัวควบคุมกำลังสองเชิงเส้นเป็นสิ่งที่แย่ที่คุณจะไม่มีวันเชี่ยวชาญในชีวิตของคุณคือ วิธีกำลังสองน้อยที่สุด. คุณสามารถแก้สมการเชิงเส้นได้หรือไม่? หากคุณกำลังอ่านข้อความนี้ มีแนวโน้มว่าจะไม่เป็นเช่นนั้น

ดังนั้น เมื่อพิจารณาจุดสองจุด (x0, y0), (x1, y1) เช่น (1,1) และ (3,2) ภารกิจคือการหาสมการของเส้นตรงที่ผ่านจุดสองจุดนี้:

ภาพประกอบ

บรรทัดนี้ควรมีสมการดังต่อไปนี้:

ที่นี่เราไม่รู้จักอัลฟ่าและเบต้า แต่ทราบสองประเด็นของบรรทัดนี้:

เราสามารถเขียนสมการนี้ในรูปแบบเมทริกซ์:

ที่นี่เราควรพูดนอกเรื่องโคลงสั้น ๆ: เมทริกซ์คืออะไร? เมทริกซ์ไม่มีอะไรมากไปกว่าอาร์เรย์สองมิติ นี่เป็นวิธีการจัดเก็บข้อมูล ไม่ควรแนบความหมายเพิ่มเติมเข้าไปด้วย ขึ้นอยู่กับเราว่าจะตีความเมทริกซ์บางตัวอย่างไร ผมจะตีความเป็นระยะๆ ว่าเป็นการแมปเชิงเส้น เป็นระยะๆ เป็นรูปกำลังสอง และบางครั้งก็เป็นเพียงเซตของเวกเตอร์ ทั้งหมดนี้จะมีการชี้แจงในบริบท

ลองแทนที่เมทริกซ์คอนกรีตด้วยการแสดงเชิงสัญลักษณ์:

จากนั้น (อัลฟ่า, เบต้า) สามารถพบได้ง่าย:

โดยเฉพาะอย่างยิ่งสำหรับข้อมูลก่อนหน้าของเรา:

ซึ่งนำไปสู่สมการของเส้นที่ผ่านจุด (1,1) และ (3,2) ต่อไปนี้:

โอเคทุกอย่างชัดเจนที่นี่ ลองหาสมการของเส้นที่ผ่าน สามคะแนน: (x0,y0), (x1,y1) และ (x2,y2):

โอ้ โอ้ แต่เรามีสมการสามสมการสำหรับสองสิ่งที่ไม่รู้! นักคณิตศาสตร์มาตรฐานจะบอกว่าไม่มีวิธีแก้ปัญหา โปรแกรมเมอร์จะพูดอะไร? และเขาจะเขียนระบบสมการก่อนหน้านี้ใหม่ในรูปแบบต่อไปนี้:

ในกรณีของเรา เวกเตอร์ i, j, b เป็นสามมิติ ดังนั้น (ในกรณีทั่วไป) จึงไม่มีวิธีแก้ปัญหาสำหรับระบบนี้ เวกเตอร์ใดๆ (alpha\*i + beta\*j) อยู่ในระนาบที่ทอดโดยเวกเตอร์ (i, j) ถ้า b ไม่ได้อยู่ในระนาบนี้ แสดงว่าไม่มีทางแก้ (สมการไม่สามารถบรรลุความเท่าเทียมกันได้) จะทำอย่างไร? ลองมองหาการประนีประนอม เรามาแสดงแทนด้วย อี(อัลฟา, เบต้า)เราไม่สามารถบรรลุถึงความเท่าเทียมกันได้ไกลแค่ไหน:

และเราจะพยายามลดข้อผิดพลาดนี้ให้เหลือน้อยที่สุด:

ทำไมต้องเหลี่ยม?

เราไม่ได้มองหาแค่ค่าขั้นต่ำของค่ามาตรฐานเท่านั้น แต่ยังมองหาค่าขั้นต่ำของค่ากำลังสองของค่ามาตรฐานด้วย ทำไม จุดต่ำสุดนั้นเกิดขึ้นพร้อมกัน และกำลังสองให้ฟังก์ชันที่ราบรื่น (ฟังก์ชันกำลังสองของอาร์กิวเมนต์ (อัลฟา, เบตา)) ในขณะที่ความยาวเพียงอย่างเดียวให้ฟังก์ชันรูปทรงกรวย ซึ่งหาความแตกต่างไม่ได้ที่จุดต่ำสุด บร. สี่เหลี่ยมจะสะดวกกว่า

แน่นอนว่าข้อผิดพลาดจะลดลงเมื่อเวกเตอร์ ตั้งฉากกับระนาบที่ทอดโดยเวกเตอร์ ฉันและ เจ.

ภาพประกอบ

กล่าวอีกนัยหนึ่ง: เรากำลังมองหาเส้นตรงที่ผลรวมของความยาวกำลังสองของระยะทางจากทุกจุดถึงเส้นตรงนี้มีค่าน้อยที่สุด:

อัปเดต: ฉันมีปัญหาที่นี่ ควรวัดระยะห่างถึงเส้นตรงในแนวตั้ง ไม่ใช่โดยการฉายภาพแบบตั้งฉาก นักวิจารณ์คนนี้พูดถูก

ภาพประกอบ

ในคำที่แตกต่างกันโดยสิ้นเชิง (อย่างระมัดระวัง มีรูปแบบที่ไม่ดี แต่ควรชัดเจน): เราจะนำเส้นที่เป็นไปได้ทั้งหมดระหว่างจุดทุกคู่และมองหาเส้นค่าเฉลี่ยระหว่างทั้งหมด:

ภาพประกอบ

คำอธิบายอีกประการหนึ่งตรงไปตรงมา: เราแนบสปริงระหว่างจุดข้อมูลทั้งหมด (ในที่นี้เรามีสามจุด) กับเส้นตรงที่เรากำลังมองหา และเส้นตรงของสถานะสมดุลคือสิ่งที่เรากำลังมองหา

รูปแบบกำลังสองขั้นต่ำ

แล้วให้เวกเตอร์นี้มา และระนาบที่สแปนโดยเวกเตอร์คอลัมน์ของเมทริกซ์ (ในกรณีนี้ (x0,x1,x2) และ (1,1,1)) เรากำลังมองหาเวกเตอร์ ด้วยความยาวกำลังสองขั้นต่ำ แน่นอนว่าค่าต่ำสุดสามารถทำได้สำหรับเวกเตอร์เท่านั้น ตั้งฉากกับระนาบที่สแปนโดยเวกเตอร์คอลัมน์ของเมทริกซ์ :

กล่าวอีกนัยหนึ่ง เรากำลังมองหาเวกเตอร์ x=(alpha, beta) ดังนี้:

ฉันขอเตือนคุณว่าเวกเตอร์นี้ x=(alpha, beta) คือค่าต่ำสุดของฟังก์ชันกำลังสอง ||e(alpha, beta)||^2:

ในที่นี้จะมีประโยชน์ที่จะจำไว้ว่าเมทริกซ์สามารถแปลเป็นรูปแบบกำลังสองได้เช่นกัน ตัวอย่างเช่น เมทริกซ์เอกลักษณ์ ((1,0),(0,1)) สามารถแปลเป็นฟังก์ชัน x^2 + y^ 2:

รูปแบบกำลังสอง

ยิมนาสติกทั้งหมดนี้เรียกว่าการถดถอยเชิงเส้น

สมการลาปลาซกับเงื่อนไขขอบเขตดิริชเลต์

ตอนนี้งานจริงที่ง่ายที่สุด: มีพื้นผิวรูปสามเหลี่ยมบางอย่างจำเป็นต้องทำให้เรียบ ตัวอย่างเช่น ลองโหลดแบบจำลองใบหน้าของฉัน:

คอมมิตดั้งเดิมพร้อมใช้งาน เพื่อลดการพึ่งพาภายนอก ฉันจึงนำโค้ดของตัวเรนเดอร์ซอฟต์แวร์ของฉันไปไว้ใน Habré แล้ว ในการแก้ปัญหาระบบเชิงเส้น ฉันใช้ OpenNL ซึ่งเป็นตัวแก้ปัญหาที่ยอดเยี่ยม ซึ่งติดตั้งได้ยากมาก: คุณต้องคัดลอกสองไฟล์ (.h+.c) ไปยังโฟลเดอร์ที่มีโปรเจ็กต์ของคุณ การปรับให้เรียบทั้งหมดทำได้ด้วยรหัสต่อไปนี้:

สำหรับ (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&ใบหน้า = ใบหน้า[i]; สำหรับ (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

พิกัด X, Y และ Z แยกจากกันได้ ฉันปรับให้แยกกัน นั่นคือ ฉันแก้สมการเชิงเส้นสามระบบ โดยแต่ละระบบมีตัวแปรจำนวนหนึ่งเท่ากับจำนวนจุดยอดในแบบจำลองของฉัน n แถวแรกของเมทริกซ์ A มีเพียง 1 แถวต่อแถว และ n แถวแรกของเวกเตอร์ b มีพิกัดโมเดลดั้งเดิม นั่นคือฉันผูกสปริงระหว่างตำแหน่งใหม่ของจุดยอดกับตำแหน่งเก่าของจุดยอด - สปริงใหม่ไม่ควรเคลื่อนไปไกลจากจุดยอดเก่ามากเกินไป

แถวต่อมาทั้งหมดของเมทริกซ์ A (faces.size()*3 = จำนวนขอบของสามเหลี่ยมทั้งหมดในตาข่าย) มีการเกิด 1 ครั้งและเกิดขึ้น 1 ครั้งคือ -1 โดยเวกเตอร์ b มีองค์ประกอบเป็นศูนย์ตรงข้ามกัน ซึ่งหมายความว่าฉันวางสปริงไว้ที่ขอบแต่ละด้านของตาข่ายสามเหลี่ยมของเรา: ขอบทั้งหมดพยายามให้จุดยอดเดียวกันกับจุดเริ่มต้นและจุดสิ้นสุด

อีกครั้งหนึ่ง: จุดยอดทั้งหมดเป็นตัวแปร และไม่สามารถเคลื่อนไปไกลจากตำแหน่งเดิมได้ แต่ในขณะเดียวกัน จุดยอดก็พยายามที่จะคล้ายกัน

นี่คือผลลัพธ์:

ทุกอย่างจะเรียบร้อยดี ตัวแบบมีความเรียบเนียนมาก แต่มันขยับออกไปจากขอบเดิม มาเปลี่ยนรหัสกันหน่อย:

สำหรับ (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

ในเมทริกซ์ A ของเรา สำหรับจุดยอดที่อยู่บนขอบ ฉันไม่ได้เพิ่มแถวจากหมวดหมู่ v_i = verts[i][d] แต่เพิ่ม 1,000*v_i = 1,000*verts[i][d] มันเปลี่ยนแปลงอะไร? และนี่เปลี่ยนรูปแบบข้อผิดพลาดกำลังสองของเรา ตอนนี้ค่าเบี่ยงเบนเดียวจากด้านบนที่ขอบจะไม่มีราคาหนึ่งหน่วยเหมือนเมื่อก่อน แต่ราคา 1,000*1,000 หน่วย นั่นคือเราแขวนสปริงที่แข็งแรงกว่าไว้ที่จุดยอดสุดขั้ว วิธีแก้ปัญหาจะชอบยืดสปริงที่เหลือให้แรงกว่า นี่คือผลลัพธ์:

เพิ่มความแรงของสปริงระหว่างจุดยอดเป็นสองเท่า:
nlค่าสัมประสิทธิ์(หน้า[ j ], 2); nlค่าสัมประสิทธิ์(หน้า[(j+1)%3], -2);

เป็นเหตุผลที่พื้นผิวเรียบขึ้น:

และตอนนี้แข็งแกร่งกว่าร้อยเท่า:

นี่คืออะไร? ลองนึกภาพว่าเราจุ่มวงแหวนลวดลงในน้ำสบู่ เป็นผลให้ฟิล์มสบู่ที่ได้จะพยายามมีความโค้งน้อยที่สุดเท่าที่จะทำได้โดยสัมผัสกับขอบ - วงแหวนลวดของเรา นี่คือสิ่งที่เราได้จากการแก้ไขขอบและขอให้มีพื้นผิวเรียบภายใน ยินดีด้วย เราเพิ่งแก้สมการลาปลาซกับเงื่อนไขขอบเขตดิริชเลต์ได้ ฟังดูดีนะ? แต่ในความเป็นจริง คุณแค่ต้องแก้สมการเชิงเส้นระบบเดียว

สมการของปัวซอง

จำชื่อเด็ดอีกชื่อหนึ่ง

สมมติว่าฉันมีภาพเช่นนี้:

ดูดีสำหรับทุกคน แต่ฉันไม่ชอบเก้าอี้

ฉันจะตัดภาพออกครึ่งหนึ่ง:



และฉันจะเลือกเก้าอี้ด้วยมือของฉัน:

จากนั้นฉันจะดึงทุกอย่างที่เป็นสีขาวในหน้ากากไปทางด้านซ้ายของภาพและในเวลาเดียวกันตลอดทั้งภาพฉันจะบอกว่าความแตกต่างระหว่างสองพิกเซลที่อยู่ติดกันควรเท่ากับความแตกต่างระหว่างสองพิกเซลที่อยู่ติดกันทางด้านขวา รูปภาพ:

สำหรับ (int i=0; i

นี่คือผลลัพธ์:

ตัวอย่างจากชีวิต

ฉันจงใจไม่ทำให้เลียผลลัพธ์เพราะ... ฉันแค่อยากจะแสดงให้เห็นว่าคุณสามารถใช้วิธีกำลังสองน้อยที่สุดได้อย่างไร นี่คือรหัสการฝึกอบรม ตอนนี้ให้ฉันยกตัวอย่างจากชีวิต:

ฉันมีรูปถ่ายตัวอย่างผ้าจำนวนหนึ่งดังนี้:

งานของฉันคือสร้างพื้นผิวที่ไร้รอยต่อจากภาพถ่ายคุณภาพนี้ ในการเริ่มต้น ฉัน (โดยอัตโนมัติ) มองหารูปแบบการทำซ้ำ:

หากฉันตัดรูปสี่เหลี่ยมนี้ออกตรงๆ เนื่องจากความบิดเบี้ยว ขอบจึงไม่บรรจบกัน นี่คือตัวอย่างของรูปแบบที่ทำซ้ำสี่ครั้ง:

ข้อความที่ซ่อนอยู่

นี่คือส่วนที่มองเห็นตะเข็บได้ชัดเจน:

ดังนั้นฉันจะไม่ตัดเป็นเส้นตรง นี่คือเส้นตัด:

ข้อความที่ซ่อนอยู่

และนี่คือรูปแบบที่ทำซ้ำสี่ครั้ง:

ข้อความที่ซ่อนอยู่

และขอชี้แจงให้ชัดเจนยิ่งขึ้นว่า

ดีกว่าอยู่แล้ว การตัดไม่เป็นเส้นตรง หลีกเลี่ยงการหยิกทุกประเภท แต่ตะเข็บยังคงมองเห็นได้เนื่องจากแสงที่ไม่สม่ำเสมอในภาพถ่ายต้นฉบับ นี่คือจุดที่วิธีกำลังสองน้อยที่สุดสำหรับสมการปัวซองช่วยได้ นี่คือผลลัพธ์สุดท้ายหลังจากปรับระดับแสง:

พื้นผิวดูไร้รอยต่ออย่างสมบูรณ์แบบ และทั้งหมดนี้โดยอัตโนมัติจากภาพถ่ายคุณภาพปานกลางมาก อย่ากลัวคณิตศาสตร์ หาคำอธิบายง่ายๆ แล้วคุณจะมีความสุขในวิชาวิศวกรรม

หลังจากการปรับระดับเราจะได้ฟังก์ชันในรูปแบบต่อไปนี้: g (x) = x + 1 3 + 1 .

เราสามารถประมาณข้อมูลนี้ได้โดยใช้ความสัมพันธ์เชิงเส้น y = a x + b โดยการคำนวณพารามิเตอร์ที่เกี่ยวข้อง เมื่อต้องการทำเช่นนี้ เราจำเป็นต้องใช้วิธีที่เรียกว่ากำลังสองน้อยที่สุด คุณจะต้องวาดภาพเพื่อตรวจสอบว่าเส้นใดจะจัดแนวข้อมูลการทดลองได้ดีที่สุด

OLS คืออะไร (วิธีกำลังสองน้อยที่สุด)

สิ่งสำคัญที่เราต้องทำคือการหาค่าสัมประสิทธิ์ของการพึ่งพาเชิงเส้นซึ่งค่าของฟังก์ชันของตัวแปรสองตัว F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 จะเป็น เล็กที่สุด กล่าวอีกนัยหนึ่งสำหรับค่าบางค่าของ a และ b ผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลที่นำเสนอจากเส้นตรงผลลัพธ์จะมีค่าต่ำสุด นี่คือความหมายของวิธีกำลังสองน้อยที่สุด สิ่งที่เราต้องทำเพื่อแก้ตัวอย่างคือการหาจุดสิ้นสุดของฟังก์ชันของตัวแปรสองตัว

วิธีหาสูตรคำนวณสัมประสิทธิ์

เพื่อที่จะได้สูตรในการคำนวณค่าสัมประสิทธิ์ คุณต้องสร้างและแก้ระบบสมการที่มีตัวแปรสองตัว ในการทำเช่นนี้ เราคำนวณอนุพันธ์ย่อยของนิพจน์ F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 เทียบกับ a และ b แล้วเทียบให้เป็น 0

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

ในการแก้ระบบสมการ คุณสามารถใช้วิธีใดก็ได้ เช่น การแทนที่ หรือวิธีของแครเมอร์ ด้วยเหตุนี้เราจึงควรมีสูตรที่สามารถใช้คำนวณค่าสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุดได้

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

เราได้คำนวณค่าของตัวแปรที่ฟังก์ชัน
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 จะใช้ค่าต่ำสุด ในย่อหน้าที่สาม เราจะพิสูจน์ว่าทำไมมันจึงเป็นเช่นนี้

นี่คือการประยุกต์ใช้วิธีกำลังสองน้อยที่สุดในทางปฏิบัติ สูตรที่ใช้ค้นหาพารามิเตอร์ a ประกอบด้วย ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2 รวมถึงพารามิเตอร์ด้วย
n – หมายถึงจำนวนข้อมูลการทดลอง เราแนะนำให้คุณคำนวณแต่ละจำนวนเงินแยกกัน ค่าของสัมประสิทธิ์ b จะถูกคำนวณทันทีหลังจาก a

กลับไปที่ตัวอย่างเดิม

ตัวอย่างที่ 1

ตรงนี้เรามี n เท่ากับ 5. เพื่อให้สะดวกยิ่งขึ้นในการคำนวณจำนวนเงินที่ต้องการซึ่งรวมอยู่ในสูตรสัมประสิทธิ์ เรามากรอกตารางกันดีกว่า

ฉัน = 1 ผม=2 ผม=3 ผม=4 ผม=5 ∑ ผม = 1 5
x ฉัน 0 1 2 4 5 12
ใช่แล้ว 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x ฉัน ฉัน ฉัน 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x ฉัน 2 0 1 4 16 25 46

สารละลาย

แถวที่สี่รวมข้อมูลที่ได้รับโดยการคูณค่าจากแถวที่สองด้วยค่าของแถวที่สามสำหรับแต่ละ i บรรทัดที่ห้าประกอบด้วยข้อมูลจากบรรทัดที่สอง กำลังสอง คอลัมน์สุดท้ายจะแสดงผลรวมของค่าของแต่ละแถว

ลองใช้วิธีกำลังสองน้อยที่สุดในการคำนวณค่าสัมประสิทธิ์ a และ b ที่เราต้องการ ในการดำเนินการนี้ให้แทนที่ค่าที่ต้องการจากคอลัมน์สุดท้ายแล้วคำนวณจำนวนเงิน:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33, 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - ก 12 5 ⇒ ก µ 0, 165 ข ต้อ 2, 184

ปรากฎว่าเส้นตรงโดยประมาณที่ต้องการจะมีลักษณะดังนี้ y = 0, 165 x + 2, 184 ตอนนี้เราต้องพิจารณาว่าบรรทัดใดจะประมาณข้อมูลได้ดีกว่า - g (x) = x + 1 3 + 1 หรือ 0, 165 x + 2, 184 ลองประมาณโดยใช้วิธีกำลังสองน้อยที่สุด

ในการคำนวณข้อผิดพลาด เราจำเป็นต้องค้นหาผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลจากเส้นตรง σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 และ σ 2 = ∑ i = 1 n (y i - g (x i)) 2 ค่าต่ำสุดจะสอดคล้องกับเส้นที่เหมาะสมกว่า

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 data 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 data 0.096

คำตอบ:ตั้งแต่ σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0.165 x + 2.184

วิธีกำลังสองน้อยที่สุดจะแสดงไว้อย่างชัดเจนในภาพประกอบกราฟิก เส้นสีแดงทำเครื่องหมายเส้นตรง g (x) = x + 1 3 + 1 เส้นสีน้ำเงินทำเครื่องหมาย y = 0, 165 x + 2, 184 ข้อมูลต้นฉบับจะแสดงด้วยจุดสีชมพู

ให้เราอธิบายว่าทำไมจึงต้องมีการประมาณประเภทนี้

สามารถใช้ในงานที่ต้องการการปรับข้อมูลให้เรียบ เช่นเดียวกับงานที่ต้องแก้ไขหรือคาดการณ์ข้อมูล ตัวอย่างเช่น ในปัญหาที่กล่าวถึงข้างต้น เราสามารถหาค่าของปริมาณที่สังเกตได้ y ที่ x = 3 หรือที่ x = 6 เราได้อุทิศบทความแยกต่างหากให้กับตัวอย่างดังกล่าว

หลักฐานของวิธี OLS

เพื่อให้ฟังก์ชันรับค่าต่ำสุดเมื่อคำนวณ a และ b จำเป็นที่จุดที่กำหนดเมทริกซ์ของรูปแบบกำลังสองของส่วนต่างของฟังก์ชันของรูปแบบ F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 เป็นบวกแน่นอน มาดูกันว่าควรมีลักษณะอย่างไร

ตัวอย่างที่ 2

เรามีส่วนต่างลำดับที่สองของแบบฟอร์มต่อไปนี้:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2ข

สารละลาย

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

กล่าวอีกนัยหนึ่ง เราสามารถเขียนได้ดังนี้: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b

เราได้เมทริกซ์ที่มีรูปแบบกำลังสอง M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n

ในกรณีนี้ค่าของแต่ละองค์ประกอบจะไม่เปลี่ยนแปลงขึ้นอยู่กับ a และ b . เมทริกซ์นี้เป็นค่าบวกแน่นอนหรือไม่? เพื่อตอบคำถามนี้ ลองตรวจสอบว่ารองเชิงมุมของมันเป็นบวกหรือไม่

เราคำนวณตัวรองเชิงมุมของลำดับแรก: 2 ∑ i = 1 n (x i) 2 > 0 เนื่องจากจุด x ฉันไม่ตรง ความไม่เท่าเทียมกันจึงเข้มงวด เราจะจำสิ่งนี้ไว้ในการคำนวณต่อไป

เราคำนวณผู้เยาว์เชิงมุมลำดับที่สอง:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

หลังจากนี้ เราจะพิสูจน์อสมการ n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 โดยใช้การอุปนัยทางคณิตศาสตร์

  1. ลองตรวจสอบว่าอสมการนี้ใช้ได้กับ n ใดๆ ก็ตามหรือไม่ ลองเอา 2 มาคำนวณ:

2 ∑ ผม = 1 2 (x i) 2 - ∑ ผม = 1 2 x ผม 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

เราได้รับความเท่าเทียมกันที่ถูกต้อง (หากค่า x 1 และ x 2 ไม่ตรงกัน)

  1. ให้เราสมมุติว่าอสมการนี้จะเป็นจริงสำหรับ n นั่นคือ n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – จริง
  2. ตอนนี้เราจะพิสูจน์ความถูกต้องของ n + 1 เช่น นั่น (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, ถ้า n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

เราคำนวณ:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + xn + 1 2 - 2 xn + 1 x 1 + xn 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (xn + 1 - x 1) 2 + (x n + 1 - x 2) 2 + . . . + (xn - 1 - xn) 2 > 0

นิพจน์ที่อยู่ในวงเล็บปีกกาจะมากกว่า 0 (ขึ้นอยู่กับสิ่งที่เราสมมติในขั้นตอนที่ 2) และพจน์ที่เหลือจะมากกว่า 0 เนื่องจากล้วนเป็นตัวเลขกำลังสองทั้งหมด เราได้พิสูจน์ความไม่เท่าเทียมกันแล้ว

คำตอบ: a และ b ที่พบจะสอดคล้องกับค่าที่น้อยที่สุดของฟังก์ชัน F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 ซึ่งหมายความว่าพวกมันเป็นพารามิเตอร์ที่ต้องการของวิธีกำลังสองน้อยที่สุด (แอลเอสเอ็ม).

หากคุณสังเกตเห็นข้อผิดพลาดในข้อความ โปรดไฮไลต์แล้วกด Ctrl+Enter

งานหลักสูตร

การประมาณฟังก์ชันโดยใช้วิธีกำลังสองน้อยที่สุด


การแนะนำ

การประมาณคณิตศาสตร์เชิงประจักษ์

วัตถุประสงค์ของงานหลักสูตรนี้คือเพื่อเพิ่มพูนความรู้ด้านวิทยาการคอมพิวเตอร์ พัฒนาและรวบรวมทักษะในการทำงานกับตัวประมวลผลสเปรดชีต Microsoft Excel และ MathCAD การใช้คอมพิวเตอร์ในการแก้ปัญหาโดยใช้คอมพิวเตอร์ในสาขาวิชาที่เกี่ยวข้องกับการวิจัย

ในแต่ละงานจะมีการกำหนดเงื่อนไขของปัญหาข้อมูลเริ่มต้นแบบฟอร์มการออกผลลัพธ์โดยระบุการพึ่งพาทางคณิตศาสตร์หลักสำหรับการแก้ปัญหาการคำนวณการควบคุมช่วยให้คุณตรวจสอบการทำงานที่ถูกต้องของโปรแกรม

แนวคิดของการประมาณคือการแสดงออกโดยประมาณของวัตถุทางคณิตศาสตร์ใดๆ (เช่น ตัวเลขหรือฟังก์ชัน) ผ่านวัตถุอื่นๆ ที่ง่ายกว่า ใช้งานง่ายกว่า หรือรู้จักกันดีกว่า ในการวิจัยทางวิทยาศาสตร์ การประมาณใช้เพื่ออธิบาย วิเคราะห์ สรุป และใช้ผลลัพธ์เชิงประจักษ์ต่อไป

ดังที่ทราบกันดีว่า อาจมีการเชื่อมโยง (เชิงฟังก์ชัน) ที่แน่นอนระหว่างปริมาณ เมื่อค่าเฉพาะหนึ่งค่าสอดคล้องกับค่าหนึ่งของอาร์กิวเมนต์ และการเชื่อมต่อ (สหสัมพันธ์) ที่แม่นยำน้อยกว่า เมื่อค่าเฉพาะหนึ่งของอาร์กิวเมนต์สอดคล้องกับค่าประมาณหรือ ชุดของค่าฟังก์ชันบางค่าที่ใกล้เคียงกันในระดับหนึ่งหรืออีกระดับหนึ่ง เมื่อทำการวิจัยทางวิทยาศาสตร์ ประมวลผลผลการสังเกตหรือการทดลอง คุณมักจะต้องจัดการกับตัวเลือกที่สอง เมื่อศึกษาการพึ่งพาเชิงปริมาณของตัวบ่งชี้ต่าง ๆ ค่าที่ถูกกำหนดเชิงประจักษ์ตามกฎแล้วจะมีความแปรปรวนอยู่บ้าง บางส่วนถูกกำหนดโดยความหลากหลายของวัตถุที่ศึกษาซึ่งไม่มีชีวิตและโดยเฉพาะอย่างยิ่งธรรมชาติที่มีชีวิต และส่วนหนึ่งถูกกำหนดโดยข้อผิดพลาดของการสังเกตและการประมวลผลเชิงปริมาณของวัสดุ องค์ประกอบสุดท้ายไม่สามารถกำจัดออกไปได้ทั้งหมดเสมอไป สามารถลดขนาดลงได้โดยการเลือกวิธีการวิจัยที่เหมาะสมและการทำงานอย่างระมัดระวังอย่างระมัดระวังเท่านั้น

ผู้เชี่ยวชาญในสาขาระบบอัตโนมัติของกระบวนการทางเทคโนโลยีและการผลิตจัดการกับข้อมูลการทดลองจำนวนมากสำหรับการประมวลผลที่ใช้คอมพิวเตอร์ ข้อมูลต้นฉบับและผลการคำนวณที่ได้รับสามารถนำเสนอในรูปแบบตารางโดยใช้ตัวประมวลผลสเปรดชีต (สเปรดชีต) และโดยเฉพาะ Excel งานหลักสูตรวิทยาการคอมพิวเตอร์ช่วยให้นักเรียนสามารถรวบรวมและพัฒนาทักษะโดยใช้เทคโนโลยีคอมพิวเตอร์ขั้นพื้นฐานเมื่อแก้ไขปัญหาในสาขากิจกรรมทางวิชาชีพ - ระบบพีชคณิตคอมพิวเตอร์จากชั้นเรียนระบบการออกแบบโดยใช้คอมพิวเตอร์ช่วยเน้นที่การเตรียมเอกสารเชิงโต้ตอบด้วย การคำนวณและการสนับสนุนด้วยภาพ ใช้งานง่ายและใช้สำหรับการทำงานเป็นทีม


1. ข้อมูลทั่วไป


บ่อยครั้งมาก โดยเฉพาะอย่างยิ่งเมื่อวิเคราะห์ข้อมูลเชิงประจักษ์ จำเป็นต้องค้นหาความสัมพันธ์เชิงฟังก์ชันระหว่างปริมาณอย่างชัดเจน xและ ที่ซึ่งได้มาจากการวัด

ในการศึกษาเชิงวิเคราะห์ความสัมพันธ์ระหว่างสองปริมาณ x และ y จะมีการสังเกตชุดหนึ่งและผลลัพธ์ที่ได้คือตารางค่า:


xx1 x1 xฉันเอ็กซ์nใช่1 1 ฉันn

ตารางนี้มักจะได้มาจากการทดลองบางอย่างซึ่ง เอ็กซ์,(ค่าอิสระ) ถูกกำหนดโดยผู้ทดลองและ ใช่ที่ได้รับจากประสบการณ์ ดังนั้นคุณค่าเหล่านี้ ใช่เราจะเรียกพวกมันว่าค่าเชิงประจักษ์หรือค่าทดลอง

มีความสัมพันธ์เชิงฟังก์ชันระหว่างปริมาณ x และ y แต่มักจะไม่ทราบรูปแบบการวิเคราะห์ของมัน ดังนั้นจึงมีงานที่สำคัญในทางปฏิบัติเกิดขึ้น - เพื่อค้นหาสูตรเชิงประจักษ์


ย =(x; ก 1, ก 2,…, เช้า ), (1)


(ที่ไหน 1 , ก2 ,…,ก- พารามิเตอร์) ค่าที่ x = x,อาจจะแตกต่างจากค่าทดลองเล็กน้อย ใช่ (ฉัน = 1,2,…, ป).

มักจะระบุคลาสของฟังก์ชัน (เช่น ชุดของเชิงเส้น กำลัง เลขชี้กำลัง ฯลฯ) ที่เลือกฟังก์ชันไว้ ฉ(x)จากนั้นจึงกำหนดค่าพารามิเตอร์ที่ดีที่สุด

ถ้าเราทดแทนของเดิม เอ็กซ์,จากนั้นเราจะได้ค่าทางทฤษฎี

ฉัน= ฉ (xฉัน; ก 1, ก 2……) , ที่ไหน ฉัน = 1,2,…, n.


ความแตกต่าง ฉัน- ยฉัน, เรียกว่าความเบี่ยงเบนและแสดงถึงระยะห่างในแนวตั้งจากจุดต่างๆ ฉันไปยังกราฟของฟังก์ชันเชิงประจักษ์

ตามวิธีกำลังสองน้อยที่สุด จะได้ค่าสัมประสิทธิ์ที่ดีที่สุด 1 , ก2 ,…,กสิ่งที่พิจารณาผลรวมของการเบี่ยงเบนกำลังสองของฟังก์ชันเชิงประจักษ์ที่พบจากค่าฟังก์ชันที่กำหนด



จะน้อยที่สุด

ให้เราอธิบายความหมายทางเรขาคณิตของวิธีกำลังสองน้อยที่สุด

ตัวเลขแต่ละคู่ ( xฉัน, ฉัน) จากตารางต้นทางจะกำหนดจุด ฉันบนพื้นผิว เอ็กซ์อย.การใช้สูตร (1) สำหรับค่าต่างๆ ของสัมประสิทธิ์ 1 , ก2 ,…,กคุณสามารถสร้างชุดเส้นโค้งที่เป็นกราฟของฟังก์ชัน (1) ได้ ภารกิจคือการกำหนดค่าสัมประสิทธิ์ 1 , ก2 ,…,กในลักษณะที่ผลรวมของกำลังสองของแนวตั้งอยู่ห่างจากจุดนั้น ฉัน (xฉัน, ฉัน) ก่อนที่กราฟของฟังก์ชัน (1) จะเล็กที่สุด (รูปที่ 1)



การสร้างสูตรเชิงประจักษ์ประกอบด้วยสองขั้นตอน: การทำให้รูปแบบทั่วไปของสูตรนี้ชัดเจนขึ้น และการกำหนดพารามิเตอร์ที่ดีที่สุด

หากธรรมชาติของความสัมพันธ์ระหว่างปริมาณเหล่านี้ x และ ดังนั้นประเภทของการพึ่งพาเชิงประจักษ์นั้นขึ้นอยู่กับอำเภอใจ การตั้งค่าให้กับสูตรง่าย ๆ ที่มีความแม่นยำดี การเลือกสูตรเชิงประจักษ์ที่ประสบความสำเร็จนั้นขึ้นอยู่กับความรู้ของผู้วิจัยในสาขาวิชานั้นเป็นหลัก ซึ่งเขาสามารถระบุคลาสของฟังก์ชันจากการพิจารณาทางทฤษฎีได้ สิ่งที่สำคัญที่สุดคือการเป็นตัวแทนของข้อมูลที่ได้รับในระบบคาร์ทีเซียนหรือระบบพิกัดพิเศษ (กึ่งลอการิทึม ลอการิทึม ฯลฯ ) จากตำแหน่งของจุด คุณสามารถประมาณรูปแบบทั่วไปของการพึ่งพาได้โดยสร้างความคล้ายคลึงกันระหว่างกราฟที่สร้างขึ้นและตัวอย่างของเส้นโค้งที่ทราบ

การกำหนดอัตราต่อรองที่ดีที่สุด 1 , ก2,…, ที่รวมอยู่ในสูตรเชิงประจักษ์นั้นผลิตโดยวิธีวิเคราะห์ที่รู้จักกันดี

เพื่อที่จะหาเซตของสัมประสิทธิ์ 1 , ก2 …..ก, ซึ่งส่งค่าต่ำสุดของฟังก์ชัน S ที่กำหนดโดยสูตร (2) เราใช้เงื่อนไขที่จำเป็นสำหรับฟังก์ชันสุดขั้วของตัวแปรหลายตัว - ความเท่าเทียมกันของอนุพันธ์ย่อยเป็นศูนย์

เป็นผลให้เราได้รับระบบปกติในการกำหนดค่าสัมประสิทธิ์ ฉัน(ฉัน= 1,2,…, ม):



ดังนั้นการหาค่าสัมประสิทธิ์ ฉันลดการแก้ระบบ (3) ระบบนี้จะง่ายขึ้นถ้าสูตรเชิงประจักษ์ (1) เป็นเส้นตรงเทียบกับพารามิเตอร์ ฉันจากนั้นระบบ (3) จะเป็นเส้นตรง


1.1 การพึ่งพาเชิงเส้น


รูปแบบเฉพาะของระบบ (3) ขึ้นอยู่กับคลาสของสูตรเชิงประจักษ์ที่เรากำลังมองหาการพึ่งพา (1) ในกรณีที่มีการพึ่งพาเชิงเส้น ย = ก1 + ก2 xระบบ (3) จะอยู่ในรูปแบบ:


ระบบเชิงเส้นนี้สามารถแก้ไขได้ด้วยวิธีใดก็ได้ที่รู้จัก (วิธีเกาส์ การวนซ้ำอย่างง่าย สูตรแครเมอร์)


1.2 การพึ่งพากำลังสอง


ในกรณีที่มีการพึ่งพากำลังสอง ย = ก1 + ก2 x+ก3x 2ระบบ (3) จะอยู่ในรูปแบบ:



1.3 การพึ่งพาแบบเอ็กซ์โปเนนเชียล


ในบางกรณี ฟังก์ชันที่ค่าสัมประสิทธิ์ที่ไม่แน่นอนป้อนแบบไม่เชิงเส้นจะถือเป็นสูตรเชิงประจักษ์ ในกรณีนี้ บางครั้งปัญหาอาจทำให้เป็นเส้นตรงได้ เช่น ลดเป็นเส้นตรง การขึ้นต่อกันดังกล่าวรวมถึงการขึ้นต่อกันแบบเอ็กซ์โปเนนเชียล


ย = ก1 *จa2x (6)


ที่ไหน 1และ 2, ค่าสัมประสิทธิ์ไม่แน่นอน

การทำให้เป็นเส้นตรงทำได้โดยการหาลอการิทึมของความเท่าเทียมกัน (6) หลังจากนั้นเราจะได้ความสัมพันธ์

ln y = ln ก 1+ก 2x (7)


ให้เราแทน ln ที่และ ln xตามลำดับผ่าน ทีและ จากนั้นสามารถเขียนการพึ่งพา (6) ในรูปแบบได้ เสื้อ = ก1 + ก2 เอ็กซ์ซึ่งช่วยให้เราใช้สูตร (4) กับการแทนที่ได้ 1 บน และ ที่ฉันบน ทีฉัน


1.4 องค์ประกอบของทฤษฎีสหสัมพันธ์


กราฟของการพึ่งพาการทำงานที่ได้รับการฟื้นฟู ใช่(x)ตามผลการวัด (x ฉัน, ที่ฉัน),ผม = 1.2, เค, nเรียกว่าเส้นโค้งการถดถอย ในการตรวจสอบข้อตกลงของเส้นโค้งการถดถอยที่สร้างขึ้นกับผลการทดลอง โดยทั่วไปจะแนะนำคุณลักษณะเชิงตัวเลขต่อไปนี้: สัมประสิทธิ์สหสัมพันธ์ (การพึ่งพาเชิงเส้น) อัตราส่วนสหสัมพันธ์ และสัมประสิทธิ์การกำหนด ในกรณีนี้ โดยปกติแล้วผลลัพธ์จะถูกจัดกลุ่มและนำเสนอในรูปแบบของตารางความสัมพันธ์ แต่ละเซลล์ของตารางนี้จะแสดงตัวเลข nไอเจ - คู่เหล่านั้น (x, ญ)ซึ่งองค์ประกอบต่างๆ จะอยู่ในช่วงเวลาการจัดกลุ่มที่เหมาะสมสำหรับตัวแปรแต่ละตัว สมมติว่าความยาวของช่วงการจัดกลุ่ม (สำหรับแต่ละตัวแปร) เท่ากัน ให้เลือกจุดศูนย์กลาง x ฉัน(ตามลำดับ ที่ฉัน) ของช่วงเวลาและตัวเลขเหล่านี้ nไอเจ- เพื่อเป็นพื้นฐานในการคำนวณ

ค่าสัมประสิทธิ์สหสัมพันธ์คือการวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่มตาม ซึ่งแสดงให้เห็นว่า โดยเฉลี่ยแล้ว ตัวแปรตัวหนึ่งสามารถแสดงเป็นฟังก์ชันเชิงเส้นของอีกตัวแปรหนึ่งได้ดีเพียงใด

ค่าสัมประสิทธิ์สหสัมพันธ์คำนวณโดยใช้สูตร:


โดยที่ และ เป็นค่าเฉลี่ยเลขคณิตตามลำดับ เอ็กซ์และ ที่.

ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่มที่มีค่าสัมบูรณ์ไม่เกิน 1 ยิ่งใกล้ |p| ถึง 1 ยิ่งความสัมพันธ์เชิงเส้นระหว่าง x และยิ่งใกล้มากขึ้นเท่านั้น ยู.

ในกรณีที่มีความสัมพันธ์แบบไม่เชิงเส้น ค่าเฉลี่ยแบบมีเงื่อนไขจะอยู่ใกล้กับเส้นโค้ง ในกรณีนี้ขอแนะนำให้ใช้อัตราส่วนสหสัมพันธ์เป็นลักษณะของจุดแข็งของการเชื่อมต่อซึ่งการตีความไม่ได้ขึ้นอยู่กับประเภทของการพึ่งพาที่กำลังศึกษา

อัตราส่วนสหสัมพันธ์คำนวณโดยใช้สูตร:



ที่ไหน nฉัน = , n= และตัวเศษแสดงลักษณะการกระจายตัวของค่าเฉลี่ยแบบมีเงื่อนไข ใช่เกี่ยวกับค่าเฉลี่ยสัมบูรณ์ .

เสมอ. ความเท่าเทียมกัน = 0 สอดคล้องกับตัวแปรสุ่มที่ไม่สัมพันธ์กัน = 1 ถ้าหากว่ามีการเชื่อมต่อการทำงานที่แน่นอนระหว่างกัน และ x ในกรณีที่มีการพึ่งพาเชิงเส้น ของ x อัตราส่วนสหสัมพันธ์เกิดขึ้นพร้อมกับกำลังสองของสัมประสิทธิ์สหสัมพันธ์ ขนาด - ? 2 ใช้เป็นตัวบ่งชี้ความเบี่ยงเบนจากการถดถอยเชิงเส้น

อัตราส่วนสหสัมพันธ์เป็นตัววัดความสัมพันธ์สหสัมพันธ์ กับ xในรูปแบบใดๆ แต่ไม่สามารถให้แนวคิดระดับความใกล้ชิดของข้อมูลเชิงประจักษ์กับรูปแบบพิเศษได้ หากต้องการทราบว่าเส้นโค้งที่สร้างขึ้นสะท้อนข้อมูลเชิงประจักษ์ได้อย่างแม่นยำเพียงใด จึงมีการแนะนำคุณลักษณะอีกประการหนึ่ง นั่นคือสัมประสิทธิ์การกำหนด

หากต้องการอธิบาย ให้พิจารณาปริมาณต่อไปนี้ - ผลรวมของกำลังสอง โดยที่ คือค่าเฉลี่ย

เราสามารถพิสูจน์ความเท่าเทียมกันได้ดังต่อไปนี้

เทอมแรกเท่ากับ Sres = และเรียกว่าผลรวมที่เหลือของกำลังสอง เป็นลักษณะความเบี่ยงเบนของการทดลองจากทางทฤษฎี

เทอมที่สองมีค่าเท่ากับ Sreg = 2 และเรียกว่าผลรวมการถดถอยของกำลังสอง และระบุลักษณะการแพร่กระจายของข้อมูล

แน่นอนว่าความเท่าเทียมกันต่อไปนี้เป็นจริง: S เต็ม = ost + ส เร็ก

ค่าสัมประสิทธิ์ระดับถูกกำหนดโดยสูตร:



ยิ่งผลรวมที่เหลือของกำลังสองน้อยกว่าเมื่อเปรียบเทียบกับผลรวมของกำลังสองทั้งหมด ค่าสัมประสิทธิ์การกำหนดก็จะยิ่งมากขึ้น 2 ซึ่งแสดงให้เห็นว่าสมการที่เกิดจากการวิเคราะห์การถดถอยอธิบายความสัมพันธ์ระหว่างตัวแปรได้ดีเพียงใด ถ้ามันเท่ากับ 1 แสดงว่ามีความสัมพันธ์อย่างสมบูรณ์กับแบบจำลองนั่นคือ ไม่มีความแตกต่างระหว่างค่าจริงและค่าประมาณของ y ในกรณีตรงกันข้ามถ้าค่าสัมประสิทธิ์ระดับเป็น 0 แสดงว่าสมการการถดถอยไม่สามารถทำนายค่าของ y ได้สำเร็จ

ค่าสัมประสิทธิ์ของการกำหนดจะต้องไม่เกินอัตราส่วนสหสัมพันธ์เสมอ ในกรณีที่ได้ความเท่าเทียมกันแล้ว 2 = จากนั้น เราสามารถสรุปได้ว่าสูตรเชิงประจักษ์ที่สร้างขึ้นสะท้อนข้อมูลเชิงประจักษ์ได้แม่นยำที่สุด


2. คำชี้แจงของปัญหา


1. ใช้วิธีกำลังสองน้อยที่สุด ประมาณฟังก์ชันที่กำหนดในตาราง

ก) พหุนามของดีกรีแรก

b) พหุนามของดีกรีที่สอง

c) การพึ่งพาแบบเอ็กซ์โปเนนเชียล

สำหรับการพึ่งพาแต่ละครั้ง ให้คำนวณค่าสัมประสิทธิ์ของค่ากำหนด

คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ (เฉพาะกรณี ก)

สำหรับการขึ้นต่อกันแต่ละครั้ง ให้วาดเส้นแนวโน้ม

การใช้ฟังก์ชัน LINEST คำนวณลักษณะตัวเลขของการขึ้นต่อกัน

เปรียบเทียบการคำนวณของคุณกับผลลัพธ์ที่ได้รับโดยใช้ฟังก์ชัน LINEST

สรุปว่าสูตรใดที่ใกล้เคียงกับฟังก์ชันมากที่สุด

เขียนโปรแกรมในภาษาการเขียนโปรแกรมภาษาใดภาษาหนึ่งและเปรียบเทียบผลการคำนวณกับผลลัพธ์ข้างต้น


3. ข้อมูลเบื้องต้น


ฟังก์ชั่นได้รับในรูปที่ 1



4. การคำนวณการประมาณในตัวประมวลผลสเปรดชีต Excel


ในการคำนวณ ขอแนะนำให้ใช้ตัวประมวลผลสเปรดชีต Microsoft Excel และจัดเรียงข้อมูลดังรูปที่ 2



เพื่อทำสิ่งนี้ เราป้อน:

· ในเซลล์ A6:A30 เราป้อนค่า xi .

· ในเซลล์ B6:B30 เราป้อนค่าของуi .

· ในเซลล์ C6 ให้ป้อนสูตร =A6^ 2.

· สูตรนี้ถูกคัดลอกไปยังเซลล์ C7:C30

· ในเซลล์ D6 ให้ป้อนสูตร =A6*B6

· สูตรนี้ถูกคัดลอกไปยังเซลล์ D7:D30

· ในเซลล์ F6 เราใส่สูตร =A6^4

· สูตรนี้ถูกคัดลอกไปยังเซลล์ F7:F30

· ในเซลล์ G6 เราใส่สูตร =A6^2*B6

· สูตรนี้ถูกคัดลอกไปยังเซลล์ G7:G30

· ในเซลล์ H6 ให้ป้อนสูตร =LN(B6)

· สูตรนี้ถูกคัดลอกไปยังเซลล์ H7:H30

· ในเซลล์ I6 ให้ป้อนสูตร =A6*LN(B6)

· สูตรนี้ถูกคัดลอกไปยังเซลล์ I7:I30 เราดำเนินการขั้นตอนถัดไปโดยใช้การรวมอัตโนมัติ

· ในเซลล์ A33 ให้ป้อนสูตร =SUM (A6:A30)

· ในเซลล์ B33 ให้ใส่สูตร =SUM (B6:B30)

· ในเซลล์ C33 ให้ป้อนสูตร =SUM (C6:C30)

· ในเซลล์ D33 ให้ป้อนสูตร =SUM (D6:D30)

· ในเซลล์ E33 ให้ป้อนสูตร =SUM (E6:E30)

· ในเซลล์ F33 ให้ป้อนสูตร =SUM (F6:F30)

· ในเซลล์ G33 ให้ใส่สูตร =SUM (G6:G30)

· ในเซลล์ H33 ให้ใส่สูตร =SUM (H6:H30)

· ในเซลล์ I33 ให้ใส่สูตร =SUM (I6:I30)

ลองประมาณฟังก์ชันดู ย = ฉ(x) ฟังก์ชันเชิงเส้น ย = ก1 + ก2x. เพื่อกำหนดค่าสัมประสิทธิ์ก 1และก 2มาใช้ระบบ (4) กันเถอะ ใช้ผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A33, B33, C33 และ D33 เราเขียนระบบ (4) ในรูปแบบ



การแก้ปัญหาที่เราได้รับ 1= -24.7164 และ a2 = 11,63183

ดังนั้นการประมาณเชิงเส้นจึงมีรูปแบบ y= -24.7164 + 11.63183x (12)

ระบบ (11) ได้รับการแก้ไขโดยใช้ Microsoft Excel ผลลัพธ์แสดงในรูปที่ 3:



ในตารางในเซลล์ A38:B39 จะมีการเขียนสูตร (=MOBR (A35:B36)) เซลล์ E38:E39 มีสูตร (=MULTIPLE (A38:B39, C35:C36))


ต่อไปเราจะประมาณฟังก์ชัน ย = ฉ(x) ด้วยฟังก์ชันกำลังสอง ย = ก1 + ก2 x+ก3 x2. เพื่อกำหนดค่าสัมประสิทธิ์ก 1, ก 2และก 3มาใช้ระบบ (5) กันเถอะ ด้วยการใช้ผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A33, B33, C33, D33, E33, F33 และ G33 เราเขียนระบบ (5) ในรูปแบบ:



เมื่อแก้ไขอันไหนแล้วเราจะได้ 1= 1.580946,ก 2= -0.60819 และ a3 = 0,954171 (14)

ดังนั้นการประมาณกำลังสองจึงมีรูปแบบดังนี้

y = 1.580946 -0.60819x +0.954171 x2

ระบบ (13) ได้รับการแก้ไขโดยใช้ Microsoft Excel ผลลัพธ์แสดงไว้ในรูปที่ 4



ในตารางในเซลล์ A46:C48 จะมีการเขียนสูตร (=MOBR (A41:C43)) เซลล์ F46:F48 มีสูตร (=MULTIPLE (A41:C43, D46:D48))

ทีนี้ลองประมาณฟังก์ชันกัน ย = ฉ(x) ฟังก์ชันเลขชี้กำลัง ย = ก1 a2x. เพื่อกำหนดค่าสัมประสิทธิ์ 1 และ 2 ลองลอการิทึมค่าต่างๆ กัน ฉันและใช้ผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A26, C26, H26 และ I26 เราได้รับระบบ:



ที่ไหน с = ln(ก1 ).

เมื่อแก้ระบบแล้ว (10) เราพบ ค =0.506435,a2 = 0.409819.

หลังจากศักยภาพ เราจะได้ a1 = 1,659365.

ดังนั้นการประมาณเอ็กซ์โปเนนเชียลจึงมีรูปแบบ y = 1.659365*e0.4098194x

ระบบ (15) ได้รับการแก้ไขโดยใช้ Microsoft Excel ผลลัพธ์แสดงไว้ในรูปที่ 5


ในตารางในเซลล์ A55:B56 จะมีการเขียนสูตร (=MOBR (A51:B52)) ในเซลล์ E54:E56 สูตรจะถูกเขียน (=MULTIPLE (A51:B52, C51:C52)) เซลล์ E56 มีสูตร =EXP(E54)

ลองคำนวณค่าเฉลี่ยเลขคณิตของ x และ y โดยใช้สูตร:



ผลการคำนวณ x และ การใช้ Microsoft Excel แสดงในรูปที่ 6



เซลล์ B58 มีสูตร =A33/25 เซลล์ B59 มีสูตร =B33/25

ตารางที่ 2


ให้เราอธิบายวิธีการรวบรวมตารางในรูปที่ 7

เซลล์ A6:A33 และ B6:B33 ได้ถูกเติมไว้แล้ว (ดูรูปที่ 2)

· ในเซลล์ J6 ให้ป้อนสูตร =(A6-$B$58)*(B6-$B$59)

· สูตรนี้ถูกคัดลอกไปยังเซลล์ J7:J30

· ในเซลล์ K6 ให้ป้อนสูตร =(A6-$B$58)^ 2.

· สูตรนี้ถูกคัดลอกไปยังเซลล์ K7:K30

· ในเซลล์ L6 เราป้อนสูตร =(B1-$B$59)^2

· สูตรนี้ถูกคัดลอกไปยังเซลล์ L7:L30

· ในเซลล์ M6 เราป้อนสูตร =($E$38+$E$39*A6-B6)^2

· สูตรนี้ถูกคัดลอกไปยังเซลล์ M7:M30

· ในเซลล์ N6 เราป้อนสูตร =($F$46 +$F$47*A6 +$F$48*A6 L6-B6)^2

· สูตรนี้ถูกคัดลอกไปยังเซลล์ N7:N30

· ในเซลล์ O6 ให้ป้อนสูตร =($E$56*EXP ($E$55*A6) - B6)^2

· สูตรนี้ถูกคัดลอกไปยังเซลล์ O7:O30

เราดำเนินการขั้นตอนถัดไปโดยใช้การรวมอัตโนมัติ

· ในเซลล์ J33 ให้ป้อนสูตร =CYMM (J6:J30)

· ในเซลล์ K33 เราใส่สูตร =SUM (K6:K30)

· ในเซลล์ L33 ให้ป้อนสูตร =CYMM (L6:L30)

· ในเซลล์ M33 เราป้อนสูตร =SUM (M6:M30)

· ในเซลล์ N33 ให้ป้อนสูตร =SUM (N6:N30)

· ในเซลล์ O33 ให้ป้อนสูตร =SUM (06:030)

ทีนี้ลองคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตร (8) (สำหรับการประมาณเชิงเส้นเท่านั้น) และค่าสัมประสิทธิ์การกำหนดโดยใช้สูตร (10) ผลลัพธ์การคำนวณโดยใช้ Microsoft Excel แสดงไว้ในรูปที่ 7



ในตารางที่ 8 ในเซลล์ B61 เขียนสูตรไว้ =J33/(K33*L33^(1/2) ในเซลล์ B62 เขียนสูตร =1 - M33/L33 ในเซลล์ B63 เขียนสูตร =1 - N33 /L33 ในเซลล์ B64 สูตรจะเขียนเป็นสูตร =1 - O33/L33

การวิเคราะห์ผลการคำนวณแสดงให้เห็นว่าการประมาณกำลังสองอธิบายข้อมูลการทดลองได้ดีที่สุด


4.1 การพล็อตกราฟใน Excel


เลือกเซลล์ A1:A25 จากนั้นไปที่ตัวช่วยสร้างแผนภูมิ เรามาเลือกแผนภูมิกระจายกัน หลังจากสร้างแผนภูมิแล้ว ให้คลิกขวาที่เส้นกราฟแล้วเลือกเพิ่มเส้นแนวโน้ม (เชิงเส้น เลขชี้กำลัง กำลัง และพหุนามของระดับที่สอง ตามลำดับ)

กราฟการประมาณเชิงเส้น


กราฟการประมาณกำลังสอง


กราฟฟิตติ้งเอ็กซ์โปเนนเชียล


5. การประมาณฟังก์ชันโดยใช้ MathCAD


การประมาณข้อมูลที่คำนึงถึงพารามิเตอร์ทางสถิติเป็นของปัญหาการถดถอย มักเกิดขึ้นเมื่อประมวลผลข้อมูลการทดลองที่ได้รับจากการวัดกระบวนการหรือปรากฏการณ์ทางกายภาพที่มีลักษณะทางสถิติ (เช่น การวัดในเรดิโอเมทรีและธรณีฟิสิกส์นิวเคลียร์) หรือที่ระดับการรบกวน (สัญญาณรบกวน) ในระดับสูง หน้าที่ของการวิเคราะห์การถดถอยคือการเลือกสูตรทางคณิตศาสตร์ที่อธิบายข้อมูลการทดลองได้ดีที่สุด


.1 การถดถอยเชิงเส้น


การถดถอยเชิงเส้นในระบบ Mathcad ดำเนินการโดยใช้เวกเตอร์อาร์กิวเมนต์ เอ็กซ์และการอ่าน ฟังก์ชั่น:

ตัด (x, y)- คำนวณพารามิเตอร์ 1 , การกระจัดในแนวตั้งของเส้นถดถอย (ดูรูป)

ความชัน(x, y)- คำนวณพารามิเตอร์ 2 , ความชันของเส้นถดถอย (ดูรูป)

y(x) = a1+a2*x


การทำงาน ถูกต้อง (y, y(x))คำนวณ สัมประสิทธิ์สหสัมพันธ์เพียร์สันยิ่งเขาอยู่ใกล้ 1, ข้อมูลที่ประมวลผลจะสอดคล้องกับความสัมพันธ์เชิงเส้นได้แม่นยำยิ่งขึ้น (ดูรูป)

.2 การถดถอยพหุนาม


การถดถอยพหุนามหนึ่งมิติที่มีระดับตามอำเภอใจ n ของพหุนามและมีพิกัดตามอำเภอใจของกลุ่มตัวอย่างใน Mathcad ดำเนินการโดยฟังก์ชัน:

การถดถอย (x, y, n)- คำนวณเวกเตอร์ ส,ซึ่งมีค่าสัมประสิทธิ์ AIพหุนาม nระดับ;

ค่าสัมประสิทธิ์ AIสามารถแยกออกจากเวกเตอร์ได้ การทำงาน เมทริกซ์ย่อย(S, 3, ความยาว(S) - 1, 0, 0)

เราใช้ค่าสัมประสิทธิ์ที่ได้รับในสมการการถดถอย


y(x) = a1+a2*x+a3*x2 (ดูภาพ)

.3 การถดถอยแบบไม่เชิงเส้น


สำหรับสูตรการประมาณมาตรฐานอย่างง่าย จะมีฟังก์ชันการถดถอยแบบไม่เชิงเส้นจำนวนหนึ่งให้ไว้ โดยที่พารามิเตอร์ฟังก์ชันจะถูกเลือกโดยโปรแกรม Mathcad

ซึ่งรวมถึงฟังก์ชันด้วย ขยายออก (x, y, s)ซึ่งส่งคืนเวกเตอร์ที่มีค่าสัมประสิทธิ์ เอ1,เอ2และ ก3ฟังก์ชันเลขชี้กำลัง

y(x) = a1 ^ประสบการณ์ (a2x) + a3เวกเตอร์วี ป้อนค่าเริ่มต้นของสัมประสิทธิ์ เอ1,เอ2และ ก3การประมาณครั้งแรก


บทสรุป


การวิเคราะห์ผลการคำนวณแสดงให้เห็นว่าการประมาณเชิงเส้นอธิบายข้อมูลการทดลองได้ดีที่สุด

ผลลัพธ์ที่ได้รับโดยใช้โปรแกรม MathCAD ตรงกับค่าที่ได้รับโดยใช้ Excel โดยสมบูรณ์ สิ่งนี้บ่งบอกถึงความแม่นยำของการคำนวณ


บรรณานุกรม

  1. วิทยาการคอมพิวเตอร์: หนังสือเรียน / เอ็ด ศาสตราจารย์ เอ็น.วี. มาคาโรวา. อ.: การเงินและสถิติ 2550
  2. สารสนเทศ: การประชุมเชิงปฏิบัติการเกี่ยวกับเทคโนโลยีคอมพิวเตอร์ / Ed. เอ็ด ศาสตราจารย์ เอ็น.วี. มาคาโรวา. เอ็ม การเงินและสถิติ, 2554.
  3. เอ็นเอส พิสคูนอฟ. แคลคูลัสเชิงอนุพันธ์และปริพันธ์ 2553
  4. วิทยาการคอมพิวเตอร์, การประมาณกำลังสองน้อยที่สุด, แนวปฏิบัติ, เซนต์ปีเตอร์สเบิร์ก, 2009
กวดวิชา

ต้องการความช่วยเหลือในการศึกษาหัวข้อหรือไม่?

ผู้เชี่ยวชาญของเราจะแนะนำหรือให้บริการสอนพิเศษในหัวข้อที่คุณสนใจ
ส่งใบสมัครของคุณระบุหัวข้อในขณะนี้เพื่อค้นหาความเป็นไปได้ในการรับคำปรึกษา

กำลังโหลด...กำลังโหลด...