สถิติการเรียนรู้ตั้งแต่การนำเสนอไปจนถึงมาตรการการกระจายข้อมูล

สถิติเป็นวิทยาศาสตร์ทางคณิตศาสตร์ที่ศึกษาการรวบรวมการประมวลผลการวิเคราะห์และการนำเสนอข้อมูล สถิติที่ใช้กันอย่างแพร่หลายใน บริษัท ประกันภัยซึ่งหนึ่งในนั้นคือการกำหนดจำนวนเบี้ยประกันภัยในกรมธรรม์ประกันภัย ผู้ถือประกันทุกคนจะต้องจ่ายเงินสมทบที่เรียกว่าเบี้ยประกันภัย เบี้ยประกันภัยที่จ่ายเป็นไปตามทุนประกันที่ตนได้รับ

ที่นี่ บริษัท ประกันภัยใช้สถิติเพื่อให้จำนวนเบี้ยประกันภัยเป็นไปตามจำนวนความคุ้มครองที่สามารถให้กับผู้ถือประกันได้ ด้วยวิธีนี้ทั้งสองฝ่ายได้รับประโยชน์จากมัน

ตามที่กล่าวไว้ก่อนหน้านี้สถิติไม่เพียง แต่รวบรวมและประมวลผล แต่ยังนำเสนอข้อมูลด้วย สถิติยังใช้มาตรการการกระจายข้อมูลหลายอย่างในการประมวลผลข้อมูล วันนี้เราจะพูดถึงประเภทของการนำเสนอตลอดจนขนาดของการแพร่กระจายของข้อมูลในสถิติ

ประเภทของการนำเสนอข้อมูล

ประเภทของการนำเสนอข้อมูลในสถิติ ได้แก่ ตารางแจกแจงความถี่ฮิสโตแกรมรูปหลายเหลี่ยมและอ็อกฟอร์ด

การนำเสนอข้อมูลรูปแบบแรกคือการใช้ตารางแจกแจงความถี่ ตามความหมายของชื่อเราใช้ตารางเพื่อแสดงประเภทและจำนวนข้อมูลที่ได้รับ ตารางแจกแจงความถี่ยังมีอีกหลายประเภท ได้แก่ ตารางแจกแจงความถี่สำหรับข้อมูลเดี่ยวและข้อมูลกลุ่ม

(อ่านเพิ่มเติม: ข้อมูลการวัดสองรายการในสถิติ)

ตารางแจกแจงความถี่ข้อมูลเดียวใช้เพื่อนำเสนอข้อมูลจำนวนน้อยอย่างน้อย 30 ข้อมูล ตัวอย่างการนำเสนอข้อมูลโดยใช้ตารางแจกแจงความถี่ข้อมูลเดียวมีดังนี้

ข้อมูลด้านล่างคือคะแนนสอบของนักเรียน 30 คน แสดงในตารางแจกแจงความถี่ข้อมูลเดียว!

4 8 7 9 10 3 4 6 7 6 5 7 7 8 9 6 6 8 7 9 4 5 6 7 8 10 4 5 6 7

ถ้าเราใส่ใจคะแนนการทดสอบต่ำสุดที่ได้คือ 3 ในขณะที่คะแนนสูงสุดคือ 10 จากนั้นให้นับว่ามีนักเรียนกี่คนที่ได้คะแนน สำหรับชั้นประถมศึกษาปีที่ 3 เช่นนักเรียนเพียง 1 คน สำหรับชั้นประถมศึกษาปีที่ 4 มีนักเรียน 4 คนและอื่น ๆ จากนั้นรูปนี้จะถูกนำเสนอในตารางดังต่อไปนี้

กังหันบนพื้นของฟาร์มกังหันลมนอกชายฝั่ง

ตารางแจกแจงความถี่ประเภทต่อไปคือตารางแจกแจงความถี่ข้อมูลกลุ่ม ตารางนี้ใช้เพื่อนำเสนอข้อมูลจำนวนมากนั่นคือข้อมูลมากกว่า 30 รายการ ลองดูตัวอย่างด้านล่าง

ต่อไปนี้คือความสูงของต้นพริก (หน่วยเป็นมิลลิเมตร) ในสวนพริก นำเสนอข้อมูลลงในตารางการกระจายข้อมูลแบบกลุ่ม!

123 131 120 128 126 124 125 122

121 126 124 123 122 120 125 126

123 123 134 125 125126 128 135

120 126 124 133 126 127 123 126

122 125 123 132 124 132 128 124

ซึ่งแตกต่างจากข้อมูลเดี่ยวที่นี่เราต้องคำนวณจำนวนชั้นเรียนและความยาวชั้นเรียนที่จะแสดงในตาราง การใช้ข้อมูลด้านบนนี่คือการคำนวณ

ข้อมูลจำนวนมาก (n) = 40

ความสูงสูงสุด (x สูงสุด ) = 135

ความสูงขั้นต่ำ (x นาที ) = 120

ช่วง (J) = x สูงสุด  - x นาที = 135 - 120 = 15

จำนวนคลาส (k) = 1 + 3,3logn = 1 + 3,3 log40 = 6,2868 …≈ k = 6

ความยาวคลาส (c) = J / k = 15/6 = 2.5 ≈ c = 3

จากผลลัพธ์เหล่านี้เราสามารถแสดงตารางการกระจายข้อมูลกลุ่มได้ดังนี้

กังหันบนพื้นของฟาร์มกังหันลมนอกชายฝั่ง

ต่อไปเราจะกล่าวถึงการนำเสนอข้อมูลแบบจัดกลุ่มประเภทอื่น ๆ ได้แก่ ในรูปแบบของฮิสโทแกรมรูปหลายเหลี่ยมความถี่และอ็อก ดูตารางความถี่ด้านล่างซึ่งมีข้อมูลน้ำหนักสำหรับสมาชิกสโมสรกีฬา 80 คน

กังหันบนพื้นของฟาร์มกังหันลมนอกชายฝั่ง

ในการนำเสนอข้อมูลโดยใช้กราฟฮิสโตแกรมอันดับแรกเราจะสร้างแผนภูมิคาร์ทีเซียน แกน x แสดงขอบเขตบนและล่างของแต่ละคลาสในขณะที่แกน y แสดงความถี่

สถิติ 4 (1)

ซึ่งแตกต่างจากฮิสโตแกรมกราฟรูปหลายเหลี่ยมความถี่รับค่าเฉลี่ยของช่วงเวลาชั้นเรียนและแสดงด้วยเส้นตามความถี่

สถิติ 5 (1)

สุดท้ายนำเสนอข้อมูลโดยใช้เส้นโค้งความถี่สะสมเชิงบวกหรือเชิงลบ ขั้นแรกให้ทำเครื่องหมายค่าความถี่สะสมของแต่ละช่วงเวลาบนแกน y จากนั้นทำเครื่องหมายพิกัดของจุดตามคู่ขอบเขตบนของคลาสช่วงเวลาและความถี่สะสม เชื่อมต่อจุดเป็นเส้นโค้งเรียบ

ขนาดการแพร่กระจายข้อมูล

ในสถิติมีการวัดข้อมูล 2 ประเภท ได้แก่ ขนาดของความเข้มข้นของข้อมูลและขนาดของการกระจายข้อมูล มีคำอธิบายและความแตกต่างอย่างไร?

ขนาดศูนย์ข้อมูลคือค่าที่แสดงถึงตำแหน่งของข้อมูล ในการวัดที่เน้นข้อมูลจะมีค่าเฉลี่ยโหมดและค่ามัธยฐาน

ค่าเฉลี่ยหรือค่าเฉลี่ยคือผลหารระหว่างผลรวมของข้อมูลที่สังเกตได้ทั้งหมดกับข้อมูลจำนวนมาก เราสามารถกำหนดค่าเฉลี่ยได้ดังนี้

ค่าเฉลี่ย = (ผลรวมของข้อมูลทั้งหมด) / (ข้อมูลจำนวนมาก)

เพื่อให้เข้าใจได้ดีขึ้นเรามาดูปัญหาตัวอย่างต่อไปนี้ จำนวนชั่วโมงในหนึ่งสัปดาห์ที่คน 5 คนต้องการสำหรับกิจกรรมทางสังคมในสภาพแวดล้อมของพวกเขาคือ 10, 7, 13, 20 และ 15 ชั่วโมง กำหนดจำนวนชั่วโมงเฉลี่ยต่อสัปดาห์ที่พวกเขาใช้ไปกับกิจกรรมทางสังคม!

จากปัญหาข้างต้นเราสามารถป้อนตัวเลขลงในสูตรได้ดังนี้

ค่าเฉลี่ย = (10 + 7 + 13 + 20 + 15) / 5 = 65/5 = 13

ซึ่งหมายความว่าจำนวนชั่วโมงโดยเฉลี่ยที่พวกเขาใช้ไปกับกิจกรรมทางสังคมคือ 13 ชั่วโมง

นอกเหนือจากค่าเฉลี่ยหรือค่าเฉลี่ยแล้วยังมีโหมด โหมดคือค่าที่ปรากฏบ่อยที่สุดในข้อมูล ลองดูตัวอย่างของปัญหาต่อไปนี้

ด้านล่างนี้เป็นข้อมูลน้ำหนัก (กิโลกรัม) ของนักเรียนชั้นประถมศึกษาปีที่ 7 บางคนกำหนดโหมดของข้อมูล!

32, 35, 33, 32, 34, 31, 35, 35, 31, 34, 35, 3

ก่อนอื่นเราต้องนับจำนวนครั้งที่แต่ละค่าปรากฏในข้อมูล จากข้อมูลเหล่านี้เราจะได้ 31 (x3), 32 (x2), 33 (x1), 34 (x2) และ 35 (x4) เนื่องจาก 35 เกิดขึ้นบ่อยที่สุดโหมดของข้อมูลด้านบนคือ 35

ประเภทสุดท้ายของการวัดศูนย์กลางคือค่ามัธยฐาน ค่ามัธยฐานจะแบ่งข้อมูลออกเป็นสองส่วนเท่า ๆ กันเพื่อให้ค่ามัธยฐานเป็นค่ากลางของข้อมูลที่เรียงลำดับ

ในการกำหนดค่ามัธยฐานก่อนอื่นเราต้องเรียงลำดับข้อมูลทั้งหมดจากน้อยไปมากหรือน้อยไปหามาก ประการที่สองกำหนดข้อมูลจำนวนมากและแสดงสัญลักษณ์เป็น "n" ถ้า n เป็นเลขคี่สูตรที่เราใช้จะเป็นดังนี้

มัธยฐาน = หมายเลขข้อมูล - ((n + 1) / 2)

ในขณะเดียวกันถ้า n เท่ากันเราจะใช้สูตรด้านล่าง

มัธยฐาน = (ข้อมูล ith (n / 2) + ข้อมูล ith (n / 2 + 1)) / 2

การวัดข้อมูลครั้งที่สองในสถิติเป็นการวัดการแพร่กระจายของข้อมูล ขนาดของการแพร่กระจายข้อมูลเป็นค่าที่ระบุว่าข้อมูลอยู่ห่างจากศูนย์ข้อมูลเพียงใด ขนาดของการกระจายข้อมูลประกอบด้วยช่วงควอไทล์และช่วงระหว่างควอไทล์

ช่วงคือความแตกต่างระหว่างค่าข้อมูลที่ใหญ่ที่สุดและค่าข้อมูลที่น้อยที่สุด เราสามารถเข้าถึงได้โดยการลบข้อมูลที่ใหญ่ที่สุดออกจากข้อมูลที่เล็กที่สุด ตัวอย่างเช่นถ้าในชั้นเรียนหนึ่งนักเรียนที่สูงที่สุดมีความสูง 160 ซม. และนักเรียนที่เตี้ยที่สุดมีความสูง 143 ซม. เราจะได้รับการเข้าถึง 23 ซม.

ในขณะเดียวกันควอไทล์คือการจัดกลุ่มข้อมูลทางสถิติออกเป็นสี่ส่วนเท่า ๆ กัน ขนาดควอไทล์แบ่งออกเป็น 3 ควอร์ไทล์ล่าง (Q 1 ) ควอร์ไทล์กลาง (Q 2หรือมัธยฐาน) และควอไทล์บน (Q 3 ) ในการพิจารณาแต่ละควอร์ไทล์มีหลายขั้นตอนที่เราต้องดำเนินการ

ขั้นแรกให้เรียงลำดับข้อมูลจากน้อยไปมากหรือมากไปหาน้อย ประการที่สองกำหนดค่ากลางหรือค่ากลางของข้อมูล ประการที่สามการตรวจสอบควอไทล์ที่ต่ำกว่า (Q 1 ) ซึ่งเป็นค่าเฉลี่ยของกลุ่มข้อมูลด้านล่างค่ามัธยฐาน (Q 2) สุดท้ายตรวจสอบควอไทล์บน (Q 3 ) ซึ่งเป็นค่าเฉลี่ยของชุดข้อมูลดังกล่าวข้างต้นค่ามัธยฐาน (Q 2)

ประเภทสุดท้ายของการวัดการกระจายข้อมูลคือช่วงระหว่างควอไทล์ ช่วงระหว่างควอไทล์คือความแตกต่างระหว่างควอไทล์บนและล่าง สูตรมีดังนี้

Q d = Q 3 - Q 1