ชุดค่าของพารามิเตอร์ที่ศึกษาในการทดลองหรือการสังเกตที่กำหนดซึ่งจัดอันดับตามค่า (เพิ่มขึ้นหรือลดลง) เรียกว่า ซีรีย์การเปลี่ยนแปลง.
สมมติว่าเราวัดความดันโลหิตของผู้ป่วยสิบรายเพื่อให้ได้ค่าเกณฑ์ความดันโลหิตส่วนบน: ความดันซิสโตลิก เช่น มีเพียงหมายเลขเดียวเท่านั้น
ลองจินตนาการว่าชุดของการสังเกต (ชุดทางสถิติ) ของความดันซิสโตลิกของหลอดเลือดแดงในการสังเกต 10 ครั้ง มุมมองถัดไป(ตารางที่ 1):
ตารางที่ 1
ส่วนประกอบ ซีรีย์การเปลี่ยนแปลงเรียกว่าตัวเลือก ตัวเลือกนี้แสดงถึงค่าตัวเลขของคุณลักษณะที่กำลังศึกษา
การสร้างอนุกรมความแปรผันจากชุดการสังเกตทางสถิติเป็นเพียงก้าวแรกในการทำความเข้าใจคุณลักษณะต่างๆ ของทั้งชุด ถัดไปคุณต้องกำหนด ระดับเฉลี่ยของลักษณะเชิงปริมาณที่กำลังศึกษา (ระดับโปรตีนในเลือดโดยเฉลี่ย น้ำหนักเฉลี่ยผู้ป่วย ระยะเวลาเฉลี่ยในการดมยาสลบ เป็นต้น)
ระดับเฉลี่ยวัดโดยใช้เกณฑ์ที่เรียกว่าค่าเฉลี่ย ค่าเฉลี่ยเป็นคุณลักษณะเชิงตัวเลขทั่วไปของค่าที่เป็นเนื้อเดียวกันในเชิงคุณภาพ โดยแสดงลักษณะเฉพาะของประชากรทางสถิติทั้งหมดด้วยตัวเลขหนึ่งตัวตามเกณฑ์เดียว ค่าเฉลี่ยแสดงถึงสิ่งที่เหมือนกันกับคุณลักษณะในชุดการสังเกตที่กำหนด
ค่าเฉลี่ยที่ใช้ทั่วไปมีสามประเภท: โหมด (), ค่ามัธยฐาน () และค่าเฉลี่ยเลขคณิต ()
ในการหาค่าเฉลี่ยใดๆ จำเป็นต้องใช้ผลลัพธ์ของการสังเกตแต่ละรายการ โดยบันทึกไว้ในรูปแบบของชุดรูปแบบต่างๆ (ตารางที่ 2)
แฟชั่น- ค่าที่เกิดขึ้นบ่อยที่สุดในชุดการสังเกต ในตัวอย่างของเรา โหมด = 120 หากไม่มีค่าซ้ำในชุดรูปแบบ แสดงว่าไม่มีโหมด หากมีการทำซ้ำหลายค่าในจำนวนเท่ากันค่าที่น้อยที่สุดจะถูกใช้เป็นโหมด
ค่ามัธยฐาน- ค่าที่แบ่งการแจกแจงออกเป็นสองส่วนเท่าๆ กัน คือค่ากลางหรือค่ามัธยฐานของชุดการสังเกตโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อย ดังนั้น หากมี 5 ค่าในชุดรูปแบบ ค่ามัธยฐานของมันจะเท่ากับสมาชิกตัวที่สามของชุดรูปแบบถ้าอยู่ในชุด เลขคู่สมาชิก ดังนั้นค่ามัธยฐานคือค่าเฉลี่ยเลขคณิตของการสังเกตหลักสองค่า นั่นคือ หากมีการสังเกต 10 ครั้งในอนุกรมหนึ่ง ค่ามัธยฐานจะเท่ากับค่าเฉลี่ยเลขคณิตของการสังเกตครั้งที่ 5 และ 6 ในตัวอย่างของเรา
บันทึก คุณสมบัติที่สำคัญโหมดและค่ามัธยฐาน: ค่าของพวกมันจะไม่ได้รับผลกระทบ ค่าตัวเลขตัวเลือกที่รุนแรง
ค่าเฉลี่ยเลขคณิตคำนวณโดยสูตร:
โดยที่ค่าที่สังเกตได้ในการสังเกตครั้งที่ - คือจำนวนการสังเกต สำหรับกรณีของเรา
ค่าเฉลี่ยเลขคณิตมีคุณสมบัติสามประการ:
ค่าเฉลี่ยครองตำแหน่งตรงกลางในชุดรูปแบบต่างๆ ในแถวที่สมมาตรอย่างเคร่งครัด
ค่าเฉลี่ยเป็นค่าทั่วไป และความผันผวนแบบสุ่มและความแตกต่างของข้อมูลแต่ละรายการจะไม่สามารถมองเห็นได้หลังค่าเฉลี่ย มันสะท้อนให้เห็นถึงสิ่งที่เป็นเรื่องปกติของประชากรทั้งหมด
ผลรวมของการเบี่ยงเบนของตัวเลือกทั้งหมดจากค่าเฉลี่ยคือศูนย์: ระบุความเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ย
ซีรีส์รูปแบบต่างๆ ประกอบด้วยรูปแบบต่างๆ และความถี่ที่สอดคล้องกัน จากสิบค่าที่ได้นั้น จำนวน 120 เกิดขึ้น 6 ครั้ง 115 - 3 ครั้ง 125 - 1 ครั้ง ความถี่ () - จำนวนสัมบูรณ์ของตัวแปรแต่ละตัวในผลรวม ซึ่งระบุจำนวนครั้งที่เกิดขึ้น ตัวเลือกนี้ในซีรี่ส์รูปแบบต่างๆ
ซีรีย์รูปแบบอาจเป็นแบบง่าย (ความถี่ = 1) หรือจัดกลุ่มและย่อให้สั้นลง โดยมีตัวเลือก 3-5 อนุกรมแบบง่ายจะใช้เมื่อมีการสังเกตจำนวนเล็กน้อย () จัดกลุ่ม - เมื่อใด จำนวนมากการสังเกต ()
(คำจำกัดความของอนุกรมความแปรผัน ส่วนประกอบของอนุกรมความแปรผัน รูปแบบสามรูปแบบของอนุกรมความแปรผัน ความเป็นไปได้ในการสร้างอนุกรมช่วง ข้อสรุปที่สามารถดึงได้จากอนุกรมที่สร้างขึ้น)
ซีรีย์รูปแบบคือลำดับขององค์ประกอบตัวอย่างทั้งหมดที่จัดเรียงแบบไม่ลดลง องค์ประกอบที่เหมือนกันถูกทำซ้ำ
ซีรีส์แบบแปรผันคือซีรีส์ที่สร้างขึ้นบนพื้นฐานเชิงปริมาณ
อนุกรมการแจกแจงแบบแปรผันประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่:
ตัวแปรคือค่าตัวเลขของคุณลักษณะเชิงปริมาณในชุดการแจกแจงแบบแปรผัน อาจเป็นค่าบวกและค่าลบ ค่าสัมบูรณ์และค่าสัมพัทธ์ ดังนั้นเมื่อจัดกลุ่มวิสาหกิจตามผลลัพธ์ กิจกรรมทางเศรษฐกิจตัวเลขบวกหมายถึงกำไร และตัวเลขติดลบหมายถึงขาดทุน
ความถี่คือจำนวนตัวแปรแต่ละตัวหรือแต่ละกลุ่มของอนุกรมรูปแบบต่างๆ เช่น ตัวเลขเหล่านี้เป็นตัวเลขที่แสดงว่าตัวเลือกบางอย่างเกิดขึ้นในซีรีส์การแจกจ่ายบ่อยเพียงใด ผลรวมของความถี่ทั้งหมดเรียกว่าปริมาตรของประชากรและถูกกำหนดโดยจำนวนองค์ประกอบของประชากรทั้งหมด
ความถี่คือความถี่ที่แสดงเป็นค่าสัมพัทธ์ (เศษส่วนของหน่วยหรือเปอร์เซ็นต์) ผลรวมของความถี่เท่ากับหนึ่งหรือ 100% การแทนที่ความถี่ด้วยความถี่ทำให้สามารถเปรียบเทียบอนุกรมความแปรผันกับจำนวนการสังเกตที่ต่างกันได้
ซีรี่ส์รูปแบบต่างๆ มีสามรูปแบบ:อนุกรมอันดับ อนุกรมแยก และอนุกรมช่วง
ลำดับอนุกรมคือการกระจายของแต่ละหน่วยของประชากรโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อยของคุณลักษณะที่กำลังศึกษา การจัดอันดับช่วยให้คุณแบ่งข้อมูลเชิงปริมาณออกเป็นกลุ่มๆ ได้อย่างง่ายดาย ตรวจจับข้อมูลที่เล็กที่สุดและทันที มูลค่าสูงสุดลักษณะเด่นเน้นค่าที่ซ้ำกันบ่อยที่สุด
ซีรีส์รูปแบบอื่นคือตารางกลุ่มที่รวบรวมตามลักษณะของการเปลี่ยนแปลงในค่าของคุณลักษณะที่กำลังศึกษา ตามลักษณะของการแปรผันจะแยกแยะลักษณะที่ไม่ต่อเนื่อง (ไม่ต่อเนื่อง) และต่อเนื่อง
ซีรีส์แบบแยกเป็นซีรีส์แบบแปรผัน ซึ่งการก่อสร้างขึ้นอยู่กับคุณลักษณะที่มีการเปลี่ยนแปลงไม่ต่อเนื่อง (คุณลักษณะแบบไม่ต่อเนื่อง) หลังรวมถึงหมวดหมู่ภาษีจำนวนเด็กในครอบครัวจำนวนพนักงานในองค์กร ฯลฯ คุณลักษณะเหล่านี้สามารถรับค่าเฉพาะจำนวนจำกัดเท่านั้น
ชุดรูปแบบที่ไม่ต่อเนื่องแสดงถึงตารางที่ประกอบด้วยสองคอลัมน์ คอลัมน์แรกระบุค่าเฉพาะของแอตทริบิวต์ และคอลัมน์ที่สองระบุจำนวนหน่วยในประชากรที่มีค่าเฉพาะของแอตทริบิวต์
หากลักษณะมีการเปลี่ยนแปลงอย่างต่อเนื่อง (จำนวนรายได้ระยะเวลาในการให้บริการต้นทุนของสินทรัพย์ถาวรขององค์กร ฯลฯ ซึ่งอาจใช้กับมูลค่าใด ๆ ภายในขอบเขตที่กำหนด) ดังนั้นสำหรับคุณลักษณะนี้จำเป็นต้องสร้าง อนุกรมการเปลี่ยนแปลงช่วงเวลา
ตารางกลุ่มที่นี่มีสองคอลัมน์ด้วย อันแรกระบุค่าของแอตทริบิวต์ในช่วงเวลา "จาก - ถึง" (ตัวเลือก) อันที่สองระบุจำนวนหน่วยที่รวมอยู่ในช่วงเวลา (ความถี่)
ความถี่ (ความถี่การทำซ้ำ) - จำนวนการซ้ำของตัวแปรเฉพาะของค่าแอตทริบิวต์ซึ่งแสดงถึง fi และผลรวมของความถี่เท่ากับปริมาตรของประชากรที่อยู่ระหว่างการศึกษาจะแสดงแทน
โดยที่ k คือจำนวนตัวเลือกสำหรับค่าแอตทริบิวต์
บ่อยครั้งที่ตารางจะเสริมด้วยคอลัมน์ที่คำนวณความถี่สะสม S ซึ่งแสดงจำนวนหน่วยในประชากรที่มีค่าลักษณะเฉพาะไม่เกินค่านี้
อนุกรมการแจกแจงแบบแปรผันแบบไม่ต่อเนื่องคืออนุกรมที่กลุ่มต่างๆ ถูกประกอบขึ้นตามคุณลักษณะที่เปลี่ยนแปลงแบบไม่ต่อเนื่องและรับเฉพาะค่าจำนวนเต็มเท่านั้น
อนุกรมการแจกแจงแบบแปรผันตามช่วงเวลาคืออนุกรมที่ลักษณะการจัดกลุ่มที่เป็นพื้นฐานของการจัดกลุ่มสามารถรับค่าใดๆ รวมถึงค่าเศษส่วนในช่วงเวลาหนึ่งได้
ซีรีย์การแปรผันช่วงเวลาคือชุดของช่วงเวลาที่เรียงลำดับของการเปลี่ยนแปลงค่าของตัวแปรสุ่มด้วยความถี่ที่สอดคล้องกันหรือความถี่ของการเกิดขึ้นของค่าในแต่ละค่า
ขอแนะนำให้สร้างอนุกรมการแจกแจงตามช่วงเวลา โดยประการแรกคือมีการแปรผันอย่างต่อเนื่องของคุณลักษณะ และหากการแปรผันแบบไม่ต่อเนื่องปรากฏในช่วงกว้าง เช่น จำนวนตัวแปรของลักษณะที่ไม่ต่อเนื่องกันนั้นค่อนข้างมาก
สามารถสรุปข้อสรุปหลายประการได้จากซีรี่ส์นี้ ตัวอย่างเช่น องค์ประกอบตรงกลางของชุดรูปแบบ (ค่ามัธยฐาน) อาจเป็นค่าประมาณของผลการวัดที่น่าจะเป็นไปได้มากที่สุด ครั้งแรกและ องค์ประกอบสุดท้ายชุดรูปแบบต่างๆ (เช่น องค์ประกอบตัวอย่างขั้นต่ำและสูงสุด) แสดงการแพร่กระจายขององค์ประกอบตัวอย่าง บางครั้งหากองค์ประกอบแรกหรือสุดท้ายแตกต่างจากตัวอย่างที่เหลือมาก องค์ประกอบเหล่านั้นจะถูกแยกออกจากผลการวัด โดยพิจารณาว่าค่าเหล่านี้ได้มาอันเป็นผลมาจากความล้มเหลวขั้นต้นบางประเภท เช่น เทคโนโลยี
Variation series - ซีรีส์ที่มีการเปรียบเทียบ (ตามระดับการเพิ่มขึ้นหรือลดลง) ตัวเลือกและสอดคล้องกัน ความถี่
ตัวเลือกคือการแสดงออกเชิงปริมาณส่วนบุคคลของคุณลักษณะ กำหนด อักษรละติน วี . ความเข้าใจแบบดั้งเดิมของคำว่า "ตัวแปร" ถือว่าแต่ละค่าที่ไม่ซ้ำกันของคุณลักษณะเรียกว่าตัวแปร โดยไม่คำนึงถึงจำนวนการทำซ้ำ
ตัวอย่างเช่น ในชุดการเปลี่ยนแปลงของตัวบ่งชี้ความดันโลหิตซิสโตลิกที่วัดในผู้ป่วย 10 ราย:
110, 120, 120, 130, 130, 130, 140, 140, 160, 170;
มีเพียง 6 ค่าเท่านั้น:
110, 120, 130, 140, 160, 170.
ความถี่คือตัวเลขที่ระบุจำนวนครั้งที่ตัวเลือกนั้นถูกทำซ้ำ เขียนแทนด้วยอักษรละติน ป . ผลรวมของความถี่ทั้งหมด (ซึ่งแน่นอนว่าเท่ากับจำนวนความถี่ทั้งหมดที่ศึกษา) แสดงว่า n.
- ในตัวอย่างของเรา ความถี่จะใช้ค่าต่อไปนี้:
- สำหรับตัวเลือก 110 ความถี่ P = 1 (ค่า 110 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
- สำหรับตัวเลือก 120 ความถี่ P = 2 (ค่า 120 เกิดขึ้นในผู้ป่วยสองราย)
- สำหรับตัวเลือก 130 ความถี่ P = 3 (ค่า 130 เกิดขึ้นในผู้ป่วย 3 ราย)
- สำหรับตัวเลือก 140 ความถี่ P = 2 (ค่า 140 เกิดขึ้นในผู้ป่วยสองราย)
- สำหรับตัวเลือก 160 ความถี่ P = 1 (ค่า 160 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
- สำหรับตัวเลือก 170 ความถี่ P = 1 (ค่า 170 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
ประเภทของซีรี่ส์รูปแบบ:
- เรียบง่าย- นี่คืออนุกรมที่แต่ละตัวเลือกเกิดขึ้นเพียงครั้งเดียว (ความถี่ทั้งหมดเท่ากับ 1)
- ถูกระงับ- ซีรีส์ที่มีตัวเลือกตั้งแต่หนึ่งรายการขึ้นไปปรากฏขึ้นมากกว่าหนึ่งครั้ง
ซีรีส์รูปแบบต่างๆ ใช้เพื่ออธิบายอาร์เรย์จำนวนมาก ในรูปแบบนี้ ข้อมูลที่รวบรวมได้จากการศึกษาทางการแพทย์ส่วนใหญ่จะถูกนำเสนอในขั้นต้น เพื่อกำหนดลักษณะเฉพาะของชุดรูปแบบต่างๆ จะมีการคำนวณตัวบ่งชี้พิเศษ ซึ่งรวมถึงค่าเฉลี่ย ตัวบ่งชี้ความแปรปรวน (ที่เรียกว่าการกระจายตัว) และตัวบ่งชี้ความเป็นตัวแทนของข้อมูลตัวอย่าง
ตัวบ่งชี้ชุดรูปแบบต่างๆ
1) ค่าเฉลี่ยเลขคณิตเป็นตัวบ่งชี้ทั่วไปที่แสดงลักษณะของขนาดของคุณลักษณะที่กำลังศึกษา ค่าเฉลี่ยเลขคณิตแสดงเป็น ม เป็นค่าเฉลี่ยประเภทหนึ่งที่พบบ่อยที่สุด ค่าเฉลี่ยเลขคณิตคำนวณเป็นอัตราส่วนของผลรวมของค่าตัวบ่งชี้ของหน่วยการสังเกตทั้งหมดต่อจำนวนวิชาทั้งหมดที่ศึกษา วิธีการคำนวณค่าเฉลี่ยเลขคณิตจะแตกต่างกันไปสำหรับอนุกรมการแปรผันแบบง่ายและแบบถ่วงน้ำหนัก
สูตรการคำนวณ ค่าเฉลี่ยเลขคณิตอย่างง่าย:
สูตรการคำนวณ ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:
M = Σ(V * P)/n
2) โหมดเป็นค่าเฉลี่ยอีกค่าหนึ่งของอนุกรมรูปแบบ ซึ่งสอดคล้องกับตัวเลือกที่เกิดซ้ำบ่อยที่สุด หรือพูดอีกอย่างคือนี่คือตัวเลือกที่สอดคล้องกับความถี่สูงสุด แสดงว่า โม . โหมดนี้คำนวณสำหรับอนุกรมแบบถ่วงน้ำหนักเท่านั้น เนื่องจากในชุดแบบธรรมดาไม่มีตัวเลือกใดซ้ำกันและความถี่ทั้งหมดจะเท่ากับหนึ่ง
ตัวอย่างเช่น ในชุดรูปแบบต่างๆ ของค่าอัตราการเต้นของหัวใจ:
80, 84, 84, 86, 86, 86, 90, 94;
ค่าโหมดคือ 86 เนื่องจากตัวเลือกนี้เกิดขึ้น 3 ครั้ง ดังนั้นความถี่จึงสูงที่สุด
3) ค่ามัธยฐาน - ค่าของตัวเลือกที่แบ่งซีรี่ส์รูปแบบออกเป็นครึ่งหนึ่ง: ทั้งสองด้านมีตัวเลือกจำนวนเท่ากัน ค่ามัธยฐาน เช่นเดียวกับค่าเฉลี่ยเลขคณิตและโหมด หมายถึงค่าเฉลี่ย แสดงว่า ฉัน
4) ส่วนเบี่ยงเบนมาตรฐาน (คำพ้องความหมาย: ส่วนเบี่ยงเบนมาตรฐาน ส่วนเบี่ยงเบนซิกมา ซิกมา) - การวัดความแปรปรวนของอนุกรมความแปรผัน เป็นตัวบ่งชี้สำคัญที่รวมทุกกรณีของการเบี่ยงเบนจากค่าเฉลี่ย ในความเป็นจริง มันตอบคำถามว่าตัวแปรต่างๆ กระจายจากค่าเฉลี่ยเลขคณิตไปไกลแค่ไหนและบ่อยแค่ไหน เขียนแทนด้วยอักษรกรีก σ ("ซิกมา").
หากขนาดประชากรมากกว่า 30 หน่วย ค่าเบี่ยงเบนมาตรฐานจะคำนวณโดยใช้สูตรต่อไปนี้
สำหรับประชากรขนาดเล็ก - 30 หน่วยการสังเกตหรือน้อยกว่า - ค่าเบี่ยงเบนมาตรฐานจะคำนวณโดยใช้สูตรอื่น:
ซีรี่ส์รูปแบบต่างๆ - เป็นชุดสถิติที่แสดงการกระจายตัวของปรากฏการณ์ที่กำลังศึกษาตามมูลค่าของลักษณะเชิงปริมาณใดๆ เช่น ผู้ป่วยตามอายุ ระยะเวลาการรักษา ทารกแรกเกิดตามน้ำหนัก เป็นต้น
ตัวเลือก - ค่าส่วนบุคคลของคุณลักษณะที่ใช้ในการจัดกลุ่ม (แสดง วี ) .
ความถี่- ตัวเลขที่แสดงว่าตัวเลือกนั้นเกิดขึ้นบ่อยแค่ไหน (แสดงไว้ ป ) . ผลรวมของความถี่ทั้งหมดที่แสดง จำนวนทั้งหมด ข้อสังเกตและถูกกำหนดไว้ n . เรียกว่าความแตกต่างระหว่างตัวแปรที่ใหญ่ที่สุดและเล็กที่สุดของซีรีย์รูปแบบ ช่วงหรือความกว้าง .
มีซีรีย์หลากหลาย:
1. ไม่ต่อเนื่อง (ไม่ต่อเนื่อง) และต่อเนื่อง
อนุกรมจะถือว่าต่อเนื่องหากลักษณะการจัดกลุ่มสามารถแสดงเป็นค่าเศษส่วน (น้ำหนัก ส่วนสูง ฯลฯ) ไม่ต่อเนื่องหากลักษณะการจัดกลุ่มแสดงเป็นจำนวนเต็มเท่านั้น (วันที่ทุพพลภาพ จำนวนชีพจรเต้น ฯลฯ) .
2.เรียบง่ายและสมดุล
อนุกรมการแปรผันอย่างง่ายคืออนุกรมซึ่งค่าเชิงปริมาณของคุณลักษณะที่แตกต่างกันเกิดขึ้นเพียงครั้งเดียว ในชุดรูปแบบที่ถ่วงน้ำหนัก ค่าเชิงปริมาณของคุณลักษณะที่แตกต่างกันจะถูกทำซ้ำด้วยความถี่ที่แน่นอน
3. จัดกลุ่ม (ช่วง) และไม่ได้จัดกลุ่ม
ซีรีส์ที่จัดกลุ่มจะมีตัวเลือกที่รวมกันเป็นกลุ่มซึ่งจะรวมเข้าด้วยกันตามขนาดภายในช่วงเวลาหนึ่ง ในชุดข้อมูลที่ไม่ได้จัดกลุ่ม แต่ละตัวเลือกจะสอดคล้องกับความถี่ที่แน่นอน
4. คู่และคี่
ในอนุกรมรูปแบบคู่ ผลรวมของความถี่หรือ จำนวนทั้งหมดการสังเกตแสดงเป็นเลขคู่ เลขคี่ - เลขคี่
5. สมมาตรและไม่สมมาตร
ในชุดความแปรผันแบบสมมาตร ค่าเฉลี่ยทุกประเภทตรงกันหรือใกล้เคียงกันมาก (โหมด, ค่ามัธยฐาน, ค่าเฉลี่ยเลขคณิต)
ขึ้นอยู่กับลักษณะของปรากฏการณ์ที่กำลังศึกษาในงานเฉพาะและเป้าหมายของการวิจัยทางสถิติตลอดจนเนื้อหาของแหล่งข้อมูลในสถิติสุขาภิบาล มีการใช้ค่าเฉลี่ยประเภทต่อไปนี้:
วิธีโครงสร้าง (โหมด, ค่ามัธยฐาน);
ค่าเฉลี่ยเลขคณิต
ค่าเฉลี่ยฮาร์มอนิก
เฉลี่ยเรขาคณิต;
ก้าวหน้าโดยเฉลี่ย
แฟชั่น (ม โอ ) - คุณค่าของลักษณะที่แตกต่างกันซึ่งมักพบในประชากรที่กำลังศึกษาอยู่เช่น ตัวเลือกที่สอดคล้องกับความถี่สูงสุด พวกเขาค้นหาได้โดยตรงจากโครงสร้างของซีรีย์รูปแบบต่างๆ โดยไม่ต้องพึ่งการคำนวณใดๆ โดยปกติแล้วจะเป็นค่าที่ใกล้เคียงกับค่าเฉลี่ยเลขคณิตมากและสะดวกในทางปฏิบัติมาก
ค่ามัธยฐาน (ม จ ) - การแบ่งชุดรูปแบบ (จัดอันดับ เช่น ค่าของตัวเลือกจะจัดเรียงจากน้อยไปหามากหรือจากมากไปน้อย) ออกเป็นสองซีกเท่าๆ กัน ค่ามัธยฐานคำนวณโดยใช้สิ่งที่เรียกว่าอนุกรมคี่ ซึ่งได้มาจากการรวมความถี่ตามลำดับ หากผลรวมของความถี่สอดคล้องกับเลขคู่ ค่าเฉลี่ยเลขคณิตของค่าเฉลี่ยทั้งสองจะถูกใช้เป็นค่ามัธยฐานตามอัตภาพ
โหมดและค่ามัธยฐานใช้ในกรณีของประชากรเปิด เช่น เมื่อตัวเลือกที่ใหญ่ที่สุดหรือเล็กที่สุดไม่มีคุณลักษณะเชิงปริมาณที่แน่นอน (เช่น มากถึง 15 ปี, 50 ปีขึ้นไป เป็นต้น) ในกรณีนี้ ไม่สามารถคำนวณค่าเฉลี่ยเลขคณิต (คุณลักษณะของพารามิเตอร์) ได้
เฉลี่ย ฉันเป็นคนเลขคณิต - ค่าที่พบบ่อยที่สุด ค่าเฉลี่ยเลขคณิตมักเขียนแทนด้วย ม.
มีค่าเฉลี่ยเลขคณิตแบบง่ายและถ่วงน้ำหนัก
ค่าเฉลี่ยเลขคณิตอย่างง่าย คำนวณ:
- ในกรณีที่ประชากรแสดงด้วยรายการความรู้อย่างง่ายเกี่ยวกับคุณลักษณะของแต่ละหน่วย
- หากไม่สามารถกำหนดจำนวนการซ้ำของแต่ละตัวเลือกได้
- หากจำนวนการซ้ำของแต่ละตัวเลือกอยู่ใกล้กัน
ค่าเฉลี่ยเลขคณิตอย่างง่ายคำนวณโดยใช้สูตร:
โดยที่ V - ค่าส่วนบุคคลของคุณลักษณะ; n - จำนวนค่าแต่ละค่า
- เครื่องหมายสรุป
ดังนั้น ค่าเฉลี่ยอย่างง่ายคืออัตราส่วนของผลรวมของตัวแปรต่อจำนวนการสังเกต
ตัวอย่าง: กำหนดระยะเวลาเฉลี่ยในการนอนบนเตียงของผู้ป่วยโรคปอดบวม 10 ราย:
16 วัน - ผู้ป่วย 1 ราย; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.
วันนอน
ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก คำนวณในกรณีที่มีการทำซ้ำค่าแต่ละค่าของคุณลักษณะ สามารถคำนวณได้สองวิธี:
1. ทางตรง (ค่าเฉลี่ยเลขคณิตหรือวิธีทางตรง) ตามสูตร:
,
โดยที่ P คือความถี่ (จำนวนกรณี) ของการสังเกตของแต่ละตัวเลือก
ดังนั้น ค่าเฉลี่ยเลขคณิตแบบถ่วงน้ำหนักคืออัตราส่วนของผลรวมของผลคูณของตัวแปรและความถี่ต่อจำนวนการสังเกต
2. โดยการคำนวณความเบี่ยงเบนจากค่าเฉลี่ยแบบมีเงื่อนไข (โดยใช้วิธีโมเมนต์)
พื้นฐานสำหรับการคำนวณค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักคือ:
- จัดกลุ่มวัสดุตามตัวแปรของคุณลักษณะเชิงปริมาณ
— ตัวเลือกทั้งหมดควรจัดเรียงตามค่าของแอตทริบิวต์จากน้อยไปหามากหรือจากมากไปน้อย (อนุกรมอันดับ)
ในการคำนวณโดยใช้วิธีโมเมนต์ ข้อกำหนดเบื้องต้นคือขนาดเท่ากันของช่วงเวลาทั้งหมด
โดยใช้วิธีการโมเมนต์ ค่าเฉลี่ยเลขคณิตคำนวณโดยใช้สูตร:
,
โดยที่ M o คือค่าเฉลี่ยแบบมีเงื่อนไขซึ่งมักจะถือเป็นค่าของคุณลักษณะที่สอดคล้องกับความถี่สูงสุดคือ ซึ่งเกิดซ้ำบ่อยขึ้น (แฟชั่น)
i คือค่าของช่วงเวลา
a คือการเบี่ยงเบนแบบมีเงื่อนไขจากเงื่อนไขของค่าเฉลี่ย ซึ่งเป็นชุดตัวเลขตามลำดับ (1, 2 เป็นต้น) โดยมีเครื่องหมาย + สำหรับตัวแปรของค่าเฉลี่ยแบบมีเงื่อนไขขนาดใหญ่และมีเครื่องหมาย – (–1, –2 ฯลฯ .) สำหรับตัวแปรที่ต่ำกว่าค่าเฉลี่ยทั่วไป ค่าเบี่ยงเบนแบบมีเงื่อนไขจากตัวแปรที่นำมาเป็นค่าเฉลี่ยแบบมีเงื่อนไขคือ 0
P - ความถี่
- จำนวนการสังเกตทั้งหมดหรือ n
ตัวอย่าง: กำหนด ความสูงเฉลี่ยเด็กชายอายุ 8 ขวบ ใช้วิธีการโดยตรง (ตารางที่ 1)
ตารางที่ 1
ความสูงเป็นซม |
เด็กชาย ป |
ศูนย์กลาง ตัวเลือก V | |
ตัวเลือกกลาง - ตรงกลางของช่วงเวลา - ถูกกำหนดให้เป็นผลรวมกึ่งของค่าเริ่มต้นของสองกลุ่มที่อยู่ติดกัน:
;
ฯลฯ
VP ของผลิตภัณฑ์ได้มาจากการคูณตัวแปรกลางด้วยความถี่
;
ฯลฯ จากนั้นจึงเพิ่มและรับผลิตภัณฑ์ผลลัพธ์
ซึ่งหารด้วยจำนวนการสังเกต (100) และได้ค่าเฉลี่ยเลขคณิตแบบถ่วงน้ำหนัก
ซม.
เราจะแก้ไขปัญหาเดียวกันโดยใช้วิธีโมเมนต์ซึ่งรวบรวมตารางที่ 2 ต่อไปนี้:
ตารางที่ 2
ความสูงเป็นซม. (V) |
เด็กชาย ป | ||
n=100
เราเอา 122 เป็น M o เพราะ จากการสังเกต 100 ครั้ง มีคน 33 คนมีส่วนสูง 122 ซม. เราพบความเบี่ยงเบนแบบมีเงื่อนไข (a) จากค่าเฉลี่ยแบบมีเงื่อนไขตามข้างต้น จากนั้นเราจะได้ผลคูณของการเบี่ยงเบนตามเงื่อนไขตามความถี่ (aP) และสรุปค่าที่ได้รับ (
). ผลลัพธ์คือ 17 สุดท้าย เราแทนที่ข้อมูลลงในสูตร:
เมื่อศึกษาคุณลักษณะที่แตกต่างกัน เราไม่สามารถจำกัดตัวเองอยู่เพียงการคำนวณค่าเฉลี่ยเท่านั้น นอกจากนี้ยังจำเป็นต้องคำนวณตัวบ่งชี้ที่แสดงถึงระดับความหลากหลายของลักษณะที่กำลังศึกษา ค่าของคุณลักษณะเชิงปริมาณอย่างใดอย่างหนึ่งไม่เหมือนกันสำหรับทุกหน่วยของประชากรทางสถิติ
ลักษณะของอนุกรมรูปแบบคือค่าเบี่ยงเบนมาตรฐาน ( ) ซึ่งแสดงการแพร่กระจาย (การกระจายตัว) ของคุณลักษณะที่ศึกษาสัมพันธ์กับค่าเฉลี่ยเลขคณิต เช่น ระบุลักษณะความแปรปรวนของชุดรูปแบบต่างๆ สามารถกำหนดได้โดยตรงโดยใช้สูตร:
ค่าเบี่ยงเบนมาตรฐานเท่ากับรากที่สองของผลรวมของผลคูณของค่าเบี่ยงเบนกำลังสองของแต่ละตัวเลือกจากค่าเฉลี่ยเลขคณิต (V-M) 2 ด้วยความถี่หารด้วยผลรวมของความถี่ (
).
ตัวอย่างการคำนวณ: กำหนดจำนวนใบป่วยโดยเฉลี่ยที่ออกให้ในคลินิกต่อวัน (ตารางที่ 3)
ตารางที่ 3
จำนวนวันที่ลาป่วย แผ่นงานออกแล้ว แพทย์ต่อวัน (V) |
จำนวนแพทย์ (P) | ||||
;
ในตัวส่วนเมื่อจำนวนการสังเกตน้อยกว่า 30 จะต้องจาก
ลบหนึ่ง
หากอนุกรมถูกจัดกลุ่มในช่วงเวลาเท่ากัน ค่าเบี่ยงเบนมาตรฐานสามารถกำหนดได้โดยใช้วิธีการของโมเมนต์:
,
โดยที่ i คือค่าของช่วงเวลา
- การเบี่ยงเบนแบบมีเงื่อนไขจากค่าเฉลี่ยแบบมีเงื่อนไข
P - ตัวแปรความถี่ของช่วงเวลาที่สอดคล้องกัน
- จำนวนการสังเกตทั้งหมด
ตัวอย่างการคำนวณ : กำหนดระยะเวลาเฉลี่ยของการอยู่บนเตียงของผู้ป่วย (โดยใช้วิธีการช่วงเวลา) (ตารางที่ 4):
ตารางที่ 4
จำนวนวัน อยู่บนเตียง (วี) |
ป่วย (ป) | |||
;
นักสถิติชาวเบลเยียม A. Quetelet ค้นพบว่าความแปรผันของปรากฏการณ์มวลเป็นไปตามกฎการกระจายข้อผิดพลาด ซึ่งค้นพบเกือบจะพร้อมๆ กันโดย K. Gauss และ P. Laplace เส้นโค้งที่แสดงถึงการกระจายนี้มีรูปร่างคล้ายระฆัง ตามกฎหมายการแจกแจงแบบปกติ ความแปรปรวนของค่าแต่ละค่าของคุณลักษณะนั้นอยู่ภายในขีดจำกัด
ซึ่งครอบคลุมร้อยละ 99.73 ของหน่วยประชากรทั้งหมด
มีการคำนวณไว้ว่าหากคุณบวกและลบ 2 เข้ากับค่าเฉลี่ยเลขคณิต จากนั้น 95.45% ของสมาชิกทั้งหมดของอนุกรมรูปแบบต่างๆ อยู่ภายในค่าที่ได้รับ และสุดท้าย ถ้าเราบวกและลบ 1 เข้ากับค่าเฉลี่ยเลขคณิต จากนั้น 68.27% ของสมาชิกทั้งหมดของอนุกรมรูปแบบนี้จะอยู่ภายในค่าที่ได้รับ ในทางการแพทย์อย่างยิ่งใหญ่
1เกี่ยวข้องกับแนวคิดเรื่องบรรทัดฐาน ส่วนเบี่ยงเบนจากค่าเฉลี่ยเลขคณิตมากกว่า 1 แต่น้อยกว่า 2 ผิดปกติและการเบี่ยงเบนมากกว่า 2 ผิดปกติ (สูงหรือต่ำกว่าปกติ)
ในสถิติด้านสุขภาพ กฎสามซิกมาจะใช้ในการศึกษาพัฒนาการทางกายภาพ การประเมินการปฏิบัติงานของสถาบันดูแลสุขภาพ และการประเมินสุขภาพของประชากร กฎเดียวกันนี้ใช้กันอย่างแพร่หลายใน เศรษฐกิจของประเทศเมื่อกำหนดมาตรฐาน
ดังนั้น ค่าเบี่ยงเบนมาตรฐานจึงมีไว้สำหรับ:
- การวัดการกระจายตัวของอนุกรมความแปรผัน
— ลักษณะของระดับความหลากหลายของลักษณะซึ่งถูกกำหนดโดยค่าสัมประสิทธิ์ของการแปรผัน:
หากค่าสัมประสิทธิ์ของการแปรผันมากกว่า 20% - ความหลากหลายที่แข็งแกร่งจาก 20 ถึง 10% - โดยเฉลี่ย น้อยกว่า 10% - ความหลากหลายของลักษณะที่อ่อนแอ ค่าสัมประสิทธิ์ของการแปรผันเป็นเกณฑ์สำหรับความน่าเชื่อถือของค่าเฉลี่ยเลขคณิตในระดับหนึ่ง
ขึ้นอยู่กับลักษณะที่เป็นรากฐานของการก่อตัวของชุดการแจกจ่ายที่มีอยู่ ชุดการแจกแจงแบบระบุแหล่งที่มาและแบบแปรผัน.
การมีลักษณะทั่วไปเป็นพื้นฐานสำหรับการก่อตัวของประชากรทางสถิติซึ่งแสดงถึงผลลัพธ์ของการอธิบายหรือการวัดลักษณะทั่วไปของวัตถุที่ทำการศึกษา
หัวข้อการศึกษาทางสถิติคือการเปลี่ยนแปลง (แปรผัน) ลักษณะหรือลักษณะทางสถิติ
ประเภทของลักษณะทางสถิติ.
ชุดการแจกจ่ายเรียกว่าแอตทริบิวต์สร้างขึ้นตามเกณฑ์คุณภาพ แอตทริบิวต์– นี่คือสัญลักษณ์ที่มีชื่อ (เช่น อาชีพ: ช่างเย็บผ้า, ครู ฯลฯ )
โดยทั่วไปชุดการแจกจ่ายจะแสดงในรูปแบบของตาราง ในตาราง 2.8 แสดงชุดการแจกแจงแอตทริบิวต์
ตารางที่ 2.8 - การกระจายความช่วยเหลือทางกฎหมายประเภทต่างๆ ที่จัดทำโดยนักกฎหมายให้กับพลเมืองในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซีย
ชุดรูปแบบคือชุดการจัดจำหน่ายสร้างขึ้นบนพื้นฐานเชิงปริมาณ ชุดรูปแบบต่างๆ ประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่
ตัวแปรถือเป็นค่าเฉพาะของคุณลักษณะที่ใช้ในชุดรูปแบบต่างๆ
ความถี่คือจำนวนตัวแปรแต่ละตัวหรือแต่ละกลุ่มของอนุกรมรูปแบบต่างๆ เช่น ตัวเลขเหล่านี้เป็นตัวเลขที่แสดงว่าตัวเลือกบางอย่างเกิดขึ้นในซีรีส์การแจกจ่ายบ่อยเพียงใด ผลรวมของความถี่ทั้งหมดจะกำหนดขนาดของประชากรทั้งหมดและปริมาตรของมัน
ความถี่คือความถี่ที่แสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของทั้งหมด ดังนั้นผลรวมของความถี่จึงเท่ากับ 1 หรือ 100% ชุดรูปแบบต่างๆ ช่วยให้สามารถประมาณรูปแบบของกฎการกระจายตามข้อมูลจริงได้
ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลงของลักษณะที่มีอยู่ อนุกรมความแปรผันแบบไม่ต่อเนื่องและช่วงเวลา.
ตัวอย่างของชุดรูปแบบที่แยกจากกันแสดงไว้ในตาราง 2.9.
ตารางที่ 2.9 - การกระจายของครอบครัวตามจำนวนห้องที่ถูกครอบครองในแต่ละอพาร์ทเมนต์ในปี 1989 ในสหพันธรัฐรัสเซีย
ซีรี่ส์รูปแบบต่างๆ
มีการศึกษาลักษณะเชิงปริมาณบางอย่างในประชากรทั่วไป ตัวอย่างปริมาตรจะถูกสุ่มออกมา nนั่นคือจำนวนองค์ประกอบตัวอย่างเท่ากับ n. ในขั้นตอนแรกของการประมวลผลทางสถิติ ตั้งแต่ตัวอย่างเช่น การสั่งจำนวน x 1 , x 2 , …, xnจากน้อยไปมาก. แต่ละค่าที่สังเกตได้ x ฉันเรียกว่า ตัวเลือก. ความถี่ ฉันคือจำนวนการสังเกตค่า x ฉันในตัวอย่าง ความถี่สัมพัทธ์ (ความถี่) ฉันคืออัตราส่วนความถี่ ฉันถึงขนาดตัวอย่าง n: .เมื่อศึกษาอนุกรมความแปรผัน ก็จะใช้แนวคิดเกี่ยวกับความถี่สะสมและความถี่สะสมด้วย อนุญาต xหมายเลขบางอย่าง แล้ว จำนวนตัวเลือก, ซึ่งมีค่าน้อยกว่า xเรียกว่าความถี่สะสม: สำหรับ x i
ลักษณะที่เรียกว่าตัวแปรแบบไม่ต่อเนื่องหากค่าแต่ละค่า (ตัวแปร) แตกต่างจากกันด้วยค่าจำกัดที่แน่นอน (โดยปกติจะเป็นจำนวนเต็ม) อนุกรมความแปรผันของคุณลักษณะดังกล่าวเรียกว่าอนุกรมความแปรผันแบบไม่ต่อเนื่อง
ตารางที่ 1 มุมมองทั่วไปของชุดความถี่การแปรผันแบบไม่ต่อเนื่อง
ค่าลักษณะเฉพาะ | x ฉัน | x1 | x2 | … | เอ็กซ์เอ็น |
ความถี่ | ฉัน | ม. 1 | ม. 2 | … | ม |
ลักษณะที่เรียกว่าเปลี่ยนแปลงอย่างต่อเนื่องหากค่าของมันแตกต่างกันด้วยจำนวนเล็กน้อยโดยพลการเช่น เครื่องหมายสามารถรับค่าใดก็ได้ในช่วงเวลาหนึ่ง อนุกรมความแปรผันต่อเนื่องสำหรับคุณลักษณะดังกล่าวเรียกว่าช่วงเวลา
ตารางที่ 2 มุมมองทั่วไปของชุดความถี่ที่แปรผันตามช่วงเวลา
ตารางที่ 3. ภาพกราฟิกของซีรีย์รูปแบบต่างๆ
แถว | รูปหลายเหลี่ยมหรือฮิสโตแกรม | ฟังก์ชันการกระจายเชิงประจักษ์ | |
ไม่ต่อเนื่อง | |||
ช่วงเวลา |
สำหรับการแสดงอนุกรมของรูปแบบกราฟิก รูปแบบที่ใช้กันมากที่สุดคือรูปหลายเหลี่ยม ฮิสโตแกรม เส้นโค้งสะสม และฟังก์ชันการแจกแจงเชิงประจักษ์
ในตาราง 2.3 (การจัดกลุ่มประชากรรัสเซียโดยรายได้ต่อหัวเฉลี่ยในเดือนเมษายน 2537) อนุกรมการเปลี่ยนแปลงช่วงเวลา.
สะดวกในการวิเคราะห์อนุกรมการแจกแจงโดยใช้ภาพกราฟิก ซึ่งช่วยให้สามารถตัดสินรูปร่างของการแจกแจงได้ การแสดงภาพธรรมชาติของการเปลี่ยนแปลงความถี่ของชุดรูปแบบต่างๆ จะได้รับจาก รูปหลายเหลี่ยมและฮิสโตแกรม.
รูปหลายเหลี่ยมจะใช้เมื่อแสดงชุดรูปแบบที่แยกจากกัน.
ตัวอย่างเช่น ให้เราอธิบายการกระจายสต็อกที่อยู่อาศัยตามประเภทของอพาร์ทเมนต์แบบกราฟิก (ตารางที่ 2.10)
ตารางที่ 2.10 - การกระจายสต็อกที่อยู่อาศัยในเขตเมืองตามประเภทของอพาร์ทเมนต์ (ตัวเลขตามเงื่อนไข)
ข้าว. พื้นที่จำหน่ายที่อยู่อาศัย
ไม่เพียงแต่ค่าความถี่เท่านั้น แต่ยังรวมถึงความถี่ของอนุกรมการเปลี่ยนแปลงบนแกนพิกัดอีกด้วย
ฮิสโตแกรมใช้เพื่อแสดงชุดการแปรผันตามช่วงเวลา. เมื่อสร้างฮิสโตแกรมค่าของช่วงเวลาจะถูกพล็อตบนแกน abscissa และความถี่จะถูกแสดงด้วยสี่เหลี่ยมที่สร้างขึ้นในช่วงเวลาที่สอดคล้องกัน ความสูงของคอลัมน์ในกรณีที่มีระยะห่างเท่ากันควรเป็นสัดส่วนกับความถี่ ฮิสโตแกรมคือกราฟที่แสดงชุดข้อมูลเป็นแท่งที่อยู่ติดกัน
ให้เราอธิบายอนุกรมการแจกแจงตามช่วงเวลาที่กำหนดในตารางด้วยภาพกราฟิก 2.11.
ตารางที่ 2.11 - การกระจายของครอบครัวตามขนาดพื้นที่อยู่อาศัยต่อคน (ตัวเลขตามเงื่อนไข)
เอ็น พี/พี | กลุ่มครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน | จำนวนครอบครัวที่มีขนาดพื้นที่ใช้สอยที่กำหนด | จำนวนครอบครัวสะสม |
1 | 3 – 5 | 10 | 10 |
2 | 5 – 7 | 20 | 30 |
3 | 7 – 9 | 40 | 70 |
4 | 9 – 11 | 30 | 100 |
5 | 11 – 13 | 15 | 115 |
ทั้งหมด | 115 | ---- |
ข้าว. 2.2. ฮิสโตแกรมของการกระจายตัวของครอบครัวตามขนาดพื้นที่อยู่อาศัยต่อคน
เราสร้างโดยใช้ข้อมูลของอนุกรมที่สะสม (ตาราง 2.11) กระจายสะสม
ข้าว. 2.3. การกระจายครอบครัวสะสมตามขนาดพื้นที่อยู่อาศัยต่อคน
การแทนอนุกรมรูปแบบต่างๆ ในรูปแบบของการสะสมจะมีประสิทธิภาพโดยเฉพาะอย่างยิ่งสำหรับอนุกรมรูปแบบต่างๆ ซึ่งความถี่จะแสดงเป็นเศษส่วนหรือเปอร์เซ็นต์ของผลรวมของความถี่อนุกรม
หากเราเปลี่ยนแกนเมื่อแสดงชุดรูปแบบต่างๆ ในรูปแบบของการสะสมแบบกราฟิก เราก็จะได้ โอกิวา. ในรูป 2.4 แสดง ogive ที่สร้างขึ้นบนพื้นฐานของข้อมูลในตาราง 2.11.
ฮิสโตแกรมสามารถแปลงเป็นรูปหลายเหลี่ยมการแจกแจงได้โดยการค้นหาจุดกึ่งกลางของด้านข้างของสี่เหลี่ยม แล้วเชื่อมต่อจุดเหล่านี้ด้วยเส้นตรง รูปหลายเหลี่ยมการกระจายผลลัพธ์จะแสดงในรูปที่ 1 2.2 มีเส้นประ
เมื่อสร้างฮิสโตแกรมของการแจกแจงของอนุกรมความแปรผันที่มีช่วงเวลาที่ไม่เท่ากัน ไม่ใช่ความถี่ที่ถูกพล็อตตามแนวแกนกำหนด แต่เป็นความหนาแน่นของการกระจายของลักษณะเฉพาะในช่วงเวลาที่สอดคล้องกัน
ความหนาแน่นของการแจกแจงคือความถี่ที่คำนวณต่อความกว้างช่วงหน่วย เช่น แต่ละกลุ่มมีกี่หน่วยต่อหน่วยของค่าช่วง ตัวอย่างการคำนวณความหนาแน่นของการกระจายแสดงไว้ในตาราง 1 2.12.
ตารางที่ 2.12 - การกระจายตัวของวิสาหกิจตามจำนวนพนักงาน (ตัวเลขตามเงื่อนไข)
เอ็น พี/พี | กลุ่มวิสาหกิจแยกตามจำนวนพนักงานคน | จำนวนวิสาหกิจ | ขนาดช่วงคน | ความหนาแน่นของการกระจาย |
ก | 1 | 2 | 3=1/2 | |
1 | มากถึง 20 | 15 | 20 | 0,75 |
2 | 20 – 80 | 27 | 60 | 0,25 |
3 | 80 – 150 | 35 | 70 | 0,5 |
4 | 150 – 300 | 60 | 150 | 0,4 |
5 | 300 – 500 | 10 | 200 | 0,05 |
ทั้งหมด | 147 | ---- | ---- |
ยังสามารถใช้เพื่อแสดงชุดรูปแบบต่างๆ แบบกราฟิกได้ เส้นโค้งสะสม. การใช้กราฟสะสม (เส้นโค้งผลรวม) จะแสดงชุดความถี่สะสม ความถี่สะสมถูกกำหนดโดยการรวมความถี่ตามลำดับระหว่างกลุ่มและแสดงจำนวนหน่วยในประชากรที่มีค่าแอตทริบิวต์ไม่เกินค่าที่พิจารณา
ข้าว. 2.4. การกระจายครอบครัวตามขนาดพื้นที่อยู่อาศัยต่อคน
เมื่อสร้างการสะสมของอนุกรมความแปรผันตามช่วงเวลา ความแปรผันของอนุกรมจะถูกพล็อตไปตามแกนแอบซิสซา และความถี่สะสมจะถูกพล็อตไปตามแกนกำหนด