ซีรี่ส์รูปแบบต่างๆ การกระจายตัวทางสถิติของกลุ่มตัวอย่าง ลักษณะสำคัญของซีรี่ส์รูปแบบต่างๆ คำจำกัดความของซีรีย์รูปแบบต่างๆ

ชุดค่าของพารามิเตอร์ที่ศึกษาในการทดลองหรือการสังเกตที่กำหนดซึ่งจัดอันดับตามค่า (เพิ่มขึ้นหรือลดลง) เรียกว่า ซีรีย์การเปลี่ยนแปลง.

สมมติว่าเราวัดความดันโลหิตของผู้ป่วยสิบรายเพื่อให้ได้ค่าเกณฑ์ความดันโลหิตส่วนบน: ความดันซิสโตลิก เช่น มีเพียงหมายเลขเดียวเท่านั้น

ลองจินตนาการว่าชุดของการสังเกต (ชุดทางสถิติ) ของความดันซิสโตลิกของหลอดเลือดแดงในการสังเกต 10 ครั้ง มุมมองถัดไป(ตารางที่ 1):

ตารางที่ 1

ส่วนประกอบ ซีรีย์การเปลี่ยนแปลงเรียกว่าตัวเลือก ตัวเลือกนี้แสดงถึงค่าตัวเลขของคุณลักษณะที่กำลังศึกษา

การสร้างอนุกรมความแปรผันจากชุดการสังเกตทางสถิติเป็นเพียงก้าวแรกในการทำความเข้าใจคุณลักษณะต่างๆ ของทั้งชุด ถัดไปคุณต้องกำหนด ระดับเฉลี่ยของลักษณะเชิงปริมาณที่กำลังศึกษา (ระดับโปรตีนในเลือดโดยเฉลี่ย น้ำหนักเฉลี่ยผู้ป่วย ระยะเวลาเฉลี่ยในการดมยาสลบ เป็นต้น)

ระดับเฉลี่ยวัดโดยใช้เกณฑ์ที่เรียกว่าค่าเฉลี่ย ค่าเฉลี่ยเป็นคุณลักษณะเชิงตัวเลขทั่วไปของค่าที่เป็นเนื้อเดียวกันในเชิงคุณภาพ โดยแสดงลักษณะเฉพาะของประชากรทางสถิติทั้งหมดด้วยตัวเลขหนึ่งตัวตามเกณฑ์เดียว ค่าเฉลี่ยแสดงถึงสิ่งที่เหมือนกันกับคุณลักษณะในชุดการสังเกตที่กำหนด

ค่าเฉลี่ยที่ใช้ทั่วไปมีสามประเภท: โหมด (), ค่ามัธยฐาน () และค่าเฉลี่ยเลขคณิต ()

ในการหาค่าเฉลี่ยใดๆ จำเป็นต้องใช้ผลลัพธ์ของการสังเกตแต่ละรายการ โดยบันทึกไว้ในรูปแบบของชุดรูปแบบต่างๆ (ตารางที่ 2)

แฟชั่น- ค่าที่เกิดขึ้นบ่อยที่สุดในชุดการสังเกต ในตัวอย่างของเรา โหมด = 120 หากไม่มีค่าซ้ำในชุดรูปแบบ แสดงว่าไม่มีโหมด หากมีการทำซ้ำหลายค่าในจำนวนเท่ากันค่าที่น้อยที่สุดจะถูกใช้เป็นโหมด

ค่ามัธยฐาน- ค่าที่แบ่งการแจกแจงออกเป็นสองส่วนเท่าๆ กัน คือค่ากลางหรือค่ามัธยฐานของชุดการสังเกตโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อย ดังนั้น หากมี 5 ค่าในชุดรูปแบบ ค่ามัธยฐานของมันจะเท่ากับสมาชิกตัวที่สามของชุดรูปแบบถ้าอยู่ในชุด เลขคู่สมาชิก ดังนั้นค่ามัธยฐานคือค่าเฉลี่ยเลขคณิตของการสังเกตหลักสองค่า นั่นคือ หากมีการสังเกต 10 ครั้งในอนุกรมหนึ่ง ค่ามัธยฐานจะเท่ากับค่าเฉลี่ยเลขคณิตของการสังเกตครั้งที่ 5 และ 6 ในตัวอย่างของเรา

บันทึก คุณสมบัติที่สำคัญโหมดและค่ามัธยฐาน: ค่าของพวกมันจะไม่ได้รับผลกระทบ ค่าตัวเลขตัวเลือกที่รุนแรง

ค่าเฉลี่ยเลขคณิตคำนวณโดยสูตร:

โดยที่ค่าที่สังเกตได้ในการสังเกตครั้งที่ - คือจำนวนการสังเกต สำหรับกรณีของเรา

ค่าเฉลี่ยเลขคณิตมีคุณสมบัติสามประการ:

ค่าเฉลี่ยครองตำแหน่งตรงกลางในชุดรูปแบบต่างๆ ในแถวที่สมมาตรอย่างเคร่งครัด

ค่าเฉลี่ยเป็นค่าทั่วไป และความผันผวนแบบสุ่มและความแตกต่างของข้อมูลแต่ละรายการจะไม่สามารถมองเห็นได้หลังค่าเฉลี่ย มันสะท้อนให้เห็นถึงสิ่งที่เป็นเรื่องปกติของประชากรทั้งหมด

ผลรวมของการเบี่ยงเบนของตัวเลือกทั้งหมดจากค่าเฉลี่ยคือศูนย์: ระบุความเบี่ยงเบนของตัวเลือกจากค่าเฉลี่ย

ซีรีส์รูปแบบต่างๆ ประกอบด้วยรูปแบบต่างๆ และความถี่ที่สอดคล้องกัน จากสิบค่าที่ได้นั้น จำนวน 120 เกิดขึ้น 6 ครั้ง 115 - 3 ครั้ง 125 - 1 ครั้ง ความถี่ () - จำนวนสัมบูรณ์ของตัวแปรแต่ละตัวในผลรวม ซึ่งระบุจำนวนครั้งที่เกิดขึ้น ตัวเลือกนี้ในซีรี่ส์รูปแบบต่างๆ

ซีรีย์รูปแบบอาจเป็นแบบง่าย (ความถี่ = 1) หรือจัดกลุ่มและย่อให้สั้นลง โดยมีตัวเลือก 3-5 อนุกรมแบบง่ายจะใช้เมื่อมีการสังเกตจำนวนเล็กน้อย () จัดกลุ่ม - เมื่อใด จำนวนมากการสังเกต ()

(คำจำกัดความของอนุกรมความแปรผัน ส่วนประกอบของอนุกรมความแปรผัน รูปแบบสามรูปแบบของอนุกรมความแปรผัน ความเป็นไปได้ในการสร้างอนุกรมช่วง ข้อสรุปที่สามารถดึงได้จากอนุกรมที่สร้างขึ้น)

ซีรีย์รูปแบบคือลำดับขององค์ประกอบตัวอย่างทั้งหมดที่จัดเรียงแบบไม่ลดลง องค์ประกอบที่เหมือนกันถูกทำซ้ำ

ซีรีส์แบบแปรผันคือซีรีส์ที่สร้างขึ้นบนพื้นฐานเชิงปริมาณ

อนุกรมการแจกแจงแบบแปรผันประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่:

ตัวแปรคือค่าตัวเลขของคุณลักษณะเชิงปริมาณในชุดการแจกแจงแบบแปรผัน อาจเป็นค่าบวกและค่าลบ ค่าสัมบูรณ์และค่าสัมพัทธ์ ดังนั้นเมื่อจัดกลุ่มวิสาหกิจตามผลลัพธ์ กิจกรรมทางเศรษฐกิจตัวเลขบวกหมายถึงกำไร และตัวเลขติดลบหมายถึงขาดทุน

ความถี่คือจำนวนตัวแปรแต่ละตัวหรือแต่ละกลุ่มของอนุกรมรูปแบบต่างๆ เช่น ตัวเลขเหล่านี้เป็นตัวเลขที่แสดงว่าตัวเลือกบางอย่างเกิดขึ้นในซีรีส์การแจกจ่ายบ่อยเพียงใด ผลรวมของความถี่ทั้งหมดเรียกว่าปริมาตรของประชากรและถูกกำหนดโดยจำนวนองค์ประกอบของประชากรทั้งหมด

ความถี่คือความถี่ที่แสดงเป็นค่าสัมพัทธ์ (เศษส่วนของหน่วยหรือเปอร์เซ็นต์) ผลรวมของความถี่เท่ากับหนึ่งหรือ 100% การแทนที่ความถี่ด้วยความถี่ทำให้สามารถเปรียบเทียบอนุกรมความแปรผันกับจำนวนการสังเกตที่ต่างกันได้

ซีรี่ส์รูปแบบต่างๆ มีสามรูปแบบ:อนุกรมอันดับ อนุกรมแยก และอนุกรมช่วง

ลำดับอนุกรมคือการกระจายของแต่ละหน่วยของประชากรโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อยของคุณลักษณะที่กำลังศึกษา การจัดอันดับช่วยให้คุณแบ่งข้อมูลเชิงปริมาณออกเป็นกลุ่มๆ ได้อย่างง่ายดาย ตรวจจับข้อมูลที่เล็กที่สุดและทันที มูลค่าสูงสุดลักษณะเด่นเน้นค่าที่ซ้ำกันบ่อยที่สุด

ซีรีส์รูปแบบอื่นคือตารางกลุ่มที่รวบรวมตามลักษณะของการเปลี่ยนแปลงในค่าของคุณลักษณะที่กำลังศึกษา ตามลักษณะของการแปรผันจะแยกแยะลักษณะที่ไม่ต่อเนื่อง (ไม่ต่อเนื่อง) และต่อเนื่อง

ซีรีส์แบบแยกเป็นซีรีส์แบบแปรผัน ซึ่งการก่อสร้างขึ้นอยู่กับคุณลักษณะที่มีการเปลี่ยนแปลงไม่ต่อเนื่อง (คุณลักษณะแบบไม่ต่อเนื่อง) หลังรวมถึงหมวดหมู่ภาษีจำนวนเด็กในครอบครัวจำนวนพนักงานในองค์กร ฯลฯ คุณลักษณะเหล่านี้สามารถรับค่าเฉพาะจำนวนจำกัดเท่านั้น

ชุดรูปแบบที่ไม่ต่อเนื่องแสดงถึงตารางที่ประกอบด้วยสองคอลัมน์ คอลัมน์แรกระบุค่าเฉพาะของแอตทริบิวต์ และคอลัมน์ที่สองระบุจำนวนหน่วยในประชากรที่มีค่าเฉพาะของแอตทริบิวต์

หากลักษณะมีการเปลี่ยนแปลงอย่างต่อเนื่อง (จำนวนรายได้ระยะเวลาในการให้บริการต้นทุนของสินทรัพย์ถาวรขององค์กร ฯลฯ ซึ่งอาจใช้กับมูลค่าใด ๆ ภายในขอบเขตที่กำหนด) ดังนั้นสำหรับคุณลักษณะนี้จำเป็นต้องสร้าง อนุกรมการเปลี่ยนแปลงช่วงเวลา



ตารางกลุ่มที่นี่มีสองคอลัมน์ด้วย อันแรกระบุค่าของแอตทริบิวต์ในช่วงเวลา "จาก - ถึง" (ตัวเลือก) อันที่สองระบุจำนวนหน่วยที่รวมอยู่ในช่วงเวลา (ความถี่)

ความถี่ (ความถี่การทำซ้ำ) - จำนวนการซ้ำของตัวแปรเฉพาะของค่าแอตทริบิวต์ซึ่งแสดงถึง fi และผลรวมของความถี่เท่ากับปริมาตรของประชากรที่อยู่ระหว่างการศึกษาจะแสดงแทน

โดยที่ k คือจำนวนตัวเลือกสำหรับค่าแอตทริบิวต์

บ่อยครั้งที่ตารางจะเสริมด้วยคอลัมน์ที่คำนวณความถี่สะสม S ซึ่งแสดงจำนวนหน่วยในประชากรที่มีค่าลักษณะเฉพาะไม่เกินค่านี้

อนุกรมการแจกแจงแบบแปรผันแบบไม่ต่อเนื่องคืออนุกรมที่กลุ่มต่างๆ ถูกประกอบขึ้นตามคุณลักษณะที่เปลี่ยนแปลงแบบไม่ต่อเนื่องและรับเฉพาะค่าจำนวนเต็มเท่านั้น

อนุกรมการแจกแจงแบบแปรผันตามช่วงเวลาคืออนุกรมที่ลักษณะการจัดกลุ่มที่เป็นพื้นฐานของการจัดกลุ่มสามารถรับค่าใดๆ รวมถึงค่าเศษส่วนในช่วงเวลาหนึ่งได้

ซีรีย์การแปรผันช่วงเวลาคือชุดของช่วงเวลาที่เรียงลำดับของการเปลี่ยนแปลงค่าของตัวแปรสุ่มด้วยความถี่ที่สอดคล้องกันหรือความถี่ของการเกิดขึ้นของค่าในแต่ละค่า

ขอแนะนำให้สร้างอนุกรมการแจกแจงตามช่วงเวลา โดยประการแรกคือมีการแปรผันอย่างต่อเนื่องของคุณลักษณะ และหากการแปรผันแบบไม่ต่อเนื่องปรากฏในช่วงกว้าง เช่น จำนวนตัวแปรของลักษณะที่ไม่ต่อเนื่องกันนั้นค่อนข้างมาก

สามารถสรุปข้อสรุปหลายประการได้จากซีรี่ส์นี้ ตัวอย่างเช่น องค์ประกอบตรงกลางของชุดรูปแบบ (ค่ามัธยฐาน) อาจเป็นค่าประมาณของผลการวัดที่น่าจะเป็นไปได้มากที่สุด ครั้งแรกและ องค์ประกอบสุดท้ายชุดรูปแบบต่างๆ (เช่น องค์ประกอบตัวอย่างขั้นต่ำและสูงสุด) แสดงการแพร่กระจายขององค์ประกอบตัวอย่าง บางครั้งหากองค์ประกอบแรกหรือสุดท้ายแตกต่างจากตัวอย่างที่เหลือมาก องค์ประกอบเหล่านั้นจะถูกแยกออกจากผลการวัด โดยพิจารณาว่าค่าเหล่านี้ได้มาอันเป็นผลมาจากความล้มเหลวขั้นต้นบางประเภท เช่น เทคโนโลยี

​ Variation series - ซีรีส์ที่มีการเปรียบเทียบ (ตามระดับการเพิ่มขึ้นหรือลดลง) ตัวเลือกและสอดคล้องกัน ความถี่

ตัวเลือกคือการแสดงออกเชิงปริมาณส่วนบุคคลของคุณลักษณะ กำหนด อักษรละติน วี . ความเข้าใจแบบดั้งเดิมของคำว่า "ตัวแปร" ถือว่าแต่ละค่าที่ไม่ซ้ำกันของคุณลักษณะเรียกว่าตัวแปร โดยไม่คำนึงถึงจำนวนการทำซ้ำ

ตัวอย่างเช่น ในชุดการเปลี่ยนแปลงของตัวบ่งชี้ความดันโลหิตซิสโตลิกที่วัดในผู้ป่วย 10 ราย:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

มีเพียง 6 ค่าเท่านั้น:

110, 120, 130, 140, 160, 170.

ความถี่คือตัวเลขที่ระบุจำนวนครั้งที่ตัวเลือกนั้นถูกทำซ้ำ เขียนแทนด้วยอักษรละติน . ผลรวมของความถี่ทั้งหมด (ซึ่งแน่นอนว่าเท่ากับจำนวนความถี่ทั้งหมดที่ศึกษา) แสดงว่า n.

    ในตัวอย่างของเรา ความถี่จะใช้ค่าต่อไปนี้:
  • สำหรับตัวเลือก 110 ความถี่ P = 1 (ค่า 110 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
  • สำหรับตัวเลือก 120 ความถี่ P = 2 (ค่า 120 เกิดขึ้นในผู้ป่วยสองราย)
  • สำหรับตัวเลือก 130 ความถี่ P = 3 (ค่า 130 เกิดขึ้นในผู้ป่วย 3 ราย)
  • สำหรับตัวเลือก 140 ความถี่ P = 2 (ค่า 140 เกิดขึ้นในผู้ป่วยสองราย)
  • สำหรับตัวเลือก 160 ความถี่ P = 1 (ค่า 160 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
  • สำหรับตัวเลือก 170 ความถี่ P = 1 (ค่า 170 เกิดขึ้นในผู้ป่วยรายหนึ่ง)

ประเภทของซีรี่ส์รูปแบบ:

  1. เรียบง่าย- นี่คืออนุกรมที่แต่ละตัวเลือกเกิดขึ้นเพียงครั้งเดียว (ความถี่ทั้งหมดเท่ากับ 1)
  2. ถูกระงับ- ซีรีส์ที่มีตัวเลือกตั้งแต่หนึ่งรายการขึ้นไปปรากฏขึ้นมากกว่าหนึ่งครั้ง

ซีรีส์รูปแบบต่างๆ ใช้เพื่ออธิบายอาร์เรย์จำนวนมาก ในรูปแบบนี้ ข้อมูลที่รวบรวมได้จากการศึกษาทางการแพทย์ส่วนใหญ่จะถูกนำเสนอในขั้นต้น เพื่อกำหนดลักษณะเฉพาะของชุดรูปแบบต่างๆ จะมีการคำนวณตัวบ่งชี้พิเศษ ซึ่งรวมถึงค่าเฉลี่ย ตัวบ่งชี้ความแปรปรวน (ที่เรียกว่าการกระจายตัว) และตัวบ่งชี้ความเป็นตัวแทนของข้อมูลตัวอย่าง

ตัวบ่งชี้ชุดรูปแบบต่างๆ

1) ค่าเฉลี่ยเลขคณิตเป็นตัวบ่งชี้ทั่วไปที่แสดงลักษณะของขนาดของคุณลักษณะที่กำลังศึกษา ค่าเฉลี่ยเลขคณิตแสดงเป็น เป็นค่าเฉลี่ยประเภทหนึ่งที่พบบ่อยที่สุด ค่าเฉลี่ยเลขคณิตคำนวณเป็นอัตราส่วนของผลรวมของค่าตัวบ่งชี้ของหน่วยการสังเกตทั้งหมดต่อจำนวนวิชาทั้งหมดที่ศึกษา วิธีการคำนวณค่าเฉลี่ยเลขคณิตจะแตกต่างกันไปสำหรับอนุกรมการแปรผันแบบง่ายและแบบถ่วงน้ำหนัก

สูตรการคำนวณ ค่าเฉลี่ยเลขคณิตอย่างง่าย:

สูตรการคำนวณ ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:

M = Σ(V * P)/n

​ 2) โหมดเป็นค่าเฉลี่ยอีกค่าหนึ่งของอนุกรมรูปแบบ ซึ่งสอดคล้องกับตัวเลือกที่เกิดซ้ำบ่อยที่สุด หรือพูดอีกอย่างคือนี่คือตัวเลือกที่สอดคล้องกับความถี่สูงสุด แสดงว่า โม . โหมดนี้คำนวณสำหรับอนุกรมแบบถ่วงน้ำหนักเท่านั้น เนื่องจากในชุดแบบธรรมดาไม่มีตัวเลือกใดซ้ำกันและความถี่ทั้งหมดจะเท่ากับหนึ่ง

ตัวอย่างเช่น ในชุดรูปแบบต่างๆ ของค่าอัตราการเต้นของหัวใจ:

80, 84, 84, 86, 86, 86, 90, 94;

ค่าโหมดคือ 86 เนื่องจากตัวเลือกนี้เกิดขึ้น 3 ครั้ง ดังนั้นความถี่จึงสูงที่สุด

3) ค่ามัธยฐาน - ค่าของตัวเลือกที่แบ่งซีรี่ส์รูปแบบออกเป็นครึ่งหนึ่ง: ทั้งสองด้านมีตัวเลือกจำนวนเท่ากัน ค่ามัธยฐาน เช่นเดียวกับค่าเฉลี่ยเลขคณิตและโหมด หมายถึงค่าเฉลี่ย แสดงว่า ฉัน

4) ส่วนเบี่ยงเบนมาตรฐาน (คำพ้องความหมาย: ส่วนเบี่ยงเบนมาตรฐาน ส่วนเบี่ยงเบนซิกมา ซิกมา) - การวัดความแปรปรวนของอนุกรมความแปรผัน เป็นตัวบ่งชี้สำคัญที่รวมทุกกรณีของการเบี่ยงเบนจากค่าเฉลี่ย ในความเป็นจริง มันตอบคำถามว่าตัวแปรต่างๆ กระจายจากค่าเฉลี่ยเลขคณิตไปไกลแค่ไหนและบ่อยแค่ไหน เขียนแทนด้วยอักษรกรีก σ ("ซิกมา").

หากขนาดประชากรมากกว่า 30 หน่วย ค่าเบี่ยงเบนมาตรฐานจะคำนวณโดยใช้สูตรต่อไปนี้

สำหรับประชากรขนาดเล็ก - 30 หน่วยการสังเกตหรือน้อยกว่า - ค่าเบี่ยงเบนมาตรฐานจะคำนวณโดยใช้สูตรอื่น:

ซีรี่ส์รูปแบบต่างๆ - เป็นชุดสถิติที่แสดงการกระจายตัวของปรากฏการณ์ที่กำลังศึกษาตามมูลค่าของลักษณะเชิงปริมาณใดๆ เช่น ผู้ป่วยตามอายุ ระยะเวลาการรักษา ทารกแรกเกิดตามน้ำหนัก เป็นต้น

ตัวเลือก - ค่าส่วนบุคคลของคุณลักษณะที่ใช้ในการจัดกลุ่ม (แสดง วี ) .

ความถี่- ตัวเลขที่แสดงว่าตัวเลือกนั้นเกิดขึ้นบ่อยแค่ไหน (แสดงไว้ ) . ผลรวมของความถี่ทั้งหมดที่แสดง จำนวนทั้งหมด ข้อสังเกตและถูกกำหนดไว้ n . เรียกว่าความแตกต่างระหว่างตัวแปรที่ใหญ่ที่สุดและเล็กที่สุดของซีรีย์รูปแบบ ช่วงหรือความกว้าง .

มีซีรีย์หลากหลาย:

1. ไม่ต่อเนื่อง (ไม่ต่อเนื่อง) และต่อเนื่อง

อนุกรมจะถือว่าต่อเนื่องหากลักษณะการจัดกลุ่มสามารถแสดงเป็นค่าเศษส่วน (น้ำหนัก ส่วนสูง ฯลฯ) ไม่ต่อเนื่องหากลักษณะการจัดกลุ่มแสดงเป็นจำนวนเต็มเท่านั้น (วันที่ทุพพลภาพ จำนวนชีพจรเต้น ฯลฯ) .

2.เรียบง่ายและสมดุล

อนุกรมการแปรผันอย่างง่ายคืออนุกรมซึ่งค่าเชิงปริมาณของคุณลักษณะที่แตกต่างกันเกิดขึ้นเพียงครั้งเดียว ในชุดรูปแบบที่ถ่วงน้ำหนัก ค่าเชิงปริมาณของคุณลักษณะที่แตกต่างกันจะถูกทำซ้ำด้วยความถี่ที่แน่นอน

3. จัดกลุ่ม (ช่วง) และไม่ได้จัดกลุ่ม

ซีรีส์ที่จัดกลุ่มจะมีตัวเลือกที่รวมกันเป็นกลุ่มซึ่งจะรวมเข้าด้วยกันตามขนาดภายในช่วงเวลาหนึ่ง ในชุดข้อมูลที่ไม่ได้จัดกลุ่ม แต่ละตัวเลือกจะสอดคล้องกับความถี่ที่แน่นอน

4. คู่และคี่

ในอนุกรมรูปแบบคู่ ผลรวมของความถี่หรือ จำนวนทั้งหมดการสังเกตแสดงเป็นเลขคู่ เลขคี่ - เลขคี่

5. สมมาตรและไม่สมมาตร

ในชุดความแปรผันแบบสมมาตร ค่าเฉลี่ยทุกประเภทตรงกันหรือใกล้เคียงกันมาก (โหมด, ค่ามัธยฐาน, ค่าเฉลี่ยเลขคณิต)

ขึ้นอยู่กับลักษณะของปรากฏการณ์ที่กำลังศึกษาในงานเฉพาะและเป้าหมายของการวิจัยทางสถิติตลอดจนเนื้อหาของแหล่งข้อมูลในสถิติสุขาภิบาล มีการใช้ค่าเฉลี่ยประเภทต่อไปนี้:

วิธีโครงสร้าง (โหมด, ค่ามัธยฐาน);

ค่าเฉลี่ยเลขคณิต

ค่าเฉลี่ยฮาร์มอนิก

เฉลี่ยเรขาคณิต;

ก้าวหน้าโดยเฉลี่ย

แฟชั่น (ม โอ ) - คุณค่าของลักษณะที่แตกต่างกันซึ่งมักพบในประชากรที่กำลังศึกษาอยู่เช่น ตัวเลือกที่สอดคล้องกับความถี่สูงสุด พวกเขาค้นหาได้โดยตรงจากโครงสร้างของซีรีย์รูปแบบต่างๆ โดยไม่ต้องพึ่งการคำนวณใดๆ โดยปกติแล้วจะเป็นค่าที่ใกล้เคียงกับค่าเฉลี่ยเลขคณิตมากและสะดวกในทางปฏิบัติมาก

ค่ามัธยฐาน (ม ) - การแบ่งชุดรูปแบบ (จัดอันดับ เช่น ค่าของตัวเลือกจะจัดเรียงจากน้อยไปหามากหรือจากมากไปน้อย) ออกเป็นสองซีกเท่าๆ กัน ค่ามัธยฐานคำนวณโดยใช้สิ่งที่เรียกว่าอนุกรมคี่ ซึ่งได้มาจากการรวมความถี่ตามลำดับ หากผลรวมของความถี่สอดคล้องกับเลขคู่ ค่าเฉลี่ยเลขคณิตของค่าเฉลี่ยทั้งสองจะถูกใช้เป็นค่ามัธยฐานตามอัตภาพ

โหมดและค่ามัธยฐานใช้ในกรณีของประชากรเปิด เช่น เมื่อตัวเลือกที่ใหญ่ที่สุดหรือเล็กที่สุดไม่มีคุณลักษณะเชิงปริมาณที่แน่นอน (เช่น มากถึง 15 ปี, 50 ปีขึ้นไป เป็นต้น) ในกรณีนี้ ไม่สามารถคำนวณค่าเฉลี่ยเลขคณิต (คุณลักษณะของพารามิเตอร์) ได้

เฉลี่ย ฉันเป็นคนเลขคณิต - ค่าที่พบบ่อยที่สุด ค่าเฉลี่ยเลขคณิตมักเขียนแทนด้วย .

มีค่าเฉลี่ยเลขคณิตแบบง่ายและถ่วงน้ำหนัก

ค่าเฉลี่ยเลขคณิตอย่างง่าย คำนวณ:

- ในกรณีที่ประชากรแสดงด้วยรายการความรู้อย่างง่ายเกี่ยวกับคุณลักษณะของแต่ละหน่วย

- หากไม่สามารถกำหนดจำนวนการซ้ำของแต่ละตัวเลือกได้

- หากจำนวนการซ้ำของแต่ละตัวเลือกอยู่ใกล้กัน

ค่าเฉลี่ยเลขคณิตอย่างง่ายคำนวณโดยใช้สูตร:

โดยที่ V - ค่าส่วนบุคคลของคุณลักษณะ; n - จำนวนค่าแต่ละค่า
- เครื่องหมายสรุป

ดังนั้น ค่าเฉลี่ยอย่างง่ายคืออัตราส่วนของผลรวมของตัวแปรต่อจำนวนการสังเกต

ตัวอย่าง: กำหนดระยะเวลาเฉลี่ยในการนอนบนเตียงของผู้ป่วยโรคปอดบวม 10 ราย:

16 วัน - ผู้ป่วย 1 ราย; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

วันนอน

ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก คำนวณในกรณีที่มีการทำซ้ำค่าแต่ละค่าของคุณลักษณะ สามารถคำนวณได้สองวิธี:

1. ทางตรง (ค่าเฉลี่ยเลขคณิตหรือวิธีทางตรง) ตามสูตร:

,

โดยที่ P คือความถี่ (จำนวนกรณี) ของการสังเกตของแต่ละตัวเลือก

ดังนั้น ค่าเฉลี่ยเลขคณิตแบบถ่วงน้ำหนักคืออัตราส่วนของผลรวมของผลคูณของตัวแปรและความถี่ต่อจำนวนการสังเกต

2. โดยการคำนวณความเบี่ยงเบนจากค่าเฉลี่ยแบบมีเงื่อนไข (โดยใช้วิธีโมเมนต์)

พื้นฐานสำหรับการคำนวณค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักคือ:

- จัดกลุ่มวัสดุตามตัวแปรของคุณลักษณะเชิงปริมาณ

— ตัวเลือกทั้งหมดควรจัดเรียงตามค่าของแอตทริบิวต์จากน้อยไปหามากหรือจากมากไปน้อย (อนุกรมอันดับ)

ในการคำนวณโดยใช้วิธีโมเมนต์ ข้อกำหนดเบื้องต้นคือขนาดเท่ากันของช่วงเวลาทั้งหมด

โดยใช้วิธีการโมเมนต์ ค่าเฉลี่ยเลขคณิตคำนวณโดยใช้สูตร:

,

โดยที่ M o คือค่าเฉลี่ยแบบมีเงื่อนไขซึ่งมักจะถือเป็นค่าของคุณลักษณะที่สอดคล้องกับความถี่สูงสุดคือ ซึ่งเกิดซ้ำบ่อยขึ้น (แฟชั่น)

i คือค่าของช่วงเวลา

a คือการเบี่ยงเบนแบบมีเงื่อนไขจากเงื่อนไขของค่าเฉลี่ย ซึ่งเป็นชุดตัวเลขตามลำดับ (1, 2 เป็นต้น) โดยมีเครื่องหมาย + สำหรับตัวแปรของค่าเฉลี่ยแบบมีเงื่อนไขขนาดใหญ่และมีเครื่องหมาย – (–1, –2 ฯลฯ .) สำหรับตัวแปรที่ต่ำกว่าค่าเฉลี่ยทั่วไป ค่าเบี่ยงเบนแบบมีเงื่อนไขจากตัวแปรที่นำมาเป็นค่าเฉลี่ยแบบมีเงื่อนไขคือ 0

P - ความถี่

- จำนวนการสังเกตทั้งหมดหรือ n

ตัวอย่าง: กำหนด ความสูงเฉลี่ยเด็กชายอายุ 8 ขวบ ใช้วิธีการโดยตรง (ตารางที่ 1)

ตารางที่ 1

ความสูงเป็นซม

เด็กชาย ป

ศูนย์กลาง

ตัวเลือก V

ตัวเลือกกลาง - ตรงกลางของช่วงเวลา - ถูกกำหนดให้เป็นผลรวมกึ่งของค่าเริ่มต้นของสองกลุ่มที่อยู่ติดกัน:

;
ฯลฯ

VP ของผลิตภัณฑ์ได้มาจากการคูณตัวแปรกลางด้วยความถี่
;
ฯลฯ จากนั้นจึงเพิ่มและรับผลิตภัณฑ์ผลลัพธ์
ซึ่งหารด้วยจำนวนการสังเกต (100) และได้ค่าเฉลี่ยเลขคณิตแบบถ่วงน้ำหนัก

ซม.

เราจะแก้ไขปัญหาเดียวกันโดยใช้วิธีโมเมนต์ซึ่งรวบรวมตารางที่ 2 ต่อไปนี้:

ตารางที่ 2

ความสูงเป็นซม. (V)

เด็กชาย ป

n=100

เราเอา 122 เป็น M o เพราะ จากการสังเกต 100 ครั้ง มีคน 33 คนมีส่วนสูง 122 ซม. เราพบความเบี่ยงเบนแบบมีเงื่อนไข (a) จากค่าเฉลี่ยแบบมีเงื่อนไขตามข้างต้น จากนั้นเราจะได้ผลคูณของการเบี่ยงเบนตามเงื่อนไขตามความถี่ (aP) และสรุปค่าที่ได้รับ (
). ผลลัพธ์คือ 17 สุดท้าย เราแทนที่ข้อมูลลงในสูตร:

เมื่อศึกษาคุณลักษณะที่แตกต่างกัน เราไม่สามารถจำกัดตัวเองอยู่เพียงการคำนวณค่าเฉลี่ยเท่านั้น นอกจากนี้ยังจำเป็นต้องคำนวณตัวบ่งชี้ที่แสดงถึงระดับความหลากหลายของลักษณะที่กำลังศึกษา ค่าของคุณลักษณะเชิงปริมาณอย่างใดอย่างหนึ่งไม่เหมือนกันสำหรับทุกหน่วยของประชากรทางสถิติ

ลักษณะของอนุกรมรูปแบบคือค่าเบี่ยงเบนมาตรฐาน ( ) ซึ่งแสดงการแพร่กระจาย (การกระจายตัว) ของคุณลักษณะที่ศึกษาสัมพันธ์กับค่าเฉลี่ยเลขคณิต เช่น ระบุลักษณะความแปรปรวนของชุดรูปแบบต่างๆ สามารถกำหนดได้โดยตรงโดยใช้สูตร:

ค่าเบี่ยงเบนมาตรฐานเท่ากับรากที่สองของผลรวมของผลคูณของค่าเบี่ยงเบนกำลังสองของแต่ละตัวเลือกจากค่าเฉลี่ยเลขคณิต (V-M) 2 ด้วยความถี่หารด้วยผลรวมของความถี่ (
).

ตัวอย่างการคำนวณ: กำหนดจำนวนใบป่วยโดยเฉลี่ยที่ออกให้ในคลินิกต่อวัน (ตารางที่ 3)

ตารางที่ 3

จำนวนวันที่ลาป่วย

แผ่นงานออกแล้ว

แพทย์ต่อวัน (V)

จำนวนแพทย์ (P)

;

ในตัวส่วนเมื่อจำนวนการสังเกตน้อยกว่า 30 จะต้องจาก
ลบหนึ่ง

หากอนุกรมถูกจัดกลุ่มในช่วงเวลาเท่ากัน ค่าเบี่ยงเบนมาตรฐานสามารถกำหนดได้โดยใช้วิธีการของโมเมนต์:

,

โดยที่ i คือค่าของช่วงเวลา

- การเบี่ยงเบนแบบมีเงื่อนไขจากค่าเฉลี่ยแบบมีเงื่อนไข

P - ตัวแปรความถี่ของช่วงเวลาที่สอดคล้องกัน

- จำนวนการสังเกตทั้งหมด

ตัวอย่างการคำนวณ : กำหนดระยะเวลาเฉลี่ยของการอยู่บนเตียงของผู้ป่วย (โดยใช้วิธีการช่วงเวลา) (ตารางที่ 4):

ตารางที่ 4

จำนวนวัน

อยู่บนเตียง (วี)

ป่วย (ป)

;

นักสถิติชาวเบลเยียม A. Quetelet ค้นพบว่าความแปรผันของปรากฏการณ์มวลเป็นไปตามกฎการกระจายข้อผิดพลาด ซึ่งค้นพบเกือบจะพร้อมๆ กันโดย K. Gauss และ P. Laplace เส้นโค้งที่แสดงถึงการกระจายนี้มีรูปร่างคล้ายระฆัง ตามกฎหมายการแจกแจงแบบปกติ ความแปรปรวนของค่าแต่ละค่าของคุณลักษณะนั้นอยู่ภายในขีดจำกัด
ซึ่งครอบคลุมร้อยละ 99.73 ของหน่วยประชากรทั้งหมด

มีการคำนวณไว้ว่าหากคุณบวกและลบ 2 เข้ากับค่าเฉลี่ยเลขคณิต จากนั้น 95.45% ของสมาชิกทั้งหมดของอนุกรมรูปแบบต่างๆ อยู่ภายในค่าที่ได้รับ และสุดท้าย ถ้าเราบวกและลบ 1 เข้ากับค่าเฉลี่ยเลขคณิต จากนั้น 68.27% ของสมาชิกทั้งหมดของอนุกรมรูปแบบนี้จะอยู่ภายในค่าที่ได้รับ ในทางการแพทย์อย่างยิ่งใหญ่
1เกี่ยวข้องกับแนวคิดเรื่องบรรทัดฐาน ส่วนเบี่ยงเบนจากค่าเฉลี่ยเลขคณิตมากกว่า 1 แต่น้อยกว่า 2 ผิดปกติและการเบี่ยงเบนมากกว่า 2 ผิดปกติ (สูงหรือต่ำกว่าปกติ)

ในสถิติด้านสุขภาพ กฎสามซิกมาจะใช้ในการศึกษาพัฒนาการทางกายภาพ การประเมินการปฏิบัติงานของสถาบันดูแลสุขภาพ และการประเมินสุขภาพของประชากร กฎเดียวกันนี้ใช้กันอย่างแพร่หลายใน เศรษฐกิจของประเทศเมื่อกำหนดมาตรฐาน

ดังนั้น ค่าเบี่ยงเบนมาตรฐานจึงมีไว้สำหรับ:

- การวัดการกระจายตัวของอนุกรมความแปรผัน

— ลักษณะของระดับความหลากหลายของลักษณะซึ่งถูกกำหนดโดยค่าสัมประสิทธิ์ของการแปรผัน:

หากค่าสัมประสิทธิ์ของการแปรผันมากกว่า 20% - ความหลากหลายที่แข็งแกร่งจาก 20 ถึง 10% - โดยเฉลี่ย น้อยกว่า 10% - ความหลากหลายของลักษณะที่อ่อนแอ ค่าสัมประสิทธิ์ของการแปรผันเป็นเกณฑ์สำหรับความน่าเชื่อถือของค่าเฉลี่ยเลขคณิตในระดับหนึ่ง

ชุดการกระจายทางสถิติ– นี่คือการกระจายหน่วยประชากรออกเป็นกลุ่มตามลักษณะเฉพาะที่แตกต่างกันตามลำดับ
ขึ้นอยู่กับลักษณะที่เป็นรากฐานของการก่อตัวของชุดการแจกจ่ายที่มีอยู่ ชุดการแจกแจงแบบระบุแหล่งที่มาและแบบแปรผัน.

การมีลักษณะทั่วไปเป็นพื้นฐานสำหรับการก่อตัวของประชากรทางสถิติซึ่งแสดงถึงผลลัพธ์ของการอธิบายหรือการวัดลักษณะทั่วไปของวัตถุที่ทำการศึกษา

หัวข้อการศึกษาทางสถิติคือการเปลี่ยนแปลง (แปรผัน) ลักษณะหรือลักษณะทางสถิติ

ประเภทของลักษณะทางสถิติ.

ชุดการแจกจ่ายเรียกว่าแอตทริบิวต์สร้างขึ้นตามเกณฑ์คุณภาพ แอตทริบิวต์– นี่คือสัญลักษณ์ที่มีชื่อ (เช่น อาชีพ: ช่างเย็บผ้า, ครู ฯลฯ )
โดยทั่วไปชุดการแจกจ่ายจะแสดงในรูปแบบของตาราง ในตาราง 2.8 แสดงชุดการแจกแจงแอตทริบิวต์
ตารางที่ 2.8 - การกระจายความช่วยเหลือทางกฎหมายประเภทต่างๆ ที่จัดทำโดยนักกฎหมายให้กับพลเมืองในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซีย

ซีรี่ส์รูปแบบต่างๆ– นี่คือค่าของคุณลักษณะ (หรือช่วงเวลาของค่า) และความถี่
ชุดรูปแบบคือชุดการจัดจำหน่ายสร้างขึ้นบนพื้นฐานเชิงปริมาณ ชุดรูปแบบต่างๆ ประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่
ตัวแปรถือเป็นค่าเฉพาะของคุณลักษณะที่ใช้ในชุดรูปแบบต่างๆ
ความถี่คือจำนวนตัวแปรแต่ละตัวหรือแต่ละกลุ่มของอนุกรมรูปแบบต่างๆ เช่น ตัวเลขเหล่านี้เป็นตัวเลขที่แสดงว่าตัวเลือกบางอย่างเกิดขึ้นในซีรีส์การแจกจ่ายบ่อยเพียงใด ผลรวมของความถี่ทั้งหมดจะกำหนดขนาดของประชากรทั้งหมดและปริมาตรของมัน
ความถี่คือความถี่ที่แสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของทั้งหมด ดังนั้นผลรวมของความถี่จึงเท่ากับ 1 หรือ 100% ชุดรูปแบบต่างๆ ช่วยให้สามารถประมาณรูปแบบของกฎการกระจายตามข้อมูลจริงได้

ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลงของลักษณะที่มีอยู่ อนุกรมความแปรผันแบบไม่ต่อเนื่องและช่วงเวลา.
ตัวอย่างของชุดรูปแบบที่แยกจากกันแสดงไว้ในตาราง 2.9.
ตารางที่ 2.9 - การกระจายของครอบครัวตามจำนวนห้องที่ถูกครอบครองในแต่ละอพาร์ทเมนต์ในปี 1989 ในสหพันธรัฐรัสเซีย

คอลัมน์แรกของตารางแสดงตัวเลือกสำหรับชุดรูปแบบที่แยกจากกัน คอลัมน์ที่สองประกอบด้วยความถี่ของชุดรูปแบบต่างๆ และคอลัมน์ที่สามประกอบด้วยตัวบ่งชี้ความถี่

ซีรี่ส์รูปแบบต่างๆ

มีการศึกษาลักษณะเชิงปริมาณบางอย่างในประชากรทั่วไป ตัวอย่างปริมาตรจะถูกสุ่มออกมา nนั่นคือจำนวนองค์ประกอบตัวอย่างเท่ากับ n. ในขั้นตอนแรกของการประมวลผลทางสถิติ ตั้งแต่ตัวอย่างเช่น การสั่งจำนวน x 1 , x 2 , …, xnจากน้อยไปมาก. แต่ละค่าที่สังเกตได้ x ฉันเรียกว่า ตัวเลือก. ความถี่ ฉันคือจำนวนการสังเกตค่า x ฉันในตัวอย่าง ความถี่สัมพัทธ์ (ความถี่) ฉันคืออัตราส่วนความถี่ ฉันถึงขนาดตัวอย่าง n: .
เมื่อศึกษาอนุกรมความแปรผัน ก็จะใช้แนวคิดเกี่ยวกับความถี่สะสมและความถี่สะสมด้วย อนุญาต xหมายเลขบางอย่าง แล้ว จำนวนตัวเลือก, ซึ่งมีค่าน้อยกว่า xเรียกว่าความถี่สะสม: สำหรับ x i nเรียกว่าความถี่สะสม w i max
ลักษณะที่เรียกว่าตัวแปรแบบไม่ต่อเนื่องหากค่าแต่ละค่า (ตัวแปร) แตกต่างจากกันด้วยค่าจำกัดที่แน่นอน (โดยปกติจะเป็นจำนวนเต็ม) อนุกรมความแปรผันของคุณลักษณะดังกล่าวเรียกว่าอนุกรมความแปรผันแบบไม่ต่อเนื่อง

ตารางที่ 1 มุมมองทั่วไปของชุดความถี่การแปรผันแบบไม่ต่อเนื่อง

ค่าลักษณะเฉพาะx ฉัน x1 x2 เอ็กซ์เอ็น
ความถี่ฉัน ม. 1 ม. 2

ลักษณะที่เรียกว่าเปลี่ยนแปลงอย่างต่อเนื่องหากค่าของมันแตกต่างกันด้วยจำนวนเล็กน้อยโดยพลการเช่น เครื่องหมายสามารถรับค่าใดก็ได้ในช่วงเวลาหนึ่ง อนุกรมความแปรผันต่อเนื่องสำหรับคุณลักษณะดังกล่าวเรียกว่าช่วงเวลา

ตารางที่ 2 มุมมองทั่วไปของชุดความถี่ที่แปรผันตามช่วงเวลา

ตารางที่ 3. ภาพกราฟิกของซีรีย์รูปแบบต่างๆ

แถวรูปหลายเหลี่ยมหรือฮิสโตแกรมฟังก์ชันการกระจายเชิงประจักษ์
ไม่ต่อเนื่อง
ช่วงเวลา
โดยการทบทวนผลลัพธ์ของการสังเกต จะกำหนดจำนวนค่าตัวแปรที่ตกอยู่ในแต่ละช่วงเวลาเฉพาะ สันนิษฐานว่าแต่ละช่วงเวลาเป็นของจุดสิ้นสุดด้านใดด้านหนึ่ง: ไม่ว่าในกรณีทั้งหมดจะเหลือ (บ่อยกว่า) หรือถูกต้องในทุกกรณี และความถี่หรือความถี่จะแสดงจำนวนตัวเลือกที่อยู่ภายในขอบเขตที่ระบุ ความแตกต่าง ฉัน – ฉัน +1เรียกว่าช่วงบางส่วน เพื่อให้การคำนวณในภายหลังง่ายขึ้น คุณสามารถแทนที่ชุดความแปรผันของช่วงเวลาด้วยชุดข้อมูลที่ไม่ต่อเนื่องตามเงื่อนไขได้ ในกรณีนี้คือค่าเฉลี่ย ฉัน- ช่วงเวลาถือเป็นตัวเลือก x ฉันและความถี่ช่วงที่สอดคล้องกัน ฉัน– สำหรับความถี่ของช่วงเวลานี้
สำหรับการแสดงอนุกรมของรูปแบบกราฟิก รูปแบบที่ใช้กันมากที่สุดคือรูปหลายเหลี่ยม ฮิสโตแกรม เส้นโค้งสะสม และฟังก์ชันการแจกแจงเชิงประจักษ์

ในตาราง 2.3 (การจัดกลุ่มประชากรรัสเซียโดยรายได้ต่อหัวเฉลี่ยในเดือนเมษายน 2537) อนุกรมการเปลี่ยนแปลงช่วงเวลา.
สะดวกในการวิเคราะห์อนุกรมการแจกแจงโดยใช้ภาพกราฟิก ซึ่งช่วยให้สามารถตัดสินรูปร่างของการแจกแจงได้ การแสดงภาพธรรมชาติของการเปลี่ยนแปลงความถี่ของชุดรูปแบบต่างๆ จะได้รับจาก รูปหลายเหลี่ยมและฮิสโตแกรม.
รูปหลายเหลี่ยมจะใช้เมื่อแสดงชุดรูปแบบที่แยกจากกัน.
ตัวอย่างเช่น ให้เราอธิบายการกระจายสต็อกที่อยู่อาศัยตามประเภทของอพาร์ทเมนต์แบบกราฟิก (ตารางที่ 2.10)
ตารางที่ 2.10 - การกระจายสต็อกที่อยู่อาศัยในเขตเมืองตามประเภทของอพาร์ทเมนต์ (ตัวเลขตามเงื่อนไข)


ข้าว. พื้นที่จำหน่ายที่อยู่อาศัย


ไม่เพียงแต่ค่าความถี่เท่านั้น แต่ยังรวมถึงความถี่ของอนุกรมการเปลี่ยนแปลงบนแกนพิกัดอีกด้วย
ฮิสโตแกรมใช้เพื่อแสดงชุดการแปรผันตามช่วงเวลา. เมื่อสร้างฮิสโตแกรมค่าของช่วงเวลาจะถูกพล็อตบนแกน abscissa และความถี่จะถูกแสดงด้วยสี่เหลี่ยมที่สร้างขึ้นในช่วงเวลาที่สอดคล้องกัน ความสูงของคอลัมน์ในกรณีที่มีระยะห่างเท่ากันควรเป็นสัดส่วนกับความถี่ ฮิสโตแกรมคือกราฟที่แสดงชุดข้อมูลเป็นแท่งที่อยู่ติดกัน
ให้เราอธิบายอนุกรมการแจกแจงตามช่วงเวลาที่กำหนดในตารางด้วยภาพกราฟิก 2.11.
ตารางที่ 2.11 - การกระจายของครอบครัวตามขนาดพื้นที่อยู่อาศัยต่อคน (ตัวเลขตามเงื่อนไข)
เอ็น พี/พี กลุ่มครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน จำนวนครอบครัวที่มีขนาดพื้นที่ใช้สอยที่กำหนด จำนวนครอบครัวสะสม
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ทั้งหมด 115 ----


ข้าว. 2.2. ฮิสโตแกรมของการกระจายตัวของครอบครัวตามขนาดพื้นที่อยู่อาศัยต่อคน


เราสร้างโดยใช้ข้อมูลของอนุกรมที่สะสม (ตาราง 2.11) กระจายสะสม


ข้าว. 2.3. การกระจายครอบครัวสะสมตามขนาดพื้นที่อยู่อาศัยต่อคน


การแทนอนุกรมรูปแบบต่างๆ ในรูปแบบของการสะสมจะมีประสิทธิภาพโดยเฉพาะอย่างยิ่งสำหรับอนุกรมรูปแบบต่างๆ ซึ่งความถี่จะแสดงเป็นเศษส่วนหรือเปอร์เซ็นต์ของผลรวมของความถี่อนุกรม
หากเราเปลี่ยนแกนเมื่อแสดงชุดรูปแบบต่างๆ ในรูปแบบของการสะสมแบบกราฟิก เราก็จะได้ โอกิวา. ในรูป 2.4 แสดง ogive ที่สร้างขึ้นบนพื้นฐานของข้อมูลในตาราง 2.11.
ฮิสโตแกรมสามารถแปลงเป็นรูปหลายเหลี่ยมการแจกแจงได้โดยการค้นหาจุดกึ่งกลางของด้านข้างของสี่เหลี่ยม แล้วเชื่อมต่อจุดเหล่านี้ด้วยเส้นตรง รูปหลายเหลี่ยมการกระจายผลลัพธ์จะแสดงในรูปที่ 1 2.2 มีเส้นประ
เมื่อสร้างฮิสโตแกรมของการแจกแจงของอนุกรมความแปรผันที่มีช่วงเวลาที่ไม่เท่ากัน ไม่ใช่ความถี่ที่ถูกพล็อตตามแนวแกนกำหนด แต่เป็นความหนาแน่นของการกระจายของลักษณะเฉพาะในช่วงเวลาที่สอดคล้องกัน
ความหนาแน่นของการแจกแจงคือความถี่ที่คำนวณต่อความกว้างช่วงหน่วย เช่น แต่ละกลุ่มมีกี่หน่วยต่อหน่วยของค่าช่วง ตัวอย่างการคำนวณความหนาแน่นของการกระจายแสดงไว้ในตาราง 1 2.12.
ตารางที่ 2.12 - การกระจายตัวของวิสาหกิจตามจำนวนพนักงาน (ตัวเลขตามเงื่อนไข)
เอ็น พี/พี กลุ่มวิสาหกิจแยกตามจำนวนพนักงานคน จำนวนวิสาหกิจ ขนาดช่วงคน ความหนาแน่นของการกระจาย
1 2 3=1/2
1 มากถึง 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ทั้งหมด 147 ---- ----

ยังสามารถใช้เพื่อแสดงชุดรูปแบบต่างๆ แบบกราฟิกได้ เส้นโค้งสะสม. การใช้กราฟสะสม (เส้นโค้งผลรวม) จะแสดงชุดความถี่สะสม ความถี่สะสมถูกกำหนดโดยการรวมความถี่ตามลำดับระหว่างกลุ่มและแสดงจำนวนหน่วยในประชากรที่มีค่าแอตทริบิวต์ไม่เกินค่าที่พิจารณา


ข้าว. 2.4. การกระจายครอบครัวตามขนาดพื้นที่อยู่อาศัยต่อคน

เมื่อสร้างการสะสมของอนุกรมความแปรผันตามช่วงเวลา ความแปรผันของอนุกรมจะถูกพล็อตไปตามแกนแอบซิสซา และความถี่สะสมจะถูกพล็อตไปตามแกนกำหนด