ชื่อพารามิเตอร์ | ความหมาย |
หัวข้อบทความ: | ซีรี่ส์รูปแบบต่างๆ |
รูบริก (หมวดหมู่เฉพาะเรื่อง) | การผลิต |
ค่าที่สังเกตได้จากตัวแปรสุ่ม เอ็กซ์ 1 , เอ็กซ์ 2 , …, เอ็กซ์ เคถูกเรียกว่า ตัวเลือก.
ความถี่ตัวเลือก เอ็กซ์ฉันมักจะถูกเรียกว่าหมายเลข ฉัน (ฉัน=1,…,เค) แสดงจำนวนครั้งที่ตัวเลือกนี้เกิดขึ้นในตัวอย่าง
ความถี่(ความถี่สัมพัทธ์, เศษส่วน) ตัวเลือก x ฉัน (ฉัน=1,…,เค) โดยทั่วไปเรียกว่าอัตราส่วนของความถี่ ฉันถึงขนาดตัวอย่าง n.
ความถี่และความถี่เรียกว่า ตาชั่ง.
ความถี่สะสมเป็นเรื่องปกติที่จะเรียกจำนวนตัวเลือกที่มีค่าน้อยกว่าค่าที่กำหนด เอ็กซ์:
ความถี่สะสมเป็นเรื่องปกติที่จะเรียกอัตราส่วนของความถี่สะสมต่อปริมาตรตัวอย่าง:
ซีรี่ส์รูปแบบต่างๆ(ชุดทางสถิติ) – เป็นเรื่องปกติที่จะเรียกลำดับของตัวเลือกที่เขียนตามลำดับจากน้อยไปหามากและน้ำหนักที่สอดคล้องกัน
ซีรีย์รูปแบบควรจะเป็น ไม่ต่อเนื่อง(การสุ่มตัวอย่างค่าของตัวแปรสุ่มแบบไม่ต่อเนื่อง) และ ต่อเนื่อง (ช่วง)(ตัวอย่างค่าของตัวแปรสุ่มต่อเนื่อง)
ซีรี่ส์รูปแบบที่ไม่ต่อเนื่องมีรูปแบบ:
… | ||||
… |
เมื่อจำนวนตัวแปรมีขนาดใหญ่หรือเครื่องหมายมีความต่อเนื่อง (ตัวแปรสุ่มสามารถรับค่าใด ๆ ในช่วงเวลาหนึ่ง) ให้ทำดังนี้ ช่วงเวลาซีรีย์การเปลี่ยนแปลง
เพื่อสร้างช่วงเวลา ซีรีย์การเปลี่ยนแปลงดำเนินการ การจัดกลุ่มตัวเลือก - แบ่งออกเป็นช่วงเวลาที่แยกจากกัน:
บางครั้งจำนวนช่วงเวลาจะถูกกำหนดโดยใช้ สูตรสเติร์จ:
จากนั้นจะนับจำนวนตัวเลือกที่อยู่ในแต่ละช่วงเวลา - ความถี่ ฉัน(หรือความถี่ ฉัน/n). หากตัวเลือกอยู่บนขอบเขตของช่วงเวลา ตัวเลือกนั้นจะแนบไปกับช่วงเวลาที่ถูกต้อง
อนุกรมความแปรผันตามช่วงเวลามีรูปแบบ:
ตัวเลือก | … | |||
ความถี่ | … |
ฟังก์ชันการแจกแจงเชิงประจักษ์ (เชิงสถิติ)เป็นเรื่องปกติที่จะเรียกใช้ฟังก์ชันที่มีค่า ณ จุดหนึ่ง เอ็กซ์เท่ากับความถี่สัมพัทธ์ของตัวแปรที่มีค่าน้อยกว่า เอ็กซ์(ความถี่สะสมสำหรับ เอ็กซ์):
รูปหลายเหลี่ยมความถี่เรียกว่าเส้นขาดซึ่งส่วนที่เชื่อมต่อจุดกับพิกัด ( เอ็กซ์ 1 ; n 1), (เอ็กซ์ 2 ; n 2), …, (เอ็กซ์ เค; ไม่เป็นไร). มันถูกสร้างขึ้นในลักษณะเดียวกัน รูปหลายเหลี่ยมความถี่ซึ่งเป็นอะนาล็อกทางสถิติของรูปหลายเหลี่ยมการกระจาย
เป็นเรื่องที่คุ้มที่จะบอกว่าสำหรับอนุกรมการแปรผันที่ต่อเนื่อง สามารถสร้างรูปหลายเหลี่ยมได้หากค่าดังกล่าว เอ็กซ์ 1 , เอ็กซ์ 2 , …, เอ็กซ์ เคใช้จุดกึ่งกลางของช่วงเวลา
โดยทั่วไปแล้วชุดความแปรผันของช่วงเวลาจะแสดงเป็นภาพกราฟิกโดยใช้ ฮิสโตแกรม.
แผนภูมิแท่ง– รูปขั้นบันไดประกอบด้วยรูปสี่เหลี่ยมผืนผ้าซึ่งมีฐานเป็นช่วงความยาวบางส่วน ชม.= x ฉัน +1 – x ฉัน, ฉัน= 0,…,เค-1 และความสูงเท่ากับความถี่ (หรือความถี่) ของช่วงเวลา ฉัน (ฉัน).
สะสม(เส้นโค้งสะสม) – เส้นโค้งความถี่สะสม (ความถี่) สำหรับ ซีรีส์ไม่ต่อเนื่องการสะสมแสดงถึงเส้นขาดที่เชื่อมจุดหรือ , สำหรับ ซีรีย์ช่วงเวลาการสะสมเริ่มต้นจากจุดที่ abscissa เท่ากับจุดเริ่มต้นของช่วงแรก และลำดับเท่ากับความถี่สะสม (ความถี่) เท่ากับศูนย์ จุดอื่นๆ ของเส้นประนี้สอดคล้องกับจุดสิ้นสุดของช่วงเวลา
ซีรี่ส์รูปแบบต่างๆ - แนวคิดและประเภท การจำแนกประเภทและคุณสมบัติของหมวดหมู่ "Variation Series" 2017, 2018
การกระจายมูลค่าการขายปลีก สหพันธรัฐรัสเซียในปี 1995 ตามประเภทของการเป็นเจ้าของ ล้านรูเบิล ประเภทของชุดการจัดจำหน่าย การบรรยาย VIII ชุดการแจกจ่าย เป็นผลมาจากการประมวลผลและการจัดระบบข้อมูลทางสถิติหลัก เราได้รับ... .
การแปลงข้อมูลทางสถิติที่ง่ายที่สุดคือการเรียงลำดับตามขนาด ตัวอย่างปริมาตรจากประชากรทั่วไปเรียงลำดับองค์ประกอบไม่ลดลงเช่น , เรียกว่า ซีรีย์การเปลี่ยนแปลง: . ในกรณีที่ปริมาณการสังเกต... .
1. จากตัวอย่างที่ให้มาซึ่งสอดคล้องกับตัวแปรของงาน ให้สร้างอนุกรมความแปรผันตามช่วงเวลา สร้างฮิสโตแกรมและสะสม (ใช้สองวิธี: การแทรกแผนภูมิ Excel และโหมด "ฮิสโตแกรม" ของแพ็คเกจ "การวิเคราะห์ข้อมูล") 2. วิเคราะห์ฮิสโตแกรมผลลัพธ์ ... .
ประชากร - หน่วยโครงสร้างใจดี. ขนาดประชากร สาเหตุของความผันผวนของประชากร ความสัมพันธ์ระหว่างบุคคลในประชากรและระหว่างประชากรที่แตกต่างกันของชนิดเดียวกันและต่างกัน 1. สัญญาณสำคัญชนิดพันธุ์ - การตั้งถิ่นฐานของกลุ่ม ประชากรใน...
แถวที่สร้าง บนพื้นฐานเชิงปริมาณเรียกว่า แปรผัน.
ชุดการจัดจำหน่ายประกอบด้วย ตัวเลือก(ค่าลักษณะเฉพาะ) และ ความถี่(จำนวนกลุ่ม) ความถี่ที่แสดงเป็นค่าสัมพัทธ์ (เศษส่วน, เปอร์เซ็นต์) เรียกว่า ความถี่. ผลรวมของความถี่ทั้งหมดเรียกว่าปริมาตรของอนุกรมการแจกแจง
โดยแบ่งตามประเภทชุดการจำหน่ายออกเป็น ไม่ต่อเนื่อง(สร้างตามค่าที่ไม่ต่อเนื่องของคุณลักษณะ) และ ช่วงเวลา(ขึ้นอยู่กับค่าต่อเนื่องของคุณลักษณะ)
ซีรี่ส์รูปแบบต่างๆแสดงถึงสองคอลัมน์ (หรือแถว) หนึ่งในนั้นให้ค่าแต่ละค่าของคุณลักษณะที่แตกต่างกันเรียกว่าตัวแปรและเขียนแทนด้วย X; และอีกประการหนึ่งคือตัวเลขสัมบูรณ์ที่แสดงจำนวนครั้ง (บ่อยแค่ไหน) แต่ละตัวเลือกเกิดขึ้น ตัวบ่งชี้ในคอลัมน์ที่สองเรียกว่าความถี่และเขียนแทนด้วย f ตามอัตภาพ ให้เราทราบอีกครั้งว่าในคอลัมน์ที่สองทั้งสอง ตัวชี้วัดที่เกี่ยวข้องการกำหนดลักษณะการแบ่งความถี่ของแต่ละตัวเลือกในผลรวมของความถี่ ตัวบ่งชี้สัมพัทธ์เหล่านี้เรียกว่าความถี่และแสดงตามอัตภาพด้วย ω ผลรวมของความถี่ทั้งหมดในกรณีนี้เท่ากับหนึ่ง อย่างไรก็ตาม ความถี่สามารถแสดงเป็นเปอร์เซ็นต์ได้ จากนั้นผลรวมของความถี่ทั้งหมดจะเป็น 100%
ถ้าตัวแปรของอนุกรมความแปรผันแสดงในรูปของปริมาณที่แยกจากกัน ก็จะเรียกว่าอนุกรมความแปรผันดังกล่าว ไม่ต่อเนื่อง
สำหรับคุณลักษณะต่อเนื่อง อนุกรมของรูปแบบจะถูกสร้างขึ้นเป็น ช่วงเวลานั่นคือค่าของแอตทริบิวต์จะแสดงเป็น "จาก... ถึง..." ในกรณีนี้ค่าต่ำสุดของคุณลักษณะในช่วงเวลาดังกล่าวเรียกว่าขีด จำกัด ล่างของช่วงเวลาและค่าสูงสุด - ขีด จำกัด บน
ซีรีย์ความแปรผันของช่วงยังถูกสร้างขึ้นสำหรับคุณลักษณะที่ไม่ต่อเนื่องซึ่งแตกต่างกันไปในช่วงขนาดใหญ่ ซีรีย์ช่วงเวลาสามารถอยู่กับ เท่ากันและ ไม่เท่ากันเป็นระยะ
ลองพิจารณาว่าค่าของช่วงเวลาที่เท่ากันถูกกำหนดอย่างไร ให้เราแนะนำสัญกรณ์ต่อไปนี้:
ฉัน– ขนาดช่วง;
- ค่าสูงสุดของคุณลักษณะสำหรับหน่วยประชากร
– ค่าต่ำสุดของคุณลักษณะสำหรับหน่วยประชากร
ไม่มี –จำนวนกลุ่มที่ได้รับการจัดสรร
ถ้าทราบ n
หากยากต่อการกำหนดจำนวนกลุ่มที่จะแยกแยะล่วงหน้า ดังนั้นเพื่อคำนวณค่าที่เหมาะสมที่สุดของช่วงเวลาที่มีขนาดประชากรเพียงพอ สามารถแนะนำสูตรที่เสนอโดย Sturgess ในปี 1926 ได้:
n = 1+ 3.322 log N โดยที่ N คือจำนวนหน่วยในการรวม
ขนาดของช่วงเวลาที่ไม่เท่ากันจะถูกกำหนดในแต่ละช่วง กรณีพิเศษโดยคำนึงถึงลักษณะของวัตถุที่ศึกษา
การกระจายตัวอย่างทางสถิติเรียกรายการตัวเลือกและความถี่ที่เกี่ยวข้อง (หรือความถี่สัมพัทธ์)
การกระจายทางสถิติของตัวอย่างสามารถระบุได้ในรูปแบบของตารางในคอลัมน์แรกซึ่งมีตัวเลือกอยู่และในคอลัมน์ที่สอง - ความถี่ที่สอดคล้องกับตัวเลือกเหล่านี้ พรรณีหรือความถี่สัมพัทธ์ พาย .
การกระจายตัวทางสถิติของกลุ่มตัวอย่าง
อนุกรมช่วงเป็นอนุกรมการเปลี่ยนแปลงซึ่งค่าของคุณลักษณะที่เป็นรากฐานของการก่อตัวจะแสดงภายในขอบเขตที่กำหนด (ช่วงเวลา) ความถี่ในกรณีนี้ไม่ได้อ้างอิงถึงค่าแต่ละค่าของแอตทริบิวต์ แต่รวมถึงช่วงเวลาทั้งหมด
อนุกรมการแจกแจงแบบช่วงเวลาถูกสร้างขึ้นตามคุณลักษณะเชิงปริมาณที่ต่อเนื่อง เช่นเดียวกับคุณลักษณะแบบแยกส่วนที่แตกต่างกันภายในขีดจำกัดที่มีนัยสำคัญ
อนุกรมช่วงเวลาสามารถแสดงได้ด้วยการกระจายทางสถิติของกลุ่มตัวอย่างที่ระบุช่วงเวลาและความถี่ที่สอดคล้องกัน ในกรณีนี้ ผลรวมของความถี่ของตัวแปรที่อยู่ภายในช่วงเวลานี้จะถือเป็นความถี่ของช่วงเวลา
เมื่อจัดกลุ่มตามคุณลักษณะต่อเนื่องเชิงปริมาณ การกำหนดขนาดของช่วงเวลาเป็นสิ่งสำคัญ
นอกจากค่าเฉลี่ยตัวอย่างและความแปรปรวนของตัวอย่างแล้ว ยังใช้คุณลักษณะอื่นๆ ของชุดรูปแบบต่างๆ อีกด้วย
แฟชั่นเรียกว่าตัวแปรที่มีความถี่สูงสุด
บทเรียนภาคปฏิบัติ 1
ชุดการกระจายที่หลากหลาย
ซีรี่ส์รูปแบบต่างๆหรือ ใกล้กระจายเรียกการกระจายคำสั่งของหน่วยประชากรตามค่าคุณลักษณะที่เพิ่มขึ้น (บ่อยขึ้น) หรือลดลง (น้อยลง) และนับจำนวนหน่วยด้วยค่าเฉพาะของลักษณะเฉพาะ
มี 3 ใจดีแถวการกระจายสินค้า:
1) ซีรีส์จัดอันดับ– นี่คือรายการของแต่ละหน่วยของประชากรโดยเรียงลำดับตามลักษณะที่กำลังศึกษาจากน้อยไปมาก หากจำนวนหน่วยประชากรมากเพียงพอ อนุกรมอันดับจะยุ่งยาก และในกรณีเช่นนี้ อนุกรมการแจกแจงจะถูกสร้างขึ้นโดยการจัดกลุ่มหน่วยประชากรตามค่าคุณลักษณะที่กำลังศึกษา (หากลักษณะเฉพาะมีจำนวนน้อย ค่า จากนั้นจะมีการสร้างอนุกรมแบบแยกส่วน มิฉะนั้น จะเป็นอนุกรมช่วงเวลา)
2) ซีรีส์ไม่ต่อเนื่อง- นี่คือตารางที่ประกอบด้วยสองคอลัมน์ (แถว) - ค่าเฉพาะของคุณลักษณะที่แตกต่างกัน เอ็กซ์ ฉันและจำนวนหน่วยประชากรที่มีค่าคุณลักษณะที่กำหนด ฉ ฉัน– ความถี่; จำนวนกลุ่มในชุดข้อมูลแยกจะถูกกำหนดโดยจำนวนค่าที่มีอยู่จริงของคุณลักษณะที่แตกต่างกัน
3) ซีรีย์ช่วงเวลา- นี่คือตารางที่ประกอบด้วยสองคอลัมน์ (แถว) - ช่วงเวลาของลักษณะที่แตกต่างกัน เอ็กซ์ ฉันและจำนวนหน่วยประชากรที่อยู่ในช่วงที่กำหนด (ความถี่) หรือสัดส่วนของจำนวนนี้ต่อจำนวนประชากรทั้งหมด (ความถี่)
ตัวเลขแสดงจำนวนครั้งที่แต่ละตัวเลือกเกิดขึ้นในประชากรที่กำหนด ความถี่หรือ ตาชั่งตัวเลือกและกำหนดด้วยอักษรตัวพิมพ์เล็กของอักษรละติน ฉ. ผลรวมของความถี่ของอนุกรมการแปรผันเท่ากับปริมาตรของประชากรที่กำหนด เช่น
ที่ไหน เค– จำนวนกลุ่ม n – จำนวนทั้งหมดการสังเกตหรือขนาดประชากร
ความถี่ (น้ำหนัก) ไม่เพียงแต่แสดงในรูปแบบสัมบูรณ์เท่านั้น แต่ยังแสดงเป็นจำนวนสัมพัทธ์ด้วย - เป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของจำนวนตัวแปรทั้งหมดที่ประกอบเป็นประชากรที่กำหนด ในกรณีเช่นนี้จะมีการเรียกตุ้มน้ำหนัก ความถี่สัมพัทธ์หรือ ความถี่ผลรวมของชิ้นส่วนมีค่าเท่ากับหนึ่ง
หรือ
,
ถ้าความถี่แสดงเป็นเปอร์เซ็นต์ของจำนวนการสังเกตทั้งหมด ป.ไม่จำเป็นต้องแทนที่ความถี่ด้วยความถี่ แต่บางครั้งก็มีประโยชน์และจำเป็นในกรณีที่จำเป็นต้องเปรียบเทียบซีรีย์รูปแบบต่างๆ ที่มีปริมาณแตกต่างกันมาก
ขึ้นอยู่กับลักษณะการเปลี่ยนแปลง - แบบไม่ต่อเนื่องหรือต่อเนื่อง ในช่วงกว้างหรือแคบ - ประชากรทางสถิติจะถูกกระจายใน ไม่ใช่ช่วงเวลาหรือ ช่วงเวลาซีรีย์การเปลี่ยนแปลง ในกรณีแรกความถี่จะเกี่ยวข้องโดยตรงกับค่าอันดับของคุณลักษณะซึ่งได้รับตำแหน่งของแต่ละกลุ่มหรือคลาสของชุดรูปแบบต่างๆ ในส่วนที่สอง - จะนับความถี่ที่เกี่ยวข้องกับแต่ละช่วงเวลาหรือช่วงเวลา (จาก - ถึง) โดยแบ่งความแปรผันทั้งหมดของลักษณะเฉพาะออก ตั้งแต่ตัวเลือกขั้นต่ำไปจนถึงสูงสุดสำหรับประชากรที่กำหนด ช่องว่างเหล่านี้หรือช่วงชั้นเรียนอาจมีความกว้างเท่ากันหรือไม่ก็ได้ ดังนั้นพวกเขาจึงแยกแยะ อนุกรมการแปรผันช่วงเท่ากันและไม่เท่ากันในอนุกรมช่วงเวลาที่ไม่เท่ากัน ธรรมชาติของการแจกแจงความถี่จะเปลี่ยนไปตามความกว้างของช่วงคลาสที่เปลี่ยนแปลง การจัดกลุ่มช่วงเวลาที่ไม่เท่ากันนั้นไม่ค่อยมีใครใช้ในทางชีววิทยา ตามกฎแล้ว ข้อมูลไบโอเมตริกซ์จะถูกกระจายออกเป็นชุดข้อมูลที่มีช่วงระยะเวลาเท่ากัน ซึ่งไม่เพียงแต่ช่วยให้ระบุรูปแบบของความแปรผันเท่านั้น แต่ยังอำนวยความสะดวกในการคำนวณลักษณะตัวเลขสรุปของชุดข้อมูลรูปแบบต่างๆ และการเปรียบเทียบชุดข้อมูลการกระจายระหว่างกันอีกด้วย
เมื่อเริ่มสร้างอนุกรมรูปแบบที่มีช่วงเท่ากัน สิ่งสำคัญคือต้องจัดเค้าร่างความกว้างของช่วงชั้นเรียนให้ถูกต้อง ความจริงก็คือการจัดกลุ่มคร่าวๆ (เมื่อมีการกำหนดช่วงคลาสที่กว้างมาก) จะบิดเบือนคุณลักษณะทั่วไปของการแปรผัน และทำให้ความแม่นยำของคุณลักษณะเชิงตัวเลขของอนุกรมลดลง เมื่อเลือกช่วงเวลาที่แคบเกินไป ความแม่นยำของลักษณะตัวเลขโดยทั่วไปจะเพิ่มขึ้น แต่อนุกรมนั้นยืดเกินไปและไม่ได้ให้ภาพการเปลี่ยนแปลงที่ชัดเจน
เพื่อให้ได้ซีรีย์รูปแบบที่มองเห็นได้ชัดเจนและ เพื่อให้มั่นใจถึงความแม่นยำที่เพียงพอของคุณลักษณะเชิงตัวเลขที่คำนวณจากนั้น ความแปรผันของคุณลักษณะ (ตั้งแต่ตัวเลือกขั้นต่ำไปจนถึงสูงสุด) ควรแบ่งออกเป็นกลุ่มหรือคลาสจำนวนหนึ่งที่จะตรงตามข้อกำหนดทั้งสอง ปัญหานี้แก้ไขได้โดยการหารช่วงของการแปรผันของคุณลักษณะด้วยจำนวนกลุ่มหรือคลาสที่ระบุไว้เมื่อสร้างชุดรูปแบบ:
,
ที่ไหน ชม.– ขนาดช่วง; เอ็กซ์ม ก x และ เอ็กซ์นาที – รวมค่าสูงสุดและต่ำสุด เค– จำนวนกลุ่ม
เมื่อสร้างอนุกรมการแจกแจงตามช่วงเวลา จำเป็นต้องเลือกจำนวนกลุ่มที่เหมาะสมที่สุด (ช่วงแอตทริบิวต์) และตั้งค่าความยาว (ช่วง) ของช่วงเวลา เนื่องจากการวิเคราะห์อนุกรมการแจกแจงจะเปรียบเทียบความถี่ในช่วงเวลาที่ต่างกัน ความยาวของช่วงการแจกแจงจึงจำเป็นที่คงที่ หากคุณต้องจัดการกับชุดการแจกแจงช่วงเวลาที่มีช่วงเวลาที่ไม่เท่ากันดังนั้นเพื่อการเปรียบเทียบคุณต้องลดความถี่หรือความถี่ให้เป็นหน่วยของช่วงเวลาค่าผลลัพธ์จะถูกเรียกว่า ความหนาแน่น
ρ
, นั่นคือ
.
เลือกจำนวนกลุ่มที่เหมาะสมที่สุดเพื่อให้สะท้อนถึงความหลากหลายของค่าคุณลักษณะโดยรวมอย่างเพียงพอ และในขณะเดียวกัน รูปแบบการกระจายจะไม่ถูกบิดเบือนจากความผันผวนของความถี่แบบสุ่ม หากมีกลุ่มน้อยเกินไป รูปแบบของการแปรผันจะไม่ปรากฏ หากมีกลุ่มมากเกินไป การกระโดดความถี่แบบสุ่มจะทำให้รูปร่างของการแจกแจงผิดเพี้ยนไป
บ่อยครั้งที่จำนวนกลุ่มในชุดการแจกจ่ายถูกกำหนดโดยใช้สูตร Sturgess:
ที่ไหน n– ขนาดประชากร
การแสดงแบบกราฟิกให้ความช่วยเหลือที่สำคัญในการวิเคราะห์อนุกรมการแจกแจงและคุณสมบัติของชุดข้อมูล อนุกรมช่วงเวลาแสดงด้วยแผนภูมิแท่งซึ่งฐานของแท่งที่อยู่ตามแนวแกน Abscissa คือช่วงเวลาของค่าของลักษณะที่แตกต่างกันและความสูงของแท่งคือความถี่ที่สอดคล้องกับมาตราส่วนตามพิกัด แกน. ไดอะแกรมประเภทนี้เรียกว่า ฮิสโตแกรม
หากมีอนุกรมการแจกแจงแบบแยกส่วนหรือใช้จุดกึ่งกลางของช่วงเวลา การแสดงแบบกราฟิกของอนุกรมดังกล่าวจะถูกเรียกว่า รูปหลายเหลี่ยมซึ่งได้มาจากการเชื่อมต่อเส้นตรงกับจุดที่มีพิกัด เอ็กซ์ ฉันและ ฉ ฉัน .
หากค่าของคลาสถูกพล็อตตามแกน abscissa และความถี่สะสมถูกพล็อตไปตามแกนกำหนดตามด้วยการเชื่อมต่อจุดด้วยเส้นตรงกราฟที่เรียกว่า สะสมความถี่สะสมจะพบได้จากผลรวมตามลำดับหรือ การสะสมความถี่ในทิศทางจากคลาสแรกไปจนถึงจุดสิ้นสุดของซีรีย์รูปแบบต่างๆ
ตัวอย่าง. มีข้อมูลเกี่ยวกับการผลิตไข่ของแม่ไก่ไข่ 50 ตัวใน 1 ปีเลี้ยงในฟาร์มสัตว์ปีก (ตารางที่ 1.1)
ตารางที่ 1.1
การผลิตไข่ของแม่ไก่ไข่
ไก่ไข่หมายเลข |
การผลิตไข่ ชิ้น |
ไก่ไข่หมายเลข |
การผลิตไข่ ชิ้น |
ไก่ไข่หมายเลข |
การผลิตไข่ ชิ้น |
ไก่ไข่หมายเลข |
การผลิตไข่ ชิ้น |
ไก่ไข่หมายเลข |
การผลิตไข่ ชิ้น |
จำเป็นต้องสร้างอนุกรมการแจกแจงตามช่วงเวลาและแสดงเป็นกราฟในรูปแบบของฮิสโตแกรม รูปหลายเหลี่ยม และสะสม
จะเห็นได้ว่าลักษณะนี้แตกต่างกันไปตั้งแต่ 212 ถึง 245 ฟองที่ได้จากแม่ไก่ไข่ใน 1 ปี
ในตัวอย่างของเรา โดยใช้สูตร Sturgess เรากำหนดจำนวนกลุ่ม:
เค = 1 + 3,322แอลจี 50 = 6,643 ≈ 7.
ลองคำนวณความยาว (ช่วง) ของช่วงเวลาโดยใช้สูตร:
.
มาสร้างอนุกรมช่วงเวลาด้วย 7 กลุ่มและช่วงเวลา 5 ส่วนกัน ไข่ (ตารางที่ 1.2) ในการสร้างกราฟในตาราง เราจะคำนวณจุดกึ่งกลางของช่วงเวลาและความถี่สะสม
ตารางที่ 1.2
การกระจายการผลิตไข่แบบช่วง
กลุ่มแม่ไก่ไข่โดยการผลิตไข่ เอ็กซ์ ฉัน |
จำนวนแม่ไก่ไข่ ฉ ฉัน |
ตรงกลางของช่วง เอ็กซ์ฉัน' |
ความถี่สะสม ฉ ฉัน ’ |
|
เรามาสร้างฮิสโตแกรมการกระจายการผลิตไข่กันเถอะ (รูปที่ 1.1)
ข้าว. 1.1. ฮิสโตแกรมการกระจายการผลิตไข่
ฮิสโตแกรมเหล่านี้แสดงลักษณะรูปร่างการกระจายของลักษณะต่างๆ มากมาย: ค่าของช่วงเวลาเฉลี่ยของลักษณะนั้นพบได้บ่อยกว่า และค่าสุดขีด (เล็กและใหญ่) ของลักษณะนั้นพบน้อยกว่า รูปร่างของการแจกแจงนี้ใกล้เคียงกับกฎการแจกแจงแบบปกติ ซึ่งเกิดขึ้นหากตัวแปรที่แตกต่างกันได้รับอิทธิพลจากปัจจัยจำนวนมาก ซึ่งไม่มีปัจจัยใดที่มีนัยสำคัญเหนือกว่า
รูปหลายเหลี่ยมและการกระจายสะสมของการผลิตไข่มีลักษณะดังนี้ (รูปที่ 1.2 และ 1.3)
ข้าว. 1.2. พื้นที่จำหน่ายการผลิตไข่
ข้าว. 1.3. การกระจายการผลิตไข่สะสม
เทคโนโลยีในการแก้ปัญหาใน โปรเซสเซอร์ตาราง ไมโครซอฟต์ เอ็กเซล ต่อไป.
1. ป้อนข้อมูลเบื้องต้นตามรูป 1.4.
2. จัดอันดับแถว.
2.1. เลือกเซลล์ A2:A51
2.2. คลิกซ้ายบนแถบเครื่องมือบนปุ่ม<Сортировка по возрастанию > .
3. กำหนดขนาดของช่วงเวลาในการสร้างอนุกรมการแจกแจงช่วงเวลา
3.1. คัดลอกเซลล์ A2 ไปยังเซลล์ E53
3.2. คัดลอกเซลล์ A51 ไปยังเซลล์ E54
3.3. คำนวณช่วงของการเปลี่ยนแปลง เมื่อต้องการทำเช่นนี้ ให้ป้อนสูตรในเซลล์ E55 =E54-E53.
3.4. คำนวณจำนวนกลุ่มรูปแบบ เมื่อต้องการทำเช่นนี้ ให้ป้อนสูตรในเซลล์ E56 =1+3.322*ล็อก10(50).
3.5. ป้อนจำนวนกลุ่มที่ปัดเศษในเซลล์ E57
3.6. คำนวณความยาวของช่วงเวลา เมื่อต้องการทำเช่นนี้ ให้ป้อนสูตรในเซลล์ E58 =E55/E57.
3.7. ป้อนความยาวช่วงการปัดเศษในเซลล์ E59
4. สร้างอนุกรมช่วงเวลา
4.1. คัดลอกเซลล์ E53 ไปยังเซลล์ B64
4.2. ป้อนสูตรในเซลล์ B65 =B64+$E$59.
4.3. คัดลอกเซลล์ B65 ไปยังเซลล์ B66:B70
4.4. ป้อนสูตรในเซลล์ C64 =B65.
4.5. ป้อนสูตรในเซลล์ C65 =C64+$E$59.
4.6. คัดลอกเซลล์ C65 ไปยังเซลล์ C66:C70
ผลลัพธ์ของการแก้ปัญหาจะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.5)
5. คำนวณความถี่ช่วงเวลา
5.1. รันคำสั่ง บริการ,การวิเคราะห์ข้อมูลโดยคลิกสลับกันด้วยปุ่มซ้ายของเมาส์
5.2. ในกล่องโต้ตอบ การวิเคราะห์ข้อมูลใช้ปุ่มซ้ายของเมาส์เพื่อติดตั้ง: เครื่องมือวิเคราะห์ <Гистограмма>(รูปที่ 1.6)
5.3. คลิกซ้ายที่ปุ่ม<ОК>.
5.4. บนแท็บ แผนภูมิแท่งตั้งค่าพารามิเตอร์ตามรูป 1.7.
5.5. คลิกซ้ายที่ปุ่ม<ОК>.
ผลลัพธ์ของการแก้ปัญหาจะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.8)
6. กรอกตาราง “อนุกรมการแจกแจงช่วง”
6.1. คัดลอกเซลล์ B74:B80 ไปยังเซลล์ D64:D70
6.2. คำนวณผลรวมของความถี่ เมื่อต้องการทำเช่นนี้ ให้เลือกเซลล์ D64:D70 แล้วคลิกซ้ายที่ปุ่มในแถบเครื่องมือ<Автосумма > .
6.3. คำนวณจุดกึ่งกลางของช่วงเวลา เมื่อต้องการทำเช่นนี้ ให้ป้อนสูตรในเซลล์ E64 =(B64+C64)/2และคัดลอกไปยังเซลล์ E65:E70
6.4. คำนวณความถี่สะสม เมื่อต้องการทำเช่นนี้ ให้คัดลอกเซลล์ D64 ไปยังเซลล์ F64 ในเซลล์ F65 ให้ใส่สูตร =F64+D65 แล้วคัดลอกไปยังเซลล์ F66:F70
ผลลัพธ์ของการแก้ปัญหาจะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.9)
7. แก้ไขฮิสโตแกรม
7.1. คลิกขวาที่ไดอะแกรมชื่อ "พ็อกเก็ต" และบนแท็บที่ปรากฏขึ้นให้คลิกปุ่ม<Очистить>.
7.2. คลิกขวาที่แผนภูมิ และในแท็บที่ปรากฏขึ้น ให้คลิก<Исходные данные>.
7.3. ในกล่องโต้ตอบ ข้อมูลเบื้องต้นเปลี่ยนป้ายกำกับแกน X โดยเลือกเซลล์ B64:C70 (รูปที่ 1.10)
7.5. กดปุ่ม
ผลลัพธ์จะแสดงบนหน้าจอแสดงผลค่ะ แบบฟอร์มต่อไปนี้(รูปที่ 1.11)
8. สร้างรูปหลายเหลี่ยมเพื่อกระจายการผลิตไข่
8.1. คลิกซ้ายบนแถบเครื่องมือบนปุ่ม<Мастер диаграмм > .
8.2. ในกล่องโต้ตอบ ตัวช่วยสร้างแผนภูมิ (ขั้นตอนที่ 1 จาก 4)โดยใช้ชุดปุ่มซ้ายของเมาส์: Standard <График>(รูปที่ 1.12)
8.3. คลิกซ้ายที่ปุ่ม<Далее>.
8.4. ในกล่องโต้ตอบ ตัวช่วยสร้างแผนภูมิ (ขั้นตอนที่ 2 จาก 4)ตั้งค่าพารามิเตอร์ตามรูป 1.13.
8.5. คลิกซ้ายที่ปุ่ม<Далее>.
8.6. ในกล่องโต้ตอบ ตัวช่วยสร้างแผนภูมิ (ขั้นตอนที่ 3 จาก 4)ป้อนชื่อของไดอะแกรมและแกน Y (รูปที่ 1.14)
8.7. คลิกซ้ายที่ปุ่ม<Далее>.
8.8. ในกล่องโต้ตอบ ตัวช่วยสร้างแผนภูมิ (ขั้นตอนที่ 4 จาก 4)ตั้งค่าพารามิเตอร์ตามรูป 1.15.
8.9. คลิกซ้ายที่ปุ่ม<Готово>.
ผลลัพธ์จะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.16)
9. แทรกป้ายกำกับข้อมูลลงในกราฟ
9.1. คลิกขวาที่แผนภูมิ และในแท็บที่ปรากฏขึ้น ให้คลิก<Исходные данные>.
9.2. ในกล่องโต้ตอบ ข้อมูลเบื้องต้นเปลี่ยนป้ายกำกับแกน X โดยเลือกเซลล์ E64:E70 (รูปที่ 1.17)
9.3. กดปุ่ม
ผลลัพธ์จะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.18)
การสะสมการแจกแจงถูกสร้างขึ้นคล้ายกับรูปหลายเหลี่ยมการแจกแจงตามความถี่ที่สะสม
มูลค่าทั้งหมดของทรัพย์สินภายใต้การศึกษาที่เกิดขึ้นในกลุ่มประชากรที่ศึกษาเรียกว่ามูลค่าของคุณลักษณะ (ตัวเลือก ตัวเลือก) และการเปลี่ยนแปลงของค่านี้ โดยการเปลี่ยนแปลง. ตัวเลือกจะแสดงด้วยตัวอักษรละตินตัวเล็กพร้อมดัชนีที่สอดคล้องกับหมายเลขซีเรียลของกลุ่ม - x ฉัน .
ตัวเลขที่แสดงจำนวนครั้งที่ค่าคุณลักษณะแต่ละค่าเกิดขึ้นในประชากรที่กำลังศึกษา ความถี่ และแสดงถึง f ฉัน . ผลรวมของความถี่ทั้งหมดของอนุกรมนี้เท่ากับปริมาตรของประชากรที่กำลังศึกษา
บ่อยครั้งคุณต้องนับ ความถี่สะสม (ส). ความถี่สะสมสำหรับค่าลักษณะเฉพาะแต่ละค่าจะแสดงจำนวนหน่วยประชากรที่มีค่าลักษณะเฉพาะไม่เกิน มูลค่าที่กำหนด. ความถี่สะสมคำนวณโดยการเพิ่มค่าคุณลักษณะต่อไปนี้ตามลำดับในความถี่ของค่าแรกของเครื่องหมายความถี่:
ความถี่สะสมเริ่มคำนวณจากค่าแรกของแอตทริบิวต์
ผลรวมของความถี่จะเท่ากับหนึ่งหรือ 100% เสมอ การแทนที่ความถี่ด้วยความถี่ทำให้สามารถเปรียบเทียบอนุกรมความแปรผันกับจำนวนการสังเกตที่ต่างกันได้
ในบางกรณีความถี่ของอนุกรม (f i) สามารถถูกแทนที่ด้วยความถี่ (ω i)
หากชุดรูปแบบได้รับในช่วงเวลาไม่เท่ากันเพื่อให้เข้าใจถึงธรรมชาติของการแจกแจงที่ถูกต้องจำเป็นต้องคำนวณความหนาแน่นสัมบูรณ์หรือสัมพัทธ์ของการแจกแจง
ความหนาแน่นของการกระจายสัมบูรณ์ (หน้า ฉ ) หมายถึงค่าความถี่ต่อขนาดช่วงหน่วย แยกกลุ่มแถว:
ร ฉ = ฉ/ ฉัน.
ความหนาแน่นของการกระจายสัมพัทธ์ (หน้า ω ) หมายถึงค่าความถี่ต่อขนาดหน่วยของช่วงเวลาของกลุ่มแยกอนุกรม:
ร ω = ω / ฉัน.
สำหรับอนุกรมที่มีช่วงเวลาไม่เท่ากัน เฉพาะคุณลักษณะเหล่านี้เท่านั้นที่ให้แนวคิดที่ถูกต้องเกี่ยวกับธรรมชาติของการแจกแจงมากกว่าความถี่และความถี่
การกระจายตัวอย่างทางสถิติ เรียกรายการตัวเลือก (ค่าสัญญาณ) และความถี่หรือความหนาแน่นของการแจกแจงที่สอดคล้องกัน ความถี่สัมพัทธ์ หรือความหนาแน่นของการแจกแจงสัมพัทธ์
อนุกรมการกระจายที่แตกต่างกันมีลักษณะเฉพาะด้วยชุดลักษณะความถี่ที่แตกต่างกัน:
น้อยที่สุด - ชุดคุณลักษณะ (ความถี่, ความถี่)
สำหรับสิ่งที่ไม่ต่อเนื่องจะใช้คุณสมบัติสี่ประการ (ความถี่, ความถี่, ความถี่สะสม, ความถี่สะสม)
สำหรับช่วงเวลา – ทั้งห้า (ความถี่ ความถี่ ความถี่สะสม ความถี่สะสม ความหนาแน่นของการแจกแจงแบบสัมบูรณ์และสัมพัทธ์)
กฎสำหรับการสร้างอนุกรมความแปรผันตามช่วงเวลา
การแสดงกราฟิกของซีรีย์รูปแบบต่างๆ
ขั้นตอนแรกของการศึกษาชุดรูปแบบคือการสร้างภาพกราฟิก การแสดงชุดรูปแบบต่างๆ แบบกราฟิกช่วยอำนวยความสะดวกในการวิเคราะห์ และช่วยให้สามารถตัดสินรูปร่างของการแจกแจงได้ ในการแสดงชุดความแปรผันในสถิติในรูปแบบกราฟิก จะมีการสร้างฮิสโตแกรม รูปหลายเหลี่ยม และการกระจายแบบสะสม
อนุกรมความแปรผันที่แยกจากกันจะถูกแสดงเป็นสิ่งที่เรียกว่ารูปหลายเหลี่ยมความถี่
ในการแสดงอนุกรมช่วงเวลา จะใช้รูปหลายเหลี่ยมการกระจายความถี่และฮิสโตแกรมความถี่
กราฟถูกสร้างขึ้นในระบบพิกัดสี่เหลี่ยม
(คำจำกัดความของอนุกรมความแปรผัน ส่วนประกอบของอนุกรมความแปรผัน รูปแบบสามรูปแบบของอนุกรมความแปรผัน ความเป็นไปได้ในการสร้างอนุกรมช่วง ข้อสรุปที่สามารถดึงได้จากอนุกรมที่สร้างขึ้น)
ซีรีย์รูปแบบคือลำดับขององค์ประกอบตัวอย่างทั้งหมดที่จัดเรียงแบบไม่ลดลง องค์ประกอบที่เหมือนกันถูกทำซ้ำ
ซีรีส์แบบแปรผันคือซีรีส์ที่สร้างขึ้นบนพื้นฐานเชิงปริมาณ
อนุกรมการแจกแจงแบบแปรผันประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่:
ตัวเลือกคือ ค่าตัวเลขลักษณะเชิงปริมาณในชุดการกระจายตัวแบบแปรผัน อาจเป็นค่าบวกและค่าลบ ค่าสัมบูรณ์และค่าสัมพัทธ์ ดังนั้นเมื่อจัดกลุ่มวิสาหกิจตามผลลัพธ์ กิจกรรมทางเศรษฐกิจตัวเลขบวกหมายถึงกำไร และตัวเลขติดลบหมายถึงขาดทุน
ความถี่คือจำนวนตัวแปรแต่ละตัวหรือแต่ละกลุ่มของอนุกรมรูปแบบต่างๆ เช่น ตัวเลขเหล่านี้เป็นตัวเลขที่แสดงว่าตัวเลือกบางอย่างเกิดขึ้นในซีรีส์การแจกจ่ายบ่อยแค่ไหน ผลรวมของความถี่ทั้งหมดเรียกว่าปริมาตรของประชากรและถูกกำหนดโดยจำนวนองค์ประกอบของประชากรทั้งหมด
ความถี่คือความถี่ที่แสดงเป็นค่าสัมพัทธ์ (เศษส่วนของหน่วยหรือเปอร์เซ็นต์) ผลรวมของความถี่เท่ากับหนึ่งหรือ 100% การแทนที่ความถี่ด้วยความถี่ทำให้สามารถเปรียบเทียบอนุกรมความแปรผันกับจำนวนการสังเกตที่ต่างกันได้
ซีรี่ส์รูปแบบต่างๆ มีสามรูปแบบ:อนุกรมอันดับ อนุกรมแยก และอนุกรมช่วง
ลำดับอนุกรมคือการกระจายของแต่ละหน่วยของประชากรโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อยของคุณลักษณะที่กำลังศึกษา การจัดอันดับช่วยให้คุณแบ่งข้อมูลเชิงปริมาณออกเป็นกลุ่มๆ ได้อย่างง่ายดาย ตรวจจับข้อมูลที่เล็กที่สุดและทันที มูลค่าสูงสุดลักษณะเด่นเน้นค่าที่ซ้ำกันบ่อยที่สุด
ซีรีส์รูปแบบอื่นคือตารางกลุ่มที่รวบรวมตามลักษณะของการเปลี่ยนแปลงในค่าของคุณลักษณะที่กำลังศึกษา ตามลักษณะของการแปรผันจะแยกแยะลักษณะที่ไม่ต่อเนื่อง (ไม่ต่อเนื่อง) และต่อเนื่อง
ซีรีส์แบบแยกเป็นซีรีส์แบบแปรผัน ซึ่งการก่อสร้างขึ้นอยู่กับคุณลักษณะที่มีการเปลี่ยนแปลงไม่ต่อเนื่อง (คุณลักษณะแบบไม่ต่อเนื่อง) หลังรวมถึงหมวดหมู่ภาษีจำนวนเด็กในครอบครัวจำนวนพนักงานในองค์กร ฯลฯ คุณลักษณะเหล่านี้สามารถรับค่าเฉพาะจำนวนจำกัดเท่านั้น
ชุดรูปแบบที่ไม่ต่อเนื่องแสดงถึงตารางที่ประกอบด้วยสองคอลัมน์ คอลัมน์แรกระบุค่าเฉพาะของแอตทริบิวต์ และคอลัมน์ที่สองระบุจำนวนหน่วยในประชากรที่มีค่าเฉพาะของแอตทริบิวต์
หากลักษณะมีการเปลี่ยนแปลงอย่างต่อเนื่อง (จำนวนรายได้ระยะเวลาในการให้บริการต้นทุนของสินทรัพย์ถาวรขององค์กร ฯลฯ ซึ่งอาจใช้กับมูลค่าใด ๆ ภายในขอบเขตที่กำหนด) ดังนั้นสำหรับคุณลักษณะนี้จำเป็นต้องสร้าง อนุกรมการเปลี่ยนแปลงช่วงเวลา
ตารางกลุ่มที่นี่มีสองคอลัมน์ด้วย อันแรกระบุค่าของแอตทริบิวต์ในช่วงเวลา "จาก - ถึง" (ตัวเลือก) อันที่สองระบุจำนวนหน่วยที่รวมอยู่ในช่วงเวลา (ความถี่)
ความถี่ (ความถี่การทำซ้ำ) - จำนวนการซ้ำของตัวแปรเฉพาะของค่าแอตทริบิวต์ซึ่งแสดงถึง fi และผลรวมของความถี่เท่ากับปริมาตรของประชากรที่อยู่ระหว่างการศึกษาจะแสดงแทน
โดยที่ k คือจำนวนตัวเลือกสำหรับค่าแอตทริบิวต์
บ่อยครั้งที่ตารางจะเสริมด้วยคอลัมน์ที่คำนวณความถี่สะสม S ซึ่งแสดงจำนวนหน่วยในประชากรที่มีค่าลักษณะเฉพาะไม่เกินค่านี้
อนุกรมการแจกแจงแบบแปรผันแบบไม่ต่อเนื่องคืออนุกรมที่กลุ่มต่างๆ ถูกประกอบขึ้นตามคุณลักษณะที่เปลี่ยนแปลงแบบไม่ต่อเนื่องและรับเฉพาะค่าจำนวนเต็มเท่านั้น
อนุกรมการแจกแจงแบบแปรผันตามช่วงเวลาคืออนุกรมที่ลักษณะการจัดกลุ่มที่เป็นพื้นฐานของการจัดกลุ่มสามารถรับค่าใดๆ รวมถึงค่าเศษส่วนในช่วงเวลาหนึ่งได้
ซีรีย์การแปรผันช่วงเวลาคือชุดของช่วงเวลาที่เรียงลำดับของการเปลี่ยนแปลงค่าของตัวแปรสุ่มด้วยความถี่ที่สอดคล้องกันหรือความถี่ของการเกิดขึ้นของค่าในแต่ละค่า
ประการแรกขอแนะนำให้สร้างอนุกรมการแจกแจงตามช่วงเวลาโดยมีการแปรผันอย่างต่อเนื่องของคุณลักษณะ และหากการแปรผันแบบไม่ต่อเนื่องปรากฏในช่วงกว้าง เช่น จำนวนตัวแปรของลักษณะที่ไม่ต่อเนื่องกันนั้นค่อนข้างมาก
สามารถสรุปข้อสรุปหลายประการได้จากซีรี่ส์นี้ ตัวอย่างเช่น องค์ประกอบตรงกลางของชุดรูปแบบ (ค่ามัธยฐาน) อาจเป็นค่าประมาณของผลการวัดที่น่าจะเป็นไปได้มากที่สุด ครั้งแรกและ องค์ประกอบสุดท้ายชุดรูปแบบต่างๆ (เช่น องค์ประกอบตัวอย่างขั้นต่ำและสูงสุด) แสดงการแพร่กระจายขององค์ประกอบตัวอย่าง บางครั้งหากองค์ประกอบแรกหรือสุดท้ายแตกต่างจากตัวอย่างที่เหลือมาก องค์ประกอบเหล่านั้นจะถูกแยกออกจากผลการวัด โดยพิจารณาว่าค่าเหล่านี้ได้มาอันเป็นผลมาจากความล้มเหลวขั้นต้นบางประเภท เช่น เทคโนโลยี