ความน่าเชื่อถือทางสถิติถือเป็นสิ่งสำคัญในการฝึกคำนวณของ FCC ก่อนหน้านี้มีข้อสังเกตว่าสามารถเลือกตัวอย่างได้หลายตัวอย่างจากประชากรกลุ่มเดียวกัน:
หากเลือกอย่างถูกต้องตัวบ่งชี้เฉลี่ยและตัวบ่งชี้ของประชากรทั่วไปจะแตกต่างกันเล็กน้อยจากขนาดของข้อผิดพลาดในการเป็นตัวแทนโดยคำนึงถึงความน่าเชื่อถือที่ยอมรับได้
หากเลือกจากประชากรที่แตกต่างกัน ความแตกต่างระหว่างพวกเขาจะกลายเป็นเรื่องสำคัญ สถิติเป็นเรื่องเกี่ยวกับการเปรียบเทียบตัวอย่าง
หากพวกเขาแตกต่างกันอย่างไม่มีนัยสำคัญ ไม่มีหลักการ ไม่มีนัยสำคัญ กล่าวคือ จริงๆ แล้วพวกเขาอยู่ในประชากรทั่วไปกลุ่มเดียวกัน ความแตกต่างระหว่างพวกเขาเรียกว่าไม่น่าเชื่อถือทางสถิติ
มีความน่าเชื่อถือทางสถิติ ความแตกต่างของกลุ่มตัวอย่างคือกลุ่มตัวอย่างที่แตกต่างกันอย่างมีนัยสำคัญและเป็นพื้นฐาน กล่าวคือ เป็นของกลุ่มประชากรทั่วไปที่แตกต่างกัน
ที่ FCC การประเมินนัยสำคัญทางสถิติของความแตกต่างของตัวอย่างหมายถึงการแก้ปัญหาในทางปฏิบัติหลายประการ เช่น การแนะนำวิธีการสอน โปรแกรม ชุดแบบฝึกหัด แบบทดสอบใหม่ๆ การออกกำลังกายควบคุมมีความเกี่ยวข้องกับการทดสอบเชิงทดลอง ซึ่งควรแสดงให้เห็นว่ากลุ่มการทดสอบมีความแตกต่างจากกลุ่มควบคุมโดยพื้นฐาน ดังนั้นจึงใช้วิธีการทางสถิติพิเศษที่เรียกว่าเกณฑ์ที่มีนัยสำคัญทางสถิติ เพื่อตรวจหาการมีหรือไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างตัวอย่าง
เกณฑ์ทั้งหมดแบ่งออกเป็นสองกลุ่ม: แบบอิงพารามิเตอร์และแบบไม่มีพารามิเตอร์ เกณฑ์พาราเมตริกกำหนดให้ต้องมีกฎหมายการแจกแจงแบบปกติ เช่น นี่หมายถึงการกำหนดตัวบ่งชี้หลักของกฎปกติ - ค่าเฉลี่ยเลขคณิตและค่าเบี่ยงเบนมาตรฐาน เกณฑ์พาราเมตริกมีความแม่นยำและถูกต้องที่สุด การทดสอบแบบไม่อิงพารามิเตอร์จะขึ้นอยู่กับความแตกต่างอันดับ (ลำดับ) ระหว่างองค์ประกอบตัวอย่าง
ต่อไปนี้เป็นเกณฑ์หลักสำหรับนัยสำคัญทางสถิติที่ใช้ในการฝึก FCC: การทดสอบของนักเรียนและการทดสอบของฟิชเชอร์
การทดสอบของนักเรียนตั้งชื่อตามนักวิทยาศาสตร์ชาวอังกฤษ K. Gosset (นักเรียน - นามแฝง) ผู้ค้นพบวิธีนี้ การทดสอบของนักเรียนเป็นแบบพาราเมตริกและใช้เพื่อเปรียบเทียบค่าสัมบูรณ์ของกลุ่มตัวอย่าง ตัวอย่างอาจมีขนาดแตกต่างกัน
การทดสอบของนักเรียน ถูกกำหนดเช่นนี้
1. ค้นหาแบบทดสอบ Student โดยใช้สูตรต่อไปนี้:
ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่างที่เปรียบเทียบอยู่ที่ไหน เสื้อ 1, เสื้อ 2 - ข้อผิดพลาดของการเป็นตัวแทนที่ระบุตามตัวบ่งชี้ของกลุ่มตัวอย่างที่เปรียบเทียบ
2. การปฏิบัติที่ FCC ได้แสดงให้เห็นว่าสำหรับ งานกีฬาก็เพียงพอที่จะยอมรับความน่าเชื่อถือของบัญชี P = 0.95
ความน่าเชื่อถือในการนับ: P = 0.95 (a = 0.05) พร้อมจำนวนองศาอิสระ
k = n 1 + n 2 - 2 โดยใช้ตารางในภาคผนวก 4 เราค้นหาค่าของค่าขีด จำกัด ของเกณฑ์ ( ทีกรัม).
3. ขึ้นอยู่กับคุณสมบัติของกฎการกระจายแบบปกติ เกณฑ์ของนักเรียนจะเปรียบเทียบ t และ t gr
เราได้ข้อสรุป:
ถ้า t t gr ความแตกต่างระหว่างตัวอย่างที่เปรียบเทียบนั้นมีนัยสำคัญทางสถิติ
หากไม่ได้หมายความว่าความแตกต่างนั้นไม่มีนัยสำคัญทางสถิติ
สำหรับนักวิจัยในสาขา FCS การประเมินนัยสำคัญทางสถิติเป็นขั้นตอนแรกในการแก้ปัญหาที่เฉพาะเจาะจง ไม่ว่าตัวอย่างที่จะเปรียบเทียบจะแตกต่างกันโดยพื้นฐานหรือไม่มีพื้นฐานจากกันก็ตาม ขั้นตอนต่อไปคือการประเมินความแตกต่างนี้จากมุมมองการสอนซึ่งกำหนดโดยเงื่อนไขของงาน
ลองพิจารณาการประยุกต์ใช้แบบทดสอบนักเรียนโดยใช้ตัวอย่างเฉพาะ
ตัวอย่างที่ 2.14 กลุ่มตัวอย่าง 18 คนได้รับการประเมินอัตราการเต้นของหัวใจ (bpm) ก่อน x i และหลัง ใช่แล้วอุ่นเครื่อง
ประเมินประสิทธิผลของการวอร์มอัพตามอัตราการเต้นของหัวใจ ข้อมูลเบื้องต้นและการคำนวณแสดงไว้ในตาราง 2.30 และ 2.31 น.
ตารางที่ 2.30
การประมวลผลตัวบ่งชี้อัตราการเต้นของหัวใจก่อนอบอุ่นร่างกาย
ข้อผิดพลาดสำหรับทั้งสองกลุ่มเกิดขึ้นพร้อมกัน เนื่องจากขนาดตัวอย่างเท่ากัน (กลุ่มเดียวกันได้รับการศึกษาภายใต้เงื่อนไขที่ต่างกัน) และค่าเบี่ยงเบนมาตรฐานคือ s x = s y = 3 ครั้ง/นาที มาดูการกำหนดการทดสอบของนักเรียนกันดีกว่า:
เราตั้งค่าความน่าเชื่อถือของบัญชี: P = 0.95
จำนวนองศาอิสระ k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34 จากตารางในภาคผนวก 4 เราพบ ทีกรัม= 2,02.
อนุมานทางสถิติ. เนื่องจาก t = 11.62 และขอบเขต t gr = 2.02 จากนั้น 11.62 > 2.02 เช่น t > t gr ดังนั้นความแตกต่างระหว่างกลุ่มตัวอย่างจึงมีนัยสำคัญทางสถิติ
บทสรุปการสอน พบว่าในแง่ของอัตราการเต้นของหัวใจ ความแตกต่างระหว่างสถานะของกลุ่มก่อนและหลังการอบอุ่นร่างกายมีนัยสำคัญทางสถิติ กล่าวคือ สำคัญและเป็นพื้นฐาน ดังนั้น จากตัวบ่งชี้อัตราการเต้นของหัวใจ เราสามารถสรุปได้ว่าการวอร์มอัพมีประสิทธิผล
เกณฑ์ฟิชเชอร์เป็นพารามิเตอร์ ใช้ในการเปรียบเทียบอัตราการกระจายตัวของตัวอย่าง ซึ่งมักจะหมายถึงการเปรียบเทียบในแง่ของความเสถียรของประสิทธิภาพการกีฬาหรือความเสถียรของตัวบ่งชี้การทำงานและทางเทคนิคในทางปฏิบัติ วัฒนธรรมทางกายภาพและกีฬา ตัวอย่างอาจมีขนาดแตกต่างกัน
เกณฑ์ฟิชเชอร์ถูกกำหนดตามลำดับต่อไปนี้
1. ค้นหาเกณฑ์ฟิชเชอร์ F โดยใช้สูตร
โดยที่ คือความแปรปรวนของกลุ่มตัวอย่างที่เปรียบเทียบ
เงื่อนไขของเกณฑ์ฟิชเชอร์กำหนดไว้ในตัวเศษของสูตร เอฟ มีการกระจายตัวมากเช่น จำนวน F จะมากกว่าหนึ่งเสมอ
เราตั้งค่าความน่าเชื่อถือในการคำนวณ: P = 0.95 - และกำหนดจำนวนองศาอิสระสำหรับทั้งสองตัวอย่าง: k 1 = n 1 - 1, k 2 = n 2 - 1
เมื่อใช้ตารางในภาคผนวก 4 เราจะค้นหาค่าขีดจำกัดของเกณฑ์ F กรัม.
การเปรียบเทียบเกณฑ์ F และ F กรัมช่วยให้เราสามารถสรุปได้:
ถ้า F > F gr ความแตกต่างระหว่างกลุ่มตัวอย่างจะมีนัยสำคัญทางสถิติ
ถ้า F< F гр, то различие между выборками статически недостоверно.
ลองยกตัวอย่างที่เฉพาะเจาะจง
ตัวอย่าง 2.15. มาวิเคราะห์ผู้เล่นแฮนด์บอลสองกลุ่ม: x ฉัน (หมายเลข 1= 16 คน) และ y (p 2 = 18 คน) นักกีฬากลุ่มเหล่านี้ได้รับการศึกษาเกี่ยวกับเวลาขึ้นเครื่องเมื่อขว้างลูกบอลเข้าประตู
ตัวบ่งชี้แรงผลักเป็นประเภทเดียวกันหรือไม่?
ข้อมูลเบื้องต้นและการคำนวณพื้นฐานแสดงไว้ในตาราง 2.32 และ 2.33
ตารางที่ 2.32
การประมวลผลตัวบ่งชี้การขับไล่ของผู้เล่นแฮนด์บอลกลุ่มแรก
ให้เรากำหนดเกณฑ์ฟิชเชอร์:
ตามข้อมูลที่นำเสนอในตารางในภาคผนวก 6 เราพบ Fgr: Fgr = 2.4
ให้เราใส่ใจกับความจริงที่ว่าตารางในภาคผนวก 6 แสดงรายการจำนวนระดับความเป็นอิสระของการกระจายทั้งมากและน้อยเมื่อเข้าใกล้ จำนวนมากรุนแรงขึ้น ดังนั้นจำนวนองศาความเป็นอิสระของการกระจายตัวที่มากขึ้นตามลำดับนี้: 8, 9, 10, 11, 12, 14, 16, 20, 24 เป็นต้น และอันที่เล็กกว่า - 28, 29, 30, 40 , 50 ฯลฯ ง.
สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าเมื่อขนาดตัวอย่างเพิ่มขึ้น ความแตกต่างในการทดสอบ F จะลดลง และคุณสามารถใช้ค่าแบบตารางที่ใกล้เคียงกับข้อมูลต้นฉบับได้ ดังนั้น ในตัวอย่าง 2.15 =17 หายไป และเราสามารถนำค่าที่ใกล้เคียงที่สุด k = 16 ซึ่งเราจะได้ Fgr = 2.4
อนุมานทางสถิติ. เนื่องจากการทดสอบของฟิชเชอร์ F= 2.5 > F= 2.4 กลุ่มตัวอย่างจึงสามารถแยกแยะได้ทางสถิติ
บทสรุปการสอน ค่าของเวลาออกตัวเมื่อโยนบอลเข้าประตูสำหรับผู้เล่นแฮนด์บอลของทั้งสองกลุ่มแตกต่างกันอย่างมีนัยสำคัญ กลุ่มเหล่านี้ควรได้รับการพิจารณาที่แตกต่างกัน
การวิจัยเพิ่มเติมควรเปิดเผยสาเหตุของความแตกต่างนี้
ตัวอย่าง 2.20.(เกี่ยวกับความน่าเชื่อถือทางสถิติของกลุ่มตัวอย่าง ). คุณสมบัติของนักฟุตบอลดีขึ้นหรือไม่ หากเวลาจากการให้สัญญาณในการเตะบอลในช่วงเริ่มต้นการฝึกคือ x i และในตอนท้าย y i
ข้อมูลเบื้องต้นและการคำนวณพื้นฐานแสดงไว้ในตาราง 2.40 และ 2.41
ตารางที่ 2.40
ตัวบ่งชี้เวลาในการประมวลผลจากการให้สัญญาณในการตีลูกบอลเมื่อเริ่มฝึกซ้อม
ให้เราพิจารณาความแตกต่างระหว่างกลุ่มตัวบ่งชี้โดยใช้เกณฑ์ของนักเรียน:
ด้วยความน่าเชื่อถือ P = 0.95 และองศาอิสระ k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42 โดยใช้ตารางในภาคผนวก 4 เราพบ ทีกรัม= 2.02. เนื่องจาก t = 8.3 > ทีกรัม= 2.02 - ความแตกต่างมีนัยสำคัญทางสถิติ
ให้เราพิจารณาความแตกต่างระหว่างกลุ่มตัวบ่งชี้โดยใช้เกณฑ์ของฟิชเชอร์:
ตามตารางในภาคผนวก 2 โดยมีความน่าเชื่อถือ P = 0.95 และองศาอิสระ k = 22-1 = 21 ค่า F gr = 21 เนื่องจาก F = 1.53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.
อนุมานทางสถิติ. ตามค่าเฉลี่ยเลขคณิต ความแตกต่างระหว่างกลุ่มของตัวบ่งชี้มีนัยสำคัญทางสถิติ ในแง่ของการกระจายตัว (dispersion) ความแตกต่างระหว่างกลุ่มของตัวบ่งชี้นั้นไม่น่าเชื่อถือทางสถิติ
บทสรุปการสอนคุณสมบัติของนักฟุตบอลได้รับการปรับปรุงอย่างมีนัยสำคัญ แต่ควรให้ความสนใจกับความมั่นคงของคำให้การของเขา
การเตรียมงาน
ก่อนที่จะดำเนินงานห้องปฏิบัติการนี้ในสาขาวิชา” มาตรวิทยาการกีฬา» ถึงนักเรียนทุกคน กลุ่มการศึกษามีความจำเป็นต้องจัดตั้งทีมงานจำนวน 3-4 คนในแต่ละกลุ่มเพื่อร่วมกันมอบหมายงานงานห้องปฏิบัติการทั้งหมดให้เสร็จสิ้น
ในการเตรียมงาน อ่านส่วนที่เกี่ยวข้องของวรรณกรรมที่แนะนำ (ดูหัวข้อที่ 6 ของข้อมูล คำแนะนำระเบียบวิธี) และบันทึกการบรรยาย ศึกษาส่วนที่ 1 และ 2 สำหรับงานในห้องปฏิบัติการนี้ ตลอดจนการมอบหมายงาน (ส่วนที่ 4)
เตรียมแบบฟอร์มรายงานบนแผ่นมาตรฐาน กระดาษเขียนรูปแบบ A4 และใส่วัสดุที่จำเป็นสำหรับการทำงานลงไป
โดยในรายงานจะต้องมี :
หน้าชื่อเรื่องโดยระบุแผนก (UC และ TR) กลุ่มวิชา นามสกุล ชื่อจริง นามสกุลของนักศึกษา หมายเลขและชื่อผลงานห้องปฏิบัติการ วันที่สำเร็จการศึกษา ตลอดจนนามสกุล ปริญญาทางวิชาการ ตำแหน่งทางวิชาการ และตำแหน่ง ครูรับงาน;
เป้าหมายของงาน
สูตรด้วย ค่าตัวเลขอธิบายผลการคำนวณขั้นกลางและขั้นสุดท้าย
ตารางค่าที่วัดและคำนวณได้
จำเป็นตามที่ได้รับมอบหมาย วัสดุกราฟิก;
ข้อสรุปโดยย่อเกี่ยวกับผลลัพธ์ของแต่ละขั้นตอนของการมอบหมายงานและงานที่ทำโดยทั่วไป
กราฟและตารางทั้งหมดถูกวาดอย่างระมัดระวังโดยใช้เครื่องมือวาดภาพ กราฟิกแบบมีเงื่อนไขและ การกำหนดตัวอักษรต้องเป็นไปตามมาตรฐาน GOST อนุญาตให้จัดทำรายงานโดยใช้เทคโนโลยีคอมพิวเตอร์ได้
การมอบหมายงาน
ก่อนที่จะดำเนินการวัดทั้งหมด สมาชิกในทีมแต่ละคนจะต้องศึกษากฎการใช้งาน เกมกีฬาลูกดอกที่ให้ไว้ในภาคผนวก 7 ซึ่งจำเป็นสำหรับการดำเนินการวิจัยในขั้นตอนต่อไปนี้
ระยะที่ 1 ของการวิจัย“การศึกษาผลการตีเป้าหมายของเกมกีฬาปาเป้าโดยสมาชิกแต่ละคนในทีมเพื่อให้เป็นไปตามกฎหมายการกระจายสินค้าตามปกติตามหลักเกณฑ์ χ 2เพียร์สันและเกณฑ์สามซิกมา"
1. วัด (ทดสอบ) ความเร็ว (ส่วนตัว) ของคุณและการประสานงานของการกระทำ ด้วยการขว้างปาเป้า 30-40 ครั้งไปที่เป้าหมายวงกลมในเกมกีฬาปาเป้า
2. ผลการวัด (การทดสอบ) x ฉัน(มีแว่น) จัดเรียงตามแบบ ซีรีย์การเปลี่ยนแปลงและเข้าไปในตารางที่ 4.1 (คอลัมน์ , ทำทั้งหมด การคำนวณที่จำเป็นกรอกตารางที่จำเป็นและสรุปผลที่เหมาะสมเกี่ยวกับการปฏิบัติตามผลการแจกแจงเชิงประจักษ์กับกฎการแจกแจงแบบปกติ โดยการเปรียบเทียบกับการคำนวณ ตาราง และข้อสรุปที่คล้ายกันของตัวอย่าง 2.12 ซึ่งให้ไว้ในส่วนที่ 2 ของแนวทางเหล่านี้ในหน้า 7 -10
ตารางที่ 4.1
ความสอดคล้องของความเร็วและการประสานงานของการกระทำของอาสาสมัครกับกฎหมายการกระจายแบบปกติ
เลขที่ | โค้งมน | |||||||||
… | ||||||||||
… | ||||||||||
ทั้งหมด |
II – ขั้นตอนการวิจัย
“การประเมินตัวบ่งชี้เฉลี่ยของประชากรทั่วไปในการโจมตีเป้าหมายของเกมกีฬาปาเป้าของนักเรียนทุกคนในกลุ่มเรียนโดยพิจารณาจากผลการวัดของสมาชิกของทีมเดียว”
ประเมินตัวบ่งชี้เฉลี่ยความเร็วและการประสานงานของการกระทำของนักเรียนทุกคนในกลุ่มเรียน (ตามรายชื่อกลุ่มเรียนในนิตยสารชั้นเรียน) โดยพิจารณาจากผลการตีเป้าหมายของเกมกีฬาปาเป้าของสมาชิกในทีมทุกคนที่ได้รับ ในขั้นตอนแรกของการวิจัยงานห้องปฏิบัติการนี้
1. บันทึกผลการวัดความเร็วและการประสานงานของการกระทำ เมื่อขว้างปาเป้าไปที่เป้าหมายวงกลมในเกมกีฬา ปาเป้าของสมาชิกทุกคนในทีมของคุณ (2 - 4 คน) ซึ่งเป็นตัวอย่างผลการวัดจากประชากรทั่วไป (ผลการวัดของนักเรียนทุกคนในกลุ่มเรียน - เช่น จำนวน 15 คน) โดยระบุในคอลัมน์ที่สองและสาม ตารางที่ 4.2
ตารางที่ 4.2
ตัวชี้วัดการประมวลผลความเร็วและการประสานงานของการกระทำ
สมาชิกกองพลน้อย
เลขที่ | ||||||
… | ||||||
… | ||||||
ทั้งหมด |
ในตาราง 4.2 ภายใต้ ควรจะเข้าใจ , คะแนนเฉลี่ยที่ตรงกัน (ดูผลการคำนวณในตารางที่ 4.1) สมาชิกในทีมของคุณ ( , ได้รับในขั้นตอนแรกของการวิจัย ควรสังเกตว่า โดยปกติ, ตาราง 4.2 ประกอบด้วยค่าเฉลี่ยที่คำนวณได้ของผลการวัดที่ได้รับโดยสมาชิกคนหนึ่งในทีมในขั้นตอนแรกของการวิจัย เนื่องจากโอกาสที่ผลการวัดของสมาชิกในทีมแต่ละคนจะตรงกันนั้นมีน้อยมาก แล้ว, ตามกฎแล้วค่าต่างๆ ในคอลัมน์ ตารางที่ 4.2 สำหรับแต่ละแถว - เท่ากับ 1 ก ในบรรทัด “ยอดรวม " คอลัมน์ " " ถูกเขียน จำนวนสมาชิกในทีมของคุณ
2. ทำการคำนวณที่จำเป็นทั้งหมดเพื่อกรอกตาราง 4.2 รวมถึงการคำนวณและข้อสรุปอื่น ๆ ที่คล้ายกับการคำนวณและข้อสรุปของตัวอย่าง 2.13 ที่ให้ไว้ในส่วนที่ 2 ของสิ่งนี้ การพัฒนาระเบียบวิธีในหน้า 13-14. ควรคำนึงถึงเมื่อคำนวณข้อผิดพลาดในการเป็นตัวแทน "ม" มีความจำเป็นต้องใช้สูตร 2.4 ที่ให้ไว้ในหน้า 13 ของการพัฒนาวิธีการนี้เนื่องจากกลุ่มตัวอย่างมีขนาดเล็ก (n และจำนวนองค์ประกอบของประชากรทั่วไป N เป็นที่รู้จักและเท่ากับจำนวนนักเรียนในกลุ่มการศึกษา ตามรายชื่อวารสารของกลุ่มศึกษา
III – ขั้นตอนการวิจัย
การประเมินประสิทธิผลของการวอร์มอัพตามตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” โดยสมาชิกในทีมแต่ละคนโดยใช้แบบทดสอบของนักเรียน
เพื่อประเมินประสิทธิผลของการวอร์มอัพสำหรับการขว้างลูกดอกไปยังเป้าหมายของเกมกีฬา "ปาเป้า" ซึ่งดำเนินการในขั้นตอนแรกของการวิจัยของงานในห้องปฏิบัติการนี้โดยสมาชิกแต่ละคนในทีมตามตัวบ่งชี้ "ความเร็วและ การประสานงานของการกระทำ" โดยใช้เกณฑ์ของนักเรียน - เกณฑ์พาราเมตริกสำหรับความน่าเชื่อถือทางสถิติของกฎการกระจายเชิงประจักษ์กับกฎการกระจายแบบปกติ
2. ความแตกต่าง และอาร์เอ็มเอส , ผลการวัดตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” ตามผลการวอร์มอัพ, กำหนดไว้ในตาราง 4.3 (ดูการคำนวณที่คล้ายกันที่ให้ไว้ทันทีหลังจากตาราง 2.30 ของตัวอย่าง 2.14 ในหน้า 16 ของการพัฒนาวิธีการนี้)
3. ทีมงานแต่ละคน วัด (ทดสอบ) ความเร็ว (ส่วนตัว) ของคุณและการประสานงานของการกระทำหลังจากการวอร์มอัพ
5. ทำการคำนวณโดยเฉลี่ย ความแตกต่าง และอาร์เอ็มเอส ,ผลการวัดตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" หลังจากการอุ่นเครื่อง กำหนดไว้ในตาราง 4.4 เขียนผลการวัดโดยรวมตามผลการอุ่นเครื่อง (ดูการคำนวณที่คล้ายกันที่ให้ไว้ทันทีหลังจากตาราง 2.31 ของตัวอย่าง 2.14 ในหน้า 17 ของการพัฒนาวิธีการนี้)
6. ทำการคำนวณและข้อสรุปที่จำเป็นทั้งหมดคล้ายกับการคำนวณและข้อสรุปของตัวอย่างที่ 2.14 ที่ให้ไว้ในส่วนที่ 2 ของการพัฒนาวิธีการนี้ในหน้า 16-17 ควรคำนึงถึงเมื่อคำนวณข้อผิดพลาดในการเป็นตัวแทน "ม" จำเป็นต้องใช้สูตร 2.1 ที่ให้ไว้ในหน้า 12 ของการพัฒนาวิธีการนี้เนื่องจากตัวอย่างคือ n และจำนวนองค์ประกอบในประชากร N ( ไม่ทราบ
IV – ขั้นตอนการวิจัย
การประเมินความสม่ำเสมอ (ความมั่นคง) ของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" ของสมาชิกในทีมสองคนโดยใช้เกณฑ์ฟิชเชอร์
ประเมินความสม่ำเสมอ (ความเสถียร) ของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" ของสมาชิกในทีมสองคนโดยใช้เกณฑ์ฟิชเชอร์ตามผลการวัดที่ได้รับในขั้นตอนที่สามของการวิจัยในงานห้องปฏิบัติการนี้
ในการทำเช่นนี้คุณต้องทำสิ่งต่อไปนี้
การใช้ข้อมูลจากตาราง 4.3 และ 4.4 ผลลัพธ์ของการคำนวณความแปรปรวนจากตารางเหล่านี้ที่ได้รับในขั้นตอนที่สามของการวิจัยตลอดจนวิธีการคำนวณและการใช้เกณฑ์ฟิชเชอร์เพื่อประเมินความสม่ำเสมอ (ความมั่นคง) ของตัวบ่งชี้กีฬาที่ให้ไว้ใน ตัวอย่าง 2.15 ในหน้า 18-19 ของการพัฒนาวิธีการนี้ ให้สรุปผลทางสถิติและการสอนที่เหมาะสม
V – ขั้นตอนการวิจัย
การประเมินกลุ่มตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” ของสมาชิกในทีมหนึ่งคนก่อนและหลังการวอร์มอัพ
ลองพิจารณาดู ตัวอย่างทั่วไปการประยุกต์วิธีการทางสถิติในการแพทย์ ผู้สร้างยาแนะนำให้เพิ่มการขับปัสสาวะตามสัดส่วนของขนาดยาที่ได้รับ เพื่อทดสอบสมมติฐานนี้ พวกเขาให้อาสาสมัคร 5 คนในขนาดยาที่แตกต่างกัน
จากผลการสังเกต กราฟของการขับปัสสาวะเทียบกับขนาดยาจะถูกพล็อต (รูปที่ 1.2A) การพึ่งพาอาศัยกันสามารถมองเห็นได้ด้วยตาเปล่า นักวิจัยแสดงความยินดีกับการค้นพบนี้และโลกของยาขับปัสสาวะชนิดใหม่
ในความเป็นจริง ข้อมูลช่วยให้เราระบุได้อย่างน่าเชื่อถือว่าอาสาสมัครทั้งห้าคนนี้มีการขับปัสสาวะตามขนาดยา ความจริงที่ว่าการพึ่งพาอาศัยกันนี้จะปรากฏในทุกคนที่เสพยานั้นไม่มีอะไรมากไปกว่าข้อสันนิษฐาน
จี
กับ
ชีวิต ไม่สามารถพูดได้ว่ามันไม่มีโคมลอย - ไม่เช่นนั้นทำไมต้องทำการทดลอง?
แต่ยาก็ขายไป ทั้งหมด ผู้คนมากขึ้นรับไปโดยหวังว่าจะเพิ่มการปัสสาวะออก แล้วเราเห็นอะไร? เราเห็นรูปที่ 1.2B ซึ่งบ่งชี้ว่าไม่มีความเชื่อมโยงระหว่างขนาดยากับการขับปัสสาวะ วงกลมสีดำบ่งบอกถึงข้อมูลจากการศึกษาต้นฉบับ สถิติมีวิธีการที่ช่วยให้เราประเมินความเป็นไปได้ที่จะได้รับตัวอย่างที่ "ไม่ได้เป็นตัวแทน" และทำให้เกิดความสับสนอย่างแท้จริง ปรากฎว่าหากไม่มีความสัมพันธ์ระหว่างการขับปัสสาวะกับขนาดยา จะสังเกต "การพึ่งพา" ที่เกิดขึ้นในการทดลองประมาณ 5 จาก 1,000 ครั้ง ดังนั้นใน ในกรณีนี้นักวิจัยโชคไม่ดีเลย แม้ว่าพวกเขาจะใช้วิธีการทางสถิติขั้นสูงสุด แต่ก็ยังไม่สามารถป้องกันพวกเขาจากการทำผิดพลาดได้
เราให้ตัวอย่างที่สมมติขึ้นนี้ แต่ไม่ไกลจากความเป็นจริงเลย โดยไม่ชี้ให้เห็นถึงความไร้ประโยชน์
ความเป็นมาของสถิติ เขาพูดถึงเรื่องอื่นเกี่ยวกับลักษณะความน่าจะเป็นของข้อสรุปของเธอ จากการใช้วิธีการทางสถิติ เราไม่ได้รับความจริงขั้นสุดท้าย แต่เป็นเพียงการประมาณความน่าจะเป็นของสมมติฐานเฉพาะเท่านั้น นอกจากนี้ วิธีการทางสถิติแต่ละวิธียังใช้แบบจำลองทางคณิตศาสตร์ของตัวเองและผลลัพธ์ที่ได้ก็ถูกต้องจนแบบจำลองนี้สอดคล้องกับความเป็นจริง
เพิ่มเติมในหัวข้อความน่าเชื่อถือและความสำคัญทางสถิติ:
- ความแตกต่างที่มีนัยสำคัญทางสถิติในตัวชี้วัดคุณภาพชีวิต
- ประชากรทางสถิติ ลักษณะทางบัญชี แนวคิดการวิจัยต่อเนื่องและคัดเลือก ข้อกำหนดสำหรับข้อมูลทางสถิติและการใช้เอกสารทางบัญชีและการรายงาน
- เชิงนามธรรม. การศึกษาความน่าเชื่อถือของตัวชี้วัด TONOMETER สำหรับการวัดความดันภายในลูกตาผ่านเปลือกตา 2561, 2561
สมมติฐานมีการทดสอบโดยใช้ การวิเคราะห์ทางสถิติ. พบนัยสำคัญทางสถิติโดยใช้ค่า P ซึ่งสอดคล้องกับความน่าจะเป็นของเหตุการณ์ที่กำหนด โดยสมมติว่าข้อความบางข้อความ (สมมติฐานว่าง) เป็นจริง หากค่า P น้อยกว่าระดับนัยสำคัญทางสถิติที่ระบุ (ปกติคือ 0.05) ผู้ทดลองสามารถสรุปได้อย่างปลอดภัยว่าสมมติฐานว่างเป็นเท็จ และดำเนินการพิจารณาสมมติฐานทางเลือกต่อไป เมื่อใช้การทดสอบของนักเรียน คุณสามารถคำนวณค่า P และกำหนดนัยสำคัญของชุดข้อมูลสองชุดได้
ขั้นตอน
ส่วนที่ 1
การตั้งค่าการทดสอบ- โดยทั่วไปสมมติฐานว่าง (H 0) จะระบุว่าไม่มีความแตกต่างระหว่างชุดข้อมูลสองชุด ตัวอย่างเช่น นักเรียนที่อ่านเนื้อหาก่อนชั้นเรียนจะไม่ได้รับเกรดที่สูงขึ้น
- สมมติฐานทางเลือก (H a) ตรงกันข้ามกับสมมติฐานว่างและเป็นข้อความที่ต้องได้รับการสนับสนุนจากข้อมูลการทดลอง ตัวอย่างเช่น นักเรียนที่อ่านเนื้อหาก่อนชั้นเรียนจะได้เกรดที่สูงขึ้น
-
กำหนดระดับนัยสำคัญเพื่อกำหนดว่าการกระจายข้อมูลจะต้องแตกต่างจากปกติมากน้อยเพียงใดจึงจะถือเป็นผลลัพธ์ที่มีนัยสำคัญ ระดับความสำคัญ (เรียกอีกอย่างว่า α (\displaystyle \alpha )-level) คือเกณฑ์ที่คุณกำหนดสำหรับนัยสำคัญทางสถิติ หากค่า P น้อยกว่าหรือเท่ากับระดับนัยสำคัญ ข้อมูลจะถือว่ามีนัยสำคัญทางสถิติ
- ตามกฎแล้ว ระดับนัยสำคัญ (value α (\displaystyle \alpha )) มีค่าเป็น 0.05 ซึ่งในกรณีนี้ความน่าจะเป็นที่จะตรวจพบความแตกต่างแบบสุ่มระหว่างชุดข้อมูลที่ต่างกันจะอยู่ที่ 5% เท่านั้น
- ยิ่งระดับนัยสำคัญสูงขึ้น (และด้วยเหตุนี้ ค่า P น้อยลง) ผลลัพธ์ก็จะยิ่งน่าเชื่อถือมากขึ้นเท่านั้น
- หากคุณต้องการผลลัพธ์ที่เชื่อถือได้มากขึ้น ให้ลดค่า P ลงเหลือ 0.01 โดยทั่วไปแล้ว ค่า P ที่ต่ำกว่าจะใช้ในการผลิตเมื่อจำเป็นต้องระบุข้อบกพร่องในผลิตภัณฑ์ ในกรณีนี้ จำเป็นต้องมีความน่าเชื่อถือสูงเพื่อให้แน่ใจว่าชิ้นส่วนทั้งหมดทำงานได้ตามที่คาดหวัง
- สำหรับการทดลองสมมุติฐานส่วนใหญ่ ระดับนัยสำคัญที่ 0.05 ก็เพียงพอแล้ว
-
ตัดสินใจว่าจะใช้เกณฑ์ใด:ด้านเดียวหรือสองด้าน ข้อสันนิษฐานประการหนึ่งในการทดสอบ Student t คือข้อมูลมีการกระจายตามปกติ การแจกแจงแบบปกติคือเส้นโค้งรูประฆังที่มีจำนวนผลลัพธ์สูงสุดตรงกลางเส้นโค้ง การทดสอบค่าทีของนักเรียนเป็นวิธีการทดสอบข้อมูลทางคณิตศาสตร์ที่ช่วยให้คุณระบุได้ว่าข้อมูลอยู่นอกการแจกแจงแบบปกติหรือไม่ (มากกว่า น้อยกว่า หรืออยู่ "ส่วนท้าย" ของเส้นโค้ง)
- หากคุณไม่แน่ใจว่าข้อมูลอยู่เหนือหรือต่ำกว่าค่ากลุ่มควบคุม ให้ใช้การทดสอบแบบสองด้าน สิ่งนี้จะช่วยให้คุณสามารถกำหนดความสำคัญได้ทั้งสองทิศทาง
- หากคุณรู้ว่าข้อมูลอาจอยู่นอกการแจกแจงแบบปกติไปในทิศทางใด ให้ใช้การทดสอบแบบด้านเดียว ในตัวอย่างข้างต้น เราคาดว่าเกรดของนักเรียนจะเพิ่มขึ้น ดังนั้นจึงสามารถใช้การทดสอบแบบด้านเดียวได้
-
กำหนดขนาดตัวอย่างโดยใช้กำลังทางสถิติกำลังทางสถิติของการศึกษาคือความน่าจะเป็นที่จะได้ผลลัพธ์ที่คาดหวังเมื่อพิจารณาจากขนาดตัวอย่าง เกณฑ์พลังงานทั่วไป (หรือ β) คือ 80% การวิเคราะห์อำนาจทางสถิติโดยไม่มีข้อมูลใดๆ มาก่อนอาจเป็นเรื่องที่ท้าทาย เนื่องจากต้องใช้ข้อมูลบางอย่างเกี่ยวกับค่าเฉลี่ยที่คาดหวังในแต่ละกลุ่มของข้อมูลและค่าเบี่ยงเบนมาตรฐาน ใช้เครื่องคำนวณการวิเคราะห์พลังงานออนไลน์เพื่อกำหนดขนาดตัวอย่างที่เหมาะสมที่สุดสำหรับข้อมูลของคุณ
- โดยทั่วไปแล้ว นักวิจัยจะดำเนินการศึกษานำร่องขนาดเล็กที่ให้ข้อมูลสำหรับการวิเคราะห์กำลังทางสถิติ และกำหนดขนาดตัวอย่างที่จำเป็นสำหรับการศึกษาที่ใหญ่และสมบูรณ์ยิ่งขึ้น
- หากคุณไม่สามารถทำการศึกษานำร่องได้ ให้พยายามประมาณค่าเฉลี่ยที่เป็นไปได้โดยพิจารณาจากวรรณกรรมและผลลัพธ์ของผู้อื่น วิธีนี้อาจช่วยให้คุณกำหนดขนาดตัวอย่างที่เหมาะสมที่สุดได้
ส่วนที่ 2
คำนวณค่าเบี่ยงเบนมาตรฐาน-
เขียนสูตรสำหรับส่วนเบี่ยงเบนมาตรฐาน.ค่าเบี่ยงเบนมาตรฐานจะแสดงว่ามีสเปรดในข้อมูลมากน้อยเพียงใด ช่วยให้คุณสามารถสรุปได้ว่าข้อมูลที่ได้รับจากตัวอย่างบางกลุ่มมีความใกล้เคียงกันเพียงใด เมื่อดูเผินๆ สูตรดูเหมือนค่อนข้างซับซ้อน แต่คำอธิบายด้านล่างจะช่วยให้คุณเข้าใจได้ สูตรก็มี มุมมองถัดไป: s = √∑((x i – µ) 2 /(N – 1)).
- s - ส่วนเบี่ยงเบนมาตรฐาน
- เครื่องหมาย ∑ ระบุว่าควรเพิ่มข้อมูลทั้งหมดที่ได้รับจากตัวอย่าง
- x i สอดคล้องกับค่า i-th นั่นคือผลลัพธ์แยกต่างหากที่ได้รับ
- µ คือค่าเฉลี่ยสำหรับกลุ่มที่กำหนด
- น- จำนวนทั้งหมดข้อมูลในตัวอย่าง
-
หาค่าเฉลี่ยในแต่ละกลุ่มในการคำนวณค่าเบี่ยงเบนมาตรฐาน คุณต้องหาค่าเฉลี่ยของแต่ละกลุ่มการศึกษาก่อน ค่าเฉลี่ยแสดงด้วยตัวอักษรกรีก µ (mu) หากต้องการค้นหาค่าเฉลี่ย เพียงเพิ่มค่าผลลัพธ์ทั้งหมดแล้วหารด้วยจำนวนข้อมูล (ขนาดตัวอย่าง)
- ตัวอย่างเช่น หากต้องการค้นหาเกรดเฉลี่ยของกลุ่มนักเรียนที่เรียนก่อนเข้าเรียน ให้พิจารณาชุดข้อมูลขนาดเล็ก เพื่อความง่าย เราใช้ชุดที่มีห้าจุด: 90, 91, 85, 83 และ 94
- มาบวกค่าทั้งหมดเข้าด้วยกัน: 90 + 91 + 85 + 83 + 94 = 443
- ลองหารผลรวมด้วยจำนวนค่า N = 5: 443/5 = 88.6
- ดังนั้นค่าเฉลี่ยของกลุ่มนี้คือ 88.6
-
ลบแต่ละค่าที่ได้รับจากค่าเฉลี่ยขั้นตอนต่อไปคือการคำนวณความแตกต่าง (x i – µ) เมื่อต้องการทำเช่นนี้ ให้ลบแต่ละค่าที่ได้รับจากค่าเฉลี่ยที่พบ ในตัวอย่างของเรา เราจำเป็นต้องค้นหาความแตกต่างห้าประการ:
- (90 – 88.6), (91 – 88.6), (85 – 88.6), (83 – 88.6) และ (94 – 88.6)
- เป็นผลให้เราได้รับค่าต่อไปนี้: 1.4, 2.4, -3.6, -5.6 และ 5.4
-
ยกกำลังสองแต่ละค่าที่ได้รับแล้วบวกเข้าด้วยกันแต่ละปริมาณที่เพิ่งค้นพบควรเป็นกำลังสอง ขั้นตอนนี้จะลบค่าลบทั้งหมด หากหลังจากขั้นตอนนี้คุณยังมีเลขติดลบ แสดงว่าคุณลืมยกกำลังสอง
- จากตัวอย่างของเรา เราได้ 1.96, 5.76, 12.96, 31.36 และ 29.16
- เราบวกค่าผลลัพธ์: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2
-
หารด้วยขนาดตัวอย่างลบ 1ในสูตรจะหารผลรวมด้วย N – 1 เนื่องจากเราไม่ได้คำนึงถึงประชากรทั่วไป แต่นำตัวอย่างนักเรียนทั้งหมดมาประเมิน
- ลบ: N – 1 = 5 – 1 = 4
- หาร: 81.2/4 = 20.3
-
ลบ รากที่สอง. หลังจากที่คุณหารผลรวมด้วยขนาดตัวอย่างลบด้วย 1 แล้ว ให้หารากที่สองของค่าที่พบ นี่เป็นขั้นตอนสุดท้ายในการคำนวณค่าเบี่ยงเบนมาตรฐาน มีโปรแกรมทางสถิติที่หลังจากป้อนข้อมูลเริ่มต้นแล้วให้ทำการคำนวณที่จำเป็นทั้งหมด
- ในตัวอย่างของเรา ค่าเบี่ยงเบนมาตรฐานของเกรดของนักเรียนที่อ่านเนื้อหาก่อนเข้าเรียนคือ s =√20.3 = 4.51
ส่วนที่ 3
กำหนดความสำคัญ-
คำนวณความแปรปรวนระหว่างข้อมูลทั้งสองกลุ่มก่อนขั้นตอนนี้ เราได้ดูตัวอย่างสำหรับข้อมูลเพียงกลุ่มเดียวเท่านั้น หากคุณต้องการเปรียบเทียบสองกลุ่ม คุณควรดึงข้อมูลจากทั้งสองกลุ่มอย่างชัดเจน คำนวณค่าเบี่ยงเบนมาตรฐานสำหรับข้อมูลกลุ่มที่สอง แล้วหาความแปรปรวนระหว่างข้อมูลทั้งสอง กลุ่มทดลอง. ความแปรปรวนคำนวณโดยใช้สูตรต่อไปนี้: s d = √((s 1 /N 1) + (s 2 /N 2))
กำหนดสมมติฐานของคุณขั้นตอนแรกในการประเมินนัยสำคัญทางสถิติคือการเลือกคำถามที่คุณต้องการตอบและกำหนดสมมติฐาน สมมติฐานคือข้อความเกี่ยวกับข้อมูลการทดลอง การกระจายตัว และคุณสมบัติ สำหรับการทดลองใดๆ ก็ตาม จะมีทั้งสมมติฐานว่างและสมมติฐานทางเลือก โดยทั่วไป คุณจะต้องเปรียบเทียบข้อมูลสองชุดเพื่อดูว่าคล้ายกันหรือต่างกัน
ถ้าคุณไม่ดำเนินการ วอร์ดจะไม่มีประโยชน์ (โชตะ รุสตาเวลี)
คำศัพท์และแนวคิดพื้นฐานของสถิติทางการแพทย์
ในบทความนี้เราจะนำเสนอบางส่วน แนวคิดหลักสถิติที่เกี่ยวข้องกับการวิจัยทางการแพทย์ มีการกล่าวถึงข้อกำหนดโดยละเอียดในบทความที่เกี่ยวข้อง
การเปลี่ยนแปลง
คำนิยาม.ระดับการกระจายตัวของข้อมูล (ค่าแอตทริบิวต์) ในช่วงของค่า
ความน่าจะเป็น
คำนิยาม. ความน่าจะเป็นคือระดับความเป็นไปได้ที่เหตุการณ์บางอย่างจะเกิดขึ้นภายใต้เงื่อนไขบางประการ
ตัวอย่าง. ให้เราอธิบายคำจำกัดความของคำในประโยค “ความน่าจะเป็นที่จะหายเมื่อใช้ยา Arimidex คือ 70%” เหตุการณ์คือ “การฟื้นตัวของผู้ป่วย” สภาพ “ผู้ป่วยได้รับยา Arimidex” ระดับความเป็นไปได้คือ 70% (พูดโดยคร่าวๆ จากผู้ที่รับยา Arimidex 100 คน หายได้ 70 คน)
ความน่าจะเป็นสะสม
คำนิยาม.ความน่าจะเป็นสะสมของการรอดชีวิต ณ เวลา t เท่ากับสัดส่วนของผู้ป่วยที่ยังมีชีวิตอยู่ในขณะนั้น
ตัวอย่าง. หากกล่าวกันว่าความน่าจะเป็นสะสมของการรอดชีวิตหลังจากการรักษาเป็นเวลาห้าปีคือ 0.7 นั่นหมายความว่ากลุ่มผู้ป่วยที่อยู่ระหว่างการพิจารณา 70% ของจำนวนเริ่มต้นยังมีชีวิตอยู่ และ 30% เสียชีวิต กล่าวอีกนัยหนึ่ง ในทุกๆ ร้อยคน มีผู้เสียชีวิต 30 รายภายใน 5 ปีแรก
เวลาก่อนงาน
คำนิยาม.เวลาก่อนเหตุการณ์คือเวลาที่แสดงในบางหน่วยที่ผ่านไปจากจุดเริ่มแรกจนกระทั่งเกิดเหตุการณ์บางอย่างขึ้น
คำอธิบาย. หน่วยเวลาในการวิจัยทางการแพทย์คือ วัน เดือน และปี
ตัวอย่างทั่วไปของเวลาเริ่มต้น:
เริ่มติดตามผู้ป่วย
การผ่าตัดรักษา
ตัวอย่างเหตุการณ์ทั่วไปที่พิจารณา:
ความก้าวหน้าของโรค
การเกิดขึ้นของการกำเริบของโรค
ผู้ป่วยเสียชีวิต
ตัวอย่าง
คำนิยาม.สัดส่วนของประชากรที่ได้รับจากการคัดเลือก
จากผลการวิเคราะห์ตัวอย่าง จะมีการหาข้อสรุปเกี่ยวกับประชากรทั้งหมด ซึ่งจะใช้ได้เฉพาะในกรณีที่การเลือกเป็นการสุ่มเท่านั้น เนื่องจากเป็นไปไม่ได้ในทางปฏิบัติที่จะสุ่มเลือกจากประชากรกลุ่มหนึ่ง จึงควรพยายามให้แน่ใจว่ากลุ่มตัวอย่างอย่างน้อยจะเป็นตัวแทนของประชากร
ตัวอย่างที่ขึ้นต่อกันและเป็นอิสระ
คำนิยาม.ตัวอย่างที่คัดเลือกอาสาสมัครที่ศึกษาโดยแยกจากกัน อีกทางเลือกหนึ่งนอกเหนือจากตัวอย่างอิสระคือตัวอย่างที่ต้องพึ่งพา (เชื่อมต่อและจับคู่)
สมมติฐาน
สมมติฐานสองด้านและด้านเดียว
ก่อนอื่น ให้เราอธิบายการใช้คำว่าสมมติฐานในสถิติ
วัตถุประสงค์ของการวิจัยส่วนใหญ่คือเพื่อทดสอบความจริงของข้อความบางข้อความ วัตถุประสงค์ของการทดสอบยาส่วนใหญ่มักเพื่อทดสอบสมมติฐานที่ว่ายาตัวหนึ่งมีประสิทธิผลมากกว่ายาอีกตัวหนึ่ง (เช่น Arimidex มีประสิทธิภาพมากกว่า Tamoxifen)
เพื่อให้มั่นใจถึงความเข้มงวดของการศึกษา ข้อความที่ได้รับการยืนยันจะแสดงออกมาทางคณิตศาสตร์ ตัวอย่างเช่น ถ้า A คือจำนวนปีที่ผู้ป่วยที่รับประทานยา Arimidex จะมีชีวิตอยู่ และ T คือจำนวนปีที่ผู้ป่วยที่รับประทานยา Tamoxifen จะมีชีวิตอยู่ ดังนั้นสมมติฐานที่จะทดสอบสามารถเขียนเป็น A>T
คำนิยาม.สมมติฐานเรียกว่าสองด้านหากประกอบด้วยปริมาณสองปริมาณเท่ากัน
ตัวอย่างของสมมติฐานสองด้าน: A=T
คำนิยาม. สมมติฐานเรียกว่าด้านเดียว (1 ด้าน) หากประกอบด้วยความไม่เท่าเทียมกันของปริมาณสองปริมาณ
ตัวอย่างสมมติฐานฝ่ายเดียว:
ข้อมูลแบบไดโคโตมัส (ไบนารี)
คำนิยาม.ข้อมูลที่แสดงด้วยค่าทางเลือกที่ถูกต้องเพียงสองค่าเท่านั้น
ตัวอย่าง: ผู้ป่วย "แข็งแรง" - "ป่วย" อาการบวมน้ำ "เป็น" - "ไม่"
ช่วงความเชื่อมั่น
คำนิยาม.ช่วงความเชื่อมั่นของปริมาณคือช่วงรอบๆ ค่าของปริมาณซึ่งมูลค่าที่แท้จริงของปริมาณนั้นอยู่ (โดยมีระดับความเชื่อมั่นที่แน่นอน)
ตัวอย่าง. ให้ปริมาณที่ศึกษาคือจำนวนผู้ป่วยต่อปี โดยเฉลี่ยแล้ว ตัวเลขคือ 500 และช่วงความเชื่อมั่น 95% คือ (350, 900) ซึ่งหมายความว่า มีแนวโน้มมากที่สุด (ที่มีความน่าจะเป็น 95%) อย่างน้อย 350 คนและไม่เกิน 900 คนจะติดต่อคลินิกในระหว่างปี
การกำหนด ตัวย่อที่ใช้กันทั่วไปคือ CI 95% คือช่วงความเชื่อมั่นที่มีระดับความเชื่อมั่น 95%
ความน่าเชื่อถือ นัยสำคัญทางสถิติ (ระดับ P)
คำนิยาม.นัยสำคัญทางสถิติของผลลัพธ์คือการวัดความเชื่อมั่นใน "ความจริง"
การวิจัยใด ๆ ดำเนินการบนพื้นฐานของวัตถุเพียงบางส่วนเท่านั้น การศึกษาประสิทธิผลของยาไม่ได้ดำเนินการบนพื้นฐานของผู้ป่วยทุกคนในโลก แต่เฉพาะกับผู้ป่วยบางกลุ่มเท่านั้น (เป็นไปไม่ได้เลยที่จะดำเนินการวิเคราะห์บนพื้นฐานของผู้ป่วยทุกราย)
สมมติว่าผลการวิเคราะห์ได้ข้อสรุปบางอย่าง (เช่น การใช้ Arimidex เป็นวิธีการรักษาที่เหมาะสมจะมีประสิทธิภาพมากกว่า Tamoxifen 2 เท่า)
คำถามที่ต้องถามคือ “คุณเชื่อถือผลลัพธ์นี้ได้มากแค่ไหน”
ลองจินตนาการว่าเราทำการศึกษาโดยใช้ผู้ป่วยเพียงสองราย แน่นอนว่าในกรณีนี้ควรปฏิบัติต่อผลลัพธ์ด้วยความระมัดระวัง หากตรวจผู้ป่วยจำนวนมาก (ค่าตัวเลข “ ปริมาณมาก“ขึ้นอยู่กับสถานการณ์) แล้วข้อสรุปที่สรุปออกมาก็เชื่อถือได้อยู่แล้ว”
ดังนั้น ระดับความเชื่อมั่นจึงถูกกำหนดโดยค่าระดับ p (ค่า p)
ระดับ p ที่สูงขึ้นสอดคล้องกับระดับความเชื่อมั่นที่ต่ำกว่าในผลลัพธ์ที่ได้จากการวิเคราะห์ตัวอย่าง ตัวอย่างเช่น ระดับ p เท่ากับ 0.05 (5%) บ่งชี้ว่าข้อสรุปที่ได้จากการวิเคราะห์ของกลุ่มใดกลุ่มหนึ่งเป็นเพียงลักษณะสุ่มของวัตถุเหล่านี้ที่มีความน่าจะเป็นเพียง 5%
กล่าวอีกนัยหนึ่ง มีความเป็นไปได้สูงมาก (95%) ข้อสรุปสามารถขยายไปยังวัตถุทั้งหมดได้
การศึกษาจำนวนมากถือว่า 5% เป็นค่าระดับ p ที่ยอมรับได้ ซึ่งหมายความว่า ตัวอย่างเช่น หาก p = 0.01 ผลลัพธ์ก็สามารถเชื่อถือได้ แต่ถ้า p = 0.06 คุณจะทำไม่ได้
ศึกษา
การศึกษาในอนาคตคือการศึกษาโดยเลือกตัวอย่างตามปัจจัยตั้งต้น และวิเคราะห์ปัจจัยผลลัพธ์บางส่วนในตัวอย่าง
การศึกษาย้อนหลังคือการศึกษาโดยเลือกตัวอย่างตามปัจจัยผลลัพธ์ และวิเคราะห์ปัจจัยเริ่มต้นบางอย่างในกลุ่มตัวอย่าง
ตัวอย่าง. ปัจจัยแรกคือหญิงตั้งครรภ์ที่อายุน้อยกว่า/20 ปีขึ้นไป ปัจจัยส่งผลให้เด็กเบา/หนักเกิน 2.5 กก. เราวิเคราะห์ว่าน้ำหนักของเด็กขึ้นอยู่กับอายุของแม่หรือไม่
หากเราคัดเลือกกลุ่มตัวอย่าง 2 กลุ่ม กลุ่มหนึ่งเป็นมารดาอายุต่ำกว่า 20 ปี อีกกลุ่มหนึ่งเป็นมารดาที่มีอายุมากกว่า แล้ววิเคราะห์มวลของเด็กในแต่ละกลุ่ม นี่คือการศึกษาในอนาคต
หากเราคัดเลือก 2 ตัวอย่าง โดยกลุ่มหนึ่งคือแม่ที่ให้กำเนิดลูกน้ำหนักน้อยกว่า 2.5 กก. อีกกลุ่มหนึ่งหนักกว่าแล้ววิเคราะห์อายุของมารดาในแต่ละกลุ่ม นี่คือการศึกษาย้อนหลัง (โดยธรรมชาติแล้ว การศึกษาดังกล่าว สามารถทำได้เมื่อการทดลองเสร็จสิ้นเท่านั้น กล่าวคือ เด็กทุกคนเกิดมา)
อพยพ
คำนิยาม.ปรากฏการณ์ที่มีนัยสำคัญทางคลินิก ตัวบ่งชี้ทางห้องปฏิบัติการหรือสัญญาณที่ทำหน้าที่เป็นเป้าหมายที่สนใจของผู้วิจัย เมื่อดำเนินการทดลองทางคลินิก ผลลัพธ์จะทำหน้าที่เป็นเกณฑ์ในการประเมินประสิทธิผลของการแทรกแซงเพื่อการรักษาหรือการป้องกัน
ระบาดวิทยาทางคลินิก
คำนิยาม.วิทยาศาสตร์ที่ทำให้สามารถทำนายผลลัพธ์เฉพาะสำหรับผู้ป่วยแต่ละรายโดยอาศัยการศึกษาทางคลินิกของโรคในกรณีที่คล้ายกันโดยใช้วิธีที่เข้มงวด วิธีการทางวิทยาศาสตร์ศึกษาผู้ป่วยเพื่อให้แน่ใจว่าการพยากรณ์มีความแม่นยำ
กลุ่มประชากรตามรุ่น
คำนิยาม.กลุ่มผู้เข้าร่วมการศึกษาที่มีลักษณะร่วมกันบางอย่างในช่วงเวลาของการก่อตั้งและศึกษากันในระยะเวลาอันยาวนาน
ควบคุม
การควบคุมทางประวัติศาสตร์
คำนิยาม.กลุ่มควบคุมก่อตัวและตรวจสอบในช่วงก่อนการศึกษา
การควบคุมแบบขนาน
คำนิยาม.กลุ่มควบคุมเกิดขึ้นพร้อมๆ กับการก่อตั้งกลุ่มหลัก
ความสัมพันธ์
คำนิยาม.ความสัมพันธ์ทางสถิติระหว่างสองลักษณะ (เชิงปริมาณหรือลำดับ) แสดงให้เห็นว่า มูลค่าที่สูงขึ้นคุณลักษณะหนึ่งในบางกรณีของกรณีสอดคล้องกับค่าที่มากกว่า - ในกรณีที่มีความสัมพันธ์เชิงบวก (โดยตรง) - ค่าของคุณลักษณะอื่นหรือค่าที่น้อยกว่า - ในกรณีของความสัมพันธ์เชิงลบ (ผกผัน)
ตัวอย่าง. พบความสัมพันธ์อย่างมีนัยสำคัญระหว่างระดับเกล็ดเลือดและเม็ดเลือดขาวในเลือดของผู้ป่วย ค่าสัมประสิทธิ์สหสัมพันธ์คือ 0.76
ค่าสัมประสิทธิ์ความเสี่ยง (RR)
คำนิยาม.อัตราส่วนความเสี่ยงคืออัตราส่วนของความน่าจะเป็นที่เหตุการณ์เดียวกันจะเกิดขึ้นสำหรับวัตถุกลุ่มแรก ("ไม่ดี") กับความน่าจะเป็นที่จะเกิดขึ้นของเหตุการณ์เดียวกันสำหรับวัตถุกลุ่มที่สอง
ตัวอย่าง. หากความน่าจะเป็นที่จะเป็นมะเร็งปอดในผู้ไม่สูบบุหรี่คือ 20% และในผู้สูบบุหรี่ - 100% CR จะเท่ากับหนึ่งในห้า ในตัวอย่างนี้ วัตถุกลุ่มแรกเป็นผู้ไม่สูบบุหรี่ กลุ่มที่สองเป็นผู้สูบบุหรี่ และการเกิดมะเร็งปอดถือเป็นเหตุการณ์ที่ "ไม่ดี"
เห็นได้ชัดว่า:
1) ถ้า KR = 1 ความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในกลุ่มจะเท่ากัน
2) ถ้า KP>1 เหตุการณ์จะเกิดขึ้นกับวัตถุจากกลุ่มแรกบ่อยกว่าจากกลุ่มที่สอง
3) ถ้า KR<1, то событие чаще происходит с объектами из второй группы, чем из первой
การวิเคราะห์เมตา
คำนิยาม. กับการวิเคราะห์ทางสถิติที่สรุปผลลัพธ์ของการศึกษาหลายชิ้นที่ตรวจสอบปัญหาเดียวกัน (โดยทั่วไปคือประสิทธิผลของการรักษา การป้องกัน วิธีการวินิจฉัย) การศึกษาแบบรวมกลุ่มจะให้ตัวอย่างที่ใหญ่ขึ้นสำหรับการวิเคราะห์และอำนาจทางสถิติที่มากขึ้นสำหรับการศึกษาแบบรวม ใช้เพื่อเพิ่มหลักฐานหรือความมั่นใจในการสรุปเกี่ยวกับประสิทธิผลของวิธีการศึกษา
วิธี Kaplan-Meier (การประมาณตัวคูณ Kaplan-Meier)
วิธีการนี้คิดค้นโดยนักสถิติ E.L. Kaplan และ Paul Meyer
วิธีการนี้ใช้ในการคำนวณปริมาณต่างๆ ที่เกี่ยวข้องกับเวลาในการสังเกตของผู้ป่วย ตัวอย่างปริมาณดังกล่าว:
ความน่าจะเป็นที่จะฟื้นตัวภายในหนึ่งปีเมื่อใช้ยา
โอกาสที่จะกลับเป็นซ้ำหลังการผ่าตัดภายใน 3 ปีหลังการผ่าตัด
ความน่าจะเป็นสะสมของการรอดชีวิตที่ห้าปีในผู้ป่วยมะเร็งต่อมลูกหมากหลังการตัดอวัยวะ
ให้เราอธิบายข้อดีของการใช้วิธี Kaplan-Meier
ค่าของปริมาณในการวิเคราะห์แบบ "ทั่วไป" (ไม่ใช้วิธี Kaplan-Meier) คำนวณโดยการแบ่งช่วงเวลาที่พิจารณาออกเป็นช่วง
เช่น หากเราศึกษาความน่าจะเป็นของการเสียชีวิตของผู้ป่วยภายใน 5 ปี ก็แบ่งช่วงเวลาออกเป็น 5 ส่วน (น้อยกว่า 1 ปี, 1-2 ปี, 2-3 ปี, 3-4 ปี, 4- 5 ปี) ดังนั้น และ 10 (อย่างละ 6 เดือน) หรือเป็นระยะเวลาอื่นๆ ผลลัพธ์สำหรับพาร์ติชันที่แตกต่างกันจะแตกต่างกัน
การเลือกพาร์ติชันที่เหมาะสมที่สุดไม่ใช่เรื่องง่าย
การประมาณค่าที่ได้รับโดยใช้วิธี Kaplan-Meier ไม่ได้ขึ้นอยู่กับการแบ่งเวลาในการสังเกตออกเป็นระยะ ๆ แต่ขึ้นอยู่กับเวลาชีวิตของผู้ป่วยแต่ละรายเท่านั้น
ดังนั้นจึงง่ายกว่าสำหรับผู้วิจัยที่จะดำเนินการวิเคราะห์ และผลลัพธ์มักจะดีกว่าผลลัพธ์ของการวิเคราะห์แบบ "ทั่วไป"
เส้นโค้ง Kaplan - Meier เป็นกราฟของเส้นโค้งการอยู่รอดที่ได้จากการใช้วิธี Kaplan-Meier
รุ่นค็อกซ์
โมเดลนี้คิดค้นโดย Sir David Roxby Cox (เกิดปี 1924) นักสถิติชาวอังกฤษผู้มีชื่อเสียง ผู้เขียนบทความและหนังสือมากกว่า 300 เล่ม
แบบจำลอง Cox ใช้ในสถานการณ์ที่ปริมาณที่ศึกษาในการวิเคราะห์การอยู่รอดขึ้นอยู่กับฟังก์ชันของเวลา ตัวอย่างเช่น ความน่าจะเป็นที่จะเกิดซ้ำหลังจาก t ปี (t=1,2,...) อาจขึ้นอยู่กับลอการิทึมของบันทึกเวลา (t)
ข้อได้เปรียบที่สำคัญของวิธีการที่ Cox เสนอคือการบังคับใช้วิธีนี้ในสถานการณ์จำนวนมาก (แบบจำลองนี้ไม่ได้กำหนดข้อจำกัดที่เข้มงวดเกี่ยวกับลักษณะหรือรูปร่างของการแจกแจงความน่าจะเป็น)
จากแบบจำลอง Cox การวิเคราะห์สามารถทำได้ (เรียกว่าการวิเคราะห์ Cox) ซึ่งผลลัพธ์ที่ได้คือค่าของสัมประสิทธิ์ความเสี่ยงและช่วงความเชื่อมั่นของค่าสัมประสิทธิ์ความเสี่ยง
วิธีการทางสถิติแบบไม่อิงพารามิเตอร์
คำนิยาม.ประเภทของวิธีการทางสถิติที่ใช้เป็นหลักในการวิเคราะห์ข้อมูลเชิงปริมาณที่ไม่ก่อให้เกิดการแจกแจงแบบปกติ รวมถึงการวิเคราะห์ข้อมูลเชิงคุณภาพ
ตัวอย่าง. เพื่อระบุความสำคัญของความแตกต่างในความดันซิสโตลิกของผู้ป่วยโดยขึ้นอยู่กับประเภทของการรักษา เราจะใช้การทดสอบ Mann-Whitney แบบไม่มีพารามิเตอร์
เครื่องหมาย (ตัวแปร)
คำนิยาม. เอ็กซ์ลักษณะของวัตถุการศึกษา (การสังเกต) มีลักษณะเชิงคุณภาพและเชิงปริมาณ
การสุ่ม
คำนิยาม.วิธีการสุ่มกระจายวัตถุวิจัยออกเป็นกลุ่มหลักและกลุ่มควบคุมโดยใช้วิธีการพิเศษ (ตารางหรือตัวนับตัวเลขสุ่ม การโยนเหรียญ และวิธีการอื่นในการสุ่มกำหนดหมายเลขกลุ่มให้กับการสังเกตที่รวมไว้) การสุ่มจะช่วยลดความแตกต่างระหว่างกลุ่มในลักษณะที่ทราบและไม่ทราบซึ่งอาจส่งผลต่อผลลัพธ์ที่กำลังศึกษา
เสี่ยง
แอตทริบิวต์- ความเสี่ยงเพิ่มเติมของผลลัพธ์ที่ไม่เอื้ออำนวย (เช่น โรค) เนื่องจากการมีลักษณะบางอย่าง (ปัจจัยเสี่ยง) ในเรื่องของการศึกษา นี่เป็นส่วนของความเสี่ยงในการเกิดโรคที่เกี่ยวข้อง อธิบายโดย และสามารถกำจัดได้หากกำจัดปัจจัยเสี่ยงออกไป
ความเสี่ยงสัมพัทธ์- อัตราส่วนของความเสี่ยงของสภาวะที่ไม่เอื้ออำนวยในกลุ่มหนึ่งต่อความเสี่ยงของภาวะนี้ในอีกกลุ่มหนึ่ง ใช้ในการศึกษาในอนาคตและเชิงสังเกตเมื่อมีการสร้างกลุ่มล่วงหน้าและยังไม่เกิดสภาวะที่กำลังศึกษา
ข้อสอบแบบกลิ้ง
คำนิยาม.วิธีการตรวจสอบความเสถียร ความน่าเชื่อถือ ประสิทธิภาพ (ความถูกต้อง) ของแบบจำลองทางสถิติโดยการลบการสังเกตออกตามลำดับและคำนวณแบบจำลองใหม่ ยิ่งโมเดลที่ได้ออกมาคล้ายกันมาก โมเดลก็ยิ่งมีเสถียรภาพและเชื่อถือได้มากขึ้นเท่านั้น
เหตุการณ์
คำนิยาม.ผลลัพธ์ทางคลินิกที่พบในการศึกษา เช่น การเกิดภาวะแทรกซ้อน การกำเริบของโรค การฟื้นตัว หรือการเสียชีวิต
การแบ่งชั้น
คำนิยาม. มเทคนิคการสุ่มตัวอย่างซึ่งประชากรของผู้เข้าร่วมทั้งหมดที่มีคุณสมบัติตรงตามเกณฑ์การคัดเลือกสำหรับการศึกษา จะถูกแบ่งออกเป็นกลุ่ม (ชั้น) ในขั้นแรกตามลักษณะหนึ่งหรือหลายลักษณะ (โดยปกติจะเป็นเพศ อายุ) ที่อาจมีอิทธิพลต่อผลลัพธ์ที่สนใจ จากนั้นจึงแยกจากแต่ละลักษณะ ผู้เข้าร่วมกลุ่มเหล่านี้ ( ชั้น) ได้รับการคัดเลือกอย่างอิสระในกลุ่มทดลองและกลุ่มควบคุม ช่วยให้ผู้วิจัยสามารถปรับสมดุลคุณลักษณะที่สำคัญระหว่างกลุ่มทดลองและกลุ่มควบคุมได้
ตารางฉุกเฉิน
คำนิยาม.ตารางความถี่สัมบูรณ์ (ตัวเลข) ของการสังเกตคอลัมน์ที่สอดคล้องกับค่าของคุณลักษณะหนึ่งและแถว - ไปยังค่าของคุณลักษณะอื่น (ในกรณีของตารางฉุกเฉินสองมิติ) ค่าความถี่สัมบูรณ์จะอยู่ในเซลล์ที่จุดตัดของแถวและคอลัมน์
เรามายกตัวอย่างตารางฉุกเฉินกัน ทำการผ่าตัดหลอดเลือดโป่งพองในผู้ป่วย 194 ราย ความรุนแรงของอาการบวมน้ำในผู้ป่วยก่อนการผ่าตัดเป็นที่ทราบกันดี
อาการบวมน้ำ\ ผลลัพธ์ | |||
---|---|---|---|
ไม่มีอาการบวม | 20 | 6 | 26 |
บวมปานกลาง | 27 | 15 | 42 |
อาการบวมน้ำที่เด่นชัด | 8 | 21 | 29 |
มเจ | 55 | 42 | 194 |
ดังนั้นจากผู้ป่วย 26 รายที่ไม่มีอาการบวมน้ำ มีผู้ป่วย 20 รายรอดชีวิตหลังการผ่าตัด และผู้ป่วย 6 รายเสียชีวิต จากผู้ป่วยอาการบวมน้ำปานกลาง 42 ราย ผู้ป่วยรอดชีวิต 27 ราย เสียชีวิต 15 ราย เป็นต้น
การทดสอบไคสแควร์สำหรับตารางฉุกเฉิน
เพื่อกำหนดความสำคัญ (ความน่าเชื่อถือ) ของความแตกต่างในสัญญาณหนึ่งโดยขึ้นอยู่กับอีกสัญญาณหนึ่ง (เช่น ผลลัพธ์ของการผ่าตัดขึ้นอยู่กับความรุนแรงของอาการบวมน้ำ) การทดสอบไคสแควร์ใช้สำหรับตารางฉุกเฉิน:
โอกาส
ให้ความน่าจะเป็นของเหตุการณ์บางอย่างเท่ากับ p จากนั้นความน่าจะเป็นที่เหตุการณ์จะไม่เกิดขึ้นคือ 1-p
ตัวอย่างเช่น หากความน่าจะเป็นที่ผู้ป่วยจะมีชีวิตอยู่หลังจากผ่านไปห้าปีคือ 0.8 (80%) ความน่าจะเป็นที่เขาจะเสียชีวิตในช่วงเวลานี้คือ 0.2 (20%)
คำนิยาม.โอกาสคืออัตราส่วนของความน่าจะเป็นที่เหตุการณ์หนึ่งจะเกิดขึ้นต่อความน่าจะเป็นที่เหตุการณ์นั้นจะไม่เกิดขึ้น
ตัวอย่าง. ในตัวอย่างของเรา (เกี่ยวกับผู้ป่วย) โอกาสคือ 4 เนื่องจาก 0.8/0.2=4
ดังนั้นความน่าจะเป็นที่จะฟื้นตัวจึงมากกว่าความน่าจะเป็นที่จะเสียชีวิตถึง 4 เท่า
การตีความมูลค่าของปริมาณ
1) ถ้าโอกาส = 1 ความน่าจะเป็นของเหตุการณ์จะเกิดขึ้นจะเท่ากับความน่าจะเป็นที่เหตุการณ์นั้นจะไม่เกิดขึ้น
2) ถ้าโอกาส >1 ความน่าจะเป็นของเหตุการณ์จะเกิดขึ้นมากกว่าความน่าจะเป็นที่เหตุการณ์จะไม่เกิดขึ้น
3) ถ้ามีโอกาส<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.
อัตราส่วนราคาต่อรอง
คำนิยาม.อัตราส่วนอัตราต่อรองคืออัตราส่วนอัตราต่อรองสำหรับออบเจ็กต์กลุ่มแรกต่ออัตราส่วนอัตราต่อรองสำหรับออบเจ็กต์กลุ่มที่สอง
ตัวอย่าง. สมมติว่าทั้งชายและหญิงได้รับการรักษาบางอย่าง
ความน่าจะเป็นที่ผู้ป่วยชายจะยังมีชีวิตอยู่หลังจากผ่านไปห้าปีคือ 0.6 (60%); ความน่าจะเป็นที่เขาจะตายในช่วงเวลานี้คือ 0.4 (40%)
ความน่าจะเป็นที่คล้ายกันสำหรับผู้หญิงคือ 0.8 และ 0.2
อัตราส่วนอัตราต่อรองในตัวอย่างนี้คือ
การตีความมูลค่าของปริมาณ
1) ถ้าอัตราต่อรอง = 1 แสดงว่าโอกาสของกลุ่มแรกจะเท่ากับโอกาสของกลุ่มที่สอง
2) หากอัตราต่อรองเป็น >1 แสดงว่าโอกาสของกลุ่มแรกมีมากกว่าโอกาสของกลุ่มที่สอง
3) ถ้าอัตราต่อรอง<1, то шанс для первой группы меньше шанса для второй группы
ในสถานการณ์ทางวิทยาศาสตร์และการปฏิบัติของการทดลอง (แบบสำรวจ) นักวิจัยสามารถศึกษาได้ไม่ใช่ทุกคน (ประชากรทั่วไป ประชากร) แต่จะศึกษาเพียงตัวอย่างบางส่วนเท่านั้น ตัวอย่างเช่น แม้ว่าเราจะศึกษาคนกลุ่มเล็กๆ เช่น ผู้ที่เป็นโรคเฉพาะเจาะจง แต่ก็ยังไม่น่าเป็นไปได้ที่เราจะมีทรัพยากรที่เหมาะสมหรือไม่จำเป็นต้องทดสอบผู้ป่วยทุกราย แต่เป็นเรื่องปกติที่จะทดสอบตัวอย่างจากประชากรแทน เนื่องจากสะดวกกว่าและใช้เวลาน้อยกว่า ถ้าเป็นเช่นนั้นเราจะรู้ได้อย่างไรว่าผลลัพธ์ที่ได้จากกลุ่มตัวอย่างเป็นตัวแทนของทั้งกลุ่ม? หรือหากต้องการใช้คำศัพท์เฉพาะทาง เราจะแน่ใจได้อย่างไรว่างานวิจัยของเราจะอธิบายเนื้อหาทั้งหมดได้อย่างถูกต้อง ประชากรตัวอย่างที่เราใช้?
เพื่อตอบคำถามนี้ จำเป็นต้องกำหนดนัยสำคัญทางสถิติของผลการทดสอบ นัยสำคัญทางสถิติ (ระดับสำคัญ, ย่อ ซิก)หรือ /7-ระดับนัยสำคัญ (ระดับ p) -คือความน่าจะเป็นที่ผลลัพธ์ที่กำหนดแสดงถึงประชากรที่สุ่มตัวอย่างการศึกษาอย่างถูกต้อง โปรดทราบว่านี่เป็นเพียง ความน่าจะเป็น- เป็นไปไม่ได้ที่จะพูดด้วยความมั่นใจว่าการศึกษาหนึ่งๆ อธิบายประชากรทั้งหมดได้อย่างถูกต้อง ที่ดีที่สุด ระดับนัยสำคัญสามารถสรุปได้ว่ามีความเป็นไปได้สูง ดังนั้นคำถามต่อไปจึงเกิดขึ้นอย่างหลีกเลี่ยงไม่ได้: ต้องมีระดับนัยสำคัญเท่าใดก่อนที่ผลลัพธ์ที่กำหนดจะถือเป็นลักษณะเฉพาะที่ถูกต้องของประชากรได้
ตัวอย่างเช่น คุณยินดีที่จะบอกว่าโอกาสดังกล่าวเพียงพอที่จะรับความเสี่ยงที่ค่าความน่าจะเป็นเท่าใด จะเกิดอะไรขึ้นถ้าอัตราต่อรองคือ 10 จาก 100 หรือ 50 จาก 100? จะเกิดอะไรขึ้นถ้าความน่าจะเป็นนี้สูงกว่า? แล้วอัตราต่อรองเช่น 90 จาก 100, 95 จาก 100 หรือ 98 จาก 100 ล่ะ? สำหรับสถานการณ์ที่เกี่ยวข้องกับความเสี่ยง ทางเลือกนี้ค่อนข้างเป็นปัญหาเนื่องจากขึ้นอยู่กับลักษณะส่วนบุคคลของบุคคล
ในทางจิตวิทยา เชื่อกันว่าโอกาส 95 หรือมากกว่าใน 100 หมายความว่าความน่าจะเป็นของผลลัพธ์ที่ถูกต้องนั้นสูงพอที่จะทำให้ประชากรทั้งหมดสามารถสรุปได้โดยทั่วไป ตัวเลขนี้ก่อตั้งขึ้นในกระบวนการของกิจกรรมทางวิทยาศาสตร์และการปฏิบัติ - ไม่มีกฎหมายที่ควรเลือกเป็นแนวทาง (และแน่นอนว่าในวิทยาศาสตร์อื่นบางครั้งค่าอื่น ๆ ของระดับนัยสำคัญก็ถูกเลือก)
ในทางจิตวิทยา ความน่าจะเป็นนี้ดำเนินการในลักษณะที่ค่อนข้างผิดปกติ แทนที่จะเป็นความน่าจะเป็นที่กลุ่มตัวอย่างแสดงถึงประชากร ความน่าจะเป็นที่กลุ่มตัวอย่าง ไม่ได้เป็นตัวแทนประชากร. กล่าวอีกนัยหนึ่ง คือความน่าจะเป็นที่ความสัมพันธ์หรือความแตกต่างที่สังเกตได้นั้นเป็นแบบสุ่มและไม่ใช่สมบัติของประชากร ดังนั้น แทนที่จะบอกว่ามีโอกาส 95 ใน 100 ที่ผลการศึกษาถูกต้อง นักจิตวิทยากลับบอกว่ามีโอกาส 5 ใน 100 ที่ผลการศึกษาจะผิด (เช่นเดียวกับโอกาส 40 ใน 100 ที่ผลการศึกษาจะถูกต้องก็หมายความว่า มีโอกาส 60 ใน 100 ที่จะสนับสนุนความผิดพลาด) บางครั้งค่าความน่าจะเป็นจะแสดงเป็นเปอร์เซ็นต์ แต่มักจะเขียนเป็นเศษส่วนทศนิยม ตัวอย่างเช่น โอกาส 10 ใน 100 จะแสดงเป็นเศษส่วนทศนิยม 0.1 5 จาก 100 เขียนเป็น 0.05; 1 จาก 100 - 0.01 ด้วยรูปแบบการบันทึกนี้ ค่าขีดจำกัดคือ 0.05 ผลที่จะถือว่าถูกต้องจะต้องมีระดับนัยสำคัญ ด้านล่างตัวเลขนี้ (จำไว้ว่านี่คือความน่าจะเป็นที่ผลลัพธ์ ผิดอธิบายถึงประชากร) หากต้องการหลีกเลี่ยงคำศัพท์ ให้เพิ่มว่า "ความน่าจะเป็นของผลลัพธ์ที่ไม่ถูกต้อง" (ซึ่งเรียกได้ถูกต้องกว่า ระดับนัยสำคัญ)มักเขียนแทนด้วยอักษรละติน ร.คำอธิบายของผลการทดลองมักจะมีข้อความสรุป เช่น “ผลลัพธ์มีนัยสำคัญที่ระดับความเชื่อมั่น” (ร(p) น้อยกว่า 0.05 (เช่น น้อยกว่า 5%)
ดังนั้นระดับนัยสำคัญ ( ร) บ่งบอกถึงความน่าจะเป็นของผลลัพธ์ ไม่เป็นตัวแทนของประชากร ตามเนื้อผ้าในด้านจิตวิทยา ผลลัพธ์จะถือว่าสะท้อนภาพรวมได้อย่างน่าเชื่อถือหากมีคุณค่า รน้อยกว่า 0.05 (เช่น 5%) อย่างไรก็ตาม นี่เป็นเพียงข้อความแสดงความน่าจะเป็นเท่านั้น และไม่ใช่การรับประกันแบบไม่มีเงื่อนไขแต่อย่างใด ในบางกรณีข้อสรุปนี้อาจไม่ถูกต้อง ในความเป็นจริง เราสามารถคำนวณได้ว่าเหตุการณ์นี้อาจเกิดขึ้นได้บ่อยเพียงใดหากเราพิจารณาขนาดของระดับนัยสำคัญ ที่ระดับนัยสำคัญ 0.05 ผลลัพธ์ 5 ใน 100 ครั้งมีแนวโน้มที่จะไม่ถูกต้อง เมื่อมองแวบแรก 11a ดูเหมือนว่านี่จะไม่ธรรมดานัก แต่ถ้าคุณคิดดูดีๆ โอกาส 5 ใน 100 ก็เท่ากับ 1 ใน 20 หรืออีกนัยหนึ่ง หนึ่งในทุกๆ 20 กรณีผลลัพธ์จะเป็น ไม่ถูกต้อง. โอกาสดังกล่าวดูเหมือนจะไม่ค่อยดีนัก และนักวิจัยควรระวังในการดำเนินการ ข้อผิดพลาดประเภทแรกนี่คือชื่อของข้อผิดพลาดที่เกิดขึ้นเมื่อนักวิจัยคิดว่าพบผลลัพธ์ที่แท้จริงแล้ว แต่ในความเป็นจริงกลับไม่พบ ข้อผิดพลาดตรงกันข้ามซึ่งประกอบด้วยนักวิจัยที่เชื่อว่าพวกเขาไม่พบผลลัพธ์เมื่อมีอยู่จริงเรียกว่า ข้อผิดพลาดประเภทที่สอง
ข้อผิดพลาดเหล่านี้เกิดขึ้นเนื่องจากความเป็นไปได้ที่การวิเคราะห์ทางสถิติดำเนินการไม่สามารถตัดออกได้ ความน่าจะเป็นของข้อผิดพลาดขึ้นอยู่กับระดับนัยสำคัญทางสถิติของผลลัพธ์ เราได้สังเกตแล้วว่าเพื่อให้พิจารณาผลลัพธ์ที่ถูกต้อง ระดับนัยสำคัญต้องต่ำกว่า 0.05 แน่นอนว่าผลลัพธ์บางส่วนยังต่ำกว่านั้นและไม่ใช่เรื่องแปลกที่จะเห็นผลต่ำถึง 0.001 (ค่า 0.001 หมายความว่ามีโอกาส 1 ใน 1,000 ที่ผลลัพธ์จะผิดพลาด) ยิ่งค่า p มีค่าน้อยลง ความมั่นใจของเราในความถูกต้องของผลลัพธ์ก็จะยิ่งมากขึ้นเท่านั้น
ในตาราง 7.2 แสดงการตีความระดับนัยสำคัญแบบดั้งเดิมเกี่ยวกับความเป็นไปได้ของการอนุมานทางสถิติและเหตุผลในการตัดสินใจเกี่ยวกับการมีความสัมพันธ์ (ความแตกต่าง)
ตารางที่ 7.2
การตีความระดับนัยสำคัญที่ใช้ในจิตวิทยาแบบดั้งเดิม
ขอแนะนำจากประสบการณ์การวิจัยเชิงปฏิบัติ: เพื่อหลีกเลี่ยงข้อผิดพลาดประเภทที่หนึ่งและสองให้มากที่สุดเมื่อทำการสรุปที่สำคัญควรทำการตัดสินใจเกี่ยวกับการมีความแตกต่าง (การเชื่อมต่อ) โดยเน้นที่ระดับ รเครื่องหมายไม่มี
การทดสอบทางสถิติ(การทดสอบทางสถิติ -เป็นเครื่องมือในการกำหนดระดับนัยสำคัญทางสถิติ นี่เป็นกฎชี้ขาดที่ทำให้แน่ใจว่าสมมติฐานที่แท้จริงได้รับการยอมรับ และสมมติฐานเท็จจะถูกปฏิเสธด้วยความน่าจะเป็นสูง
เกณฑ์ทางสถิติยังแสดงถึงวิธีการคำนวณจำนวนหนึ่งและจำนวนนั้นด้วย เกณฑ์ทั้งหมดใช้เพื่อวัตถุประสงค์หลักประการเดียว: เพื่อกำหนด ระดับนัยสำคัญข้อมูลที่พวกเขาวิเคราะห์ (เช่น ความน่าจะเป็นที่ข้อมูลจะสะท้อนถึงผลกระทบที่แท้จริงซึ่งแสดงถึงประชากรที่ใช้สุ่มตัวอย่างอย่างถูกต้อง)
การทดสอบบางอย่างสามารถใช้ได้เฉพาะกับข้อมูลที่แจกแจงแบบปกติเท่านั้น (และหากลักษณะถูกวัดเป็นช่วง) การทดสอบเหล่านี้มักจะเรียกว่า พารามิเตอร์เมื่อใช้เกณฑ์อื่นคุณสามารถวิเคราะห์ข้อมูลได้เกือบทุกกฎหมายการกระจาย - เรียกว่า ไม่ใช่พารามิเตอร์
เกณฑ์พาราเมตริกคือเกณฑ์ที่รวมพารามิเตอร์การกระจายไว้ในสูตรการคำนวณ เช่น ค่าเฉลี่ยและความแปรปรวน (การทดสอบของนักเรียน, การทดสอบ F ของฟิชเชอร์ ฯลฯ )
เกณฑ์ที่ไม่ใช่พารามิเตอร์คือเกณฑ์ที่ไม่รวมพารามิเตอร์การกระจายในสูตรสำหรับการคำนวณพารามิเตอร์การกระจาย และขึ้นอยู่กับการทำงานกับความถี่หรืออันดับ (เกณฑ์ ถามเกณฑ์ Rosenbaum ยูมานา-วิทนีย์
ตัวอย่างเช่น เมื่อเราบอกว่าความสำคัญของความแตกต่างถูกกำหนดโดยการทดสอบทีของนักเรียน เราหมายถึงว่าวิธีการทดสอบทีของนักเรียนนั้นใช้ในการคำนวณค่าเชิงประจักษ์ ซึ่งจากนั้นจะถูกนำไปเปรียบเทียบกับค่าในตาราง (วิกฤต)
ด้วยอัตราส่วนของเชิงประจักษ์ (คำนวณโดยเรา) และค่าวิกฤตของเกณฑ์ (ตาราง) เราสามารถตัดสินได้ว่าสมมติฐานของเราได้รับการยืนยันหรือหักล้างหรือไม่ ในกรณีส่วนใหญ่ เพื่อให้เรารับรู้ถึงความแตกต่างที่มีนัยสำคัญ จำเป็นที่ค่าเชิงประจักษ์ของเกณฑ์จะต้องมากกว่าค่าวิกฤติ แม้ว่าจะมีเกณฑ์ (เช่น การทดสอบแมนน์-วิทนีย์ หรือการทดสอบเครื่องหมาย) ซึ่ง เราต้องปฏิบัติตามกฎที่ตรงกันข้าม
ในบางกรณี สูตรการคำนวณสำหรับเกณฑ์จะรวมจำนวนการสังเกตในกลุ่มตัวอย่างที่กำลังศึกษาด้วย แสดงเป็น ป. เมื่อใช้ตารางพิเศษ เราจะพิจารณาว่าระดับนัยสำคัญทางสถิติของความแตกต่างซึ่งค่าเชิงประจักษ์ที่กำหนดนั้นสอดคล้องกับระดับใด ในกรณีส่วนใหญ่ ค่าเชิงประจักษ์ที่เท่ากันของเกณฑ์อาจมีนัยสำคัญหรือไม่มีนัยสำคัญ ขึ้นอยู่กับจำนวนการสังเกตในกลุ่มตัวอย่างภายใต้การศึกษา ( ป ) หรือจากสิ่งที่เรียกว่า จำนวนองศาอิสระ ซึ่งแสดงเป็น โวลต์ (g>) หรืออย่างไร df (บางครั้ง ง)
รู้ ปหรือจำนวนองศาอิสระเราสามารถกำหนดได้โดยใช้ตารางพิเศษ (หลัก ๆ จะได้รับในภาคผนวก 5) ค่าวิกฤตเกณฑ์และเปรียบเทียบค่าเชิงประจักษ์ที่ได้รับกับเกณฑ์เหล่านั้น โดยปกติจะเขียนดังนี้: “เมื่อใด” น=ค่าวิกฤต 22 ค่าของเกณฑ์คือ เสื้อ เซนต์ = 2.07" หรือ "ที่ โวลต์ (ง) = ค่าวิกฤต 2 ค่าของแบบทดสอบของนักเรียนคือ = 4.30” เป็นต้น
โดยทั่วไปแล้ว การตั้งค่าจะยังคงเป็นไปตามเกณฑ์แบบพาราเมตริก และเรายึดถือตำแหน่งนี้ พวกเขาถือว่ามีความน่าเชื่อถือมากกว่าและคุณจะได้รับความช่วยเหลือจากพวกเขา ข้อมูลมากกว่านี้และทำการวิเคราะห์เชิงลึกมากขึ้น สำหรับความซับซ้อนของการคำนวณทางคณิตศาสตร์ เมื่อใช้โปรแกรมคอมพิวเตอร์ ความซับซ้อนนี้จะหายไป (แต่บางส่วนก็ปรากฏว่าค่อนข้างจะเอาชนะได้)
- ในตำราเรียนเล่มนี้เราไม่ได้พิจารณารายละเอียดปัญหาทางสถิติ
- สมมติฐาน (null - R0 และทางเลือก - Hj) และการตัดสินใจทางสถิติเนื่องจากนักศึกษาจิตวิทยาศึกษาสิ่งนี้แยกกันในสาขาวิชา "วิธีทางคณิตศาสตร์ในด้านจิตวิทยา" นอกจากนี้ควรสังเกตด้วยว่าเมื่อจัดทำรายงานการวิจัย (รายวิชาหรือ วิทยานิพนธ์, สิ่งพิมพ์) ไม่ได้รับสมมติฐานทางสถิติและวิธีแก้ปัญหาทางสถิติตามกฎ โดยปกติเมื่ออธิบายผลลัพธ์ พวกเขาระบุเกณฑ์ จัดเตรียมสถิติเชิงพรรณนาที่จำเป็น (หมายถึง ซิกม่า สัมประสิทธิ์สหสัมพันธ์ ฯลฯ ) ค่าเชิงประจักษ์ของเกณฑ์ ระดับความเป็นอิสระ และจำเป็นต้องมีระดับนัยสำคัญ p จากนั้นจะมีการกำหนดข้อสรุปที่มีความหมายเกี่ยวกับสมมติฐานที่กำลังทดสอบ โดยระบุ (โดยปกติจะอยู่ในรูปแบบของความไม่เท่าเทียมกัน) ระดับนัยสำคัญที่บรรลุผลสำเร็จหรือไม่บรรลุผล