นัยสำคัญทางสถิติ: ความหมาย แนวคิด นัยสำคัญ สมการถดถอย และการทดสอบสมมติฐาน นัยสำคัญทางสถิติในการเพิ่มประสิทธิภาพ Conversion คืออะไร?

ความน่าเชื่อถือทางสถิติถือเป็นสิ่งสำคัญในการฝึกคำนวณของ FCC ก่อนหน้านี้มีข้อสังเกตว่าสามารถเลือกตัวอย่างได้หลายตัวอย่างจากประชากรกลุ่มเดียวกัน:

หากเลือกอย่างถูกต้องตัวบ่งชี้เฉลี่ยและตัวบ่งชี้ของประชากรทั่วไปจะแตกต่างกันเล็กน้อยจากขนาดของข้อผิดพลาดในการเป็นตัวแทนโดยคำนึงถึงความน่าเชื่อถือที่ยอมรับได้

หากเลือกจากประชากรที่แตกต่างกัน ความแตกต่างระหว่างพวกเขาจะกลายเป็นเรื่องสำคัญ สถิติเป็นเรื่องเกี่ยวกับการเปรียบเทียบตัวอย่าง

หากพวกเขาแตกต่างกันอย่างไม่มีนัยสำคัญ ไม่มีหลักการ ไม่มีนัยสำคัญ กล่าวคือ จริงๆ แล้วพวกเขาอยู่ในประชากรทั่วไปกลุ่มเดียวกัน ความแตกต่างระหว่างพวกเขาเรียกว่าไม่น่าเชื่อถือทางสถิติ

มีความน่าเชื่อถือทางสถิติ ความแตกต่างของกลุ่มตัวอย่างคือกลุ่มตัวอย่างที่แตกต่างกันอย่างมีนัยสำคัญและเป็นพื้นฐาน กล่าวคือ เป็นของกลุ่มประชากรทั่วไปที่แตกต่างกัน

ที่ FCC การประเมินนัยสำคัญทางสถิติของความแตกต่างของตัวอย่างหมายถึงการแก้ปัญหาในทางปฏิบัติหลายประการ เช่น การแนะนำวิธีการสอน โปรแกรม ชุดแบบฝึกหัด แบบทดสอบใหม่ๆ การออกกำลังกายควบคุมมีความเกี่ยวข้องกับการทดสอบเชิงทดลอง ซึ่งควรแสดงให้เห็นว่ากลุ่มการทดสอบมีความแตกต่างจากกลุ่มควบคุมโดยพื้นฐาน ดังนั้นจึงใช้วิธีการทางสถิติพิเศษที่เรียกว่าเกณฑ์ที่มีนัยสำคัญทางสถิติ เพื่อตรวจหาการมีหรือไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างตัวอย่าง

เกณฑ์ทั้งหมดแบ่งออกเป็นสองกลุ่ม: แบบอิงพารามิเตอร์และแบบไม่มีพารามิเตอร์ เกณฑ์พาราเมตริกกำหนดให้ต้องมีกฎหมายการแจกแจงแบบปกติ เช่น นี่หมายถึงการกำหนดตัวบ่งชี้หลักของกฎปกติ - ค่าเฉลี่ยเลขคณิตและค่าเบี่ยงเบนมาตรฐาน เกณฑ์พาราเมตริกมีความแม่นยำและถูกต้องที่สุด การทดสอบแบบไม่อิงพารามิเตอร์จะขึ้นอยู่กับความแตกต่างอันดับ (ลำดับ) ระหว่างองค์ประกอบตัวอย่าง

ต่อไปนี้เป็นเกณฑ์หลักสำหรับนัยสำคัญทางสถิติที่ใช้ในการฝึก FCC: การทดสอบของนักเรียนและการทดสอบของฟิชเชอร์

การทดสอบของนักเรียนตั้งชื่อตามนักวิทยาศาสตร์ชาวอังกฤษ K. Gosset (นักเรียน - นามแฝง) ผู้ค้นพบวิธีนี้ การทดสอบของนักเรียนเป็นแบบพาราเมตริกและใช้เพื่อเปรียบเทียบค่าสัมบูรณ์ของกลุ่มตัวอย่าง ตัวอย่างอาจมีขนาดแตกต่างกัน

การทดสอบของนักเรียน ถูกกำหนดเช่นนี้

1. ค้นหาแบบทดสอบ Student โดยใช้สูตรต่อไปนี้:


ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่างที่เปรียบเทียบอยู่ที่ไหน เสื้อ 1, เสื้อ 2 - ข้อผิดพลาดของการเป็นตัวแทนที่ระบุตามตัวบ่งชี้ของกลุ่มตัวอย่างที่เปรียบเทียบ

2. การปฏิบัติที่ FCC ได้แสดงให้เห็นว่าสำหรับ งานกีฬาก็เพียงพอที่จะยอมรับความน่าเชื่อถือของบัญชี P = 0.95

ความน่าเชื่อถือในการนับ: P = 0.95 (a = 0.05) พร้อมจำนวนองศาอิสระ

k = n 1 + n 2 - 2 โดยใช้ตารางในภาคผนวก 4 เราค้นหาค่าของค่าขีด จำกัด ของเกณฑ์ ( ทีกรัม).

3. ขึ้นอยู่กับคุณสมบัติของกฎการกระจายแบบปกติ เกณฑ์ของนักเรียนจะเปรียบเทียบ t และ t gr

เราได้ข้อสรุป:

ถ้า t t gr ความแตกต่างระหว่างตัวอย่างที่เปรียบเทียบนั้นมีนัยสำคัญทางสถิติ

หากไม่ได้หมายความว่าความแตกต่างนั้นไม่มีนัยสำคัญทางสถิติ

สำหรับนักวิจัยในสาขา FCS การประเมินนัยสำคัญทางสถิติเป็นขั้นตอนแรกในการแก้ปัญหาที่เฉพาะเจาะจง ไม่ว่าตัวอย่างที่จะเปรียบเทียบจะแตกต่างกันโดยพื้นฐานหรือไม่มีพื้นฐานจากกันก็ตาม ขั้นตอนต่อไปคือการประเมินความแตกต่างนี้จากมุมมองการสอนซึ่งกำหนดโดยเงื่อนไขของงาน

ลองพิจารณาการประยุกต์ใช้แบบทดสอบนักเรียนโดยใช้ตัวอย่างเฉพาะ

ตัวอย่างที่ 2.14 กลุ่มตัวอย่าง 18 คนได้รับการประเมินอัตราการเต้นของหัวใจ (bpm) ก่อน x i และหลัง ใช่แล้วอุ่นเครื่อง

ประเมินประสิทธิผลของการวอร์มอัพตามอัตราการเต้นของหัวใจ ข้อมูลเบื้องต้นและการคำนวณแสดงไว้ในตาราง 2.30 และ 2.31 น.

ตารางที่ 2.30

การประมวลผลตัวบ่งชี้อัตราการเต้นของหัวใจก่อนอบอุ่นร่างกาย


ข้อผิดพลาดสำหรับทั้งสองกลุ่มเกิดขึ้นพร้อมกัน เนื่องจากขนาดตัวอย่างเท่ากัน (กลุ่มเดียวกันได้รับการศึกษาภายใต้เงื่อนไขที่ต่างกัน) และค่าเบี่ยงเบนมาตรฐานคือ s x = s y = 3 ครั้ง/นาที มาดูการกำหนดการทดสอบของนักเรียนกันดีกว่า:

เราตั้งค่าความน่าเชื่อถือของบัญชี: P = 0.95

จำนวนองศาอิสระ k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34 จากตารางในภาคผนวก 4 เราพบ ทีกรัม= 2,02.

อนุมานทางสถิติ. เนื่องจาก t = 11.62 และขอบเขต t gr = 2.02 จากนั้น 11.62 > 2.02 เช่น t > t gr ดังนั้นความแตกต่างระหว่างกลุ่มตัวอย่างจึงมีนัยสำคัญทางสถิติ

บทสรุปการสอน พบว่าในแง่ของอัตราการเต้นของหัวใจ ความแตกต่างระหว่างสถานะของกลุ่มก่อนและหลังการอบอุ่นร่างกายมีนัยสำคัญทางสถิติ กล่าวคือ สำคัญและเป็นพื้นฐาน ดังนั้น จากตัวบ่งชี้อัตราการเต้นของหัวใจ เราสามารถสรุปได้ว่าการวอร์มอัพมีประสิทธิผล

เกณฑ์ฟิชเชอร์เป็นพารามิเตอร์ ใช้ในการเปรียบเทียบอัตราการกระจายตัวของตัวอย่าง ซึ่งมักจะหมายถึงการเปรียบเทียบในแง่ของความเสถียรของประสิทธิภาพการกีฬาหรือความเสถียรของตัวบ่งชี้การทำงานและทางเทคนิคในทางปฏิบัติ วัฒนธรรมทางกายภาพและกีฬา ตัวอย่างอาจมีขนาดแตกต่างกัน

เกณฑ์ฟิชเชอร์ถูกกำหนดตามลำดับต่อไปนี้

1. ค้นหาเกณฑ์ฟิชเชอร์ F โดยใช้สูตร


โดยที่ คือความแปรปรวนของกลุ่มตัวอย่างที่เปรียบเทียบ

เงื่อนไขของเกณฑ์ฟิชเชอร์กำหนดไว้ในตัวเศษของสูตร เอฟ มีการกระจายตัวมากเช่น จำนวน F จะมากกว่าหนึ่งเสมอ

เราตั้งค่าความน่าเชื่อถือในการคำนวณ: P = 0.95 - และกำหนดจำนวนองศาอิสระสำหรับทั้งสองตัวอย่าง: k 1 = n 1 - 1, k 2 = n 2 - 1

เมื่อใช้ตารางในภาคผนวก 4 เราจะค้นหาค่าขีดจำกัดของเกณฑ์ F กรัม.

การเปรียบเทียบเกณฑ์ F และ F กรัมช่วยให้เราสามารถสรุปได้:

ถ้า F > F gr ความแตกต่างระหว่างกลุ่มตัวอย่างจะมีนัยสำคัญทางสถิติ

ถ้า F< F гр, то различие между выборками статически недо­стоверно.

ลองยกตัวอย่างที่เฉพาะเจาะจง

ตัวอย่าง 2.15. มาวิเคราะห์ผู้เล่นแฮนด์บอลสองกลุ่ม: x ฉัน (หมายเลข 1= 16 คน) และ y (p 2 = 18 คน) นักกีฬากลุ่มเหล่านี้ได้รับการศึกษาเกี่ยวกับเวลาขึ้นเครื่องเมื่อขว้างลูกบอลเข้าประตู

ตัวบ่งชี้แรงผลักเป็นประเภทเดียวกันหรือไม่?

ข้อมูลเบื้องต้นและการคำนวณพื้นฐานแสดงไว้ในตาราง 2.32 และ 2.33

ตารางที่ 2.32

การประมวลผลตัวบ่งชี้การขับไล่ของผู้เล่นแฮนด์บอลกลุ่มแรก


ให้เรากำหนดเกณฑ์ฟิชเชอร์:





ตามข้อมูลที่นำเสนอในตารางในภาคผนวก 6 เราพบ Fgr: Fgr = 2.4

ให้เราใส่ใจกับความจริงที่ว่าตารางในภาคผนวก 6 แสดงรายการจำนวนระดับความเป็นอิสระของการกระจายทั้งมากและน้อยเมื่อเข้าใกล้ จำนวนมากรุนแรงขึ้น ดังนั้นจำนวนองศาความเป็นอิสระของการกระจายตัวที่มากขึ้นตามลำดับนี้: 8, 9, 10, 11, 12, 14, 16, 20, 24 เป็นต้น และอันที่เล็กกว่า - 28, 29, 30, 40 , 50 ฯลฯ ง.

สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าเมื่อขนาดตัวอย่างเพิ่มขึ้น ความแตกต่างในการทดสอบ F จะลดลง และคุณสามารถใช้ค่าแบบตารางที่ใกล้เคียงกับข้อมูลต้นฉบับได้ ดังนั้น ในตัวอย่าง 2.15 =17 หายไป และเราสามารถนำค่าที่ใกล้เคียงที่สุด k = 16 ซึ่งเราจะได้ Fgr = 2.4

อนุมานทางสถิติ. เนื่องจากการทดสอบของฟิชเชอร์ F= 2.5 > F= 2.4 กลุ่มตัวอย่างจึงสามารถแยกแยะได้ทางสถิติ

บทสรุปการสอน ค่าของเวลาออกตัวเมื่อโยนบอลเข้าประตูสำหรับผู้เล่นแฮนด์บอลของทั้งสองกลุ่มแตกต่างกันอย่างมีนัยสำคัญ กลุ่มเหล่านี้ควรได้รับการพิจารณาที่แตกต่างกัน

การวิจัยเพิ่มเติมควรเปิดเผยสาเหตุของความแตกต่างนี้

ตัวอย่าง 2.20.(เกี่ยวกับความน่าเชื่อถือทางสถิติของกลุ่มตัวอย่าง ). คุณสมบัติของนักฟุตบอลดีขึ้นหรือไม่ หากเวลาจากการให้สัญญาณในการเตะบอลในช่วงเริ่มต้นการฝึกคือ x i และในตอนท้าย y i

ข้อมูลเบื้องต้นและการคำนวณพื้นฐานแสดงไว้ในตาราง 2.40 และ 2.41

ตารางที่ 2.40

ตัวบ่งชี้เวลาในการประมวลผลจากการให้สัญญาณในการตีลูกบอลเมื่อเริ่มฝึกซ้อม


ให้เราพิจารณาความแตกต่างระหว่างกลุ่มตัวบ่งชี้โดยใช้เกณฑ์ของนักเรียน:

ด้วยความน่าเชื่อถือ P = 0.95 และองศาอิสระ k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42 โดยใช้ตารางในภาคผนวก 4 เราพบ ทีกรัม= 2.02. เนื่องจาก t = 8.3 > ทีกรัม= 2.02 - ความแตกต่างมีนัยสำคัญทางสถิติ

ให้เราพิจารณาความแตกต่างระหว่างกลุ่มตัวบ่งชี้โดยใช้เกณฑ์ของฟิชเชอร์:


ตามตารางในภาคผนวก 2 โดยมีความน่าเชื่อถือ P = 0.95 และองศาอิสระ k = 22-1 = 21 ค่า F gr = 21 เนื่องจาก F = 1.53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

อนุมานทางสถิติ. ตามค่าเฉลี่ยเลขคณิต ความแตกต่างระหว่างกลุ่มของตัวบ่งชี้มีนัยสำคัญทางสถิติ ในแง่ของการกระจายตัว (dispersion) ความแตกต่างระหว่างกลุ่มของตัวบ่งชี้นั้นไม่น่าเชื่อถือทางสถิติ

บทสรุปการสอนคุณสมบัติของนักฟุตบอลได้รับการปรับปรุงอย่างมีนัยสำคัญ แต่ควรให้ความสนใจกับความมั่นคงของคำให้การของเขา

การเตรียมงาน

ก่อนที่จะดำเนินงานห้องปฏิบัติการนี้ในสาขาวิชา” มาตรวิทยาการกีฬา» ถึงนักเรียนทุกคน กลุ่มการศึกษามีความจำเป็นต้องจัดตั้งทีมงานจำนวน 3-4 คนในแต่ละกลุ่มเพื่อร่วมกันมอบหมายงานงานห้องปฏิบัติการทั้งหมดให้เสร็จสิ้น

ในการเตรียมงาน อ่านส่วนที่เกี่ยวข้องของวรรณกรรมที่แนะนำ (ดูหัวข้อที่ 6 ของข้อมูล คำแนะนำระเบียบวิธี) และบันทึกการบรรยาย ศึกษาส่วนที่ 1 และ 2 สำหรับงานในห้องปฏิบัติการนี้ ตลอดจนการมอบหมายงาน (ส่วนที่ 4)

เตรียมแบบฟอร์มรายงานบนแผ่นมาตรฐาน กระดาษเขียนรูปแบบ A4 และใส่วัสดุที่จำเป็นสำหรับการทำงานลงไป

โดยในรายงานจะต้องมี :

หน้าชื่อเรื่องโดยระบุแผนก (UC และ TR) กลุ่มวิชา นามสกุล ชื่อจริง นามสกุลของนักศึกษา หมายเลขและชื่อผลงานห้องปฏิบัติการ วันที่สำเร็จการศึกษา ตลอดจนนามสกุล ปริญญาทางวิชาการ ตำแหน่งทางวิชาการ และตำแหน่ง ครูรับงาน;

เป้าหมายของงาน

สูตรด้วย ค่าตัวเลขอธิบายผลการคำนวณขั้นกลางและขั้นสุดท้าย

ตารางค่าที่วัดและคำนวณได้

จำเป็นตามที่ได้รับมอบหมาย วัสดุกราฟิก;

ข้อสรุปโดยย่อเกี่ยวกับผลลัพธ์ของแต่ละขั้นตอนของการมอบหมายงานและงานที่ทำโดยทั่วไป

กราฟและตารางทั้งหมดถูกวาดอย่างระมัดระวังโดยใช้เครื่องมือวาดภาพ กราฟิกแบบมีเงื่อนไขและ การกำหนดตัวอักษรต้องเป็นไปตามมาตรฐาน GOST อนุญาตให้จัดทำรายงานโดยใช้เทคโนโลยีคอมพิวเตอร์ได้

การมอบหมายงาน

ก่อนที่จะดำเนินการวัดทั้งหมด สมาชิกในทีมแต่ละคนจะต้องศึกษากฎการใช้งาน เกมกีฬาลูกดอกที่ให้ไว้ในภาคผนวก 7 ซึ่งจำเป็นสำหรับการดำเนินการวิจัยในขั้นตอนต่อไปนี้

ระยะที่ 1 ของการวิจัย“การศึกษาผลการตีเป้าหมายของเกมกีฬาปาเป้าโดยสมาชิกแต่ละคนในทีมเพื่อให้เป็นไปตามกฎหมายการกระจายสินค้าตามปกติตามหลักเกณฑ์ χ 2เพียร์สันและเกณฑ์สามซิกมา"

1. วัด (ทดสอบ) ความเร็ว (ส่วนตัว) ของคุณและการประสานงานของการกระทำ ด้วยการขว้างปาเป้า 30-40 ครั้งไปที่เป้าหมายวงกลมในเกมกีฬาปาเป้า

2. ผลการวัด (การทดสอบ) x ฉัน(มีแว่น) จัดเรียงตามแบบ ซีรีย์การเปลี่ยนแปลงและเข้าไปในตารางที่ 4.1 (คอลัมน์ , ทำทั้งหมด การคำนวณที่จำเป็นกรอกตารางที่จำเป็นและสรุปผลที่เหมาะสมเกี่ยวกับการปฏิบัติตามผลการแจกแจงเชิงประจักษ์กับกฎการแจกแจงแบบปกติ โดยการเปรียบเทียบกับการคำนวณ ตาราง และข้อสรุปที่คล้ายกันของตัวอย่าง 2.12 ซึ่งให้ไว้ในส่วนที่ 2 ของแนวทางเหล่านี้ในหน้า 7 -10

ตารางที่ 4.1

ความสอดคล้องของความเร็วและการประสานงานของการกระทำของอาสาสมัครกับกฎหมายการกระจายแบบปกติ

เลขที่ โค้งมน
ทั้งหมด

II – ขั้นตอนการวิจัย

“การประเมินตัวบ่งชี้เฉลี่ยของประชากรทั่วไปในการโจมตีเป้าหมายของเกมกีฬาปาเป้าของนักเรียนทุกคนในกลุ่มเรียนโดยพิจารณาจากผลการวัดของสมาชิกของทีมเดียว”

ประเมินตัวบ่งชี้เฉลี่ยความเร็วและการประสานงานของการกระทำของนักเรียนทุกคนในกลุ่มเรียน (ตามรายชื่อกลุ่มเรียนในนิตยสารชั้นเรียน) โดยพิจารณาจากผลการตีเป้าหมายของเกมกีฬาปาเป้าของสมาชิกในทีมทุกคนที่ได้รับ ในขั้นตอนแรกของการวิจัยงานห้องปฏิบัติการนี้

1. บันทึกผลการวัดความเร็วและการประสานงานของการกระทำ เมื่อขว้างปาเป้าไปที่เป้าหมายวงกลมในเกมกีฬา ปาเป้าของสมาชิกทุกคนในทีมของคุณ (2 - 4 คน) ซึ่งเป็นตัวอย่างผลการวัดจากประชากรทั่วไป (ผลการวัดของนักเรียนทุกคนในกลุ่มเรียน - เช่น จำนวน 15 คน) โดยระบุในคอลัมน์ที่สองและสาม ตารางที่ 4.2

ตารางที่ 4.2

ตัวชี้วัดการประมวลผลความเร็วและการประสานงานของการกระทำ

สมาชิกกองพลน้อย

เลขที่
ทั้งหมด

ในตาราง 4.2 ภายใต้ ควรจะเข้าใจ , คะแนนเฉลี่ยที่ตรงกัน (ดูผลการคำนวณในตารางที่ 4.1) สมาชิกในทีมของคุณ ( , ได้รับในขั้นตอนแรกของการวิจัย ควรสังเกตว่า โดยปกติ, ตาราง 4.2 ประกอบด้วยค่าเฉลี่ยที่คำนวณได้ของผลการวัดที่ได้รับโดยสมาชิกคนหนึ่งในทีมในขั้นตอนแรกของการวิจัย เนื่องจากโอกาสที่ผลการวัดของสมาชิกในทีมแต่ละคนจะตรงกันนั้นมีน้อยมาก แล้ว, ตามกฎแล้วค่าต่างๆ ในคอลัมน์ ตารางที่ 4.2 สำหรับแต่ละแถว - เท่ากับ 1 ในบรรทัด “ยอดรวม " คอลัมน์ " " ถูกเขียน จำนวนสมาชิกในทีมของคุณ

2. ทำการคำนวณที่จำเป็นทั้งหมดเพื่อกรอกตาราง 4.2 รวมถึงการคำนวณและข้อสรุปอื่น ๆ ที่คล้ายกับการคำนวณและข้อสรุปของตัวอย่าง 2.13 ที่ให้ไว้ในส่วนที่ 2 ของสิ่งนี้ การพัฒนาระเบียบวิธีในหน้า 13-14. ควรคำนึงถึงเมื่อคำนวณข้อผิดพลาดในการเป็นตัวแทน "ม" มีความจำเป็นต้องใช้สูตร 2.4 ที่ให้ไว้ในหน้า 13 ของการพัฒนาวิธีการนี้เนื่องจากกลุ่มตัวอย่างมีขนาดเล็ก (n และจำนวนองค์ประกอบของประชากรทั่วไป N เป็นที่รู้จักและเท่ากับจำนวนนักเรียนในกลุ่มการศึกษา ตามรายชื่อวารสารของกลุ่มศึกษา

III – ขั้นตอนการวิจัย

การประเมินประสิทธิผลของการวอร์มอัพตามตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” โดยสมาชิกในทีมแต่ละคนโดยใช้แบบทดสอบของนักเรียน

เพื่อประเมินประสิทธิผลของการวอร์มอัพสำหรับการขว้างลูกดอกไปยังเป้าหมายของเกมกีฬา "ปาเป้า" ซึ่งดำเนินการในขั้นตอนแรกของการวิจัยของงานในห้องปฏิบัติการนี้โดยสมาชิกแต่ละคนในทีมตามตัวบ่งชี้ "ความเร็วและ การประสานงานของการกระทำ" โดยใช้เกณฑ์ของนักเรียน - เกณฑ์พาราเมตริกสำหรับความน่าเชื่อถือทางสถิติของกฎการกระจายเชิงประจักษ์กับกฎการกระจายแบบปกติ

… ทั้งหมด

2. ความแตกต่าง และอาร์เอ็มเอส , ผลการวัดตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” ตามผลการวอร์มอัพ, กำหนดไว้ในตาราง 4.3 (ดูการคำนวณที่คล้ายกันที่ให้ไว้ทันทีหลังจากตาราง 2.30 ของตัวอย่าง 2.14 ในหน้า 16 ของการพัฒนาวิธีการนี้)

3. ทีมงานแต่ละคน วัด (ทดสอบ) ความเร็ว (ส่วนตัว) ของคุณและการประสานงานของการกระทำหลังจากการวอร์มอัพ

… ทั้งหมด

5. ทำการคำนวณโดยเฉลี่ย ความแตกต่าง และอาร์เอ็มเอส ,ผลการวัดตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" หลังจากการอุ่นเครื่อง กำหนดไว้ในตาราง 4.4 เขียนผลการวัดโดยรวมตามผลการอุ่นเครื่อง (ดูการคำนวณที่คล้ายกันที่ให้ไว้ทันทีหลังจากตาราง 2.31 ของตัวอย่าง 2.14 ในหน้า 17 ของการพัฒนาวิธีการนี้)

6. ทำการคำนวณและข้อสรุปที่จำเป็นทั้งหมดคล้ายกับการคำนวณและข้อสรุปของตัวอย่างที่ 2.14 ที่ให้ไว้ในส่วนที่ 2 ของการพัฒนาวิธีการนี้ในหน้า 16-17 ควรคำนึงถึงเมื่อคำนวณข้อผิดพลาดในการเป็นตัวแทน "ม" จำเป็นต้องใช้สูตร 2.1 ที่ให้ไว้ในหน้า 12 ของการพัฒนาวิธีการนี้เนื่องจากตัวอย่างคือ n และจำนวนองค์ประกอบในประชากร N ( ไม่ทราบ

IV – ขั้นตอนการวิจัย

การประเมินความสม่ำเสมอ (ความมั่นคง) ของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" ของสมาชิกในทีมสองคนโดยใช้เกณฑ์ฟิชเชอร์

ประเมินความสม่ำเสมอ (ความเสถียร) ของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" ของสมาชิกในทีมสองคนโดยใช้เกณฑ์ฟิชเชอร์ตามผลการวัดที่ได้รับในขั้นตอนที่สามของการวิจัยในงานห้องปฏิบัติการนี้

ในการทำเช่นนี้คุณต้องทำสิ่งต่อไปนี้

การใช้ข้อมูลจากตาราง 4.3 และ 4.4 ผลลัพธ์ของการคำนวณความแปรปรวนจากตารางเหล่านี้ที่ได้รับในขั้นตอนที่สามของการวิจัยตลอดจนวิธีการคำนวณและการใช้เกณฑ์ฟิชเชอร์เพื่อประเมินความสม่ำเสมอ (ความมั่นคง) ของตัวบ่งชี้กีฬาที่ให้ไว้ใน ตัวอย่าง 2.15 ในหน้า 18-19 ของการพัฒนาวิธีการนี้ ให้สรุปผลทางสถิติและการสอนที่เหมาะสม

V – ขั้นตอนการวิจัย

การประเมินกลุ่มตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” ของสมาชิกในทีมหนึ่งคนก่อนและหลังการวอร์มอัพ

ลองพิจารณาดู ตัวอย่างทั่วไปการประยุกต์วิธีการทางสถิติในการแพทย์ ผู้สร้างยาแนะนำให้เพิ่มการขับปัสสาวะตามสัดส่วนของขนาดยาที่ได้รับ เพื่อทดสอบสมมติฐานนี้ พวกเขาให้อาสาสมัคร 5 คนในขนาดยาที่แตกต่างกัน

จากผลการสังเกต กราฟของการขับปัสสาวะเทียบกับขนาดยาจะถูกพล็อต (รูปที่ 1.2A) การพึ่งพาอาศัยกันสามารถมองเห็นได้ด้วยตาเปล่า นักวิจัยแสดงความยินดีกับการค้นพบนี้และโลกของยาขับปัสสาวะชนิดใหม่

ในความเป็นจริง ข้อมูลช่วยให้เราระบุได้อย่างน่าเชื่อถือว่าอาสาสมัครทั้งห้าคนนี้มีการขับปัสสาวะตามขนาดยา ความจริงที่ว่าการพึ่งพาอาศัยกันนี้จะปรากฏในทุกคนที่เสพยานั้นไม่มีอะไรมากไปกว่าข้อสันนิษฐาน
จี

กับ

ชีวิต ไม่สามารถพูดได้ว่ามันไม่มีโคมลอย - ไม่เช่นนั้นทำไมต้องทำการทดลอง?

แต่ยาก็ขายไป ทั้งหมด ผู้คนมากขึ้นรับไปโดยหวังว่าจะเพิ่มการปัสสาวะออก แล้วเราเห็นอะไร? เราเห็นรูปที่ 1.2B ซึ่งบ่งชี้ว่าไม่มีความเชื่อมโยงระหว่างขนาดยากับการขับปัสสาวะ วงกลมสีดำบ่งบอกถึงข้อมูลจากการศึกษาต้นฉบับ สถิติมีวิธีการที่ช่วยให้เราประเมินความเป็นไปได้ที่จะได้รับตัวอย่างที่ "ไม่ได้เป็นตัวแทน" และทำให้เกิดความสับสนอย่างแท้จริง ปรากฎว่าหากไม่มีความสัมพันธ์ระหว่างการขับปัสสาวะกับขนาดยา จะสังเกต "การพึ่งพา" ที่เกิดขึ้นในการทดลองประมาณ 5 จาก 1,000 ครั้ง ดังนั้นใน ในกรณีนี้นักวิจัยโชคไม่ดีเลย แม้ว่าพวกเขาจะใช้วิธีการทางสถิติขั้นสูงสุด แต่ก็ยังไม่สามารถป้องกันพวกเขาจากการทำผิดพลาดได้

เราให้ตัวอย่างที่สมมติขึ้นนี้ แต่ไม่ไกลจากความเป็นจริงเลย โดยไม่ชี้ให้เห็นถึงความไร้ประโยชน์
ความเป็นมาของสถิติ เขาพูดถึงเรื่องอื่นเกี่ยวกับลักษณะความน่าจะเป็นของข้อสรุปของเธอ จากการใช้วิธีการทางสถิติ เราไม่ได้รับความจริงขั้นสุดท้าย แต่เป็นเพียงการประมาณความน่าจะเป็นของสมมติฐานเฉพาะเท่านั้น นอกจากนี้ วิธีการทางสถิติแต่ละวิธียังใช้แบบจำลองทางคณิตศาสตร์ของตัวเองและผลลัพธ์ที่ได้ก็ถูกต้องจนแบบจำลองนี้สอดคล้องกับความเป็นจริง

เพิ่มเติมในหัวข้อความน่าเชื่อถือและความสำคัญทางสถิติ:

  1. ความแตกต่างที่มีนัยสำคัญทางสถิติในตัวชี้วัดคุณภาพชีวิต
  2. ประชากรทางสถิติ ลักษณะทางบัญชี แนวคิดการวิจัยต่อเนื่องและคัดเลือก ข้อกำหนดสำหรับข้อมูลทางสถิติและการใช้เอกสารทางบัญชีและการรายงาน
  3. เชิงนามธรรม. การศึกษาความน่าเชื่อถือของตัวชี้วัด TONOMETER สำหรับการวัดความดันภายในลูกตาผ่านเปลือกตา 2561, 2561

สมมติฐานมีการทดสอบโดยใช้ การวิเคราะห์ทางสถิติ. พบนัยสำคัญทางสถิติโดยใช้ค่า P ซึ่งสอดคล้องกับความน่าจะเป็นของเหตุการณ์ที่กำหนด โดยสมมติว่าข้อความบางข้อความ (สมมติฐานว่าง) เป็นจริง หากค่า P น้อยกว่าระดับนัยสำคัญทางสถิติที่ระบุ (ปกติคือ 0.05) ผู้ทดลองสามารถสรุปได้อย่างปลอดภัยว่าสมมติฐานว่างเป็นเท็จ และดำเนินการพิจารณาสมมติฐานทางเลือกต่อไป เมื่อใช้การทดสอบของนักเรียน คุณสามารถคำนวณค่า P และกำหนดนัยสำคัญของชุดข้อมูลสองชุดได้

ขั้นตอน

ส่วนที่ 1

การตั้งค่าการทดสอบ

    กำหนดสมมติฐานของคุณขั้นตอนแรกในการประเมินนัยสำคัญทางสถิติคือการเลือกคำถามที่คุณต้องการตอบและกำหนดสมมติฐาน สมมติฐานคือข้อความเกี่ยวกับข้อมูลการทดลอง การกระจายตัว และคุณสมบัติ สำหรับการทดลองใดๆ ก็ตาม จะมีทั้งสมมติฐานว่างและสมมติฐานทางเลือก โดยทั่วไป คุณจะต้องเปรียบเทียบข้อมูลสองชุดเพื่อดูว่าคล้ายกันหรือต่างกัน

    • โดยทั่วไปสมมติฐานว่าง (H 0) จะระบุว่าไม่มีความแตกต่างระหว่างชุดข้อมูลสองชุด ตัวอย่างเช่น นักเรียนที่อ่านเนื้อหาก่อนชั้นเรียนจะไม่ได้รับเกรดที่สูงขึ้น
    • สมมติฐานทางเลือก (H a) ตรงกันข้ามกับสมมติฐานว่างและเป็นข้อความที่ต้องได้รับการสนับสนุนจากข้อมูลการทดลอง ตัวอย่างเช่น นักเรียนที่อ่านเนื้อหาก่อนชั้นเรียนจะได้เกรดที่สูงขึ้น
  1. กำหนดระดับนัยสำคัญเพื่อกำหนดว่าการกระจายข้อมูลจะต้องแตกต่างจากปกติมากน้อยเพียงใดจึงจะถือเป็นผลลัพธ์ที่มีนัยสำคัญ ระดับความสำคัญ (เรียกอีกอย่างว่า α (\displaystyle \alpha )-level) คือเกณฑ์ที่คุณกำหนดสำหรับนัยสำคัญทางสถิติ หากค่า P น้อยกว่าหรือเท่ากับระดับนัยสำคัญ ข้อมูลจะถือว่ามีนัยสำคัญทางสถิติ

    • ตามกฎแล้ว ระดับนัยสำคัญ (value α (\displaystyle \alpha )) มีค่าเป็น 0.05 ซึ่งในกรณีนี้ความน่าจะเป็นที่จะตรวจพบความแตกต่างแบบสุ่มระหว่างชุดข้อมูลที่ต่างกันจะอยู่ที่ 5% เท่านั้น
    • ยิ่งระดับนัยสำคัญสูงขึ้น (และด้วยเหตุนี้ ค่า P น้อยลง) ผลลัพธ์ก็จะยิ่งน่าเชื่อถือมากขึ้นเท่านั้น
    • หากคุณต้องการผลลัพธ์ที่เชื่อถือได้มากขึ้น ให้ลดค่า P ลงเหลือ 0.01 โดยทั่วไปแล้ว ค่า P ที่ต่ำกว่าจะใช้ในการผลิตเมื่อจำเป็นต้องระบุข้อบกพร่องในผลิตภัณฑ์ ในกรณีนี้ จำเป็นต้องมีความน่าเชื่อถือสูงเพื่อให้แน่ใจว่าชิ้นส่วนทั้งหมดทำงานได้ตามที่คาดหวัง
    • สำหรับการทดลองสมมุติฐานส่วนใหญ่ ระดับนัยสำคัญที่ 0.05 ก็เพียงพอแล้ว
  2. ตัดสินใจว่าจะใช้เกณฑ์ใด:ด้านเดียวหรือสองด้าน ข้อสันนิษฐานประการหนึ่งในการทดสอบ Student t คือข้อมูลมีการกระจายตามปกติ การแจกแจงแบบปกติคือเส้นโค้งรูประฆังที่มีจำนวนผลลัพธ์สูงสุดตรงกลางเส้นโค้ง การทดสอบค่าทีของนักเรียนเป็นวิธีการทดสอบข้อมูลทางคณิตศาสตร์ที่ช่วยให้คุณระบุได้ว่าข้อมูลอยู่นอกการแจกแจงแบบปกติหรือไม่ (มากกว่า น้อยกว่า หรืออยู่ "ส่วนท้าย" ของเส้นโค้ง)

    • หากคุณไม่แน่ใจว่าข้อมูลอยู่เหนือหรือต่ำกว่าค่ากลุ่มควบคุม ให้ใช้การทดสอบแบบสองด้าน สิ่งนี้จะช่วยให้คุณสามารถกำหนดความสำคัญได้ทั้งสองทิศทาง
    • หากคุณรู้ว่าข้อมูลอาจอยู่นอกการแจกแจงแบบปกติไปในทิศทางใด ให้ใช้การทดสอบแบบด้านเดียว ในตัวอย่างข้างต้น เราคาดว่าเกรดของนักเรียนจะเพิ่มขึ้น ดังนั้นจึงสามารถใช้การทดสอบแบบด้านเดียวได้
  3. กำหนดขนาดตัวอย่างโดยใช้กำลังทางสถิติกำลังทางสถิติของการศึกษาคือความน่าจะเป็นที่จะได้ผลลัพธ์ที่คาดหวังเมื่อพิจารณาจากขนาดตัวอย่าง เกณฑ์พลังงานทั่วไป (หรือ β) คือ 80% การวิเคราะห์อำนาจทางสถิติโดยไม่มีข้อมูลใดๆ มาก่อนอาจเป็นเรื่องที่ท้าทาย เนื่องจากต้องใช้ข้อมูลบางอย่างเกี่ยวกับค่าเฉลี่ยที่คาดหวังในแต่ละกลุ่มของข้อมูลและค่าเบี่ยงเบนมาตรฐาน ใช้เครื่องคำนวณการวิเคราะห์พลังงานออนไลน์เพื่อกำหนดขนาดตัวอย่างที่เหมาะสมที่สุดสำหรับข้อมูลของคุณ

    • โดยทั่วไปแล้ว นักวิจัยจะดำเนินการศึกษานำร่องขนาดเล็กที่ให้ข้อมูลสำหรับการวิเคราะห์กำลังทางสถิติ และกำหนดขนาดตัวอย่างที่จำเป็นสำหรับการศึกษาที่ใหญ่และสมบูรณ์ยิ่งขึ้น
    • หากคุณไม่สามารถทำการศึกษานำร่องได้ ให้พยายามประมาณค่าเฉลี่ยที่เป็นไปได้โดยพิจารณาจากวรรณกรรมและผลลัพธ์ของผู้อื่น วิธีนี้อาจช่วยให้คุณกำหนดขนาดตัวอย่างที่เหมาะสมที่สุดได้

    ส่วนที่ 2

    คำนวณค่าเบี่ยงเบนมาตรฐาน
    1. เขียนสูตรสำหรับส่วนเบี่ยงเบนมาตรฐาน.ค่าเบี่ยงเบนมาตรฐานจะแสดงว่ามีสเปรดในข้อมูลมากน้อยเพียงใด ช่วยให้คุณสามารถสรุปได้ว่าข้อมูลที่ได้รับจากตัวอย่างบางกลุ่มมีความใกล้เคียงกันเพียงใด เมื่อดูเผินๆ สูตรดูเหมือนค่อนข้างซับซ้อน แต่คำอธิบายด้านล่างจะช่วยให้คุณเข้าใจได้ สูตรก็มี มุมมองถัดไป: s = √∑((x i – µ) 2 /(N – 1)).

      • s - ส่วนเบี่ยงเบนมาตรฐาน
      • เครื่องหมาย ∑ ระบุว่าควรเพิ่มข้อมูลทั้งหมดที่ได้รับจากตัวอย่าง
      • x i สอดคล้องกับค่า i-th นั่นคือผลลัพธ์แยกต่างหากที่ได้รับ
      • µ คือค่าเฉลี่ยสำหรับกลุ่มที่กำหนด
      • น- จำนวนทั้งหมดข้อมูลในตัวอย่าง
    2. หาค่าเฉลี่ยในแต่ละกลุ่มในการคำนวณค่าเบี่ยงเบนมาตรฐาน คุณต้องหาค่าเฉลี่ยของแต่ละกลุ่มการศึกษาก่อน ค่าเฉลี่ยแสดงด้วยตัวอักษรกรีก µ (mu) หากต้องการค้นหาค่าเฉลี่ย เพียงเพิ่มค่าผลลัพธ์ทั้งหมดแล้วหารด้วยจำนวนข้อมูล (ขนาดตัวอย่าง)

      • ตัวอย่างเช่น หากต้องการค้นหาเกรดเฉลี่ยของกลุ่มนักเรียนที่เรียนก่อนเข้าเรียน ให้พิจารณาชุดข้อมูลขนาดเล็ก เพื่อความง่าย เราใช้ชุดที่มีห้าจุด: 90, 91, 85, 83 และ 94
      • มาบวกค่าทั้งหมดเข้าด้วยกัน: 90 + 91 + 85 + 83 + 94 = 443
      • ลองหารผลรวมด้วยจำนวนค่า N = 5: 443/5 = 88.6
      • ดังนั้นค่าเฉลี่ยของกลุ่มนี้คือ 88.6
    3. ลบแต่ละค่าที่ได้รับจากค่าเฉลี่ยขั้นตอนต่อไปคือการคำนวณความแตกต่าง (x i – µ) เมื่อต้องการทำเช่นนี้ ให้ลบแต่ละค่าที่ได้รับจากค่าเฉลี่ยที่พบ ในตัวอย่างของเรา เราจำเป็นต้องค้นหาความแตกต่างห้าประการ:

      • (90 – 88.6), (91 – 88.6), (85 – 88.6), (83 – 88.6) และ (94 – 88.6)
      • เป็นผลให้เราได้รับค่าต่อไปนี้: 1.4, 2.4, -3.6, -5.6 และ 5.4
    4. ยกกำลังสองแต่ละค่าที่ได้รับแล้วบวกเข้าด้วยกันแต่ละปริมาณที่เพิ่งค้นพบควรเป็นกำลังสอง ขั้นตอนนี้จะลบค่าลบทั้งหมด หากหลังจากขั้นตอนนี้คุณยังมีเลขติดลบ แสดงว่าคุณลืมยกกำลังสอง

      • จากตัวอย่างของเรา เราได้ 1.96, 5.76, 12.96, 31.36 และ 29.16
      • เราบวกค่าผลลัพธ์: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2
    5. หารด้วยขนาดตัวอย่างลบ 1ในสูตรจะหารผลรวมด้วย N – 1 เนื่องจากเราไม่ได้คำนึงถึงประชากรทั่วไป แต่นำตัวอย่างนักเรียนทั้งหมดมาประเมิน

      • ลบ: N – 1 = 5 – 1 = 4
      • หาร: 81.2/4 = 20.3
    6. ลบ รากที่สอง. หลังจากที่คุณหารผลรวมด้วยขนาดตัวอย่างลบด้วย 1 แล้ว ให้หารากที่สองของค่าที่พบ นี่เป็นขั้นตอนสุดท้ายในการคำนวณค่าเบี่ยงเบนมาตรฐาน มีโปรแกรมทางสถิติที่หลังจากป้อนข้อมูลเริ่มต้นแล้วให้ทำการคำนวณที่จำเป็นทั้งหมด

      • ในตัวอย่างของเรา ค่าเบี่ยงเบนมาตรฐานของเกรดของนักเรียนที่อ่านเนื้อหาก่อนเข้าเรียนคือ s =√20.3 = 4.51

      ส่วนที่ 3

      กำหนดความสำคัญ
      1. คำนวณความแปรปรวนระหว่างข้อมูลทั้งสองกลุ่มก่อนขั้นตอนนี้ เราได้ดูตัวอย่างสำหรับข้อมูลเพียงกลุ่มเดียวเท่านั้น หากคุณต้องการเปรียบเทียบสองกลุ่ม คุณควรดึงข้อมูลจากทั้งสองกลุ่มอย่างชัดเจน คำนวณค่าเบี่ยงเบนมาตรฐานสำหรับข้อมูลกลุ่มที่สอง แล้วหาความแปรปรวนระหว่างข้อมูลทั้งสอง กลุ่มทดลอง. ความแปรปรวนคำนวณโดยใช้สูตรต่อไปนี้: s d = √((s 1 /N 1) + (s 2 /N 2))

ถ้าคุณไม่ดำเนินการ วอร์ดจะไม่มีประโยชน์ (โชตะ รุสตาเวลี)

คำศัพท์และแนวคิดพื้นฐานของสถิติทางการแพทย์

ในบทความนี้เราจะนำเสนอบางส่วน แนวคิดหลักสถิติที่เกี่ยวข้องกับการวิจัยทางการแพทย์ มีการกล่าวถึงข้อกำหนดโดยละเอียดในบทความที่เกี่ยวข้อง

การเปลี่ยนแปลง

คำนิยาม.ระดับการกระจายตัวของข้อมูล (ค่าแอตทริบิวต์) ในช่วงของค่า

ความน่าจะเป็น

คำนิยาม. ความน่าจะเป็นคือระดับความเป็นไปได้ที่เหตุการณ์บางอย่างจะเกิดขึ้นภายใต้เงื่อนไขบางประการ

ตัวอย่าง. ให้เราอธิบายคำจำกัดความของคำในประโยค “ความน่าจะเป็นที่จะหายเมื่อใช้ยา Arimidex คือ 70%” เหตุการณ์คือ “การฟื้นตัวของผู้ป่วย” สภาพ “ผู้ป่วยได้รับยา Arimidex” ระดับความเป็นไปได้คือ 70% (พูดโดยคร่าวๆ จากผู้ที่รับยา Arimidex 100 คน หายได้ 70 คน)

ความน่าจะเป็นสะสม

คำนิยาม.ความน่าจะเป็นสะสมของการรอดชีวิต ณ เวลา t เท่ากับสัดส่วนของผู้ป่วยที่ยังมีชีวิตอยู่ในขณะนั้น

ตัวอย่าง. หากกล่าวกันว่าความน่าจะเป็นสะสมของการรอดชีวิตหลังจากการรักษาเป็นเวลาห้าปีคือ 0.7 นั่นหมายความว่ากลุ่มผู้ป่วยที่อยู่ระหว่างการพิจารณา 70% ของจำนวนเริ่มต้นยังมีชีวิตอยู่ และ 30% เสียชีวิต กล่าวอีกนัยหนึ่ง ในทุกๆ ร้อยคน มีผู้เสียชีวิต 30 รายภายใน 5 ปีแรก

เวลาก่อนงาน

คำนิยาม.เวลาก่อนเหตุการณ์คือเวลาที่แสดงในบางหน่วยที่ผ่านไปจากจุดเริ่มแรกจนกระทั่งเกิดเหตุการณ์บางอย่างขึ้น

คำอธิบาย. หน่วยเวลาในการวิจัยทางการแพทย์คือ วัน เดือน และปี

ตัวอย่างทั่วไปของเวลาเริ่มต้น:

    เริ่มติดตามผู้ป่วย

    การผ่าตัดรักษา

ตัวอย่างเหตุการณ์ทั่วไปที่พิจารณา:

    ความก้าวหน้าของโรค

    การเกิดขึ้นของการกำเริบของโรค

    ผู้ป่วยเสียชีวิต

ตัวอย่าง

คำนิยาม.สัดส่วนของประชากรที่ได้รับจากการคัดเลือก

จากผลการวิเคราะห์ตัวอย่าง จะมีการหาข้อสรุปเกี่ยวกับประชากรทั้งหมด ซึ่งจะใช้ได้เฉพาะในกรณีที่การเลือกเป็นการสุ่มเท่านั้น เนื่องจากเป็นไปไม่ได้ในทางปฏิบัติที่จะสุ่มเลือกจากประชากรกลุ่มหนึ่ง จึงควรพยายามให้แน่ใจว่ากลุ่มตัวอย่างอย่างน้อยจะเป็นตัวแทนของประชากร

ตัวอย่างที่ขึ้นต่อกันและเป็นอิสระ

คำนิยาม.ตัวอย่างที่คัดเลือกอาสาสมัครที่ศึกษาโดยแยกจากกัน อีกทางเลือกหนึ่งนอกเหนือจากตัวอย่างอิสระคือตัวอย่างที่ต้องพึ่งพา (เชื่อมต่อและจับคู่)

สมมติฐาน

สมมติฐานสองด้านและด้านเดียว

ก่อนอื่น ให้เราอธิบายการใช้คำว่าสมมติฐานในสถิติ

วัตถุประสงค์ของการวิจัยส่วนใหญ่คือเพื่อทดสอบความจริงของข้อความบางข้อความ วัตถุประสงค์ของการทดสอบยาส่วนใหญ่มักเพื่อทดสอบสมมติฐานที่ว่ายาตัวหนึ่งมีประสิทธิผลมากกว่ายาอีกตัวหนึ่ง (เช่น Arimidex มีประสิทธิภาพมากกว่า Tamoxifen)

เพื่อให้มั่นใจถึงความเข้มงวดของการศึกษา ข้อความที่ได้รับการยืนยันจะแสดงออกมาทางคณิตศาสตร์ ตัวอย่างเช่น ถ้า A คือจำนวนปีที่ผู้ป่วยที่รับประทานยา Arimidex จะมีชีวิตอยู่ และ T คือจำนวนปีที่ผู้ป่วยที่รับประทานยา Tamoxifen จะมีชีวิตอยู่ ดังนั้นสมมติฐานที่จะทดสอบสามารถเขียนเป็น A>T

คำนิยาม.สมมติฐานเรียกว่าสองด้านหากประกอบด้วยปริมาณสองปริมาณเท่ากัน

ตัวอย่างของสมมติฐานสองด้าน: A=T

คำนิยาม. สมมติฐานเรียกว่าด้านเดียว (1 ด้าน) หากประกอบด้วยความไม่เท่าเทียมกันของปริมาณสองปริมาณ

ตัวอย่างสมมติฐานฝ่ายเดียว:

ข้อมูลแบบไดโคโตมัส (ไบนารี)

คำนิยาม.ข้อมูลที่แสดงด้วยค่าทางเลือกที่ถูกต้องเพียงสองค่าเท่านั้น

ตัวอย่าง: ผู้ป่วย "แข็งแรง" - "ป่วย" อาการบวมน้ำ "เป็น" - "ไม่"

ช่วงความเชื่อมั่น

คำนิยาม.ช่วงความเชื่อมั่นของปริมาณคือช่วงรอบๆ ค่าของปริมาณซึ่งมูลค่าที่แท้จริงของปริมาณนั้นอยู่ (โดยมีระดับความเชื่อมั่นที่แน่นอน)

ตัวอย่าง. ให้ปริมาณที่ศึกษาคือจำนวนผู้ป่วยต่อปี โดยเฉลี่ยแล้ว ตัวเลขคือ 500 และช่วงความเชื่อมั่น 95% คือ (350, 900) ซึ่งหมายความว่า มีแนวโน้มมากที่สุด (ที่มีความน่าจะเป็น 95%) อย่างน้อย 350 คนและไม่เกิน 900 คนจะติดต่อคลินิกในระหว่างปี

การกำหนด ตัวย่อที่ใช้กันทั่วไปคือ CI 95% คือช่วงความเชื่อมั่นที่มีระดับความเชื่อมั่น 95%

ความน่าเชื่อถือ นัยสำคัญทางสถิติ (ระดับ P)

คำนิยาม.นัยสำคัญทางสถิติของผลลัพธ์คือการวัดความเชื่อมั่นใน "ความจริง"

การวิจัยใด ๆ ดำเนินการบนพื้นฐานของวัตถุเพียงบางส่วนเท่านั้น การศึกษาประสิทธิผลของยาไม่ได้ดำเนินการบนพื้นฐานของผู้ป่วยทุกคนในโลก แต่เฉพาะกับผู้ป่วยบางกลุ่มเท่านั้น (เป็นไปไม่ได้เลยที่จะดำเนินการวิเคราะห์บนพื้นฐานของผู้ป่วยทุกราย)

สมมติว่าผลการวิเคราะห์ได้ข้อสรุปบางอย่าง (เช่น การใช้ Arimidex เป็นวิธีการรักษาที่เหมาะสมจะมีประสิทธิภาพมากกว่า Tamoxifen 2 เท่า)

คำถามที่ต้องถามคือ “คุณเชื่อถือผลลัพธ์นี้ได้มากแค่ไหน”

ลองจินตนาการว่าเราทำการศึกษาโดยใช้ผู้ป่วยเพียงสองราย แน่นอนว่าในกรณีนี้ควรปฏิบัติต่อผลลัพธ์ด้วยความระมัดระวัง หากตรวจผู้ป่วยจำนวนมาก (ค่าตัวเลข “ ปริมาณมาก“ขึ้นอยู่กับสถานการณ์) แล้วข้อสรุปที่สรุปออกมาก็เชื่อถือได้อยู่แล้ว”

ดังนั้น ระดับความเชื่อมั่นจึงถูกกำหนดโดยค่าระดับ p (ค่า p)

ระดับ p ที่สูงขึ้นสอดคล้องกับระดับความเชื่อมั่นที่ต่ำกว่าในผลลัพธ์ที่ได้จากการวิเคราะห์ตัวอย่าง ตัวอย่างเช่น ระดับ p เท่ากับ 0.05 (5%) บ่งชี้ว่าข้อสรุปที่ได้จากการวิเคราะห์ของกลุ่มใดกลุ่มหนึ่งเป็นเพียงลักษณะสุ่มของวัตถุเหล่านี้ที่มีความน่าจะเป็นเพียง 5%

กล่าวอีกนัยหนึ่ง มีความเป็นไปได้สูงมาก (95%) ข้อสรุปสามารถขยายไปยังวัตถุทั้งหมดได้

การศึกษาจำนวนมากถือว่า 5% เป็นค่าระดับ p ที่ยอมรับได้ ซึ่งหมายความว่า ตัวอย่างเช่น หาก p = 0.01 ผลลัพธ์ก็สามารถเชื่อถือได้ แต่ถ้า p = 0.06 คุณจะทำไม่ได้

ศึกษา

การศึกษาในอนาคตคือการศึกษาโดยเลือกตัวอย่างตามปัจจัยตั้งต้น และวิเคราะห์ปัจจัยผลลัพธ์บางส่วนในตัวอย่าง

การศึกษาย้อนหลังคือการศึกษาโดยเลือกตัวอย่างตามปัจจัยผลลัพธ์ และวิเคราะห์ปัจจัยเริ่มต้นบางอย่างในกลุ่มตัวอย่าง

ตัวอย่าง. ปัจจัยแรกคือหญิงตั้งครรภ์ที่อายุน้อยกว่า/20 ปีขึ้นไป ปัจจัยส่งผลให้เด็กเบา/หนักเกิน 2.5 กก. เราวิเคราะห์ว่าน้ำหนักของเด็กขึ้นอยู่กับอายุของแม่หรือไม่

หากเราคัดเลือกกลุ่มตัวอย่าง 2 กลุ่ม กลุ่มหนึ่งเป็นมารดาอายุต่ำกว่า 20 ปี อีกกลุ่มหนึ่งเป็นมารดาที่มีอายุมากกว่า แล้ววิเคราะห์มวลของเด็กในแต่ละกลุ่ม นี่คือการศึกษาในอนาคต

หากเราคัดเลือก 2 ตัวอย่าง โดยกลุ่มหนึ่งคือแม่ที่ให้กำเนิดลูกน้ำหนักน้อยกว่า 2.5 กก. อีกกลุ่มหนึ่งหนักกว่าแล้ววิเคราะห์อายุของมารดาในแต่ละกลุ่ม นี่คือการศึกษาย้อนหลัง (โดยธรรมชาติแล้ว การศึกษาดังกล่าว สามารถทำได้เมื่อการทดลองเสร็จสิ้นเท่านั้น กล่าวคือ เด็กทุกคนเกิดมา)

อพยพ

คำนิยาม.ปรากฏการณ์ที่มีนัยสำคัญทางคลินิก ตัวบ่งชี้ทางห้องปฏิบัติการหรือสัญญาณที่ทำหน้าที่เป็นเป้าหมายที่สนใจของผู้วิจัย เมื่อดำเนินการทดลองทางคลินิก ผลลัพธ์จะทำหน้าที่เป็นเกณฑ์ในการประเมินประสิทธิผลของการแทรกแซงเพื่อการรักษาหรือการป้องกัน

ระบาดวิทยาทางคลินิก

คำนิยาม.วิทยาศาสตร์ที่ทำให้สามารถทำนายผลลัพธ์เฉพาะสำหรับผู้ป่วยแต่ละรายโดยอาศัยการศึกษาทางคลินิกของโรคในกรณีที่คล้ายกันโดยใช้วิธีที่เข้มงวด วิธีการทางวิทยาศาสตร์ศึกษาผู้ป่วยเพื่อให้แน่ใจว่าการพยากรณ์มีความแม่นยำ

กลุ่มประชากรตามรุ่น

คำนิยาม.กลุ่มผู้เข้าร่วมการศึกษาที่มีลักษณะร่วมกันบางอย่างในช่วงเวลาของการก่อตั้งและศึกษากันในระยะเวลาอันยาวนาน

ควบคุม

การควบคุมทางประวัติศาสตร์

คำนิยาม.กลุ่มควบคุมก่อตัวและตรวจสอบในช่วงก่อนการศึกษา

การควบคุมแบบขนาน

คำนิยาม.กลุ่มควบคุมเกิดขึ้นพร้อมๆ กับการก่อตั้งกลุ่มหลัก

ความสัมพันธ์

คำนิยาม.ความสัมพันธ์ทางสถิติระหว่างสองลักษณะ (เชิงปริมาณหรือลำดับ) แสดงให้เห็นว่า มูลค่าที่สูงขึ้นคุณลักษณะหนึ่งในบางกรณีของกรณีสอดคล้องกับค่าที่มากกว่า - ในกรณีที่มีความสัมพันธ์เชิงบวก (โดยตรง) - ค่าของคุณลักษณะอื่นหรือค่าที่น้อยกว่า - ในกรณีของความสัมพันธ์เชิงลบ (ผกผัน)

ตัวอย่าง. พบความสัมพันธ์อย่างมีนัยสำคัญระหว่างระดับเกล็ดเลือดและเม็ดเลือดขาวในเลือดของผู้ป่วย ค่าสัมประสิทธิ์สหสัมพันธ์คือ 0.76

ค่าสัมประสิทธิ์ความเสี่ยง (RR)

คำนิยาม.อัตราส่วนความเสี่ยงคืออัตราส่วนของความน่าจะเป็นที่เหตุการณ์เดียวกันจะเกิดขึ้นสำหรับวัตถุกลุ่มแรก ("ไม่ดี") กับความน่าจะเป็นที่จะเกิดขึ้นของเหตุการณ์เดียวกันสำหรับวัตถุกลุ่มที่สอง

ตัวอย่าง. หากความน่าจะเป็นที่จะเป็นมะเร็งปอดในผู้ไม่สูบบุหรี่คือ 20% และในผู้สูบบุหรี่ - 100% CR จะเท่ากับหนึ่งในห้า ในตัวอย่างนี้ วัตถุกลุ่มแรกเป็นผู้ไม่สูบบุหรี่ กลุ่มที่สองเป็นผู้สูบบุหรี่ และการเกิดมะเร็งปอดถือเป็นเหตุการณ์ที่ "ไม่ดี"

เห็นได้ชัดว่า:

1) ถ้า KR = 1 ความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในกลุ่มจะเท่ากัน

2) ถ้า KP>1 เหตุการณ์จะเกิดขึ้นกับวัตถุจากกลุ่มแรกบ่อยกว่าจากกลุ่มที่สอง

3) ถ้า KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

การวิเคราะห์เมตา

คำนิยาม. กับการวิเคราะห์ทางสถิติที่สรุปผลลัพธ์ของการศึกษาหลายชิ้นที่ตรวจสอบปัญหาเดียวกัน (โดยทั่วไปคือประสิทธิผลของการรักษา การป้องกัน วิธีการวินิจฉัย) การศึกษาแบบรวมกลุ่มจะให้ตัวอย่างที่ใหญ่ขึ้นสำหรับการวิเคราะห์และอำนาจทางสถิติที่มากขึ้นสำหรับการศึกษาแบบรวม ใช้เพื่อเพิ่มหลักฐานหรือความมั่นใจในการสรุปเกี่ยวกับประสิทธิผลของวิธีการศึกษา

วิธี Kaplan-Meier (การประมาณตัวคูณ Kaplan-Meier)

วิธีการนี้คิดค้นโดยนักสถิติ E.L. Kaplan และ Paul Meyer

วิธีการนี้ใช้ในการคำนวณปริมาณต่างๆ ที่เกี่ยวข้องกับเวลาในการสังเกตของผู้ป่วย ตัวอย่างปริมาณดังกล่าว:

    ความน่าจะเป็นที่จะฟื้นตัวภายในหนึ่งปีเมื่อใช้ยา

    โอกาสที่จะกลับเป็นซ้ำหลังการผ่าตัดภายใน 3 ปีหลังการผ่าตัด

    ความน่าจะเป็นสะสมของการรอดชีวิตที่ห้าปีในผู้ป่วยมะเร็งต่อมลูกหมากหลังการตัดอวัยวะ

ให้เราอธิบายข้อดีของการใช้วิธี Kaplan-Meier

ค่าของปริมาณในการวิเคราะห์แบบ "ทั่วไป" (ไม่ใช้วิธี Kaplan-Meier) คำนวณโดยการแบ่งช่วงเวลาที่พิจารณาออกเป็นช่วง

เช่น หากเราศึกษาความน่าจะเป็นของการเสียชีวิตของผู้ป่วยภายใน 5 ปี ก็แบ่งช่วงเวลาออกเป็น 5 ส่วน (น้อยกว่า 1 ปี, 1-2 ปี, 2-3 ปี, 3-4 ปี, 4- 5 ปี) ดังนั้น และ 10 (อย่างละ 6 เดือน) หรือเป็นระยะเวลาอื่นๆ ผลลัพธ์สำหรับพาร์ติชันที่แตกต่างกันจะแตกต่างกัน

การเลือกพาร์ติชันที่เหมาะสมที่สุดไม่ใช่เรื่องง่าย

การประมาณค่าที่ได้รับโดยใช้วิธี Kaplan-Meier ไม่ได้ขึ้นอยู่กับการแบ่งเวลาในการสังเกตออกเป็นระยะ ๆ แต่ขึ้นอยู่กับเวลาชีวิตของผู้ป่วยแต่ละรายเท่านั้น

ดังนั้นจึงง่ายกว่าสำหรับผู้วิจัยที่จะดำเนินการวิเคราะห์ และผลลัพธ์มักจะดีกว่าผลลัพธ์ของการวิเคราะห์แบบ "ทั่วไป"

เส้นโค้ง Kaplan - Meier เป็นกราฟของเส้นโค้งการอยู่รอดที่ได้จากการใช้วิธี Kaplan-Meier

รุ่นค็อกซ์

โมเดลนี้คิดค้นโดย Sir David Roxby Cox (เกิดปี 1924) นักสถิติชาวอังกฤษผู้มีชื่อเสียง ผู้เขียนบทความและหนังสือมากกว่า 300 เล่ม

แบบจำลอง Cox ใช้ในสถานการณ์ที่ปริมาณที่ศึกษาในการวิเคราะห์การอยู่รอดขึ้นอยู่กับฟังก์ชันของเวลา ตัวอย่างเช่น ความน่าจะเป็นที่จะเกิดซ้ำหลังจาก t ปี (t=1,2,...) อาจขึ้นอยู่กับลอการิทึมของบันทึกเวลา (t)

ข้อได้เปรียบที่สำคัญของวิธีการที่ Cox เสนอคือการบังคับใช้วิธีนี้ในสถานการณ์จำนวนมาก (แบบจำลองนี้ไม่ได้กำหนดข้อจำกัดที่เข้มงวดเกี่ยวกับลักษณะหรือรูปร่างของการแจกแจงความน่าจะเป็น)

จากแบบจำลอง Cox การวิเคราะห์สามารถทำได้ (เรียกว่าการวิเคราะห์ Cox) ซึ่งผลลัพธ์ที่ได้คือค่าของสัมประสิทธิ์ความเสี่ยงและช่วงความเชื่อมั่นของค่าสัมประสิทธิ์ความเสี่ยง

วิธีการทางสถิติแบบไม่อิงพารามิเตอร์

คำนิยาม.ประเภทของวิธีการทางสถิติที่ใช้เป็นหลักในการวิเคราะห์ข้อมูลเชิงปริมาณที่ไม่ก่อให้เกิดการแจกแจงแบบปกติ รวมถึงการวิเคราะห์ข้อมูลเชิงคุณภาพ

ตัวอย่าง. เพื่อระบุความสำคัญของความแตกต่างในความดันซิสโตลิกของผู้ป่วยโดยขึ้นอยู่กับประเภทของการรักษา เราจะใช้การทดสอบ Mann-Whitney แบบไม่มีพารามิเตอร์

เครื่องหมาย (ตัวแปร)

คำนิยาม. เอ็กซ์ลักษณะของวัตถุการศึกษา (การสังเกต) มีลักษณะเชิงคุณภาพและเชิงปริมาณ

การสุ่ม

คำนิยาม.วิธีการสุ่มกระจายวัตถุวิจัยออกเป็นกลุ่มหลักและกลุ่มควบคุมโดยใช้วิธีการพิเศษ (ตารางหรือตัวนับตัวเลขสุ่ม การโยนเหรียญ และวิธีการอื่นในการสุ่มกำหนดหมายเลขกลุ่มให้กับการสังเกตที่รวมไว้) การสุ่มจะช่วยลดความแตกต่างระหว่างกลุ่มในลักษณะที่ทราบและไม่ทราบซึ่งอาจส่งผลต่อผลลัพธ์ที่กำลังศึกษา

เสี่ยง

แอตทริบิวต์- ความเสี่ยงเพิ่มเติมของผลลัพธ์ที่ไม่เอื้ออำนวย (เช่น โรค) เนื่องจากการมีลักษณะบางอย่าง (ปัจจัยเสี่ยง) ในเรื่องของการศึกษา นี่เป็นส่วนของความเสี่ยงในการเกิดโรคที่เกี่ยวข้อง อธิบายโดย และสามารถกำจัดได้หากกำจัดปัจจัยเสี่ยงออกไป

ความเสี่ยงสัมพัทธ์- อัตราส่วนของความเสี่ยงของสภาวะที่ไม่เอื้ออำนวยในกลุ่มหนึ่งต่อความเสี่ยงของภาวะนี้ในอีกกลุ่มหนึ่ง ใช้ในการศึกษาในอนาคตและเชิงสังเกตเมื่อมีการสร้างกลุ่มล่วงหน้าและยังไม่เกิดสภาวะที่กำลังศึกษา

ข้อสอบแบบกลิ้ง

คำนิยาม.วิธีการตรวจสอบความเสถียร ความน่าเชื่อถือ ประสิทธิภาพ (ความถูกต้อง) ของแบบจำลองทางสถิติโดยการลบการสังเกตออกตามลำดับและคำนวณแบบจำลองใหม่ ยิ่งโมเดลที่ได้ออกมาคล้ายกันมาก โมเดลก็ยิ่งมีเสถียรภาพและเชื่อถือได้มากขึ้นเท่านั้น

เหตุการณ์

คำนิยาม.ผลลัพธ์ทางคลินิกที่พบในการศึกษา เช่น การเกิดภาวะแทรกซ้อน การกำเริบของโรค การฟื้นตัว หรือการเสียชีวิต

การแบ่งชั้น

คำนิยาม. มเทคนิคการสุ่มตัวอย่างซึ่งประชากรของผู้เข้าร่วมทั้งหมดที่มีคุณสมบัติตรงตามเกณฑ์การคัดเลือกสำหรับการศึกษา จะถูกแบ่งออกเป็นกลุ่ม (ชั้น) ในขั้นแรกตามลักษณะหนึ่งหรือหลายลักษณะ (โดยปกติจะเป็นเพศ อายุ) ที่อาจมีอิทธิพลต่อผลลัพธ์ที่สนใจ จากนั้นจึงแยกจากแต่ละลักษณะ ผู้เข้าร่วมกลุ่มเหล่านี้ ( ชั้น) ได้รับการคัดเลือกอย่างอิสระในกลุ่มทดลองและกลุ่มควบคุม ช่วยให้ผู้วิจัยสามารถปรับสมดุลคุณลักษณะที่สำคัญระหว่างกลุ่มทดลองและกลุ่มควบคุมได้

ตารางฉุกเฉิน

คำนิยาม.ตารางความถี่สัมบูรณ์ (ตัวเลข) ของการสังเกตคอลัมน์ที่สอดคล้องกับค่าของคุณลักษณะหนึ่งและแถว - ไปยังค่าของคุณลักษณะอื่น (ในกรณีของตารางฉุกเฉินสองมิติ) ค่าความถี่สัมบูรณ์จะอยู่ในเซลล์ที่จุดตัดของแถวและคอลัมน์

เรามายกตัวอย่างตารางฉุกเฉินกัน ทำการผ่าตัดหลอดเลือดโป่งพองในผู้ป่วย 194 ราย ความรุนแรงของอาการบวมน้ำในผู้ป่วยก่อนการผ่าตัดเป็นที่ทราบกันดี

อาการบวมน้ำ\ ผลลัพธ์

ไม่มีอาการบวม 20 6 26
บวมปานกลาง 27 15 42
อาการบวมน้ำที่เด่นชัด 8 21 29
มเจ 55 42 194

ดังนั้นจากผู้ป่วย 26 รายที่ไม่มีอาการบวมน้ำ มีผู้ป่วย 20 รายรอดชีวิตหลังการผ่าตัด และผู้ป่วย 6 รายเสียชีวิต จากผู้ป่วยอาการบวมน้ำปานกลาง 42 ราย ผู้ป่วยรอดชีวิต 27 ราย เสียชีวิต 15 ราย เป็นต้น

การทดสอบไคสแควร์สำหรับตารางฉุกเฉิน

เพื่อกำหนดความสำคัญ (ความน่าเชื่อถือ) ของความแตกต่างในสัญญาณหนึ่งโดยขึ้นอยู่กับอีกสัญญาณหนึ่ง (เช่น ผลลัพธ์ของการผ่าตัดขึ้นอยู่กับความรุนแรงของอาการบวมน้ำ) การทดสอบไคสแควร์ใช้สำหรับตารางฉุกเฉิน:


โอกาส

ให้ความน่าจะเป็นของเหตุการณ์บางอย่างเท่ากับ p จากนั้นความน่าจะเป็นที่เหตุการณ์จะไม่เกิดขึ้นคือ 1-p

ตัวอย่างเช่น หากความน่าจะเป็นที่ผู้ป่วยจะมีชีวิตอยู่หลังจากผ่านไปห้าปีคือ 0.8 (80%) ความน่าจะเป็นที่เขาจะเสียชีวิตในช่วงเวลานี้คือ 0.2 (20%)

คำนิยาม.โอกาสคืออัตราส่วนของความน่าจะเป็นที่เหตุการณ์หนึ่งจะเกิดขึ้นต่อความน่าจะเป็นที่เหตุการณ์นั้นจะไม่เกิดขึ้น

ตัวอย่าง. ในตัวอย่างของเรา (เกี่ยวกับผู้ป่วย) โอกาสคือ 4 เนื่องจาก 0.8/0.2=4

ดังนั้นความน่าจะเป็นที่จะฟื้นตัวจึงมากกว่าความน่าจะเป็นที่จะเสียชีวิตถึง 4 เท่า

การตีความมูลค่าของปริมาณ

1) ถ้าโอกาส = 1 ความน่าจะเป็นของเหตุการณ์จะเกิดขึ้นจะเท่ากับความน่าจะเป็นที่เหตุการณ์นั้นจะไม่เกิดขึ้น

2) ถ้าโอกาส >1 ความน่าจะเป็นของเหตุการณ์จะเกิดขึ้นมากกว่าความน่าจะเป็นที่เหตุการณ์จะไม่เกิดขึ้น

3) ถ้ามีโอกาส<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

อัตราส่วนราคาต่อรอง

คำนิยาม.อัตราส่วนอัตราต่อรองคืออัตราส่วนอัตราต่อรองสำหรับออบเจ็กต์กลุ่มแรกต่ออัตราส่วนอัตราต่อรองสำหรับออบเจ็กต์กลุ่มที่สอง

ตัวอย่าง. สมมติว่าทั้งชายและหญิงได้รับการรักษาบางอย่าง

ความน่าจะเป็นที่ผู้ป่วยชายจะยังมีชีวิตอยู่หลังจากผ่านไปห้าปีคือ 0.6 (60%); ความน่าจะเป็นที่เขาจะตายในช่วงเวลานี้คือ 0.4 (40%)

ความน่าจะเป็นที่คล้ายกันสำหรับผู้หญิงคือ 0.8 และ 0.2

อัตราส่วนอัตราต่อรองในตัวอย่างนี้คือ

การตีความมูลค่าของปริมาณ

1) ถ้าอัตราต่อรอง = 1 แสดงว่าโอกาสของกลุ่มแรกจะเท่ากับโอกาสของกลุ่มที่สอง

2) หากอัตราต่อรองเป็น >1 แสดงว่าโอกาสของกลุ่มแรกมีมากกว่าโอกาสของกลุ่มที่สอง

3) ถ้าอัตราต่อรอง<1, то шанс для первой группы меньше шанса для второй группы

ในสถานการณ์ทางวิทยาศาสตร์และการปฏิบัติของการทดลอง (แบบสำรวจ) นักวิจัยสามารถศึกษาได้ไม่ใช่ทุกคน (ประชากรทั่วไป ประชากร) แต่จะศึกษาเพียงตัวอย่างบางส่วนเท่านั้น ตัวอย่างเช่น แม้ว่าเราจะศึกษาคนกลุ่มเล็กๆ เช่น ผู้ที่เป็นโรคเฉพาะเจาะจง แต่ก็ยังไม่น่าเป็นไปได้ที่เราจะมีทรัพยากรที่เหมาะสมหรือไม่จำเป็นต้องทดสอบผู้ป่วยทุกราย แต่เป็นเรื่องปกติที่จะทดสอบตัวอย่างจากประชากรแทน เนื่องจากสะดวกกว่าและใช้เวลาน้อยกว่า ถ้าเป็นเช่นนั้นเราจะรู้ได้อย่างไรว่าผลลัพธ์ที่ได้จากกลุ่มตัวอย่างเป็นตัวแทนของทั้งกลุ่ม? หรือหากต้องการใช้คำศัพท์เฉพาะทาง เราจะแน่ใจได้อย่างไรว่างานวิจัยของเราจะอธิบายเนื้อหาทั้งหมดได้อย่างถูกต้อง ประชากรตัวอย่างที่เราใช้?

เพื่อตอบคำถามนี้ จำเป็นต้องกำหนดนัยสำคัญทางสถิติของผลการทดสอบ นัยสำคัญทางสถิติ (ระดับสำคัญ, ย่อ ซิก)หรือ /7-ระดับนัยสำคัญ (ระดับ p) -คือความน่าจะเป็นที่ผลลัพธ์ที่กำหนดแสดงถึงประชากรที่สุ่มตัวอย่างการศึกษาอย่างถูกต้อง โปรดทราบว่านี่เป็นเพียง ความน่าจะเป็น- เป็นไปไม่ได้ที่จะพูดด้วยความมั่นใจว่าการศึกษาหนึ่งๆ อธิบายประชากรทั้งหมดได้อย่างถูกต้อง ที่ดีที่สุด ระดับนัยสำคัญสามารถสรุปได้ว่ามีความเป็นไปได้สูง ดังนั้นคำถามต่อไปจึงเกิดขึ้นอย่างหลีกเลี่ยงไม่ได้: ต้องมีระดับนัยสำคัญเท่าใดก่อนที่ผลลัพธ์ที่กำหนดจะถือเป็นลักษณะเฉพาะที่ถูกต้องของประชากรได้

ตัวอย่างเช่น คุณยินดีที่จะบอกว่าโอกาสดังกล่าวเพียงพอที่จะรับความเสี่ยงที่ค่าความน่าจะเป็นเท่าใด จะเกิดอะไรขึ้นถ้าอัตราต่อรองคือ 10 จาก 100 หรือ 50 จาก 100? จะเกิดอะไรขึ้นถ้าความน่าจะเป็นนี้สูงกว่า? แล้วอัตราต่อรองเช่น 90 จาก 100, 95 จาก 100 หรือ 98 จาก 100 ล่ะ? สำหรับสถานการณ์ที่เกี่ยวข้องกับความเสี่ยง ทางเลือกนี้ค่อนข้างเป็นปัญหาเนื่องจากขึ้นอยู่กับลักษณะส่วนบุคคลของบุคคล

ในทางจิตวิทยา เชื่อกันว่าโอกาส 95 หรือมากกว่าใน 100 หมายความว่าความน่าจะเป็นของผลลัพธ์ที่ถูกต้องนั้นสูงพอที่จะทำให้ประชากรทั้งหมดสามารถสรุปได้โดยทั่วไป ตัวเลขนี้ก่อตั้งขึ้นในกระบวนการของกิจกรรมทางวิทยาศาสตร์และการปฏิบัติ - ไม่มีกฎหมายที่ควรเลือกเป็นแนวทาง (และแน่นอนว่าในวิทยาศาสตร์อื่นบางครั้งค่าอื่น ๆ ของระดับนัยสำคัญก็ถูกเลือก)

ในทางจิตวิทยา ความน่าจะเป็นนี้ดำเนินการในลักษณะที่ค่อนข้างผิดปกติ แทนที่จะเป็นความน่าจะเป็นที่กลุ่มตัวอย่างแสดงถึงประชากร ความน่าจะเป็นที่กลุ่มตัวอย่าง ไม่ได้เป็นตัวแทนประชากร. กล่าวอีกนัยหนึ่ง คือความน่าจะเป็นที่ความสัมพันธ์หรือความแตกต่างที่สังเกตได้นั้นเป็นแบบสุ่มและไม่ใช่สมบัติของประชากร ดังนั้น แทนที่จะบอกว่ามีโอกาส 95 ใน 100 ที่ผลการศึกษาถูกต้อง นักจิตวิทยากลับบอกว่ามีโอกาส 5 ใน 100 ที่ผลการศึกษาจะผิด (เช่นเดียวกับโอกาส 40 ใน 100 ที่ผลการศึกษาจะถูกต้องก็หมายความว่า มีโอกาส 60 ใน 100 ที่จะสนับสนุนความผิดพลาด) บางครั้งค่าความน่าจะเป็นจะแสดงเป็นเปอร์เซ็นต์ แต่มักจะเขียนเป็นเศษส่วนทศนิยม ตัวอย่างเช่น โอกาส 10 ใน 100 จะแสดงเป็นเศษส่วนทศนิยม 0.1 5 จาก 100 เขียนเป็น 0.05; 1 จาก 100 - 0.01 ด้วยรูปแบบการบันทึกนี้ ค่าขีดจำกัดคือ 0.05 ผลที่จะถือว่าถูกต้องจะต้องมีระดับนัยสำคัญ ด้านล่างตัวเลขนี้ (จำไว้ว่านี่คือความน่าจะเป็นที่ผลลัพธ์ ผิดอธิบายถึงประชากร) หากต้องการหลีกเลี่ยงคำศัพท์ ให้เพิ่มว่า "ความน่าจะเป็นของผลลัพธ์ที่ไม่ถูกต้อง" (ซึ่งเรียกได้ถูกต้องกว่า ระดับนัยสำคัญ)มักเขียนแทนด้วยอักษรละติน ร.คำอธิบายของผลการทดลองมักจะมีข้อความสรุป เช่น “ผลลัพธ์มีนัยสำคัญที่ระดับความเชื่อมั่น” (ร(p) น้อยกว่า 0.05 (เช่น น้อยกว่า 5%)

ดังนั้นระดับนัยสำคัญ ( ) บ่งบอกถึงความน่าจะเป็นของผลลัพธ์ ไม่เป็นตัวแทนของประชากร ตามเนื้อผ้าในด้านจิตวิทยา ผลลัพธ์จะถือว่าสะท้อนภาพรวมได้อย่างน่าเชื่อถือหากมีคุณค่า น้อยกว่า 0.05 (เช่น 5%) อย่างไรก็ตาม นี่เป็นเพียงข้อความแสดงความน่าจะเป็นเท่านั้น และไม่ใช่การรับประกันแบบไม่มีเงื่อนไขแต่อย่างใด ในบางกรณีข้อสรุปนี้อาจไม่ถูกต้อง ในความเป็นจริง เราสามารถคำนวณได้ว่าเหตุการณ์นี้อาจเกิดขึ้นได้บ่อยเพียงใดหากเราพิจารณาขนาดของระดับนัยสำคัญ ที่ระดับนัยสำคัญ 0.05 ผลลัพธ์ 5 ใน 100 ครั้งมีแนวโน้มที่จะไม่ถูกต้อง เมื่อมองแวบแรก 11a ดูเหมือนว่านี่จะไม่ธรรมดานัก แต่ถ้าคุณคิดดูดีๆ โอกาส 5 ใน 100 ก็เท่ากับ 1 ใน 20 หรืออีกนัยหนึ่ง หนึ่งในทุกๆ 20 กรณีผลลัพธ์จะเป็น ไม่ถูกต้อง. โอกาสดังกล่าวดูเหมือนจะไม่ค่อยดีนัก และนักวิจัยควรระวังในการดำเนินการ ข้อผิดพลาดประเภทแรกนี่คือชื่อของข้อผิดพลาดที่เกิดขึ้นเมื่อนักวิจัยคิดว่าพบผลลัพธ์ที่แท้จริงแล้ว แต่ในความเป็นจริงกลับไม่พบ ข้อผิดพลาดตรงกันข้ามซึ่งประกอบด้วยนักวิจัยที่เชื่อว่าพวกเขาไม่พบผลลัพธ์เมื่อมีอยู่จริงเรียกว่า ข้อผิดพลาดประเภทที่สอง

ข้อผิดพลาดเหล่านี้เกิดขึ้นเนื่องจากความเป็นไปได้ที่การวิเคราะห์ทางสถิติดำเนินการไม่สามารถตัดออกได้ ความน่าจะเป็นของข้อผิดพลาดขึ้นอยู่กับระดับนัยสำคัญทางสถิติของผลลัพธ์ เราได้สังเกตแล้วว่าเพื่อให้พิจารณาผลลัพธ์ที่ถูกต้อง ระดับนัยสำคัญต้องต่ำกว่า 0.05 แน่นอนว่าผลลัพธ์บางส่วนยังต่ำกว่านั้นและไม่ใช่เรื่องแปลกที่จะเห็นผลต่ำถึง 0.001 (ค่า 0.001 หมายความว่ามีโอกาส 1 ใน 1,000 ที่ผลลัพธ์จะผิดพลาด) ยิ่งค่า p มีค่าน้อยลง ความมั่นใจของเราในความถูกต้องของผลลัพธ์ก็จะยิ่งมากขึ้นเท่านั้น

ในตาราง 7.2 แสดงการตีความระดับนัยสำคัญแบบดั้งเดิมเกี่ยวกับความเป็นไปได้ของการอนุมานทางสถิติและเหตุผลในการตัดสินใจเกี่ยวกับการมีความสัมพันธ์ (ความแตกต่าง)

ตารางที่ 7.2

การตีความระดับนัยสำคัญที่ใช้ในจิตวิทยาแบบดั้งเดิม

ขอแนะนำจากประสบการณ์การวิจัยเชิงปฏิบัติ: เพื่อหลีกเลี่ยงข้อผิดพลาดประเภทที่หนึ่งและสองให้มากที่สุดเมื่อทำการสรุปที่สำคัญควรทำการตัดสินใจเกี่ยวกับการมีความแตกต่าง (การเชื่อมต่อ) โดยเน้นที่ระดับ เครื่องหมายไม่มี

การทดสอบทางสถิติ(การทดสอบทางสถิติ -เป็นเครื่องมือในการกำหนดระดับนัยสำคัญทางสถิติ นี่เป็นกฎชี้ขาดที่ทำให้แน่ใจว่าสมมติฐานที่แท้จริงได้รับการยอมรับ และสมมติฐานเท็จจะถูกปฏิเสธด้วยความน่าจะเป็นสูง

เกณฑ์ทางสถิติยังแสดงถึงวิธีการคำนวณจำนวนหนึ่งและจำนวนนั้นด้วย เกณฑ์ทั้งหมดใช้เพื่อวัตถุประสงค์หลักประการเดียว: เพื่อกำหนด ระดับนัยสำคัญข้อมูลที่พวกเขาวิเคราะห์ (เช่น ความน่าจะเป็นที่ข้อมูลจะสะท้อนถึงผลกระทบที่แท้จริงซึ่งแสดงถึงประชากรที่ใช้สุ่มตัวอย่างอย่างถูกต้อง)

การทดสอบบางอย่างสามารถใช้ได้เฉพาะกับข้อมูลที่แจกแจงแบบปกติเท่านั้น (และหากลักษณะถูกวัดเป็นช่วง) การทดสอบเหล่านี้มักจะเรียกว่า พารามิเตอร์เมื่อใช้เกณฑ์อื่นคุณสามารถวิเคราะห์ข้อมูลได้เกือบทุกกฎหมายการกระจาย - เรียกว่า ไม่ใช่พารามิเตอร์

เกณฑ์พาราเมตริกคือเกณฑ์ที่รวมพารามิเตอร์การกระจายไว้ในสูตรการคำนวณ เช่น ค่าเฉลี่ยและความแปรปรวน (การทดสอบของนักเรียน, การทดสอบ F ของฟิชเชอร์ ฯลฯ )

เกณฑ์ที่ไม่ใช่พารามิเตอร์คือเกณฑ์ที่ไม่รวมพารามิเตอร์การกระจายในสูตรสำหรับการคำนวณพารามิเตอร์การกระจาย และขึ้นอยู่กับการทำงานกับความถี่หรืออันดับ (เกณฑ์ ถามเกณฑ์ Rosenbaum ยูมานา-วิทนีย์

ตัวอย่างเช่น เมื่อเราบอกว่าความสำคัญของความแตกต่างถูกกำหนดโดยการทดสอบทีของนักเรียน เราหมายถึงว่าวิธีการทดสอบทีของนักเรียนนั้นใช้ในการคำนวณค่าเชิงประจักษ์ ซึ่งจากนั้นจะถูกนำไปเปรียบเทียบกับค่าในตาราง (วิกฤต)

ด้วยอัตราส่วนของเชิงประจักษ์ (คำนวณโดยเรา) และค่าวิกฤตของเกณฑ์ (ตาราง) เราสามารถตัดสินได้ว่าสมมติฐานของเราได้รับการยืนยันหรือหักล้างหรือไม่ ในกรณีส่วนใหญ่ เพื่อให้เรารับรู้ถึงความแตกต่างที่มีนัยสำคัญ จำเป็นที่ค่าเชิงประจักษ์ของเกณฑ์จะต้องมากกว่าค่าวิกฤติ แม้ว่าจะมีเกณฑ์ (เช่น การทดสอบแมนน์-วิทนีย์ หรือการทดสอบเครื่องหมาย) ซึ่ง เราต้องปฏิบัติตามกฎที่ตรงกันข้าม

ในบางกรณี สูตรการคำนวณสำหรับเกณฑ์จะรวมจำนวนการสังเกตในกลุ่มตัวอย่างที่กำลังศึกษาด้วย แสดงเป็น ป. เมื่อใช้ตารางพิเศษ เราจะพิจารณาว่าระดับนัยสำคัญทางสถิติของความแตกต่างซึ่งค่าเชิงประจักษ์ที่กำหนดนั้นสอดคล้องกับระดับใด ในกรณีส่วนใหญ่ ค่าเชิงประจักษ์ที่เท่ากันของเกณฑ์อาจมีนัยสำคัญหรือไม่มีนัยสำคัญ ขึ้นอยู่กับจำนวนการสังเกตในกลุ่มตัวอย่างภายใต้การศึกษา ( ) หรือจากสิ่งที่เรียกว่า จำนวนองศาอิสระ ซึ่งแสดงเป็น โวลต์ (g>) หรืออย่างไร df (บางครั้ง ง)

รู้ หรือจำนวนองศาอิสระเราสามารถกำหนดได้โดยใช้ตารางพิเศษ (หลัก ๆ จะได้รับในภาคผนวก 5) ค่าวิกฤตเกณฑ์และเปรียบเทียบค่าเชิงประจักษ์ที่ได้รับกับเกณฑ์เหล่านั้น โดยปกติจะเขียนดังนี้: “เมื่อใด” น=ค่าวิกฤต 22 ค่าของเกณฑ์คือ เสื้อ เซนต์ = 2.07" หรือ "ที่ โวลต์ () = ค่าวิกฤต 2 ค่าของแบบทดสอบของนักเรียนคือ = 4.30” เป็นต้น

โดยทั่วไปแล้ว การตั้งค่าจะยังคงเป็นไปตามเกณฑ์แบบพาราเมตริก และเรายึดถือตำแหน่งนี้ พวกเขาถือว่ามีความน่าเชื่อถือมากกว่าและคุณจะได้รับความช่วยเหลือจากพวกเขา ข้อมูลมากกว่านี้และทำการวิเคราะห์เชิงลึกมากขึ้น สำหรับความซับซ้อนของการคำนวณทางคณิตศาสตร์ เมื่อใช้โปรแกรมคอมพิวเตอร์ ความซับซ้อนนี้จะหายไป (แต่บางส่วนก็ปรากฏว่าค่อนข้างจะเอาชนะได้)

  • ในตำราเรียนเล่มนี้เราไม่ได้พิจารณารายละเอียดปัญหาทางสถิติ
  • สมมติฐาน (null - R0 และทางเลือก - Hj) และการตัดสินใจทางสถิติเนื่องจากนักศึกษาจิตวิทยาศึกษาสิ่งนี้แยกกันในสาขาวิชา "วิธีทางคณิตศาสตร์ในด้านจิตวิทยา" นอกจากนี้ควรสังเกตด้วยว่าเมื่อจัดทำรายงานการวิจัย (รายวิชาหรือ วิทยานิพนธ์, สิ่งพิมพ์) ไม่ได้รับสมมติฐานทางสถิติและวิธีแก้ปัญหาทางสถิติตามกฎ โดยปกติเมื่ออธิบายผลลัพธ์ พวกเขาระบุเกณฑ์ จัดเตรียมสถิติเชิงพรรณนาที่จำเป็น (หมายถึง ซิกม่า สัมประสิทธิ์สหสัมพันธ์ ฯลฯ ) ค่าเชิงประจักษ์ของเกณฑ์ ระดับความเป็นอิสระ และจำเป็นต้องมีระดับนัยสำคัญ p จากนั้นจะมีการกำหนดข้อสรุปที่มีความหมายเกี่ยวกับสมมติฐานที่กำลังทดสอบ โดยระบุ (โดยปกติจะอยู่ในรูปแบบของความไม่เท่าเทียมกัน) ระดับนัยสำคัญที่บรรลุผลสำเร็จหรือไม่บรรลุผล