ควอร์ไทล์
ในทางสถิติศาสตร์ ควอร์ไทล์ (อังกฤษ: quartile) เป็นชนิดของควอนไทล์ ซึ่งแบ่งจำนวนข้อมูลออกเป็น 4 ส่วน ประมาณเท่าๆ กัน ข้อมูลต้องเรียงจากน้อยไปมากเพื่อที่จะได้หาควอร์ไทล์ ควอร์ไทล์คือรูปแบบหนึ่งของสถิติเชิงอันดับ มี 3 ควอร์ไทล์หลักๆ ดังนี้
- ควอร์ไทล์ที่ 1 (Q1) เป็นตัวเลขตรงกลางระหว่างจำนวนที่น้อยที่สุด (ค่าต่ำสุด อังกฤษ: minimum) และมัธยฐานของชุดข้อมูล อาจเรียกควอร์ไทล์นี้ได้ว่าควอร์ไทล์ล่าง (lower quartile) หรือ ควอนไทล์เชิงประจักษ์ที่ 25 (25th empirical quantile)เพราะ 25% ของข้อมูลทั้งหมดอยู่ไต้จุดนี้
- ควอร์ไทล์ที่ 2 (Q2) เป็นมัธยฐานของชุดข้อมูล ดังนั้น 50% ของข้อมูลอยู่ใต้จุดนี้
- ควอร์ไทล์ที่ 3 (Q3) เป็นตัวเลขตรงกลางระหว่างมัธยฐานและจำนวนที่มากที่สุด (ค่าสูงสุด อังกฤษ: maximum) ของชุดข้อมูล อาจเรียกควอร์ไทล์นี้ได้ว่าควอร์ไทล์บน (upper quartile) หรือ ควอนไทล์เชิงประจักษ์ที่ 75 (75th empirical quantile) เพราะ 75% ของข้อมูลทั้งหมดอยู่ไต้จุดนี้
รวมถึงค่ามากสุด และค่าน้อยสุดของข้อมูล (ซี่งก็เป็นควอร์ไทล์ด้วย) ทั้ง 3 ควอร์ไทล์ที่ได้กล่าวไว้ข้างบนบอกการสรุปตัวเลข 5 ตัวของข้อมูล การสรุปนี้เป็นสิ่งสำคัญในสถิติศาสตร์ เพราะว่ามันสามารถบ่งบอกข้อมูลได้ทั้งจุดศูนย์กลาง และการกระจาย การรู้ควอร์ไทล์ที่ 1 และควอร์ไทล์ที่ 3 บ่งบอกข้อมูลให้ทราบว่าข้อมูลมีการกระจายตัวมากแค่ไหน และชุดข้อมูลจะเบ้ไปทางไหนทางหนึ่ง เพราะว่าควอร์ไทล์นั้นแบ่งจำนวนข้อมูลเท่าๆกัน พิสัยระหว่างควอร์ไทล์ต่างๆ จึงไม่เท่ากัน (ต.ย. Q3-Q2 ≠ Q2-Q1) และเราเรียกมันแทนว่าพิสัยระหว่างควอร์ไทล์ ขณะที่ค่าต่ำสุดและค่าสูงสุดก็บอกการกระจายข้อมูล ควอร์ไทล์ที่ 1 และควอร์ไทล์ที่ 3 สามารถให้ข้อมูลที่ละเอียดขึ้นกับตำแหน่งของจุดข้อมูล การมีอยู่ของค่าผิดปกติ และผลลบระหว่าง 50% ของข้อมูลตรงกลาง กับจุดข้อมูลต่างๆ รอบนอก
นิยาม
สัญลักษณ์ | ชื่อ | นิยาม |
---|---|---|
Q1 |
| แยก 25% ของข้อมูลที่น้อยกว่าจาก 75% ที่มากกว่า |
Q2 |
| แบ่งข้อมูลเป็นครึ่งๆ |
Q3 |
| แยก 25% ของข้อมูลที่มากกว่าจาก 75% ที่น้อยกว่า |
วิธีการคำนวณ
การกระจายข้อมูลแบบไม่ต่อเนื่อง
สำหรับการกระจายข้อมูลแบบไม่ต่อเนื่อง ไม่มีวิธีหาควอร์ไทล์ที่ตายตัว
วิธีที่ 1
- ใช้มัธยฐานในการเแบ่งข้อมูลที่เรียงแล้วเป็นครึ่งๆ
- ถ้าข้อมูลที่เรียงแล้วจำนวนข้อมูลเป็นจำนวนคี่ ไม่นับมัธยฐาน (ค่าที่อยู่ตรงกลางในข้อมูลที่เรียงแล้ว) ทุกข้าง
- ถ้าข้อมูลที่เรียงแล้วจำนวนข้อมูลเป็นจำนวนคู่ ให้แบ่งข้อมูลเป็นครึ่งเท่าๆ กัน
- มัธยฐานของข้อมูลครึ่งล่างคือควอร์ไทล์ล่าง มัธยฐานของข้อมูลครึ่งบนคือควอร์ไทล์บน
วิธีนี้ถูกใช้โดย เครื่องคิดเลขแผนภาพกล่อง TI-83 และฟังก์ชัน "1-Var Stats" อีกทั้งสสวท. ก็นำวิธีนี้ไปใช้ในการสอนแผนภาพกล่อง
วิธีที่ 2
- ใช้มัธยฐานในการเแบ่งข้อมูลที่เรียงแล้วเป็นครึ่งๆ
- ถ้าข้อมูลที่เรียงแล้วจำนวนข้อมูลเป็นจำนวนคี่ นับมัธยฐาน (ค่าที่อยู่ตรงกลางในข้อมูลที่เรียงแล้ว) ทุกข้าง
- ถ้าข้อมูลที่เรียงแล้วจำนวนข้อมูลเป็นจำนวนคู่ ให้แบ่งข้อมูลเป็นครึ่งเท่าๆ กัน
- มัธยฐานของข้อมูลครึ่งล่างคือควอร์ไทล์ล่าง มัธยฐานของข้อมูลครึ่งบนคือควอร์ไทล์บน
ค่าที่หาจากวิธีนี้สามารถเรียกได้ว่า "Tukey's hinge" ดูเพิ่มที่มิดฮินจ์
วิธีที่ 3
- ถ้าจำนวนข้อมูลที่มีเป็นจำนวนคู่ แล้ววิธีที่สามก็ทำเหมือนทั้งสองวิธีก่อนหน้า
- ถ้าจำนวนข้อมูลที่มีเป็นจำนวนคี่(4n + 1) แล้วควอร์ไทล์ล่างคือ 25% ของค่าจำนวนที่n บวก 75% ของค่าจำนวนที่(n+1) และ ควอร์ไทล์บนคือ 75% ของค่าจำนวนที่(3n+1) บวก 25% ของค่าจำนวนที่(3n+2)
- ถ้าจำนวนข้อมูลที่มีเป็นจำนวนคี่(4n + 3) แล้วควอร์ไทล์ล่างคือ 75% ของค่าจำนวนที่(n+1) บวก 25% ของค่าจำนวนที่(n+2) และ ควอร์ไทล์บนคือ 25% ของค่าจำนวนที่(3n+2) บวก 75% ของค่าจำนวนที่(3n+3)
วิธีที่ 4
ถ้าเรามีชุดข้อมูลที่เรียงแล้ว เราสามารถคำนวนเพื่อหาควอนไทล์เชิงประจักษ์ที่ ได้ถ้า อยู่ในควอนไทล์ที่ ถ้าเรากำหนดให้ส่วนจำนวนเต็มของ โดย แล้วฟังก์ชันควอนไทล์เชิงประจักษ์คือ
เมื่อ และ
เพื่อที่จะหาควอร์ไทล์ที่ 1, 2, 3 ของชุดข้อมูล เราก็หา , และ ตามลำดับ
ตัวอย่างที่ 1
ข้อมูลที่เรียงแล้ว: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
วิธีที่ 1 | วิธีที่ 2 | วิธีที่ 3 | วิธีที่ 4 | |
---|---|---|---|---|
Q1 | 15 | 25.5 | 20.25 | 15 |
Q2 | 40 | 40 | 40 | 40 |
Q3 | 43 | 42.5 | 42.75 | 43 |
ตัวอย่างที่ 2
ข้อมูลที่เรียงแล้ว: 7, 12, 36, 39, 40, 41
จะสังเกตว่า ถ้าจำนวนข้อมูลเป็นจำนวนคู่ ทั้ง 3 วิธีแรกจะให้ผลที่เหมือนกัน
วิธีที่ 1 | วิธีที่ 2 | วิธีที่ 3 | วิธีที่ 4 | |
---|---|---|---|---|
Q1 | 15 | 15 | 15 | 13 |
Q2 | 37.5 | 37.5 | 37.5 | 37.5 |
Q3 | 40 | 40 | 40 | 40.25 |
อ้างอิง
- ↑ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.CS1 maint: others (link)
- Joarder, A.H.; Firozzaman, M. (2001-10). "Quartiles for Discrete Data". Teaching Statistics. 23 (3): 86–89. doi:10.1111/1467-9639.00063. ISSN 0141-982X. Check date values in:
|date=
(help) - Hyndman, Rob J.; Fan, Yanan (1996-11). "Sample Quantiles in Statistical Packages". The American Statistician. 50 (4): 361–365. doi:10.1080/00031305.1996.10473566. ISSN 0003-1305. Check date values in:
|date=
(help)