Правило 68–95–99,7
У статистиці, правило 68–95–99,7 — скорочення, яке допомагає запам'ятати процент значень які знаходяться в діапазоні довкола середнього значення в нормальному розподілі із шириною у два, чотири й шість стандартних відхилень, відповідно; точніше, 68,27 %, 95,45 % і 99,73 % значень знаходяться в межах одного, двох і трьох стандартних відхилень від середнього, відповідно.
У математичній нотації, ці факти можна виразити наступним чином, де — це спостереження нормально розподіленої випадкової величини, є середнім розподілом, а — стандартне відхилення:
В емпіричних науках це правило називається емпіричним правилом трьох сигм що виражає загальноприйняте евристичне правило, що майже всі можливі значення знаходяться в межах трьох стандартних відхилень від середнього, і таким чином емпірично корисно трактувати це як 99,7 % імовірності, що є мірою найближчої імовірності.[1]
Застосованість цього евристичного правила значно залежить від задачі дослідження. У соціології, результат можуть вважати «ймовірним», якщо його довірчий інтервал знаходиться в межах двох сигм (95 %), у той час, як у фізиці елементарних частинок, загальноприйнято, що необхідно п'ять сигм (99,99994 % імовірності), аби провести якісне дослідження, яке можна віднести до наукового відкриття.
«Емпіричне правило трьох сигм» тісно пов'язане з іншим результатом також відомим як правило трьох сигм, який стверджує, що навіть для величин які не мають нормального розподілу, принаймні 88,8 % випадків повинні потрапити в межі правильно розрахованого інтервалу трьох сигм. Це правило випливає із Нерівності Чебишова. Для унімодальних розподілів імовірність потрапляння в інтервал становить близько 95 %. Також можуть існувати деякі припущення, які розширюють значення цієї ймовірності до 98 %.
Примітки
ред.- ↑ таке використання «емпіричного правила трьох сигм» увійшло до загального вжитку у 2000-их, наприклад, це згадується в Schaum's Outline of Business Statistics. McGraw Hill Professional. 2003. с. 359, і в Grafarend, Erik W. (2006). Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter. с. 553.
Джерела
ред.- Wheeler, D. J.; Chambers, D. S. (1992). Understanding Statistical Process Control. SPC Press.
- Czitrom, Veronica; Spagon, Patrick D. (1997). Statistical Case Studies for Industrial Process Improvement. SIAM. с. 342.
- Pukelsheim, F. (1994). The Three Sigma Rule. American Statistician. 48: 88—91.
Посилання
ред.- «The Normal Distribution» by Balasubramanian Narasimhan
- "Calculate percentage proportion within x sigmas at WolframAlpha