Густина ймовірності

функція, інтеграл якої по області описує ймовірність події, що відбувається в цій області

Густина ймовірності або щільність неперервної випадкової величини — це функція, що визначає ймовірнісну міру відносної правдоподібності, того що значення випадкової величини буде відповідати заданій події, для кожної окремої події (або точки) у просторі подій (множини всіх можливих значень, які може приймати випадкова величина). Іншими словами, в той час, як абсолютна правдоподібність, що неперервна випадкова величина може прийняти одне конкретне значення дорівнює 0 (оскільки існує нескінченна множина можливих значень), значення функції щільності у двох окремих точках можна використати аби припустити, наскільки ймовірніше ця випадкова величина дорівнює одному значенню порівнюючи з іншим.

Коробковий графік і функція густини імовірності для нормального розподілу N(0, σ2).

У більш точному розумінні, функція густини ймовірності використовується для визначення ймовірності того, що випадкова величина потрапить у заданий діапазон значень, замість того щоб визначати чи прийме вона одне конкретне значення. Ця ймовірність задається за допомогою інтеграла функції густини цієї величини по тому діапазону — тобто вона задає площу що обмежена функцією густини й горизонтальною віссю координат і обмеженою заданим діапазоном. Функція густини імовірностей є невід'ємною на всій області визначення, а її інтеграл по всьому простору подій дорівнює одиниці.

У випадку, коли ймовірнісна міра є розподілом випадкової величини, говорять про щільність випадкової величини.

Приклад

ред.

Припустимо, що представники бактерій зазвичай живуть від 4 до 6 годин. Яка ймовірність того, що бактерія житиме точно 5 годин? Відповідь — ця імовірність дорівнює 0 %. Багато бактерій житимуть приблизно 5 годин, але немає ймовірності, що будь-яка окрема бактерія проживе точно 5,0000000000… годин.

Замість того можна поставити питання: яка ймовірність того, що бактерія проживе часу від 5 годин до 5,01 години? Допустимо ця ймовірність становить 0,02 (тобто 2 %). Далі, а яка імовірність, що бактерія проживе від 5 годин до 5,001 години? Оскільки інтервал у десять разів менший за попередній, ця ймовірність дорівнюватиме 0,002. Імовірність того, що бактерія житиме від 5 годин до 5,0001 годин повинна дорівнювати близько 0,0002, і так далі.

У цих трьох прикладах, відношення (імовірності прожити кількість часу у заданому інтервалі) до (величини цього інтервалу) приблизно є сталим, і дорівнює 2 на годину (або 2 години−1). Наприклад, імовірність, що якась бактерія загине в інтервалі довжиною 0,01-години між 5 і 5,01 годинами життя дорівнює 0,02, а (імовірність 0,02 / 0,01 години) = 2 години−1. Ця величина 2 години−1 називається густиною імовірності того, що бактерія проживе близько 5 годин.

Щодо відповіді на питання «Яка імовірність того, що бактерія загине, проживши рівно 5 годин?», правильна, але мало зрозуміла відповідь — «0», але кращу відповідь можна записати як (2 години−1)  . Це ймовірність того, що бактерія загине у нескінченно малому проміжку довкола 5 годин, де   це величина цього проміжку.

Наприклад, ймовірність того, що вона проживе довше 5 годин, але менше ніж (5 годин + 1 наносекунда), дорівнює (2 години−1)×(1 наносекунда) ≃ 6×10−13 (якщо застосувати приведення одиниць вимірювання 3,6×1012 наносекунд = 1 годині).

Це є функцією густини імовірностей  , де  (5 годин) = 2 години−1. Інтеграл функції   по заданому діапазону часу (не лише для нескінченно малого діапазону, але і для великих діапазонів значень) є ймовірністю, що бактерія проживе задану кількість часу на цьому інтервалі.

Означення

ред.

Абсолютно неперервний розподіл однієї величини

ред.

Функція густини імовірності зазвичай пов'язана із абсолютно неперервним розподілом однієї випадкової величини. Випадкова величина   буде мати функцію густини  , якщо

 ,

де   — невід'ємна інтегровна за Лебегом функція, яка називається функцією густини імовірності випадкової величини  .

Якщо FX  це кумулятивна функція розподілу величини  , тоді:

 ,

і (якщо   є неперервною в точці  )

 .

Інтуїтивно можна розуміти, що   є ймовірністю того, що   потрапить у нескінченно малий інтервал  .

Формальне визначення

ред.

(Це визначення можна застосувати до будь-якого розподілу імовірностей застосовуючи визначення імовірності на основі теорії мір множин.)

Випадкова величина X, що приймає значення із вимірного простору   (зазвичай  , де вимірними підмножинами є Борелівські множини) і її розподілом імовірностей є міра XP по  : густиною   стосовно еталонної міри   по   є похідна Радона — Нікодима:

 .

Це означає,   є будь-якою вимірною функцією із наступною властивістю:

 

для будь-якої вимірної множини  .

Для наведеного вище випадку із неперервним розподілом однієї змінної, еталонною мірою є міра Лебега. Функція маси імовірності для дискретної випадкової величини є густиною стосовно лічильної міри по простору подій (зазвичай це є множина цілих чисел, або деяка її підмножина).

Зауваження

ред.
  • Функція густини імовірності існує лише для абсолютно неперервних випадкових величин.
  • У квантовій механіці — відношення ймовірності знаходження системи в даному елементі об'єму до величини цього елемента об'єму; розраховується як квадрат модуля хвильової функції системи (добуток хвильової функції та її комплексно спряженої функції).

Властивості

ред.
  •  .
  •  .
  •  , де   — характеристична функція випадкової величини  .

Інші особливості

ред.

На відміну від функції розподілу ймовірностей, функція густини імовірностей може приймати значення більші за одиницю; наприклад, рівномірний розподіл в інтервалі [0, ½] має густину імовірності   для   і   для інших значень.

Стандартний нормальний розподіл має густину імовірності

 

Якщо дано випадкову величину   і її розподіл дозволяє визначити функцію густини імовірностей  , тоді математичне сподівання для   (якщо воно існує) можна розрахувати так:

 .

Не кожний імовірнісний розподіл матиме функцію густини, розподіли дискретних випадкових величин не матимуть її; а також її не існує для розподілу Кантора, попри те, що він не має дискретних елементів, тобто не призначає додатного значення імовірності для жодної окремої точки розподілу.

Розподіл має функцію густини тоді і тільки тоді, коли його функція розподілу ймовірностей   абсолютно неперервна. У такому випадку:   майже скрізь диференційована, а її похідна може використовуватися як функція густини ймовірностей:

 .

Якщо розподіл має функцію густини, тоді ймовірність у кожній обраній окремій точці   дорівнює нулю; те саме стосується скінченних і зліченних множин точок.

Дві функції густини імовірностей   і   задають той самий розподіл імовірностей, коли вони відрізняються лише на множину нульової міри Лебега.

Див. також

ред.

Джерела

ред.