Математична статистика
Автор: Наталія Котова • Октябрь 24, 2020 • Лекция • 1,058 Слов (5 Страниц) • 336 Просмотры
2.1. Точкові оцінки Однією із задач математичної статистики є одержання на основі результатів спостережень випадкової величини певної інформаціє про значення параметра розподілу або про значення деякої функції від цього параметра. Задача полягає у побудові певного наближення до невідомого параметра, причому такі наближення називаються оцінками, а підхід – точковим оцінюванням. Нехай у результаті n незалежних експериментів отримано вибірку 𝑋 = 𝑥1 , … , 𝑥𝑛 . Означення 2.1. Статистикою або оцінкою 𝜃 невідомого параметра θ називається функція 𝜃 = 𝑓 𝑥1 , … , 𝑥𝑛 від змінних 𝑥1 , … , 𝑥𝑛 . Зауваження 2.1. Якщо при кожному n спостерiгається кратна вибiрка X об’єму n, а спосiб, яким утворена оцiнка, один i той самий (не залежить вiд об’єму вибiрки n), то поняття “оцiнка” використовують також у розумiннi як ”послiдовнiсть оцiнок”, що утворенi за одним правилом при рiзних значеннях об’єму вибiрки. Послiдовностi оцiнок позначаються як 𝜃 𝑛 . | Властивості Означення 2.2. Оцiнка θ називається незмiщеною, якщо її математичне сподiвання збiгається з точним значенням θ: 𝑀𝜃 = 𝜃. Якщо ж 𝑀𝜃 ≠ 𝜃, то оцінка називається змiщеною і величина 𝜃 − 𝜃 називається зміщенням оцінки. Означення 2.3. Оцiнка 𝜃 𝑛 називається асимптотично незмiщеною, якщо має мiсце асимптотична збiжнiсть середнiх: 𝑀 𝜃 𝑛 → 𝜃, 𝑛 → ∞. Означення 2.4. Оцiнка 𝜃 𝑛 називається конзистентною (або спроможною), якщо вона збiгається за ймовiрнiстю до iстинного значення θ: 𝜃 𝑛 𝑝 → 𝜃, 𝑛 → ∞, тобто 𝑃𝜃 𝜃 𝑛 − 𝜃 ≥ 𝜀 → 0, 𝑛 → ∞, ∀ 𝜀 > 0. Означення 2.5. Оцiнка 𝜃 𝑛 називається сильно конзистентною, якщо вона збiгається з iмовiрнiстю 1 до iстинного значення θ : 𝜃 𝑛 → 𝜃 з ймовірністю 1 при 𝑛 → ∞, тобто 𝑃𝜃 (∃ lim𝑛→∞ 𝜃 𝑛 = 𝜃) = 1. | Зауваження 2.2. Наведенi властивостi стосуються оцiнок 𝜃 для значення невiдомого параметру θ. У випадку, коли цей параметр – векторний, доцiльно розглядати також оцiнки 𝜏 для значень деякої функцiї τ=τ(θ) вiд параметра θ. Сформульованi вище означення поширюються також i на дану схему, якщо замiнити θ на 𝜏(𝜃), а 𝜃 на 𝜏 . Оцінюваний параметр може мати кілька точкових незміщених статистичних оцінок. Для невідомого математичного сподівання 𝑀 𝑋 досліджуваної ознаки X вибіркове середнє 𝑥 В = 1 𝑛 𝑥𝑖 𝑛 𝑖=1 є незміщеною і конзистентною оцінкою. Для невідомої дисперсії 𝐷 𝑋 конзистентною оцінкою є вибіркова дисперсія 𝐷В = 1 𝑛 𝑥𝑖 − 𝑥 В 𝑛 2 Проте ця оцінка є зміщеною. Тому для оцінки невідомої дисперсії застосовують виправлену дисперсію 𝑠 2 = 1 𝑛−1 𝑥𝑖 − 𝑥 В 𝑛 2 𝑖=1 . Оцінкою для середнього квадратичного відхилення 𝜎 𝑋 є виправлене вибіркове середнє квадратичне відхилення 𝜎В = 𝑠 2 . |
Довірчий інтервал Точкові оцінки параметрів розподілу не дають можливості зробити висновки про їхню точність та надійність, оскільки є випадковими величинами. Щоб мати уявлення про точність та надійність оцінки, у математичній статистиці використовують рівень довіри та довірчі інтервали. Означення 2.15. Iнтервальною оцiнкою (або довірчим iнтервалом) невiдомого параметра θ називається випадковий інтервал (𝜃 1 , 𝜃 2 ), який покриває невідоме точне значення θ із заданою ймовірністю (надійністю) 𝛾, тобто 𝑃 𝜃 1 < 𝜃 < 𝜃 2 = 𝛾. Випадкові величини 𝜃 1 та 𝜃 2 , які є функціями вибіркового вектора 𝑋 = 𝑥1 , … , 𝑥𝑛 , називаються відповідно нижньою та верхньою межами довірчого інтервалу; ймовірність 𝛾 ще називають довірчою ймовірністю. Точність оцінювання параметра θ характеризується довжиною довірчого інтервалу 𝜃 2 − 𝜃 1 і залежить від обсягу вибірки n та надійності 𝛾. На практиці надійність оцінки 𝛾 беруть такою, щоб подію з ймовірністю 𝛾 можна було вважати практично вірогідною, наприклад, 𝛾 = 0,95; 0,99; 0,999. Часто величину β записують у вигляді 𝛾 = 𝛼 − 1 ∈ (0,1). Мале число 𝛼 називається рівнем довіри оцінки. | 1). Інтервальною оцінкою з надійністю 𝛾 невідомої ймовiрностi успiху 𝑝 у схемi Бернуллi за відносною частотою 𝑝 = 𝜈𝑛 /𝑛 називають довірчий інтервал 𝑝 − 𝑡𝛾 𝑝(1−𝑝) 𝑛 < 𝑝 < 𝑝 + 𝑡𝛾 𝑝(1−𝑝) 𝑛 , де 𝑛 – загальна кількість випробувань; 𝑡𝛾 – значення аргументу функції Лапласа (дод. 1), при якому Φ(𝑡𝛾 ) = 𝛾 2 , 𝑝 = 𝜈𝑛 /𝑛 – відносна частота. Нехай 𝑋1 , … , 𝑋𝑛 – незалежні і нормальні розподілені випадкові величини: 𝑋𝑘 ≃ 𝑁 𝑎, 𝜎 2 , 𝑘 = 1, … , 𝑛. 2) Інтервальною оцінкою з надійністю 𝛾 невідомого математичного сподівання 𝑎 нормально розподіленої випадкової величини X з відомою дисперсією 𝜎 2 називають довірчий інтервал 𝑥 В − 𝑡𝛾 𝜎 𝑛 < 𝑎 < 𝑥 В + 𝑡𝛾 𝜎 𝑛 , де 𝑥 В = 1 𝑛 𝑋𝑖 𝑛 𝑖=1 – вибіркове середнє, 𝑡𝛾 𝜎 𝑛 = 𝛿 – точність оцінки, 𝑡𝛾 – значення аргументу функції Лапласа (дод. 1), при якому Φ 𝑡𝛾 = 𝛾 2 , 𝑛 – обсяг вибірки. | 3) Інтервальною оцінкою з надійністю 𝛾 невідомого математичного сподівання 𝑎 нормально розподіленої випадкової величини X з невідомою дисперсією 𝜎 2 називають довірчий інтервал 𝑥 В − 𝑡𝛾,𝑘 𝑠 𝑛 < 𝑎 < 𝑥 В + 𝑡𝛾,𝑘 𝑠 𝑛 , (2.1) де 𝑡𝛾,𝑘 𝑠 𝑛 = 𝛿 – точність оцінки, 𝑡𝛾,𝑘 знаходиться за дод. 4 за заданими надійністю 𝛾 і числом ступенів вільності 𝑘 = 𝑛 − 1, 𝑠 = 𝜎В – виправлене вибіркове середнє квадратичне відхилення. 4) Інтервальною оцінкою з надійністю 𝛾 невідомої дисперсії 𝜎 2 нормально розподіленої випадкової величини X з відомим математичним сподіванням 𝑎 називають довірчий інтервал 8 𝑛𝜎 2 ℎ ′′ < 𝜎 2 < 𝑛𝜎 2 ℎ ′ , де 𝑛 – обсяг вибірки, 𝜎 2 = 1 𝑛 𝑥𝑖 − 𝑎 𝑛 𝑖=1 – оцінка дисперсії, числа ℎ ′ і ℎ ′′ вибираються за допомогою дод. 3 так, щоб виконувались умови 𝑃{𝜒 2 𝑛 < ℎ ′ } = 1−𝛾 2 і 𝑃{𝜒 2 𝑛 < ℎ ′′} = 1+𝛾 2 , 𝜒 2 𝑛 – незалежна величина iз 𝜒 2 −розподiлом та 𝑛 ступенями вільності. 5) Інтервальною оцінкою з надійністю 𝛾 невідомої дисперсії 𝜎 2 нормально розподіленої випадкової величини X з невідомим математичним сподіванням 𝑎 називають довірчий інтервал (𝑛−1)𝑠 2 ℎ ′′ < 𝜎 2 < (𝑛−1)𝑠 2 ℎ ′ , (2.2) де 𝑛 – обсяг вибірки, 𝑠 2 – виправлена вибіркова дисперсія, числа ℎ ′ і ℎ ′′ вибираються за допомогою дод. 3 так, щоб виконувались умови 𝑃{𝜒 2 𝑛 − 1 < ℎ ′ } = 1−𝛾 2 і 𝑃{𝜒 2 𝑛 − 1 < ℎ ′′} = 1+𝛾 2 , 𝜒 2 𝑛 – незалежна величина iз 𝜒 2 −розподiлом та 𝑛 ступенями вільності. |
...