[МУЗЫКА] [МУЗЫКА]
[МУЗЫКА] Тема сегодняшней лекции — свойства критериев.
На прошлой лекции вы рассмотрели алгоритм проверки статистической гипотезы, и,
возможно, у вас остался вопрос: а как вообще выбрать статкритерий?
Да, у вас есть гипотеза, но критериев сотни может быть.
И сегодня мы ответим на этот вопрос.
Для этого необходимо посмотреть на свойства критериев.
Во-первых, критерий должен быть применимым, во-вторых, состоятельным,
в-третьих, несмещенным, в-четвертых, обладать наибольшей мощностью.
Обо всем по порядку.
Применимость.
Критерий должен быть применим для данной ситуации, для решения данной задачи.
То есть если начать с простого, что критерий однородности должен применяться
для гипотезы об однородности и ни в коем случае для проверки нормальности,
либо равенства средних, то есть более сложные моменты,
потому что часть критериев на самом деле требует выполнения каких-то предположений.
Например, часть критериев требует нормальности данных,
даже довольно большая часть критериев, к сожалению.
Другая часть критериев, допустим, может требовать равенства средних либо
равенства дисперсий либо равенства объемов выборки.
Так вот, все эти требования обязательно должны быть соблюдены,
иначе ваш критерий будет давать просто неверные результаты.
Дальше мы рассмотрим не второе свойство, а четвертое,
потому что для понимания остальных свойств необходимо четвертое свойство.
Так вот, критерий должен обладать и хорошо,
чтобы он обладал наибольшей мощностью.
Что такое мощность?
Мощность, если говорить неформальным языком, это просто способность критерия
хорошо работать, хорошо различать гипотезы между собой.
То есть, например, тот критерий, который лучше всего работает.
За мощность критерия принимают величину 1 − β,
то есть единица минус вероятность ошибки второго рода.
И это получается вероятность того, что мы примем альтернативную гипотезу,
когда она действительно верна.
То есть мы скажем, нет здесь никакой нормальности, здесь экспоненциальность,
и это окажется действительно правдой.
Так вот, чем мощнее критерий, тем лучше.
Для проверки мощности как раз и строят распределение статистик при
верной альтернативной гипотезе.
Дальше рассмотрим, как это выглядит на графике.
Так вот, мощность на графике выглядит как раз как расстояние между единицей и
распределением статистики критерия при верной альтернативной гипотезе с 1 − β.
Так вот, чем больше это расстояние, тем лучше.
Такой критерий и нужно брать.
Дальше рассмотрим такое свойство, как состоятельность,
которое опять же опирается на мощность.
То есть мощность критерия должна стремиться к единице при стремлении
объема выборки к бесконечности.
То есть чем больше у нас данных, тем лучше, тем лучше должен работать критерий,
потому что тем легче ему как бы должно быть.
Ну и данных становится действительно больше.
Если этого не происходит, значит, критерий не очень хороший,
такими критериями не стоит пользоваться.
И последнее свойство — это несмещенность, которое говорит о том,
что мощность критерия должна быть больше либо равна заданного уровня значимости.
Конечно, лучше, чтобы она была больше, но если равна, тоже не так страшно.
То есть если она будет больше, значит, критерий вообще работает.
Если она равна, значит, критерий просто не работает, но он об этом вам и скажет,
типа, я ничего не понимаю.
Однако если она меньше, значит, критерий будет вам врать,
потому что он является смещенным.
И так какие-то гипотезы он будет принимать, какие-то отвергать,
и вообще такому критерию доверять нельзя.
Поэтому это очень важное свойство, чтобы критерий был несмещенным.
Итого, критерий должен быть применим для вашей ситуации.
Он должен быть состоятельным, то есть его расстояние между альтернативным
распределением и единицей должно увеличиваться.
Он должен быть несмещенным, тогда правосторонних у вас всегда должно быть
распределение статистики при верной гипотезе быть левее,
чем при альтернативной.
И кроме того, должен обладать наибольшей мощностью.
Так, от этой величины до 1 − β должно быть наибольшее.
Хотелось бы этого, по крайней мере.
А в следующей лекции мы рассмотрим такой метод, который называется Монте-Карло.