ПОИСК Статьи Рисунки Таблицы Статистические оценки и проверка гипотез из "Введение в моделирование химико технологических процессов Издание 2" Теория вероятностей не занимается вопросом о том, как по опытным данным находить вышеуказанные характеристики. Это—предмет математической статистики. Рассмотрим некоторые ее вопросы. [c.57] Генеральная совокупность и выборка. Эти понятия относятся к числу важнейших в статистике. В науке чаще всего измерения производятся таким образом, что из всей интересующей нас совокупности объектов (генеральной совокупности) измеряется только лишь некоторое сравнительно небольшое число (в ы б о р-ка). Связано это либо с тем, что генеральная совокупность слишком велика — обычно теоретически она бесконечна — и измерить все объекты невозможно (или, по крайней мере, слишком дорого), либо с тем, что процесс измерения разрушает объекты и проведение измерений на всей генеральной совокупности бессмысленно она окажется полностью уничтоженной, так что выводы из эксперимента не к чему будет прилагать. [c.57] Измерения на выборке мы проводим для того, чтобы их результаты применить к генеральной совокупности. В этом смысле выборка есть модель генеральной совокупности, а измерения проводятся для того, чтобы в дальнейшем осуществить традукцию. [c.57] Рассчитываемые по результатам выборочных измерений числовые характеристики не совпадают в точности с соответствующими характеристиками генеральной совокупности. Кроме того, они — величины случайные, так как случаен сам отбор измеряемых объектов. Две выборки из одной и той же генеральной совокупности дадут несколько различающиеся значения числовых характеристик. Выборочные характеристики являются не точными значениями, а оценками характеристик генеральной совокупности если источник случайности — ошибки измерений, то считают, что значения выборочных характеристик являются оценками истинных значений. [c.58] Чтобы традукция оказалась правильной и по выборочным измерениям можно было верно судить о свойствах генеральной совокупности, рассчитываемые оценки должны обладать рядом свойств. Не давая строгих определений, укажем практический смысл этих свойств. Первое свойство — состоятельность. Состоятельной является оценка, которая при увеличении объема выборки сходится к генеральному значению чем больше измерений, тем точнее характеризует наша оценка истинное значение, и при очень большом их числе оно может быть оценено со сколь угодно высокой точностью. [c.58] Второе свойство — несмещенность. Несмещенная оценка при небольшом числе измерений может, разумеется, заметно отклоняться от оцениваемой величины, но в среднем она ей равна. В отличие от нее, смещенная оценка при малом числе измерений систематически отклоняется от оцениваемой величины (завышена или занижена), хотя при увеличении объема выборки может и стремиться к истинному значению, т. е. быть состоятельной. Несмещенность оценок очень важна в химии и химической технологии, где чаще всего эксперимент дорог и желательно работать с малыми выборками. [c.58] Наконец, третье свойство оценок — эффективность эффективная оценка точнее, чем любая другая оценка той же характеристики, полученная по той же выборке. На практике иногда приходится пользоваться оценками, не обладающими всеми этими свойствами (разумеется, если несостоятельность, смещенность н неэффективность достаточно малы) но этого желательно по возможности избегать. Подробнее и строже требования к оценкам изложены в книгах [7, 20]. [c.58] Нетрудно заметить, что формула (6.1) полностью аналогична выражению (5.9). В подавляющем большинстве случаев эта оценка— состоятельная, несмещенная и эффективная. [c.59] В статистике число степеней свободы определяют как общее число измерений за вычетом числа оценок, уже рассчитанных по этим измерениям и применяемых при расчете рассматриваемой характеристики. В данном случае уже рассчитана и используется в формуле (6.2) величина х, поэтому / на единицу меньше, чем п. [c.59] Оценка (6.4) — немного смещенная, но обычно смещение учитывается не поправкой к величине 5, а соответствующими формулами, в которых эта величина используется. [c.59] Здесь рассматриваются п объектов, ричем каждый /-тый объект характеризуется значениями хь и ус, х и г/ —средние значения х и у по всем объектам. [c.59] Рассчитаем оценки хну, характеризующие содержание в 7 образцах подземных рассолов [40] соответственно K I, % и Вг, кг/м . Вместе с величинами X к у приведены разности и их произведения, нужные для расчетов по формулам (6.1), (6.2) и (6.5), и под чертой —суммы по столбцам. [c.60] Близкая к единице величина г говорит о том, что бром в рассолах сопутствует хлористому калию. [c.60] Обычная формулировка задачи здесь такова. Сопоставляются две выборки (или одна выборка сопоставляется с генеральной совокупностью). Формулируется нуль-гипотеза Яо между обеими выборками нет существенной разницы, обе они принадлежат одной генеральной совокупности, а имеющиеся различия обусловлены случайным характером выборок, например, влиянием случайных ошибок. В этом случае любые оценки, рассчи- анные по этим двум выборкам, будут оценками одних и тех же генеральных (истинных) значений тогда в большинстве случаев имеет смысл объединить обе выборки в одну, увеличив тем самым число степеней свободы. [c.60] Противоположная, или альтернативная гипотеза Яь различия объясняются не случайностью, а существом дела. Выборки относятся к разным генеральным совокупностям. [c.60] Пример 6.2. Формулирование гипотез. [c.60] Рассмотрим несколько задач в терминах проверки гипотез. [c.60] При проверке гипотез возможны четыре ситуации. Первая верна нуль-гипотеза, и мы ее принимаем вторая верна альтернативная гипотеза, и мы ее принимаем. В этих двух случаях наше решение правильно. В двух других случаях мы принимаем неверное решение (совершаем ошибку). Если верна нуль-гипотеза, а мы ее отвергнем, примем альтернативную, это ошибка первого-рода. Если нуль-гипотеза неверна, а мы примем ее, это ошиб-кавторогорода. [c.61] Пример 6.3. Ошибки первого и второго рода. [c.61] Вернуться к основной статье