ПОИСК Статьи Рисунки Таблицы Среднее значение и мера разброса из "Химическое разделение и измерение теория и практика аналитической химии" Наша цель состоит в том, чтобы быстро обработать и извлечь максимальную пользу из произвольного набора данных. Каждый знаком с подведением итогов набора измерений путем расчета среднего значения, но эта процедура, строго говоря, является определением центра распределения и не говорит ничего о распределении результатов измерений. Для того чтобы правильно обработать набор данных, требуется дополнительно иметь некоторое представление об измерении разброса или дисперсии отдельных данных. [c.27] Дисперсия имеет размерность но ее значение не сообщает никакой информации о степени рассеяния значений х. Поэтому часто используют стандартное отклонение или среднеквадратичное отклонение. Стандартное отклонение обозначается символом Ох и также определяется, из уравнения 2-1. Заметим, что формулу можно использовать только тогда, когда известно генеральное среднее. Поэтому ура,вне-ние 2-1 связано только с генеральной дисперсией Ох и генеральным стандартным отклонением Ох- Эти параметры нужно строго отличать от выборочной дисперсии и выборочного стандартного отклонения Зх, которые рассматриваются ниже. [c.28] Это выражение отличается от того, которое дано для а1 во-пер-вых, заменили на х и, во-вторых, знаменатель равен п— 1) взамен га. Второе отличие, которое уменьшило знаменатель дроби, ведет к увеличению х- Это вполне логично, потому что, заменив р. на х, мы имеем дело не с идеальной колодой карт , а такая замена приводит к уменьшению числителя. Это происходит потому, что мы рассчитали X исходя из отдельных величин х поэтому х представляет центр нашей выборки, но не обязательно будет центром генеральной совокупности. Величина (га—1) представляет число степеней свободы или число независимых отклонений, которые возможны внутри данной выборки после того, как х уже рассчитано. [c.28] Заметим, что числитель является разностью двух больших цифр. Поэтому в этих расчетах должно быть много значащих цифр. Обычно в таких случаях точность логарифмической линейки недостаточна. [c.29] Стандартное отклонение, рассчитанное из большого числа выборок. [c.30] Последнее выражение уже приводилось ранее и здесь повторено, чтобы подчеркнуть его общность. Читатель, который потратит время, чтобы понять эквивалентность всех трех выражений, будет хорошо вознагражден. Помимо того, что это поможет лучше понять смысл стандартного отклонения, эти формулы демонстрируют тот факт, что многие статистические выражения, которые кажутся сложными, когда они выписаны в абстрактном виде, в сущности являются очень простыми. [c.30] Кодирование. Труд, затраченный для расчета стандартного отклонения, можио значительно сократить, вычитая некоторую постоянную из каждого наблюдения для того, чтобы получить меньшие числа. В других расчетах мы часто делаем это в уме. Например, каждый, кто хочет найти среднее из 61, 63, 65 и 67, обычно суммирует 1+3+5 + 7, делит на четыре и прибавляет результат к 60. Такой тип кодирования можно также применить для вычислений стандартного отклонения, не оказывая никакого влияния при этом на конечный результат. Так же иногда удобно умножить или разделить числа на некоторый постоянный фактор. Это допустимо, но после того как расчеты закончены, для того чтобы получить верное значение 5 , необходимо провести обратную операцию. Пример, иллюстрирующий применение метода стандартных отклонений совместно с кодированием, приведен ниже. [c.30] Аналогичная задача будет рассмотрена в первой части примера 2-13. [c.31] Вернуться к основной статье