ПОИСК Статьи Рисунки Таблицы Пример комплексного планирования эксперимента с применением различных статистических методов анализа из "Применение математической статистики при анализе вещества" Будем рассматривать двумерные наблюдения, т. е. такие наблюдения, которые дают значения двух случайных величин X VI у. Допустим, что для обоих признаков X ш у выполняется гипотеза нормальности — в этом случае говорят, что имеет место двумерное нормальное распределение. Нам нужно проверить гипотезу о наличии стохастической линейной связи между двумя случайными переменными х и у. [c.299] При изучении статистических связей мы считаем, что обе переменные х ш у можно рассматривать как случайные величины. Поэтому здесь имеет смысл написать также уравнение регрессии х по у. [c.301] Таким образом, мы получаем, вообще говоря, два уравнения регрессии (8.62) и (8.63), которые отвечают двум различным математическим формулировкам задачи в первом случае минимальное значение имеет сумма квадратов отклонений, взятых параллельно оси ординат, во втором случае — сумма квадратов отклонений, взятых параллельно оси абсцисс. Выбор того или иного из этих двух уравнений для описания наблюдаемой статистической связи является, конечно, совершенно произвольным. Он онределяется тем, которую из двух величин, х или у, считаем заданной. Например, если изучаем зависимость параметров градуировочных графиков от колебания температуры окружающего воздуха, то естественно, что физический смысл может иметь только одно уравнение регрессии, которое выражает зависимость величины изучаемого параметра от температуры, рассматриваемой в данном случае как заданную величину. Если же изучается зависимость между двумя показателями качества продукции, то оба уравнения регрессии имеют физический смысл. Здесь для дальнейшего практического применения выбирается то уравнение, в котором независимой переменной является наиболее точно определяемая величина. [c.301] Таким образом, корреляционный анализ является дальнейшим обобш ени0м регрессионного анализа. Ниже, на стр. 353, будет показано, как, пользуясь формулой (8.64), можно производить приближенную оценку коэффициента корреляции по сгруппированным данным. [c.302] При = 1, = О, следовательно, в этом частном случае обе линии регрессии совпадают. Двумерное распределение вырождается в одномерное. Каждая из переменных становится линейной функцией другой переменной. [c.303] При = О мы получаем две взаимно перпендикуляр ные прямые Х = х, У = у, параллельные координатным осям и проходящие через точку с координатами х, у), В этом случае очевидно, что между переменными не может существовать линейная статистическая связь. [c.303] При значениях / у , изменяющихся от О до 1, угол между линиями регрессии изменяется от 90° до 0°. Таким образом, абсолютная величина коэффициента корреляции служит мерой угла между двумя линиями регрессии, а следовательно, и мерой жесткости линейной связи между переменными. [c.303] 61) следует, что знак коэффициента корреляции всегда совпадает со знаком углового коэффициента. Поэтому, если коэффициент корреляции имеет положительный знак, то это значит, что а и у одновременно возрастают или одновременно убывают. Если коэффициент корреляции имеет отрицательный знак, то это значит, что одна из переменных увеличивается, когда другая уменьшается. [c.303] При интерпретации коэффициентов корреляции надо быть крайне осторожным. Если величины х vi у стохастически независимы, то безусловно г = 0. Но когда г = О, это значит только, что между хп у пе может существовать линейная корреляционная свзяь, но криволинейная связь может существовать. Для криволинейной корреляции значение коэффициента корреляции может служит только мерой точности линейного по х приближения величины у. [c.304] Корреляционную зависимость не следует путать с причинной зависимостью. В экспериментальной работе часто приходится наблюдать корреляционную связь между пере-меннылш, обусловленную некоторыми другими факторами, которые не фиксируются в данном наблюдении. Здесь можно привести следующий любопытный пример неправильной интерпретации корреляционной связи. При изучении технологического процесса на металлургическом заводе была обнаружена тесная корреляционная связь между содержанием углерода в металлической ванне по ее расплавлении и основностью шлака ). На этом основании была выдвинута гипотеза о возможности регулирования содержания углерода по расплавлении путем наведения нужного шлака в период предшествующий расплавлению. Проведенные опыты не привели к положительным результатам, так как содержание углерода в металлической ванне не было причинно обусловлено основностью шлака. Обе эти величины определялись третьим фактором—содержанием чугуна в шихте, взятой для завалки. [c.304] Анализируя диаграммы рассеяния, можно получить некоторую дополнительную информацию о причинах появления ошибок, а следовательно, и о процессах, происходящих. при анализе вещества. Информация будет особенно интересной, если получать диаграммы рассеяния в различные моменты после начала процесса испарения, для различных пар линий и для разных условий проведения анализа. Сравнительное изучение этих диаграмм может дать некоторое представление о процессах испарения вещества из кратера электрода, о колебаниях температуры возбуждения и об уширении спектральных линий. [c.308] Диаграммы рассеяния, полученные при испарении шпинели из кратера угольного электрода за первые 10 сек. Левые диаграммы относятся к пробе, смешанной с углем в отношении 1 3, правые диаграммы—к пробе, смешанной о углекислым барием и углем в отношении 1 19 20 [146]. [c.309] Для построения контурного эллипса достаточно определить значения г]), соответствующие q = О, и значения q, соответствующие 1]з = 0. Примеры построения контурного эллипса приведены на рис. 42 .для значения xLo(2) = 4f6. [c.310] Эту величину В. И. Романовский [24] предложил называть эллиптической дисперсией. [c.310] Чем меньше будет эта величина, тем лучше будет воспроизводимость результатов анализов. Сравнивать площади эллипсов (эллиптические дисперсии) можно при помощи F-кpитepия при числе степеней свободы п- —2, —2). [c.312] Сравнение площадей контурных эллипсов имеет смысл делать, конечно, только в том случае, когда линия ортогональной регрессии имеет угловой коэффициент, близкий к единице (а=45°), или когда эллипс вырождается в окружность, т. е. имеет место симметричное рассеяние точек относительно центра. Если же угловой коэффициент линии ортогональной регрессии сильно отличается от единицы и точки практически оказываются расположенными вдоль одной из координатных осей, то выбор условий нроведения спектрального анализа надо считать явно неудачным. В качестве критерия для выбора благоприятных условий используется отношение дисперсий з- и 5 . если дисперсии отличаются значимо, то данный вариант спектрального анализа признается неудовлетворительным и сравнение площадей контурных эллипсов не производится. [c.312] В качестве примера в табл. 8.7 приведены сопоставления пяти вариантов определения натрия в растительных материалах с применением олова в качестве внутреннего стандарта. Графически результаты определений представлены на рис. 42. В варианте а источником э.д.с. служит батарея, в варианте б—агрегат для дуги постоянного тока. Варианты виг отличаются от вариантов а и б только применением воздушного потока, окружающего электроды. Вариант д относится к вращающемуся электроду. [c.312] В процессе вычислений было обнаружено, что для варианта е дисперсии Зх и Ху отличаются значимо. В этом случае точки будут практически располагаться относительно прямой, параллельной одной из координатных осей. Выбор внутреннего стандарта здесь явно неудачен. Дальнейшие вычисления с данными, характеризующими этот метод, не производились. [c.312] Статистический анализ остальных данных показал, что варианты виг дают лучшие результаты, чем варианты аж б. Различие между вариантами еже оказалось незначимым iQг/Qe = 2,i Fomi8.Щ = гЛ). [c.313] Раздел о корреляционном анализе мы изложили очень коротко, так как в аналитической работе до сих пор нашли применение только его простейшие приемы. Совершенно не рассмотрен вопрос о криволинейных корреляционных связях, так как в аналитической работе обычно ограничиваются изучением их линейного приближения. Не рассматривается также вопрос о множественной корреляции, когда одновременно изучается статистическая связь между многими переменными. Этот метод статистического анализа до сих пор не получил применения в аналитической работе, несмотря на то, что он очень широко используется при изучении технологических процессов. [c.314] Вернуться к основной статье