Коэффициент корреляции и детерминации

Реферат на тему: Коэффициент корреляции и детерминации Построение корреляционных моделей дает возможность изучать зависимость экономических показателей, которые не связаны между собой функционально. Корреляционная связь в отличие от функционального проявляется только в общем и в среднем и только в массе наблюдений. Корреляционный анализ решает две задачи: 1) определение формы связи, то есть установление математической формулы, описывающей данную связь; 2) измерения плотности связи. В простейшем случае изучается связь между двумя показателями, один из которых рассматривается как независимый показатель — факторный признак ( х ), а другой — как зависимая величина, результативный признак ( в ). Это так называемая «парная корреляция». В общем виде она описывается функцией в = ƒ (Х). Предварительно вид математической функции устанавливается с помощью анализа связи между явлениями и графического его изображения в виде корреляционного поля. Корреляционное поле — это совокупность точек в прямоугольной системе координат, абсцисса каждой из которых соответствует значению факторного признака ( х ), а ордината — значение результативного признака ( в ) определенной единицы наблюдения. Количество точек на графике соответствует количеству единиц наблюдения. Направленность корреляционного поля указывает на наличие прямого, обратной связи между признаками, или его отсутствие, а также на форму линии регрессии (прямая линия, парабола, гипербола и т. д.). После того, как определены неизвестные параметры регрессионной модели попробуем оценить плотность связи между зависимой величиной в и независимой х . То есть попробуем ответить на вопрос, насколько значителен влияние переменной х на в. Есть ли какой критерий, который позволяет количественно оценить это влияние? Простым критерием, дает количественную оценку связи между двумя показателями является коэффициент корреляции (для прямолинейного связи).
Алмазное сверление в Краснодаре
Он рассчитывается по формуле: Плотность связи между признаками измеряется с помощью коэффициента корреляции (для прямолинейного связи) и индекса корреляции (для криволинейного связи). Коэффициент корреляции может быть вычислен также по формуле: где — средний произведение признаков х и в ; — среднее значение признака в соответствии х и в ; σ х — среднее квадратическое отклонение признака х ; σ в — среднее квадратическое отклонение признака в . ; Коэффициент корреляции в отличие от коэффициента ковариации является уже не абсолютной, а относительной степени связи между двумя признаками, поэтому он может принимать значения от -1 до +1. Чем ближе значение r к 1, тем плотнее связь. Знак «+» указывает на прямой, а знак «-» — на обратную связь. При r = 0 связь отсутствует. Наряду с коэффициентом корреляции используется еще один критерий, с помощью которого также измеряется плотность связи между двумя или более показателями и проверяется адекватность (соответствие) построенной регрессионной модели реальной действительности. То есть дается ответ на вопрос, действительно ли изменение значения в линейно зависит именно от изменения значения х , а не происходит под влиянием различных случайных факторов. Таким критерием является коэффициент детерминации. Чтобы объяснить, что именно представляет собой коэффициент детерминации и как он связан с коэффициентом корреляции, рассмотрим вопрос о декомпозиции дисперсий . В статистике разницу принято называть общим отклонением. Разницу называют отклонением, которое можно объяснить, исходя из регрессионной прямой. Разницу называют отклонением, которое нельзя объяснить, исходя из регрессионной прямой, либо не объясним отклонением. Общее отклонение раскладывается на две составляющие: = + Возведем эти разницы в квадрат и просуммируем для всех единиц наблюдения. Получим: — общая сумма квадратов — сумма квадратов, объясняет регрессию; — сумма квадратов ошибок. Справедливый такое выражение: = +. Поделив это выражение на п , получим выражение для дисперсий + где — общая дисперсия признака в ; — дисперсия, объясняет регрессию; — дисперсия ошибок. Таким образом мы осуществили декомпозиции дисперсии, то есть разложили общую дисперсию на две части: дисперсию, что объясняет регрессию, и дисперсию ошибок (или дисперсию случайной величины). Запишем это в таком виде: . Разделим обе части на общую дисперсию и получим: В этом выражении первая часть — это часть дисперсии, что объясняется регрессией, а вторая — доля ошибок в общей дисперсии. Часть дисперсии, объясняет регрессию, называется коэфф
ициентом детерминации и обозначается r 2. Коэффициент детерминации используется как критерий адекватности модели, потому что есть степени пояснительной силы независимой переменной х . Коэффициент детерминации определяется по формуле: или Коэффициент детерминации всегда положительный и находится в пределах от нуля до единицы. Он показывает, какая часть колебаний результирующей y обусловлена колебанием факторного признака х. Конечно, нас интересует, есть ли связь между коэффициентом корреляции и коэффициентом детерминации, и если есть, то какой? Прежде чем ответить на этот вопрос, рассмотрим связь между коэффициентом корреляции и наклоном регрессионной линии, то есть параметром а 1 . Напомним формулы для расчетов коэффициента корреляции и наклона ; . Умножим числитель и знаменатель выражения для вычисления коэффициента корреляции на. и сделаем некоторые преобразования . Из того, что оба значения и положительные, следует, что знак коэффициента корреляции всегда совпадает со знаком параметра а 1 . Кроме того, следует, что значение коэффициента корреляции связано со значениями коэффициента регрессии а 1 и средних квадратических отклонений и. Зная связь между коэффициентом корреляции и коэффициентом регрессии, рассмотрим связь между коэффициентом корреляции и коэффициентом детерминации. Напомним формулу для расчета коэффициента детерминации: