Корреляция, коллинеарность и мультиколлинеарность
В этой статье хотелось кратко рассмотреть такие понятия и определения, как корреляция, коллинеарность и мультиколлинеарность, которые применяются в эконометрике, а следовательно могут использованы в системном трейдинге при построении моделей и торговых стратегий.
Определение корреляции
Само слово корреляция происходит из латинского языка и обозначает некую взаимосвязь двух или более случайных величин. Если меняется по каким-либо причинам значения одной переменной, то, в свою очередь и изменяется другая переменная. Другими словами, происходит закономерное изменение, это применимо как к уменьшению значений, так и к увеличению. Особо значимо, что корреляция показывает взаимосвязь переменных но, почему произошло изменение, а именно причинно-следственную связь не определяет.
Виды корреляции:
- Положительная. Это означает, что, если значение какой-то переменной увеличивается или уменьшается, то в любом случае произойдет увеличение или уменьшение другой переменной. Таким образом, при положительной корреляции наблюдается такая картина: уменьшение / уменьшение или увеличение / увеличение
- Отрицательная. Данная корреляция показывает, что, если происходит увеличение или уменьшение какой-то переменной, то другая переменная будет уменьшаться или увеличиваться. Таким образом, при отрицательной корреляции четко видна закономерность: уменьшение / увеличение или увеличение / уменьшение
Коллинеарность и мультиколлинеарность
В эконометрике понятие мультиколлинеарности звучит следующим образом: это наличие корреляционной взаимосвязи между анализируемыми факторами, которые одновременно оказывают влияние на конечный результат, а также происходят проблемы с оценкой параметров в регрессии. Чаще всего мультиколлинеарность возникает в случае построения множественной регрессии, так как, скорее всего, будет линейная связь между объясняющими переменными.
Впервые проблему мультиколлинеарности разработал Рагнар Фриш. Главное отличие мультиколлинеарности от коллинеарности в том, что в случае, когда возникает коллинеарность, существует линейная связь между двумя переменными, которые независимы, а мультиколлинеарность подразумевает линейную связь более чем между двумя переменными.
Методы борьбы с мультиколлинеарностью:
- Устранение нескольких переменных или хотя бы одной
- Преобразование переменных линейно
- Устранение трендовой составляющей
- Анализ более ранних исследований
Важно отметить, что это нормально, если модель содержит мультиколлинеарность, но нужно стараться ее устранить, так как может привести к искаженным результатам. В случае нестрогой мультиколлинеарности выводы будут получены правильные, но будет затруднена работа с моделью. Нестрогая мультиколлинеарность – это когда существует линейная корреляционная сильная зависимость между независимыми (зависимыми) переменными. Строгая мультиколлинеарность подразумевает линейную функциональную зависимость.