СПбГУ1 June 2022 - 31 December 2024 г.Program started

Смешанные линейные модели

Хайтов Вадим Михайловичopenedu

Записаться на курс
Иногда приходится работать с очень сложно структурированными данными. Например, регрессионная модель может описывать несколько семей, из которых было отобрано по несколько человек. В подобных исследованиях будет нарушен базовый принцип статистического анализа — независимость наблюдений в выборке: люди из одной семьи будут более похожи друг на друга, а их свойства не будут независимы. В таких случаях применяются смешанные линейные модели, которые включают помимо интересующих исследователя предикторов, еще и случайные группирующие факторы (например, фактор “семья”). На примере смешанных моделей с нормальным распределением зависимой переменной мы обсудим способы тонкого моделирования взаимозависимостей наблюдений (моделирование структуры дисперсии). Наконец, мы рассмотрим, как строятся обобщенные смешанные линейные модели, описывающие поведение бинарных и счетных данных.
Вы научитесь: распознавать случайные факторы и понимать особенности моделирования группирующих факторов при помощи фиксированных и случайных эффектов; записывать смешанную модель со случайным отрезком и/или случайным углом наклона в виде уравнения и с использованием функций специализированного пакета R; рассчитывать и интерпретировать коэффициенты внутриклассовой корреляции; проводить диагностику обобщенных смешанных линейных моделей с нормальным распределением отклика; корректно применять методы тестирования гипотез в смешанных моделях и интерпретировать результаты; визуализировать смешанную модель с учетом и без учета влияния случайного фактора; описывать связь дисперсии с разным типами ковариат дисперсии; вводить элементы, моделирующие структуру дисперсии в простые и смешанные линейные модели, основанные на нормальном распределении переменной отклика;  распознавать признаки гетероскедастичности; подбирать модель с оптимальной структурой дисперсии с использованием информационных критериев; трактовать модели, включающие моделирование связи дисперсии с ковариатой; записывать обобщенную смешанную линейную модель для счетных величин; обнаруживать признаки избыточности дисперсии; подбирать модели, основанные на распределении Пуассона и отрицательном биномиальном распределении; интерпретировать коэффициенты моделей, основанных на счетных данных, с учетом функции связи; проводить пост-хок тесты для обобщенных смешанных моделей; визуализировать обобщенные смешанные модели для счетных величин; записывать обобщенную смешанную линейную модель с бинарной переменной-откликом; изменять настройки подбора модели в случае если стандартные параметры приводят к сбоям; обнаруживать признаки избыточности дисперсии в моделях с бинарным откликом; визуализировать обобщенные смешанные модели для бинарных данных; создавать отчеты в формате html при помощи rmarkdown/knitr об анализе данных с помощью обобщенной смешанной линейной модели.