Математика - - Выбор предикторов + конспект от YandexGPT
Математика - - Выбор предикторов конспект от YandexGPT
00:02 Мультиколлинеарность и линейная регрессия
• В видео обсуждается мультиколлинеарность, проблема, когда две или более независимых переменных сильно коррелированы.
• В примере с данными, где Y - зависимая переменная, а X - независимая, показывается, как мультиколлинеарность может влиять на результаты линейной регрессии.
06:28 Построение линейной регрессии
• В видео демонстрируется, как построить линейную регрессию с использованием пакета SPSS.
• Обсуждаются различные опции, такие как доверительные интервалы и сохранение предсказаний для каждого конкретного икса.
19:09 Интерпретация результатов
• В видео обсуждаются различные аспекты интерпретации результатов линейной регрессии, включая стандартные ошибки предсказания и доверительные интервалы.
• Обсуждается, как эти результаты могут быть использованы для прогнозирования и оценки точности предсказаний.
21:53 Анализ дисперсионного анализа
• В видео обсуждается дисперсионный анализ, который используется для проверки гипотезы о том, что связи между переменными нет.
• Если P-значение меньше уровня значимости, то гипотеза отвергается.
32:56 Понимание регрессионных остатков
• Регрессионные остатки - это разница между предсказанным значением и фактическим значением переменной.
• Общая сумма квадратов остатков равна сумме регрессионных остатков и остатков.
40:18 Визуализация результатов
• В видео демонстрируется, как точки данных могут быть расположены вдоль прямой линии, что указывает на хорошую модель.
• Если точки разбросаны, то модель считается плохой.
43:49 Проверка гипотез и случайность
• В видео объясняется, что соотношение между суммами квадратов остатков и регрессионных остатков является случайным и может быть разным от эксперимента к эксперименту.
• Это связано с тем, что связи между переменными могут быть случайными и не всегда предсказуемыми.
46:36 Обсуждение связи между переменными
• В видео обсуждается, как определить, есть ли связь между двумя переменными, и как это влияет на построение модели.
• Упоминается критерий Фишера, который используется для определения связи между переменными.
58:18 Стандартная ошибка среднего и популяционная характеристика
• Объясняется, что стандартная ошибка среднего и популяционная характеристика связаны между собой.
• Стандартная ошибка среднего используется для определения точности оценки среднего значения.
• Стандартная ошибка среднего уменьшается с ростом выборки, что означает, что точность оценки увеличивается.
01:09:13 Анализ линейной регрессии
• Обсуждается значимость коэффициентов и константы в линейной регрессии.
• Упоминается, что коэффициенты могут быть статистически значимыми, но не значимыми с точки зрения ошибки.
• Рассматриваются доверительные интервалы для коэффициентов и константы.
01:18:49 Описательная статистика и интервальные прогнозы
• Обсуждаются стандартные ошибки и их влияние на точность прогнозов.
• Упоминается, что интервальные прогнозы более точны в середине, а не на краях.
• Рассматривается влияние предикторов на стандартные ошибки и доверительные интервалы.
01:26:03 Завершение занятия и вопросы
• Преподаватель завершает занятие, отвечая на вопросы студентов.
• Упоминается функция корреляции в Pandas для вычисления попарных корреляций.
• Обсуждается заполнение пропусков в данных и их влияние на оценки и доверительные интервалы.
Весь плейлист: