МФЖ-101. Современные технологии поиска и обработки информации. Практическое задание №8. Регрессионный анализ информации с линейной проекцией и моделью SVM
В качестве статистики были взяты данные о населении Челябинской области с сайта 74.rosstat.gov.ru. В качестве фундамента использовалась статистика о численности женщин и мужчин в Челябинской области с 2001 по 2024 гг.
1. Пожалуй, разделю возможные модели анализа данных на две группы, поскольку я решил дифференцировать графики на "понятные" и "непонятные" для моего мышления. Глядя на скриншоты выше (Pol Reg и Scatter), можно сделать пару выводов, на которые наталкивают данные графики. Во-первых, наилучший коэффициент корреляции наблюдался с 2006 по 2018 гг. Далее, из "Скаттера" следует, что число женщин на 1000 мужчин растет с годами, однако из-за спада численности населения наблюдается регрессия.
2. В заключение, k-Means и Линейная проекция кажутся наименее понятными и прозрачными. Если линейная модель хоть как-то намекает на взаимосвязь соотношения жен:муж с временными отрезками и численностью населения, то с k-means всё сложнее. Однако есть и плюсы, К-модель интерактивная и в ней можно запустить симуляцию, это прикольно.
Стоит отметить, что для анализа статистических данных такого типа больше всего подходят две первые модели, упомянутые мной. Благодаря ним можно вычислять коэффициент корреляции, взаимосвязь переменных и видеть регрессию или прогрессию статистику.
Комментарии
Отправить комментарий