МФЖ-101. Современные технологии поиска и обработки информации. Практическое задание №9. Структурный анализ информации из внешней базы данных
1. В качестве ключевых слов были взяты ключи discord, youtube, russia, чтобы затронуть статистику текстов о блокировке ресурсов в РФ. 2. а) связаны тексты с совпадающими цветными полями - что их на ваш взгляд объединяет? да, связаны. дифференциация происходит через разные категории и тематики. темы выборов, Трампа, Илона Маска, России и Украины. Например, Мировые новости, спорт, ТВ, фильмы, мнения, фиолетовое - культура, а темно-синее - вообще новости Соединенных Штатов. б) связаны тексты, с общими линиями пересечений. Различаются ли результаты в различных моделях и если да, то чем? различаются. например, в кластеринге больше мировых новостей, чуть более разнообразные темы в категориях культуры, тв, кино, творчества. В облаке слов, например, вовсе тяжело разобраться, однако можно заметить, что наиболее распространенные темы: Трамп, государство, США, Россия, выборы и т.п.