СМИ лгут и это всем известно. Ну ладно, не совсем лгут, но часто передергивают факты, давят на эмоции, а зачастую замалчивают вещи малозначимые для широкой аудитории, но возможно очень важные лично для меня.
Именно с этой проблемой я столкнулся когда задумался о том, как бы проанализировать сообщения о происшестиях и понять, что и где происходит и происходило на самом деле. Без нагнетающей музыки и эмоциональных заголовков.
Поиски привели меня к официальным источникам. В моём случае к мчс. Да, у них тоже не вся инфа, но она хотя бы проверенная. Немного магии и вот у нас есть база происшествий по различным регионам России. Сразу оговорка для товарища Майора - всё собрано из открытых источников с общедоступных страниц. Теперь буду анализировать. По беглому предварительному анализу можно понять где и что происходит и что на самом деле является проблемой. В представленном примере данные за прошлый год, по Московской области(50), КБР/Приэльбрусье(07), Липецкой область (48), Алтай (22), Карелия(10).
Струкутра следующая: описание происшествия, его класс, ссылка на подробную информацию и приблизительное место происшествия. Сразу говорю, что адрес программа вытягивала самым топорным методом, так что записи "грязные", но понять можно.
Классификация же событий очень грубая, просто по кодовым словам, чтоб отсечь служебные сводки и сведения о пожарах. Вообще, я так смотрю пожар, как ни крути, почти везде - самая частая опасность. А если это густонаселенный район, то удивительно что я ещё не сгорел) Немного полегче с этим в горах. Там шансы сгореть гораздо ниже. Но желательно всё таки там быть летом. В противном случае может смыть селью, лавиной или паводком (это всё без серьёзного анализа просто почитал сообщения и даты). Кроме того, общей проблемой для всех регионов является изношенность инфраструктуры. Прорывы воды и отключения электричества прям один за одним идут. Так что при подготвке к БП - знайте с чем проблемы и в "мирное" время и учтите это на будущее. Серьёзного анализа я пока не проводил, времени нет, но как появится - напишу результаты. Так же было бы здорово, если бы среди форумчан нашёлся специалист по обработке данных - может подкинул бы идей или сам чего нового в них увидел.
Озвученные данные прикладываю. Для того чтоб в них хоть немного разобраться потребуется хотя бы эксель и его функция "фильтр"
З.Ы.
Это тестовый набор. В будущем, если дело пойдёт, может выложу остальные регионы.
Немного статистики
Немного статистики
- Вложения
-
- test_project.zip
- (127.36 КБ) 932 скачивания
Re: Немного статистики
Класс!