С учетом стремительно растущей статистики по COVID-19, сбор информации о распространении коронавирусной инфекции и новостей, связанных с пандемией, стал одной из самых актуальных проблем для тематических ресурсов. При этом собирать её проблематично из-за того, что на большинстве сайтов она подается в неудобном формате. Поэтому эксперты проекта «СПАРСИМ» решили рассказать, как настраивать парсер под базы данных Covid, сбор данных о ситуации с распространением SARS-cov-2 с последующим сохранением в файлах форматов Excel или JSON.

Простой и бесплатный способ получения информации о распространении вируса
Для реализации понадобится любой бесплатный веб-парсер, способный извлекать базы данных Covid с общедоступных страниц в сети. Основным источником будет проект Worldometer, предоставляющий актуальную сводку новостей и количество случаев COVID-19 с обновлением в режиме реального времени ( база данных covid )

Как парсить информацию про COVID?
Процедура состоит из нескольких этапов:
- Открываем выбранный сервис для парсинга, создаем новый проект и вводим URL проекта;
- В окне со страницей выбираем нужный нам регион, после чего выделяем нужную страну (в зависимости от особенностей приложения);
- Выставляем приоритеты, после чего создаем отдельные списки, в которые попадает собранная информация;
- Указываем на дополнительные столбцы, обозначающее к-во новых случаев, общее количество выздоровевших и умерших.
При грамотной настройке парсера, вы получите таблицу следующего формата: Страна – общее количество заболевших, статистика по новым больным, количество выздоровевших, смертность. Собирать статистику можно как по отдельным странам, так и по всему миру.
Запуск парсера
После обозначения параметров скрепинга необходимо нажать кнопку «Запустить». Тем не менее, прежде чем начать собирать данные, вы можете отсканировать несколько страниц в тестовом режиме, что позволит выявить и устранить ошибки до старта сбора информации. Чтобы статистика обновлялась в соответствии с выбранным сайтом, достаточно задать расписание парсинга. По завершении процедуры, все сведения будут собраны в таблицу Excel, либо в файл JSON, интегрирующийся с CMS вашего ресурса.
Дальнейшее использование полученной информации практически не ограничено. К примеру, канал TechWithTim использует автоматизированный скрепинг для обновления данных при работе с голосовым помощником Coronavirus.
При этом стоит отметить, что если вам нужны актуальные данные по России или странам ближнего зарубежья, «СПАРСИМ» подходит для этого как нельзя лучше. Ведь помимо простого и незатейливого интерфейса, наши эксперты готовы подсказать, как настроить скрипт для получения актуальной информации, сбора баз данных по прививкам от Covid, а также обеспечить полную его интеграцию с вашим проектом.