З урахуванням стрімко зростаючої статистики COVID-19, збір інформації про поширення коронавірусної інфекції та новин, пов’язаних з пандемією, став однією з найактуальніших проблем для тематичних ресурсів. При цьому збирати її проблематично через те, що на більшості сайтів вона подається у незручному форматі. Тому експерти проекту «СПАРСИМ» вирішили розповісти, як налаштовувати парсер під бази даних Covid, збір даних щодо ситуації з поширенням SARS-cov-2 з подальшим збереженням у файлах форматів Excel або JSON.

Простий та безкоштовний спосіб отримання інформації про поширення вірусу
Для реалізації знадобиться будь-який безкоштовний веб-парсер, здатний отримувати бази даних Covid із загальнодоступних сторінок у мережі. Основним джерелом буде проект Worldometer, що надає актуальне зведення новин та кількість випадків COVID-19 з оновленням у режимі реального часу (база даних covid)

Як писати інформацію про COVID?
Процедура складається з кількох етапів:
- Відкриваємо обраний сервіс для парсингу, створюємо новий проект та вводимо URL проекту;
- У вікні зі сторінкою вибираємо потрібний нам регіон, після чого виділяємо потрібну країну (залежно від особливостей програми);
- Виставляємо пріоритети, після чого створюємо окремі списки, які потрапляє зібрана інформація;
- Вказуємо на додаткові стовпці, що означає кількість нових випадків, загальна кількість одужалих і померлих.
При грамотному налаштуванні парсера, ви отримаєте таблицю наступного формату: Країна – загальна кількість хворих, статистика за новими хворими, кількість хворих, смерть. Збирати статистику можна як за окремими країнами, так і по всьому світу.
Запуск парсера
Після позначення параметрів скріпінгу необхідно натиснути кнопку “Запустити”. Тим не менш, перш ніж почати збирати дані, ви можете відсканувати кілька сторінок у тестовому режимі, що дозволить виявити та усунути помилки до старту збору інформації. Щоб статистика оновлювалася відповідно до вибраного сайту, достатньо задати розклад парсингу. Після завершення процедури, всі відомості будуть зібрані в таблицю Excel або файл JSON, що інтегрується з CMS вашого ресурсу.
Подальше використання отриманої інформації практично обмежено. Наприклад, канал TechWithTim використовує автоматизований скріпінг для оновлення даних під час роботи з голосовим помічником Coronavirus.
При цьому варто відзначити, що якщо вам потрібні актуальні дані щодо Росії або країн ближнього зарубіжжя, «СПАРСИМ» підходить для цього якнайкраще. Адже крім простого і невигадливого інтерфейсу, наші експерти готові підказати, як налаштувати скрипт для отримання актуальної інформації, збору баз даних із щеплень від Covid, а також забезпечити повну його інтеграцію з вашим проектом.