За последние два десятилетия, когда доступность и использование Интернета в мире возросли, население получает информацию главным образом с помощью этого нового альтернативного метода. Термин «Доктор Google» даже вошел в наш лексикон, им обозначают использование Интернета с целью поиска информации относительно имеющихся симптомов, причем часто до личного контакта с врачами.
«Инфодемиологические» методы, такие как онлайн-поиск трафика в Google, Facebook, Twitter широко используются для понимания поисковых действий населения во время эпидемии, а также для целей общественного здравоохранения [1–8]. Google Trends, который анализирует популярность определенных поисковых терминов в системе Google по всему миру, предоставляет как информацию в реальном времени, так и сведения о тенденциях (например, об изменениях интереса в Интернете к выбранным ключевым словам и темам с течением времени). В частности, Google Trends позволяет анализировать и прогнозировать такие важные вопросы здравоохранения, как распространение СПИДа, самолечение с помощью лекарств и ментальное здоровье [9]. Таким образом, данные о тенденциях, генерируемые поисковым объемом Google, могут дать ценную информацию о поведении населения и связанных со здоровьем явлениях, особенно во время вспышек инфекционных заболеваний [10–12]. Масштабы общественного интереса к COVID-19 беспрецедентны, а это означает, что тенденции в поисковом трафике в Интернете, вероятно, будут устойчивыми и надежными. Мы попытались изучить осведомленность общественности в России о COVID-19 с помощью данных запросов, полученных из Google Trends.
Материалы и методы
Базы данных
Данные по ежедневно подтвержденным случаям заболевания в России были получены с использованием ресурсов https://стопкоронавирус.рф и https://www.worldometers.info/coronavirus/. Эти данные были нормализованы по шкале от 0 до 100 для сравнения с поисковыми запросами.
Базы данных поисковых запросов
Google Trends [13] является общедоступной базой данных выборки реальных поисковых запросов, выполненных с использованием поисковой системы Google, которые анонимны, классифицированы и агрегированы. Чтобы сделать сравнения между запросами более точными, данные, извлеченные из Google Trends (GT), нормализуются по отношению к общему объему поиска, а повторные поиски, проведенные одним и тем же пользователем за короткое время, автоматически исключаются. Результаты поиска с помощью Google Trends представляются как относительный объем поиска (RSV). Результаты могут быть загружены в формате общих разделенных значений, представленных в интервале от 0 до 100.
Выбор терминов по номенклатуре и симптомам заболевания
Предварительный список поисковых терминов был составлен в соответствии с номенклатурой и симптоматикой COVID-19 [14–18].
Поскольку множественные итерации слова могут использоваться для поиска одного и того же состояния или симптома (например, миалгии и мышечной боли), GT группирует поисковые термины как тему или заболевание. Таким образом, темы или заболевания были использованы по отдельному поисковому запросу в тех случаях, когда это было применимо. В перечень терминов, обозначающих симптомы заболевания, вошли «боль в горле», «боль в груди», «диарея», «заложенность носа», «запах», «кашель», «лихорадка», «мокрота», «обоняние», «одышка», «оталгия», «потеря запаха», «потеря обоняния», «рвота», «температура», «заложенность носа».
Оцениваемая терминология заболевания включала «COVID-19», «заражение», «короновирус», «смертность» и связанные с диагностикой COVID-19 «КТ» (компьютерная томография), «ПЦР», «антитела».
Исследуемый период был установлен с 09.01 по 24.09 2020 г. (для запросов «обоняние» и «потеря обоняния» период исследования запросов был увеличен до 01.10)
При сравнении данных GT для каждого симптома и термина с реальными случаями заражения COVID-19 использовали коэффициент корреляции Пирсона (r).
Результаты
Статистически значимые корреляции между запросами и реальными случаями заражения COVID-19 в России были получены для запросов «заражение», «кашель», «обоняние», «потеря обоняния», «рвота», «смертность», а также «КТ» и «антитела» (см. таблицу).
На рис. 1 (см. на вклейке) представлен относительный объем поиска (RSV) для запросов «COVID-19» и «коронавирус» в сравнении с ежедневным подтвержденным числом случаев для России (реальными случаями заражения). Структура RSV имеет несколько пиков: 16.03, 29.03, 02.04 и 13.04. Это может быть связано с конкретными событиями в развитии эпидемии COVID-19 в России, о которых сообщалось в правительственных пресс-релизах и СМИ. Например, 29.03 сообщалось, что с 30.03 для жителей Москвы будет введен режим самоизоляции в связи с пандемией коронавируса. Интересно, что с 13.04 общественный интерес к COVID-19 начал снижаться. Это может быть связано с появившимися 13.04 сообщениями о том, что в России разработан препарат для лечения коронавируса. и что в Москве с 14.04 начнется тестирование на наличие антител к коронавирусу. Продолжительность общественного внимания к COVID-19 составила 48 дней (начало подъема интереса – 25.02, начало падения – 13.04).
RSV для запросов «коронавирус» достиг пика 31.03. Активность запросов начала снижаться, когда было объявлено о введении с 30.03 для всех жителей Москвы режима самоизоляции в связи с пандемией. Продолжительность общественного внимания к запросу «коронавирус» составила 37 дней (начало подъема интереса – 22.02, начало падения – 30.03).
Между RSV «COVID-19», «заражение», «смертность» r составил > 0,7. Для этих запросов выделяются 2 пика: первый – 17–18.03, второй – в пределах 28.03–02.04.
При анализе запросов, связанных с симптомами COVID-19, корреляция была слабой (r < 0,5) между запросами «кашель», «боль в горле», «мокрота», «температура» (рис. 2, см. на вклейке). Между запросами и реальными случаями заражения была выявлена отрицательная корреляция для запросов «кашель» (r = -0,72), «мокрота» (r = -0,53). Интерес к ним начал снижаться после 28.03, затем с начала июля появилась тенденция к росту (угол наклона 15–20о). Очевидно, что указанные симптомы, за исключением «температуры», снова вызвали интерес пользователей.
В ходе работы была выявлена сильная корреляция между RSV «обоняние», «потеря обоняния» и реальными случаями заражения COVID-19: r = 0,81 и 0,79 соответственно (рис. 3, см. на вклейке). Интерес к указанным запросам начал нарастать по мере увеличения числа реальных случаев COVID-19 с 16.03 по 11.05 и с 27.08 по 01.10 2020 г.
Нами также были проанализированы запросы пользователей, связанные с диагностикой COVID-19: «КТ» (компьютерная томография), «ПЦР» (полимеразная цепная реакция), «антитела» (иммуноферментный анализ) (рис. 4, см. на вклейке). В результате выявлен повышенный интерес общественности к «КТ», начавшийся 5.04, с максимумом запросов 27.04 апреля, затем интерес незначительно снизился и остается постоянным до настоящего времени. Корреляция между реальными случаями заражения и запросом «КТ» составила 0,71. Интересна тенденция, связанная с запросом «антитела». Интерес к тестированию вырос со 2.04 по 23.04 и держался в пределах от 25 до 50 от максимального интереса по принятой шкале до 13.05, резко вырос с пиком 27.05, затем стал снижаться. Корреляция между реальными случаями заражения и запросом «антитела» составила 0,79. Интерес к запросу «ПЦР» начал расти в середине июня и растет до настоящего времени.
Обсуждение
Данные о поведении в Интернете, полученные из GT, используются в многочисленных исследованиях COVID-19. S.M. Ayyoubzadeh и соавт. предприняли попытку предсказать заболеваемость COVID-19 с использованием данных GT для Ирана. Наиболее достоверная связь была выявлена для запросов, связанных с мытьем рук, дезинфицирующими средствами для рук и антисептиками [19]. Интернет-паттерны в Италии и Англии, обнаружили растущий интерес общественности к таким темам, как «маски для лица», «дезинфицирующее средство», «симптомы нового коронавируса», «бюллетень здоровья» и «вакцины от коронавируса» [20–21].
Другие исследования показали, что паттерны RSV предшествуют возникновению заболевания. M. Effenberger и соавт показали, что интерес общественности к коронавирусу в мире достиг первого пика в конце января, когда число новых инфицированных начало расти в геометрической прогрессии в Китае [22]. Индекс GT в мире достиг пика 12.03, когда число инфицированных пациентов в Европе резко возросло, а COVID-19 был объявлен пандемией. Во всех исследованных странах наблюдалась корреляция между показателями RSV и числом новых случаев COVID-19, причем максимальные показатели наблюдались с задержкой на 11,5 дня, то есть наибольший интерес к коронавирусу наблюдался за 11,5 дня до пика выявления новых случаев инфицирования. Эта модель была характерна для европейских стран и США. В Бразилии и Австралии самые высокие корреляции наблюдались с задержкой на 7 дней. В наших исследованиях RSV для запроса «коронавирус» достиг пика 31.03, а для «COVID-19» – 13.04.
Интересны данные о скорости реакции общественности на темы, касающиеся COVID-19, в разных странах. D. Hu и соавт. [23]. установили, что самый высокий показатель RSV в Ирландии (24.01) и Новой Зеландии (23.01) был отмечен позднее, чем в США (20.01), Великобритании (18.01), Канаде (20.01) и Австралия (21.01). Согласно нашим данным, в России максимальный интерес к заболеванию проявился еще позже (17–18.03).
Время отклика и продолжительность общественного внимания были также различными в разных странах. Продолжительность общественного внимания в США (27 дней, со 2 по 28.01), Великобритании (23 дня, с 9 по 31.01), Австралии (22 дня, с 9 по 30.01) и Канаде (13 дней, с 13 по 25.01) была больше, чем в Ирландии (12 дней, с 20 по 31.01) и Новой Зеландии (11 дней, с 20 по 30.01). В России интерес к COVID-19 продолжался значительно дольше – 48 дней (начало подъема интереса – 25.02, начало падения – 13.04), что может быть связано с подробным освещением развития заболевания в нашей стране и режимом самоизоляции.
Предшествующие пики RSV перед увеличением числа случаев наиболее значительны при анализе запросов, связанных с ключевыми симптомами COVID-19. Например, в работе M.D. Walker и соавт. [20] показано, что RSV наиболее сильно коррелировал с задержкой по времени для запросов «температура» (-20 дней; r = 0,71), «кашель» (-21 день; r = 0,75) и «лихорадка» (- 19 дней; r = 0,74). T.S. Higgins и соавт. [24] отметили, что по всему миру поисковые запросы «одышка», «аносмия», «дисгевзия и агеозия», «головная боль», «боль в груди» и «чихание» имели сильную корреляцию (r > 0,60; p < 0,001) как с новыми ежедневно подтверждаемыми случаями, так и с числом смертельных исходов от COVID-19. Поиск по запросам «COVID-19» и «короновирус» опережал рост фактически подтвержденных случаев на 12 дней (r = 0,85, SD – 0,10 и r = 0,76, SD – 0,09 соответственно; р < 0,001).
Мы не установили значимой корреляции (r < 0,5) между запросами «кашель», «боль в горле», «мокрота», «температура». Средняя отрицательная корреляция между запросами и реальными случаями заражения COVID-19 была выявлена только для запросов «кашель» (r = -0,72) и «мокрота» (r = -0,53). Интерес к этим запросам начал снижаться после 28.03, затем с начала июля появилась тенденция к росту. Очевидно, что указанные симптомы, за исключением «температуры», снова вызвали интерес пользователей.
В ходе проведенной работы была выявлена сильная корреляция между RSV «обоняние» и реальными случаями заражения (r = 0.81). Аналогичные результаты были получены А. Walker и соавт. [25], которые выявили сильную корреляцию между ежедневным RSV, связанными с потерей обоняния, ежедневным ростом числа случаев COVID-19 и смертей в диапазоне от 0,633 до 0,952 (р < 0,05) в нескольких странах. Из полученных нами данных следует, что интерес к указанным запросам начал нарастать по мере увеличения числа реальных случаев заболевания в период с 16.03 по 11.05 и с 27.08 по 01.10 (r = 0,93 и 0,87 соответственно). Интересно, что в период со 2 по 12.04 запросы опережали рост реальных случаев COVID-19 на 2–5 дней. «Опережение» запросов «обоняние» по отношению к реальным случаям заражения может быть связано с тем, что пациенты с симптомами, связанными с нарушением обоняния, первоначально обращаются к онлайн-поиску по проблеме, как предположили S.Y. Shin и соавт. [12], и только потом проходят тестирование на наличие SARS-CoV-2. С этой точки зрения вызывает обеспокоенность тот факт, что с 27.08 количество запросов, связанных с обонянием, опережает число выявленных случаев заражения по состоянию на 01.10.
При анализе запросов, связанных с диагностикой COID-19, был выявлен повышенный интерес пользователей к запросу «КТ», который резко вырос с 5.04, достиг максимума 27.04, затем незначительно снизился и остается постоянным до настоящего времени. Корреляция между реальными случаями заражения и запросом «КТ» составила 0,71.
Интересна тенденция, связанная с запросом «антитела». Интерес к нему вырос со 02 по 23.04, держался в пределах от 25 до 50 до 13.05, резко вырос и достиг максимума 27.05, затем стал снижаться. Корреляция между реальными случаями заражения и запросом «антитела» составила 0,79. Интерес общественности к «ПЦР» начал расти с середины июня и продолжается до настоящего времени. Рост интереса к методам диагностики COVID-19 может быть связан, например, с выступлениями Президента России 02.04 и 11.05 и возобновлением работы предприятий с 12.05 или объявлением мэра Москвы 14.05 о массовом бесплатном тестировании на антитела к коронавирусу в Москве с 15.05. Значительная корреляция между реальными случаями заражения и запросами «КТ» (r = 0,71) и «антитела» (r = 0,79) свидетельствует, на наш взгляд, о том, что общественность хочет иметь больше информации о методах диагностики COVID-19.
Заключение
Таким образом, несмотря на то что средства массовой информации оказывают влияние на некоторые тенденции поиска в Интернете, многие поисковые термины отражают клинические проявления заболевания и демонстрируют сильную корреляцию с реальными случаями COVID-19. Связь между RSV и подтвержденным числом случаев заражения может иметь важное значение для эпидемиологического надзора за условиями, в которых ситуация быстро развивается, и требуется актуальная информация о прогрессировании заболевания.
Взаимосвязь между запросами в Интернете, сообщениями в СМИ и фактическими сведениями о заболеваемости достаточно сложна и требует дальнейшего изучения.