Анализ запросов динамики Google Trends в России в период пандемии коронавирусной инфекции как инструмент эпидемиологического надзора


DOI: https://dx.doi.org/10.18565/epidem.2020.10.4.33-7

Момыналиев К.Т., Акимкин В.Г.

ФБУН «Центральный НИИ эпидемиологии» Роспотребнадзора, Москва, Россия
Пандемия коронавирусной инфекции (COVID-19) создала уникальную возможность исследовать закономерности активности пользователей в Интернете в связи с новым заболеванием и исследовать, как они связаны с реальными случаями заражения SARS-CoV-2.
Цель исследования. Эпидемиологическое и социальное изучение осведомленности населения Российской Федерации о новой коронавирусной инфекции — COVID-19.
Материалы и методы. Проведен анализ запросов по теме «COVID-19», полученных из Google Trends, за период с 09.01 по 24.09 2020 г.
Результаты. Поисковая активность по запросам, которые могут быть связаны с симптомами COVID-19 «обоняние» и «потеря обоняния», имеет выраженную позитивную корреляцию с подтвержденным числом случаев заболевания в России (r = 0,81 для запроса «обоняние» и r = 0,79 для запроса «потеря обоняния»). Между запросами «кашель», «мокрота» и реальными случаями заражения была выявлена сильная и средняя отрицательная корреляция: - 0,72 и - 0,53 соответственно. Также сильная положительная корреляция выявлена между реальными случаями заражения и запросами, связанными с диагностикой COVID-19: «КТ» (компьютерная томография; r = 0,71) и «антитела» (r = 0,79).
Заключение. Связь между относительным объемом поиска в Интернете и подтвержденным числом случаев может иметь важное значение для мониторинга быстро меняющейся эпидемической ситуации, когда требуется актуальная информация о распространении заболевания.

За последние два десятилетия, когда доступность и использование Интернета в мире возросли, население получает информацию главным образом с помощью этого нового альтернативного метода. Термин «Доктор Google» даже вошел в наш лексикон, им обозначают использование Интернета с целью поиска информации относительно имеющихся симптомов, причем часто до личного контакта с врачами.

«Инфодемиологические» методы, такие как онлайн-поиск трафика в Google, Facebook, Twitter широко используются для понимания поисковых действий населения во время эпидемии, а также для целей общественного здравоохранения [1–8]. Google Trends, который анализирует популярность определенных поисковых терминов в системе Google по всему миру, предоставляет как информацию в реальном времени, так и сведения о тенденциях (например, об изменениях интереса в Интернете к выбранным ключевым словам и темам с течением времени). В частности, Google Trends позволяет анализировать и прогнозировать такие важные вопросы здравоохранения, как распространение СПИДа, самолечение с помощью лекарств и ментальное здоровье [9]. Таким образом, данные о тенденциях, генерируемые поисковым объемом Google, могут дать ценную информацию о поведении населения и связанных со здоровьем явлениях, особенно во время вспышек инфекционных заболеваний [10–12]. Масштабы общественного интереса к COVID-19 беспрецедентны, а это означает, что тенденции в поисковом трафике в Интернете, вероятно, будут устойчивыми и надежными. Мы попытались изучить осведомленность общественности в России о COVID-19 с помощью данных запросов, полученных из Google Trends.

Материалы и методы

Базы данных

Данные по ежедневно подтвержденным случаям заболевания в России были получены с использованием ресурсов https://стопкоронавирус.рф и https://www.worldometers.info/coronavirus/. Эти данные были нормализованы по шкале от 0 до 100 для сравнения с поисковыми запросами.

Базы данных поисковых запросов

Google Trends [13] является общедоступной базой данных выборки реальных поисковых запросов, выполненных с использованием поисковой системы Google, которые анонимны, классифицированы и агрегированы. Чтобы сделать сравнения между запросами более точными, данные, извлеченные из Google Trends (GT), нормализуются по отношению к общему объему поиска, а повторные поиски, проведенные одним и тем же пользователем за короткое время, автоматически исключаются. Результаты поиска с помощью Google Trends представляются как относительный объем поиска (RSV). Результаты могут быть загружены в формате общих разделенных значений, представленных в интервале от 0 до 100.

Выбор терминов по номенклатуре и симптомам заболевания

Предварительный список поисковых терминов был составлен в соответствии с номенклатурой и симптоматикой COVID-19 [14–18].

Поскольку множественные итерации слова могут использоваться для поиска одного и того же состояния или симптома (например, миалгии и мышечной боли), GT группирует поисковые термины как тему или заболевание. Таким образом, темы или заболевания были использованы по отдельному поисковому запросу в тех случаях, когда это было применимо. В перечень терминов, обозначающих симптомы заболевания, вошли «боль в горле», «боль в груди», «диарея», «заложенность носа», «запах», «кашель», «лихорадка», «мокрота», «обоняние», «одышка», «оталгия», «потеря запаха», «потеря обоняния», «рвота», «температура», «заложенность носа».

Оцениваемая терминология заболевания включала «COVID-19», «заражение», «короновирус», «смертность» и связанные с диагностикой COVID-19 «КТ» (компьютерная томография), «ПЦР», «антитела».

Исследуемый период был установлен с 09.01 по 24.09 2020 г. (для запросов «обоняние» и «потеря обоняния» период исследования запросов был увеличен до 01.10)

При сравнении данных GT для каждого симптома и термина с реальными случаями заражения COVID-19 использовали коэффициент корреляции Пирсона (r).

34-1.jpg (69 KB)Результаты

Статистически значимые корреляции между запросами и реальными случаями заражения COVID-19 в России были получены для запросов «заражение», «кашель», «обоняние», «потеря обоняния», «рвота», «смертность», а также «КТ» и «антитела» (см. таблицу).

На рис. 1 (см. на вклейке) представлен относительный объем поиска (RSV) для запросов «COVID-19» и «коронавирус» в сравнении с ежедневным подтвержденным числом случаев для России (реальными случаями заражения). Структура RSV имеет несколько пиков: 16.03, 29.03, 02.04 и 13.04. Это может быть связано с конкретными событиями в развитии эпидемии COVID-19 в России, о которых сообщалось в правительственных пресс-релизах и СМИ. Например, 29.03 сообщалось, что с 30.03 для жителей Москвы будет введен режим самоизоляции в связи с пандемией коронавируса. Интересно, что с 13.04 общественный интерес к COVID-19 начал снижаться. Это может быть связано с появившимися 13.04 сообщениями о том, что в России разработан препарат для лечения коронавируса. и что в Москве с 14.04 начнется тестирование на наличие антител к коронавирусу. Продолжительность общественного внимания к COVID-19 составила 48 дней (начало подъема интереса – 25.02, начало падения – 13.04).

RSV для запросов «коронавирус» достиг пика 31.03. Активность запросов начала снижаться, когда было объявлено о введении с 30.03 для всех жителей Москвы режима самоизоляции в связи с пандемией. Продолжительность общественного внимания к запросу «коронавирус» составила 37 дней (начало подъема интереса – 22.02, начало падения – 30.03).

Между RSV «COVID-19», «заражение», «смертность» r составил > 0,7. Для этих запросов выделяются 2 пика: первый – 17–18.03, второй – в пределах 28.03–02.04.

При анализе запросов, связанных с симптомами COVID-19, корреляция была слабой (r < 0,5) между запросами «кашель», «боль в горле», «мокрота», «температура» (рис. 2, см. на вклейке). Между запросами и реальными случаями заражения была выявлена отрицательная корреляция для запросов «кашель» (r = -0,72), «мокрота» (r = -0,53). Интерес к ним начал снижаться после 28.03, затем с начала июля появилась тенденция к росту (угол наклона 15–20о). Очевидно, что указанные симптомы, за исключением «температуры», снова вызвали интерес пользователей.

В ходе работы была выявлена сильная корреляция между RSV «обоняние», «потеря обоняния» и реальными случаями заражения COVID-19: r = 0,81 и 0,79 соответственно (рис. 3, см. на вклейке). Интерес к указанным запросам начал нарастать по мере увеличения числа реальных случаев COVID-19 с 16.03 по 11.05 и с 27.08 по 01.10 2020 г.

_vkl-1.jpg (326 KB)

Нами также были проанализированы запросы пользователей, связанные с диагностикой COVID-19: «КТ» (компьютерная томография), «ПЦР» (полимеразная цепная реакция), «антитела» (иммуноферментный анализ) (рис. 4, см. на вклейке). В результате выявлен повышенный интерес общественности к «КТ», начавшийся 5.04, с максимумом запросов 27.04 апреля, затем интерес незначительно снизился и остается постоянным до настоящего времени. Корреляция между реальными случаями заражения и запросом «КТ» составила 0,71. Интересна тенденция, связанная с запросом «антитела». Интерес к тестированию вырос со 2.04 по 23.04 и держался в пределах от 25 до 50 от максимального интереса по принятой шкале до 13.05, резко вырос с пиком 27.05, затем стал снижаться. Корреляция между реальными случаями заражения и запросом «антитела» составила 0,79. Интерес к запросу «ПЦР» начал расти в середине июня и растет до настоящего времени.

Обсуждение

Данные о поведении в Интернете, полученные из GT, используются в многочисленных исследованиях COVID-19. S.M. Ayyoubzadeh и соавт. предприняли попытку предсказать заболеваемость COVID-19 с использованием данных GT для Ирана. Наиболее достоверная связь была выявлена для запросов, связанных с мытьем рук, дезинфицирующими средствами для рук и антисептиками [19]. Интернет-паттерны в Италии и Англии, обнаружили растущий интерес общественности к таким темам, как «маски для лица», «дезинфицирующее средство», «симптомы нового коронавируса», «бюллетень здоровья» и «вакцины от коронавируса» [20–21].

Другие исследования показали, что паттерны RSV предшествуют возникновению заболевания. M. Effenberger и соавт показали, что интерес общественности к коронавирусу в мире достиг первого пика в конце января, когда число новых инфицированных начало расти в геометрической прогрессии в Китае [22]. Индекс GT в мире достиг пика 12.03, когда число инфицированных пациентов в Европе резко возросло, а COVID-19 был объявлен пандемией. Во всех исследованных странах наблюдалась корреляция между показателями RSV и числом новых случаев COVID-19, причем максимальные показатели наблюдались с задержкой на 11,5 дня, то есть наибольший интерес к коронавирусу наблюдался за 11,5 дня до пика выявления новых случаев инфицирования. Эта модель была характерна для европейских стран и США. В Бразилии и Австралии самые высокие корреляции наблюдались с задержкой на 7 дней. В наших исследованиях RSV для запроса «коронавирус» достиг пика 31.03, а для «COVID-19» – 13.04.

Интересны данные о скорости реакции общественности на темы, касающиеся COVID-19, в разных странах. D. Hu и соавт. [23]. установили, что самый высокий показатель RSV в Ирландии (24.01) и Новой Зеландии (23.01) был отмечен позднее, чем в США (20.01), Великобритании (18.01), Канаде (20.01) и Австралия (21.01). Согласно нашим данным, в России максимальный интерес к заболеванию проявился еще позже (17–18.03).

Время отклика и продолжительность общественного внимания были также различными в разных странах. Продолжительность общественного внимания в США (27 дней, со 2 по 28.01), Великобритании (23 дня, с 9 по 31.01), Австралии (22 дня, с 9 по 30.01) и Канаде (13 дней, с 13 по 25.01) была больше, чем в Ирландии (12 дней, с 20 по 31.01) и Новой Зеландии (11 дней, с 20 по 30.01). В России интерес к COVID-19 продолжался значительно дольше – 48 дней (начало подъема интереса – 25.02, начало падения – 13.04), что может быть связано с подробным освещением развития заболевания в нашей стране и режимом самоизоляции.

Предшествующие пики RSV перед увеличением числа случаев наиболее значительны при анализе запросов, связанных с ключевыми симптомами COVID-19. Например, в работе M.D. Walker и соавт. [20] показано, что RSV наиболее сильно коррелировал с задержкой по времени для запросов «температура» (-20 дней; r = 0,71), «кашель» (-21 день; r = 0,75) и «лихорадка» (- 19 дней; r = 0,74). T.S. Higgins и соавт. [24] отметили, что по всему миру поисковые запросы «одышка», «аносмия», «дисгевзия и агеозия», «головная боль», «боль в груди» и «чихание» имели сильную корреляцию (r > 0,60; p < 0,001) как с новыми ежедневно подтверждаемыми случаями, так и с числом смертельных исходов от COVID-19. Поиск по запросам «COVID-19» и «короновирус» опережал рост фактически подтверж­денных случаев на 12 дней (r = 0,85, SD – 0,10 и r = 0,76, SD – 0,09 соответственно; р < 0,001).

Мы не установили значимой корреляции (r < 0,5) между запросами «кашель», «боль в горле», «мокрота», «температура». Средняя отрицательная корреляция между запросами и реальными случаями заражения COVID-19 была выявлена только для запросов «кашель» (r = -0,72) и «мокрота» (r = -0,53). Интерес к этим запросам начал снижаться после 28.03, затем с начала июля появилась тенденция к росту. Очевидно, что указанные симптомы, за исключением «температуры», снова вызвали интерес пользователей.

В ходе проведенной работы была выявлена сильная корреляция между RSV «обоняние» и реальными случаями заражения (r = 0.81). Аналогичные результаты были получены А. Walker и соавт. [25], которые выявили сильную корреляцию между ежедневным RSV, связанными с потерей обоняния, ежедневным ростом числа случаев COVID-19 и смертей в диапазоне от 0,633 до 0,952 (р < 0,05) в нескольких странах. Из полученных нами данных следует, что интерес к указанным запросам начал нарастать по мере увеличения числа реальных случаев заболевания в период с 16.03 по 11.05 и с 27.08 по 01.10 (r = 0,93 и 0,87 соответственно). Интересно, что в период со 2 по 12.04 запросы опережали рост реальных случаев COVID-19 на 2–5 дней. «Опережение» запросов «обоняние» по отношению к реальным случаям заражения может быть связано с тем, что пациенты с симптомами, связанными с нарушением обоняния, первоначально обращаются к онлайн-поиску по проблеме, как предположили S.Y. Shin и соавт. [12], и только потом проходят тестирование на наличие SARS-CoV-2. С этой точки зрения вызывает обеспокоенность тот факт, что с 27.08 количество запросов, связанных с обонянием, опережает число выявленных случаев заражения по состоянию на 01.10.

При анализе запросов, связанных с диагностикой COID-19, был выявлен повышенный интерес пользователей к запросу «КТ», который резко вырос с 5.04, достиг максимума 27.04, затем незначительно снизился и остается постоянным до настоящего времени. Корреляция между реальными случаями заражения и запросом «КТ» составила 0,71.

Интересна тенденция, связанная с запросом «антитела». Интерес к нему вырос со 02 по 23.04, держался в пределах от 25 до 50 до 13.05, резко вырос и достиг максимума 27.05, затем стал снижаться. Корреляция между реальными случаями заражения и запросом «антитела» составила 0,79. Интерес общественности к «ПЦР» начал расти с середины июня и продолжается до настоящего времени. Рост интереса к методам диагностики COVID-19 может быть связан, например, с выступлениями Президента России 02.04 и 11.05 и возобновлением работы предприятий с 12.05 или объявлением мэра Москвы 14.05 о массовом бесплатном тестировании на антитела к коронавирусу в Москве с 15.05. Значительная корреляция между реальными случаями заражения и запросами «КТ» (r = 0,71) и «антитела» (r = 0,79) свидетельствует, на наш взгляд, о том, что общественность хочет иметь больше информации о методах диагностики COVID-19.

Заключение

Таким образом, несмотря на то что средства массовой информации оказывают влияние на некоторые тенденции поиска в Интернете, многие поисковые термины отражают клинические проявления заболевания и демонстрируют сильную корреляцию с реальными случаями COVID-19. Связь между RSV и подтвержденным числом случаев заражения может иметь важное значение для эпидемиологического надзора за условиями, в которых ситуация быстро развивается, и требуется актуальная информация о прогрессировании заболевания.

Взаимосвязь между запросами в Интернете, сообщениями в СМИ и фактическими сведениями о заболеваемости достаточно сложна и требует дальнейшего изучения.


Литература


1. Mollema L., Harmsen I.A., Broekhuizen E., Clijnk R., De Melker H., Paulussen T. Et al. Disease detection or public opinion reflection? Content analysis of tweets, other social media, and online newspapers during the measles outbreak in The Netherlands in 2013. J. Med. Intern. Res. 2015; 17(5): e128. Doi: 10.2196/jmir.3863. https://www.jmir.org/2015/5/e128/


2. Chen Y., Zhang Y., Xu Z., Wang X., Lu J., Hu W. Avian influenza A (H7N9) and related Internet search query data in China. Sci. Rep. 2019; 9(1): 10434. Doi: 10.1038/s41598-019-46898-y


3. Mohamed N.A. Knowledge, attitude and practice on bats-borne diseases among village residents: a pilot study. Med & Health 2018; 13(2): 48–57. Doi: 10. 17576/MH. https://www.cabdirect.org/globalhealth/abstract/20193459604


4. Zeraatkar K., Ahmadi M. Trends of infodemiology studies: a scoping review. Health Info Libr. J. 2018; 35(2): 91–120. Doi: 10.1111/hir.12216


5. Tang L., Bie B., Park S., Zhi D. Social media and outbreaks of emerging infectious diseases: A systematic review of literature. Am. J. Infect. Control. 2018; 46(9): 962–72. Doi: 10.1016/j.ajic.2018.02.010


6. Eysenbach G. SARS and population health technology. J. Med. Intern. Res. 2003; 5(2): e14. Doi: 10.2196/ jmir.5.2.e14


7. Mavragani A., Ochoa G. Infoveillance of infectious diseases in USA: STDs, tuberculosis, and hepatitis. J. Big. Data 2018; 5(1). Doi: 10.1186/s40537-018-0140-9


8. Roccetti M., Marfia G., Salomoni P., Prandi C., Zagari R.M., Gningaye Kengni F.L. et al. Attitudes of Crohn’s Disease Patients: Infodemiology Case Study and Sentiment Analysis of Facebook and Twitter Posts. JMIR Public Health Surveill. 2017; 3(3): e51. Doi: 10.2196/publichealth.7004


9. Mavragani A., Ochoa G. Google Trends in Infodemiology and Infoveillance: Methodology Framework. JMIR Public Health Surveill. 2019; 5(2): e13439. Doi: 10.2196/13439


10. Mavragani A., Ochoa G.. Tsagarakis KP (2018) Assessing the methods, tools, and statistical approaches in Google Trends research: systematic review. J. Med. Intern. Res. 2018; 20(11): e270.


11. Ginsberg J., Mohebbi M., Patel R. et al. Detecting influenza epidemics using search engine query data. Nature 2009; 457: 1012–4.


12. Shin S.Y., Seo D., An J. et al. High correlation of Middle East respiratory syndrome spread with Google search and Twitt.er trends in Korea. Sci. Rep. 2016; 6(2): 32920.


13. Google Trends. https://trends.google.com/trends/?geo=US


14. Wang C., Horby P.W., Hayden F.G., Gao G.F. A novel coronavirus outbreak of global health concern. Lancet 2020; 395(10223): 470–3. Doi: 10.1016/s0140-6736(20)30185-9


15. Guan W., Ni Z., Hu Y., Liang W., Ou C., He J. et al China Medical Treatment Expert Group for Covid-19 Clinical characteristics of coronavirus disease 2019 in China. N. Engl. J. Med. 2020; 382(18): 1708–20. Doi: 10.1056/NEJMoa2002032


16. Chow E.J., Schwartz N.G., Tobolowsky F.A., Zacks R.L.T., Huntington-Frazier M., Reddy S.C., Rao A.K. Symptom screening at illness onset of health care personnel with SARS-CoV-2 infection in King County, Washington. JAMA 2020; 323(20): 2087–9. Doi: 10.1001/jama.2020.6637


17. World Health Organization.


18. Временные методические рекомендации «Профилак­тика, диагностика и лечение новой коронавирусной инфекции (COVID-19)». https://static-0.rosminzdrav.ru/system/attachments/attaches/000/050/584/original/03062020_МR_COVID-19_v7.pdf

[Prevention, diagnosis and treatment of new coronavirus infection (COVID-19]. (In Russ.). https://static-0.rosminzdrav.Ru/system/attachments/attaches/ 000/050/584/original/03062020_МR_ COVID-19_v7.pdf


19. Ayyoubzadeh S.M., Zahedi H., Ahmadi M. Predicting COVID-19 incidence using Google Trends and data mining techniques: a pilot study in Iran. JMIR Public Health Surveill. 2020; 6(2): e18828


20. Walker M.D., Sulyok M. Online behavioural patterns for Coronavirus disease 2019 (COVID-19) in the United Kingdom. Epidemiology and Infection 2020; 148: e110. doi: 10.1017/S0950268820001193


21. Rovetta A., Bhagavathula A. COVID-19-Related Web Search Behaviors and Infodemic Attitudes in Italy: Infodemiological Study. JMIR Public Health Surveill. 2020; 6(2): e19374. Doi: 10.2196/19374


22. Effenberger M., Kronbichler A., Shin J.I., Mayer G., Tilg H., Perco P. Association of the COVID-19 pandemic with Internet Search Volumes: A Google Trends TM Analysis. Int. J. Infect. Dis. 2020; 95: 192–7. Doi:10.1016/j.ijid.2020.04.033


23. Hu D., Lou X., Xu Z. et al. More effective strategies are required to strengthen public awareness of COVID-19: Evidence from Google Trends. J. Glob. Health 2020; 10(1): 011003. Doi:10.7189/jogh.10.011003


24. Higgins T.S., Wu A.W., Sharma D. et al. Correlations of Online Search Engine Trends With Coronavirus Disease (COVID-19) Incidence: Infodemiology Study. JMIR Public Health Surveill. 2020; 6(2): e19702. Doi:10.2196/19702


25. Walker A., Hopkins C., Surda P. Use of Google Trends to investigate loss-of-smell-related searches during the COVID-19 outbreak. Int. Forum Allergy Rhinol. 2020; 10(7): 839–47. Doi:10.1002/alr.22580


Об авторах / Для корреспонденции


Момыналиев Куват Темиргалиевич – д.б.н., доцент, ведущий научный сотрудник, ФБУН «Центральный НИИ эпидемиологии» Роспотребнадзора, Москва, Россия; е-mail: dhoroshun@gmail.com; ORCID: https://orcid.org/0000-0003-4656-1025
Акимкин Василий Геннадьевич – академик РАН, д.м.н., профессор, директор ФГБУ «Центральный НИИ эпидемиологии» Роспотребнадзора, Москва, Россия; е-mail: vgakimkin@yandex.ru; ORCID: http://orcid.org/0000-0003-4228-9044


Похожие статьи


Бионика Медиа