Прогнозирование миграции из России в Великобританию с использованием Google Trends Index

  • Михаил Антонович Галкин Национальный исследовательский университет «Высшая школа экономики»
Ключевые слова: международная миграция, миграция между Россией и Великобританией, большие данные, наукастинг, поисковые запросы, Google Trends Index, лингвистический анализ, LASSO, главные компоненты, SARIMA

Аннотация

Официальная статистика международной миграции часто публикуется с существенными задержками, может страдать от неполноты, несопоставимости и различных типов нарушений. Это затрудняет изучение миграционных потоков, их своевременный мониторинг и прогнозирование. Исследование посвящено применению и модификации методов наукастинга международной миграции с использованием данных поисковых интернет-запросов на примере миграции из России в Великобританию за период 2011-2023 гг. Они предполагают: (a) отбор регрессоров методом LASSO (параметр регуляризации подбирается по кросс-валидации), выполнение прогноза целевой переменной линейной регрессией с использованием полученных с помощью моделей SARIMA прогнозов регрессоров; (б) сокращение размерности методом главных компонент с кросс-валидационным выбором числа факторов и их лагов и последующим построением линейной регрессии на этих факторах, чьи будущие значения оцениваются моделями SARIMA. Информационной базой исследования послужили данные индекса Google Trends, отобранные по результатам проведения лингвистического анализа облака слов поисковых запросов, и официальная миграционная статистика британского правительства – представительского органа страны прибытия. По результатам моделирования были сделаны выводы о том, что (а) использование показателей поисковых запросов позволяет осуществлять прогнозирование международной миграции на разных прогнозных горизонтах с системно более низкой ошибкой, нежели при отсутствии учета поискового интереса; (б) объем собираемых для реализации наукастинга данных может быть существенно сокращен ввиду разреженности части оцененных моделей. Исследование продолжает академическую традицию использования данных поискового интереса в качестве альтернативы официальной статистики и вносит вклад в формирование методологической базы для прогнозирования изменяющихся во времени макропроцессов. Результаты работы могут быть использованы при оценке международной миграции между другими странами, а также в рамках статистических исследований в других научных областях.

Скачивания

Данные скачивания пока не доступны.

Литература

Броницкий Г.Т. (2024). Наукастинг миграции с использованием Google Trends: применение для разных стран. Население и экономика, 8(2), 133–154. https://doi.org/10.3897/popecon8.e119577

Броницкий Г.Т., Вакуленко Е.С. (2022). Прогнозирование миграции из России в Германию с использованием Google-трендов. Демографическое обозрение, 9(3), 75–92. https://doi.org/10.17323/demreview.v9i3.16471

Броницкий Г.Т., Вакуленко Е.С. (2024). Применение Google Trends для прогнозирования миграции из России: агрегация поисковых запросов и учет лаговой структуры. Прикладная эконометрика, 73, 78–101. https://doi.org/10.22394/1993-7601-2024-73-78-101

Денисенко М.Б. (2003). Эмиграция из России по данным зарубежной статистики. Мир России: Социология, этнология, 12(3), 157–169. https://mirros.hse.ru/article/view/5283

Цапенко И.П., Юревич М.А. (2022). Статистика онлайн-запросов в наукастинге миграции. Экономические и социальные перемены: факты, тенденции, прогноз, 15(1), 74–89. https://doi.org/10.15838/esc.2022.1.79.4

Aitken A.C. (1935). On Least Squares and Linear Combinations of Observations. Proceedings of Royal Statistical Society, 55, 42–48. https://doi.org/10.1017/S0370164600014346

Akaike H. (1974). A New Look at the Statistical Model Identification. IEEE Transactions on Automatic Control, 19(6), 716–723. https://doi.org/10.1109/TAC.1974.1100705

Aleshkovski I.A. (2012). International Migration, Globalization and Demographic Development of the Russian Federation. Journal of Globalization Studies, 3(1), 95–110.

Avramescu A., Wiśniowski A. (2021). Now-Casting Romanian Migration into the United Kingdom by Using Google Search Engine Data. Demographic Research, 45, 1219–1254. https://www.demographic-research.org/articles/volume/45/40

Bai J. (2003). Inferential Theory for Factor Models of Large Dimensions. Econometrica, 71(1), 135–171. https://doi.org/10.1111/1468-0262.00392

Böhme M.H., Gröger A., Stöhr T. (2020). Searching for a Better Life: Predicting Internat ional Migration with Online Search Keywords. Journal of Development Economics, 142, 102347. https://doi.org/10.1016/j.jdeveco.2019.04.002

Bordino I., Battiston S., Caldarelli G., Cristelli M., Ukkonen A., Weber I. (2012). Web Search Queries Can Predict Stock Market Volumes. PLOS ONE, 7(7), e40014. https://doi.org/10.1371/journal.pone.0040014

Box G.E.P., Jenkins G.M. (1970). Time Series Analysis: Forecasting and Control. San Francisco: Holden-Day.

Burridge P., Wallis K.F. (1984). Unobserved-Components Models for Seasonal Adjustment Filters. Journal of Business & Economic Statistics, 2(4), 350–359. https://doi.org/10.1080/07350015.1984.10509408

Canova F., Hansen B.E. (1995). Are Seasonal Patterns Constant Over Time? A Test for Seasonal Stability. Journal of Business & Economic Statistics, 13(3), 237–252. https://doi.org/10.1080/07350015.1995.10524598

Carneiro H.A., Mylonakis E. (2009). Google Trends: A Web-Based Tool for Real-Time Surveillance of Disease Outbreaks. Clinical Infectious Diseases, 49(10), 1557–1564. https://doi.org/10.1086/630200

Challet D., Ayed A.B.H. (2014). Do Google Trend Data Contain More Predictability Than Price Returns? arXiv preprint arXiv:1403.1715. https://doi.org/10.48550/arXiv.1403.1715

Choi H., Varian H. (2012). Predicting the Present with Google Trends. Economic Record, 88, 2–9. https://doi.org/10.1111/j.1475-4932.2012.00809.x

D’Amuri F., Marcucci J. (2017). The Predictive Power of Google Searches in Forecasting US Unemployment. International Journal of Forecasting, 33(4), 801–816. https://doi.org/10.1016/j.ijforecast.2017.03.004

DeWaard J., Kim K., Raymer J. (2012). Migration Systems in Europe: Evidence from Harmonized Flow Data. Demography, 49, 1307–1333. https://doi.org/10.1007/s13524-012-0117-9

De Haas H., Castles S., Miller M.J. (2019). The Age of Migration: International Population Movements in the Modern World. Bloomsbury Publishing.

Dickey D.A., Fuller W.A. (1979). Distribution of the Estimators for Autoregressive Time Series with a Unit Root. Journal of the American Statistical Association, 74(366a), 427–431. https://doi.org/10.1080/01621459.1979.10482531

Dugas A.F., Jalalpour M., Gel Y., Levin S., Torcaso F., Igusa T., Rothman R.E. (2013). Influenza Forecasting with Google Flu Trends. PLOS ONE, 8(2), e56176. https://doi.org/10.1371/journal.pone.0056176

Dustmann C., Fabbri F. (2003). Language Proficiency and Labour Market Performance of Immigrants in the UK. Economic Journal, 113(489), 695–717. https://doi.org/10.1111/1468-0297.t01-1-00151

Fantazzini D., Pushchelenko J., Mironenkov A., Kurbatskii A. (2021). Forecasting Internal Migration in Russia Using Google Trends: Evidence from Moscow and Saint Petersburg. Forecasting, 3(4), 774–803. https://doi.org/10.3390/forecast3040048

Golenvaux N., Alvarez P.G., Kiossou H.S., Schaus P. (2020). An LSTM Approach to Forecast Migration Using Google Trends. arXiv preprint arXiv:2005.09902. https://doi.org/10.48550/arXiv.2005.09902

Granger C.W.J., Newbold P. (1974). Spurious Regressions in Econometrics. Journal of Econometrics, 2(2), 111–120. https://doi.org/10.1016/0304-4076(74)90034-7

Hotelling H. (1933). Analysis of a Complex of Statistical Variables into Principal Components. Journal of Educational Psychology, 24(6), 417–441. https://doi.org/10.1037/h0071325

Hyndman R.J., Athanasopoulos G. (2018). Forecasting: Principles and Practice. OTexts.

Hyndman R.J., Ullah M.S. (2007). Robust Forecasting of Mortality and Fertility Rates: A Functional Data Approach. Computational Statistics & Data Analysis, 51(10), 4942–4956. https://doi.org/10.1016/j.csda.2006.07.028

Johansen S. (1988). Statistical Analysis of Cointegration Vectors. Journal of Economic Dynamics and Control, 12(2–3), 231–254. https://doi.org/10.1016/0165-1889(88)90041-3

Jurić T. (2022). Facebook and Google as an Empirical Basis for the Development of a Method for Monitoring External Migration of Croatian Citizens. Ekonomski Pregled, 73(2), 186–214. https://doi.org/10.32910/ep.73.2.2

Kristoufek L. (2015). Power-Law Correlations in Finance-Related Google Searches, and Their Cross-Correlations with Volatility and Traded Volume: Evidence from the Dow Jones Industrial Components. Physica A: Statistical Mechanics and its Applications, 428, 194–205. https://doi.org/10.1016/j.physa.2015.02.057

Lazer D., Kennedy R., King G., Vespignani A. (2014). The Parable of Google Flu: Traps in Big Data Analysis. Science, 343(6176), 1203–1205. https://doi.org/10.1126/science.1248506

Lee J.D., Sun D.L., Sun Y., Taylor J.E. (2016). Exact Post-Selection Inference, with Application to the Lasso. The Annals of Statistics, 44(3), 907–927. https://doi.org/10.1214/15-AOS1371

Leysen B., Verhaeghe P.P. (2023). Searching for Migration: Estimating Japanese Migration to Europe with Google Trends Data. Quality & Quantity, 57, 4603–4631. https://doi.org/10.1007/s11135-022-01560-0

Liu K. (2024). The Measurement Errors of Google Trends Data. Discover Data, 2, 7. https://doi.org/10.1007/s44248-024-00013-3

McGhee D., Heath S., Trevena P. (2012). Dignity, Happiness and Being Able to Live a ‘Normal Life’ in the UK—An Examination of Post-Accession Polish Migrants’ Transnational Autobiographical Fields. Social Identities, 18(6), 711–727. https://doi.org/10.1080/13504630.2012.709002

Medeiros M.C., Pires H.F. (2021). The Proper Use of Google Trends in Forecasting Models. arXiv preprint arXiv:2104.03065. https://doi.org/10.48550/arXiv.2104.03065

Moreh C., McGhee D., Vlachantoni A. (2020). The Return of Citizenship? An Empirical Assessment of Legal Integration in Times of Radical Sociolegal Transformation. International Migration Review, 54(1), 147–176. https://doi.org/10.1177/0197918318809924

Ormerod P., Nyman R., Bentley R.A. (2014). Nowcasting Economic and Social Data: When and Why Search Engine Data Fails, an Illustration Using Google Flu Trends. arXiv:1408.0699. https://doi.org/10.48550/arXiv.1408.0699

Pavlicek J., Kristoufek L. (2014). Can Google Searches Help Nowcast and Forecast Unemployment Rates in the Visegrad Group Countries? arXiv preprint arXiv:1408.6639. https://doi.org/10.48550/arXiv.1408.6639

Pearson K. (1896). Mathematical Contributions to the Theory of Evolution. III. Regression, Heredity, and Panmixia. Philosophical Transactions of the Royal Society of London. Series A, 187, 253–318. https://doi.org/10.1098/rsta.1896.0007

Preis T., Moat H., Stanley H. (2013). Quantifying Trading Behavior in Financial Markets Using Google Trends. Scientific Reports, 3(1), 1–6. https://doi.org/10.1038/srep01684

Qi A.H., Bircan T. (2023). Can Google Trends Predict Asylum-Seekers’ Destination Choices? EPJ Data Science, 12(1), 41. https://doi.org/10.1140/epjds/s13688-023-00419-0

Qi H., Reed H.E., Bevelander P. (2025). Can Internet Search Data Predict Human Migration Intentions? Comparative Migration Studies, 13, 1–22. https://doi.org/10.1186/s40878-025-00450-2

Rennie A., Protheroe J., Charron C., Breatnach G. (2020). Decoding Decisions. Making Sense of the Messy Middle. Think with Google. https://www.thinkwithgoogle.com/_qs/documents/9998/Decoding_Decisions_The_Messy_Middle_of_Purchase_Behavior.pdf

Rodrigues P.M.M., Taylor A.M.R. (2004). Alternative Estimators and Unit Root Tests for Seasonal Autoregressive Processes. Journal of Econometrics, 120(1), 35–73. https://doi.org/10.1016/S0304-4076(03)00206-9

Rovetta A. (2021). Reliability of Google Trends: Analysis of the Limits and Potential of Web Infoveillance During COVID-19 Pandemic and for Future Research. Frontiers in Research Metrics and Analytics, 6, 670226. https://doi.org/10.3389/frma.2021.670226

Schenk C. (2024). Counting Migrants in Russia: The Human Dimension of Administrative Data Production. International Migration Review, 58(2), 936–963. https://doi.org/10.1177/01979183231154565

Schwarz G. (1978). Estimating the Dimension of a Model. The Annals of Statistics, 6(2), 461–464. https://doi.org/10.1214/aos/1176344136

Stock J.H., Watson M.W. (2002). Forecasting Using Principal Components from a Large Number of Predictors. Journal of the American Statistical Association, 97(460), 1167–1179. https://doi.org/10.1198/016214502388618960

Tibshirani R. (1996). Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society. Series B: Statistical Methodology, 58(1), 267–288. https://doi.org/10.1111/j.2517-6161.1996.tb02080.x

Wanner P. (2021). How Well Can We Estimate Immigration Trends Using Google Data? Quality & Quantity, 55(4), 1181–1202. https://doi.org/10.1007/s11135-020-01047-w

Wladyka D. (2017). Queries to Google Search as Predictors of Migration Flows from Latin America to Spain. Journal of Population and Social Studies, 25(4), 312–327. https://doi.org/10.25133/JPSSv25n4.002

Yang S., Santillana M., Kou S.C. (2015). Accurate Estimation of Influenza Epidemics Using Google Search Data via ARGO. Proceedings of the National Academy of Sciences, 112(47), 14473–14478. https://doi.org/10.1073/pnas.1515373112

Zou H. (2006). The Adaptive Lasso and Its Oracle Properties. Journal of the American Statistical Association, 101(476), 1418–1429. https://doi.org/10.1198/016214506000000735

Опубликован
2026-04-06
Как цитировать
ГалкинМ. А. (2026). Прогнозирование миграции из России в Великобританию с использованием Google Trends Index. Демографическое обозрение, 13(1), 75-101. https://doi.org/10.17323/demreview.v13i1.33719
Раздел
Оригинальные статьи