Прогнозирование миграции из России в Великобританию с использованием Google Trends Index
Аннотация
Официальная статистика международной миграции часто публикуется с существенными задержками, может страдать от неполноты, несопоставимости и различных типов нарушений. Это затрудняет изучение миграционных потоков, их своевременный мониторинг и прогнозирование. Исследование посвящено применению и модификации методов наукастинга международной миграции с использованием данных поисковых интернет-запросов на примере миграции из России в Великобританию за период 2011-2023 гг. Они предполагают: (a) отбор регрессоров методом LASSO (параметр регуляризации подбирается по кросс-валидации), выполнение прогноза целевой переменной линейной регрессией с использованием полученных с помощью моделей SARIMA прогнозов регрессоров; (б) сокращение размерности методом главных компонент с кросс-валидационным выбором числа факторов и их лагов и последующим построением линейной регрессии на этих факторах, чьи будущие значения оцениваются моделями SARIMA. Информационной базой исследования послужили данные индекса Google Trends, отобранные по результатам проведения лингвистического анализа облака слов поисковых запросов, и официальная миграционная статистика британского правительства – представительского органа страны прибытия. По результатам моделирования были сделаны выводы о том, что (а) использование показателей поисковых запросов позволяет осуществлять прогнозирование международной миграции на разных прогнозных горизонтах с системно более низкой ошибкой, нежели при отсутствии учета поискового интереса; (б) объем собираемых для реализации наукастинга данных может быть существенно сокращен ввиду разреженности части оцененных моделей. Исследование продолжает академическую традицию использования данных поискового интереса в качестве альтернативы официальной статистики и вносит вклад в формирование методологической базы для прогнозирования изменяющихся во времени макропроцессов. Результаты работы могут быть использованы при оценке международной миграции между другими странами, а также в рамках статистических исследований в других научных областях.
Скачивания
Литература
Броницкий Г.Т. (2024). Наукастинг миграции с использованием Google Trends: применение для разных стран. Население и экономика, 8(2), 133–154. https://doi.org/10.3897/popecon8.e119577
Броницкий Г.Т., Вакуленко Е.С. (2022). Прогнозирование миграции из России в Германию с использованием Google-трендов. Демографическое обозрение, 9(3), 75–92. https://doi.org/10.17323/demreview.v9i3.16471
Броницкий Г.Т., Вакуленко Е.С. (2024). Применение Google Trends для прогнозирования миграции из России: агрегация поисковых запросов и учет лаговой структуры. Прикладная эконометрика, 73, 78–101. https://doi.org/10.22394/1993-7601-2024-73-78-101
Денисенко М.Б. (2003). Эмиграция из России по данным зарубежной статистики. Мир России: Социология, этнология, 12(3), 157–169. https://mirros.hse.ru/article/view/5283
Цапенко И.П., Юревич М.А. (2022). Статистика онлайн-запросов в наукастинге миграции. Экономические и социальные перемены: факты, тенденции, прогноз, 15(1), 74–89. https://doi.org/10.15838/esc.2022.1.79.4
Aitken A.C. (1935). On Least Squares and Linear Combinations of Observations. Proceedings of Royal Statistical Society, 55, 42–48. https://doi.org/10.1017/S0370164600014346
Akaike H. (1974). A New Look at the Statistical Model Identification. IEEE Transactions on Automatic Control, 19(6), 716–723. https://doi.org/10.1109/TAC.1974.1100705
Aleshkovski I.A. (2012). International Migration, Globalization and Demographic Development of the Russian Federation. Journal of Globalization Studies, 3(1), 95–110.
Avramescu A., Wiśniowski A. (2021). Now-Casting Romanian Migration into the United Kingdom by Using Google Search Engine Data. Demographic Research, 45, 1219–1254. https://www.demographic-research.org/articles/volume/45/40
Bai J. (2003). Inferential Theory for Factor Models of Large Dimensions. Econometrica, 71(1), 135–171. https://doi.org/10.1111/1468-0262.00392
Böhme M.H., Gröger A., Stöhr T. (2020). Searching for a Better Life: Predicting Internat ional Migration with Online Search Keywords. Journal of Development Economics, 142, 102347. https://doi.org/10.1016/j.jdeveco.2019.04.002
Bordino I., Battiston S., Caldarelli G., Cristelli M., Ukkonen A., Weber I. (2012). Web Search Queries Can Predict Stock Market Volumes. PLOS ONE, 7(7), e40014. https://doi.org/10.1371/journal.pone.0040014
Box G.E.P., Jenkins G.M. (1970). Time Series Analysis: Forecasting and Control. San Francisco: Holden-Day.
Burridge P., Wallis K.F. (1984). Unobserved-Components Models for Seasonal Adjustment Filters. Journal of Business & Economic Statistics, 2(4), 350–359. https://doi.org/10.1080/07350015.1984.10509408
Canova F., Hansen B.E. (1995). Are Seasonal Patterns Constant Over Time? A Test for Seasonal Stability. Journal of Business & Economic Statistics, 13(3), 237–252. https://doi.org/10.1080/07350015.1995.10524598
Carneiro H.A., Mylonakis E. (2009). Google Trends: A Web-Based Tool for Real-Time Surveillance of Disease Outbreaks. Clinical Infectious Diseases, 49(10), 1557–1564. https://doi.org/10.1086/630200
Challet D., Ayed A.B.H. (2014). Do Google Trend Data Contain More Predictability Than Price Returns? arXiv preprint arXiv:1403.1715. https://doi.org/10.48550/arXiv.1403.1715
Choi H., Varian H. (2012). Predicting the Present with Google Trends. Economic Record, 88, 2–9. https://doi.org/10.1111/j.1475-4932.2012.00809.x
D’Amuri F., Marcucci J. (2017). The Predictive Power of Google Searches in Forecasting US Unemployment. International Journal of Forecasting, 33(4), 801–816. https://doi.org/10.1016/j.ijforecast.2017.03.004
DeWaard J., Kim K., Raymer J. (2012). Migration Systems in Europe: Evidence from Harmonized Flow Data. Demography, 49, 1307–1333. https://doi.org/10.1007/s13524-012-0117-9
De Haas H., Castles S., Miller M.J. (2019). The Age of Migration: International Population Movements in the Modern World. Bloomsbury Publishing.
Dickey D.A., Fuller W.A. (1979). Distribution of the Estimators for Autoregressive Time Series with a Unit Root. Journal of the American Statistical Association, 74(366a), 427–431. https://doi.org/10.1080/01621459.1979.10482531
Dugas A.F., Jalalpour M., Gel Y., Levin S., Torcaso F., Igusa T., Rothman R.E. (2013). Influenza Forecasting with Google Flu Trends. PLOS ONE, 8(2), e56176. https://doi.org/10.1371/journal.pone.0056176
Dustmann C., Fabbri F. (2003). Language Proficiency and Labour Market Performance of Immigrants in the UK. Economic Journal, 113(489), 695–717. https://doi.org/10.1111/1468-0297.t01-1-00151
Fantazzini D., Pushchelenko J., Mironenkov A., Kurbatskii A. (2021). Forecasting Internal Migration in Russia Using Google Trends: Evidence from Moscow and Saint Petersburg. Forecasting, 3(4), 774–803. https://doi.org/10.3390/forecast3040048
Golenvaux N., Alvarez P.G., Kiossou H.S., Schaus P. (2020). An LSTM Approach to Forecast Migration Using Google Trends. arXiv preprint arXiv:2005.09902. https://doi.org/10.48550/arXiv.2005.09902
Granger C.W.J., Newbold P. (1974). Spurious Regressions in Econometrics. Journal of Econometrics, 2(2), 111–120. https://doi.org/10.1016/0304-4076(74)90034-7
Hotelling H. (1933). Analysis of a Complex of Statistical Variables into Principal Components. Journal of Educational Psychology, 24(6), 417–441. https://doi.org/10.1037/h0071325
Hyndman R.J., Athanasopoulos G. (2018). Forecasting: Principles and Practice. OTexts.
Hyndman R.J., Ullah M.S. (2007). Robust Forecasting of Mortality and Fertility Rates: A Functional Data Approach. Computational Statistics & Data Analysis, 51(10), 4942–4956. https://doi.org/10.1016/j.csda.2006.07.028
Johansen S. (1988). Statistical Analysis of Cointegration Vectors. Journal of Economic Dynamics and Control, 12(2–3), 231–254. https://doi.org/10.1016/0165-1889(88)90041-3
Jurić T. (2022). Facebook and Google as an Empirical Basis for the Development of a Method for Monitoring External Migration of Croatian Citizens. Ekonomski Pregled, 73(2), 186–214. https://doi.org/10.32910/ep.73.2.2
Kristoufek L. (2015). Power-Law Correlations in Finance-Related Google Searches, and Their Cross-Correlations with Volatility and Traded Volume: Evidence from the Dow Jones Industrial Components. Physica A: Statistical Mechanics and its Applications, 428, 194–205. https://doi.org/10.1016/j.physa.2015.02.057
Lazer D., Kennedy R., King G., Vespignani A. (2014). The Parable of Google Flu: Traps in Big Data Analysis. Science, 343(6176), 1203–1205. https://doi.org/10.1126/science.1248506
Lee J.D., Sun D.L., Sun Y., Taylor J.E. (2016). Exact Post-Selection Inference, with Application to the Lasso. The Annals of Statistics, 44(3), 907–927. https://doi.org/10.1214/15-AOS1371
Leysen B., Verhaeghe P.P. (2023). Searching for Migration: Estimating Japanese Migration to Europe with Google Trends Data. Quality & Quantity, 57, 4603–4631. https://doi.org/10.1007/s11135-022-01560-0
Liu K. (2024). The Measurement Errors of Google Trends Data. Discover Data, 2, 7. https://doi.org/10.1007/s44248-024-00013-3
McGhee D., Heath S., Trevena P. (2012). Dignity, Happiness and Being Able to Live a ‘Normal Life’ in the UK—An Examination of Post-Accession Polish Migrants’ Transnational Autobiographical Fields. Social Identities, 18(6), 711–727. https://doi.org/10.1080/13504630.2012.709002
Medeiros M.C., Pires H.F. (2021). The Proper Use of Google Trends in Forecasting Models. arXiv preprint arXiv:2104.03065. https://doi.org/10.48550/arXiv.2104.03065
Moreh C., McGhee D., Vlachantoni A. (2020). The Return of Citizenship? An Empirical Assessment of Legal Integration in Times of Radical Sociolegal Transformation. International Migration Review, 54(1), 147–176. https://doi.org/10.1177/0197918318809924
Ormerod P., Nyman R., Bentley R.A. (2014). Nowcasting Economic and Social Data: When and Why Search Engine Data Fails, an Illustration Using Google Flu Trends. arXiv:1408.0699. https://doi.org/10.48550/arXiv.1408.0699
Pavlicek J., Kristoufek L. (2014). Can Google Searches Help Nowcast and Forecast Unemployment Rates in the Visegrad Group Countries? arXiv preprint arXiv:1408.6639. https://doi.org/10.48550/arXiv.1408.6639
Pearson K. (1896). Mathematical Contributions to the Theory of Evolution. III. Regression, Heredity, and Panmixia. Philosophical Transactions of the Royal Society of London. Series A, 187, 253–318. https://doi.org/10.1098/rsta.1896.0007
Preis T., Moat H., Stanley H. (2013). Quantifying Trading Behavior in Financial Markets Using Google Trends. Scientific Reports, 3(1), 1–6. https://doi.org/10.1038/srep01684
Qi A.H., Bircan T. (2023). Can Google Trends Predict Asylum-Seekers’ Destination Choices? EPJ Data Science, 12(1), 41. https://doi.org/10.1140/epjds/s13688-023-00419-0
Qi H., Reed H.E., Bevelander P. (2025). Can Internet Search Data Predict Human Migration Intentions? Comparative Migration Studies, 13, 1–22. https://doi.org/10.1186/s40878-025-00450-2
Rennie A., Protheroe J., Charron C., Breatnach G. (2020). Decoding Decisions. Making Sense of the Messy Middle. Think with Google. https://www.thinkwithgoogle.com/_qs/documents/9998/Decoding_Decisions_The_Messy_Middle_of_Purchase_Behavior.pdf
Rodrigues P.M.M., Taylor A.M.R. (2004). Alternative Estimators and Unit Root Tests for Seasonal Autoregressive Processes. Journal of Econometrics, 120(1), 35–73. https://doi.org/10.1016/S0304-4076(03)00206-9
Rovetta A. (2021). Reliability of Google Trends: Analysis of the Limits and Potential of Web Infoveillance During COVID-19 Pandemic and for Future Research. Frontiers in Research Metrics and Analytics, 6, 670226. https://doi.org/10.3389/frma.2021.670226
Schenk C. (2024). Counting Migrants in Russia: The Human Dimension of Administrative Data Production. International Migration Review, 58(2), 936–963. https://doi.org/10.1177/01979183231154565
Schwarz G. (1978). Estimating the Dimension of a Model. The Annals of Statistics, 6(2), 461–464. https://doi.org/10.1214/aos/1176344136
Stock J.H., Watson M.W. (2002). Forecasting Using Principal Components from a Large Number of Predictors. Journal of the American Statistical Association, 97(460), 1167–1179. https://doi.org/10.1198/016214502388618960
Tibshirani R. (1996). Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society. Series B: Statistical Methodology, 58(1), 267–288. https://doi.org/10.1111/j.2517-6161.1996.tb02080.x
Wanner P. (2021). How Well Can We Estimate Immigration Trends Using Google Data? Quality & Quantity, 55(4), 1181–1202. https://doi.org/10.1007/s11135-020-01047-w
Wladyka D. (2017). Queries to Google Search as Predictors of Migration Flows from Latin America to Spain. Journal of Population and Social Studies, 25(4), 312–327. https://doi.org/10.25133/JPSSv25n4.002
Yang S., Santillana M., Kou S.C. (2015). Accurate Estimation of Influenza Epidemics Using Google Search Data via ARGO. Proceedings of the National Academy of Sciences, 112(47), 14473–14478. https://doi.org/10.1073/pnas.1515373112
Zou H. (2006). The Adaptive Lasso and Its Oracle Properties. Journal of the American Statistical Association, 101(476), 1418–1429. https://doi.org/10.1198/016214506000000735




















