Big Data: Google-haut ennustavat työttömyyttä Suomessa

Tuhkuri Joonas

Tiivistelmä

Suomessa tehdään päivittäin 30 miljoonaa Google-hakua. Tämä raportti selvittää, voiko Google-hauilla ennustaa nykyhetken ja lähitulevaisuuden työttömyyttä Suomessa. Nykyhetken ja lähitulevaisuuden ennustaminen on kiinnostavaa, sillä viralliset tiedot talouden tilasta julkaistaan viiveellä. Google-hakujen sisältämän informaation arvioimiseksi raportissa vertaillaan yksinkertaista työttömyyttä kuvaavaa mallia sellaiseen malliin, johon on lisätty Google-aineistosta muodostettu muuttuja, Google Index. Tämän lisäksi tarkastellaan muuttujien välisiä ristikorrelaatioita ja suoritetaan Granger-kausaalisuustesti. Yksinkertaiseen vertailukohtaan nähden Google-haut tarkentavat nykyhetken ennustetta 10 % absoluuttisella keskivirheellä mitattuna. Lisäksi Google-hakujen lisääminen malliin parantaa kolme kuukautta eteenpäin tehtyä ennustetta 39 %. Havaitaan myös, että Google-haut tarkentavat ennustetta erityisesti käännekohdissa. Tulokset viittaavat siihen, että Google-haut sisältävät hyödyllistä informaatiota nykyhetken ja lähitulevaisuuden työttömyydestä Suomessa.

Big Data: Google Searches Predict Unemployment in Finland

Abstract

There are over 3 billion searches globally on Google every day. This report examines whether Google search queries can be used to predict the present and the near future unemployment rate in Finland. Predicting the present and the near future is of interest, as the official records of the state of the economy are published with a delay. To assess the information contained in Google search queries, the report compares a simple predictive model of unemployment to a model that contains a variable, Google Index, formed from Google data. In addition, cross-correlation analysis and Granger-causality tests are performed. Compared to a simple benchmark, Google search queries improve the prediction of the present by 10 % measured by mean absolute error. Moreover, predictions using search terms perform 39 % better over the benchmark for near future unemployment 3 months ahead. Google search queries also tend to improve the prediction accuracy around turning points. The results suggest that Google searches contain useful information of the present and the near future unemployment rate in Finland.

Julkaisun tietoja

Sarja
ETLA Raportit - Reports 31
Päiväys
14.08.2014
Avainsanat
Big Data, Google, Internet, Nykyhetken ennustaminen, Ennustaminen, Työttömyys, Aikasarja-analyysi
Keywords
Big Data, Google, Internet, Nowcasting, Forecasting, Unemployment, Time-series analysis
ISSN
2323-2447, 2323-2455 (Pdf)
JEL
C1, C22, C43, C53, C82, E27
Sivuja
36
Kieli
Suomi
Julkaisu muissa palveluissa
www.etla.fi