---
title: "Big Data: Google-haut ennustavat työttömyyttä Suomessa"
authors:
  - name: "Tuhkuri, Joonas"
    url: "https://www.etla.fi/henkilot/tuhkuri-joonas/"
    sameAs:
      - "https://twitter.com/joonastuhkuri"
      - "https://joonastuhkuri.com/"
date_published: "2014-08-14"
series: "ETLA Raportit - Reports"
series_number: "31"
issn:
  - "2323-2447"
  - "2323-2455"
jel_codes:
  - "C1"
  - "C22"
  - "C43"
  - "C53"
  - "C82"
  - "E27"
language: "fi"
publisher: "ETLA Economic Research"
pdf_url: "https://www.etla.fi/wp-content/uploads/ETLA-Raportit-Reports-31.pdf"
keywords:
  - "Big Data"
  - "Google"
  - "Internet"
  - "Nykyhetken ennustaminen"
  - "Ennustaminen"
  - "Työttömyys"
  - "Aikasarja-analyysi"
identifier: "https://www.etla.fi/julkaisut/id/ETLA-Raportit---Reports-31"
abstract: "Suomessa tehdään päivittäin 30 miljoonaa Google-hakua. Tämä raportti selvittää, voiko Google-hauilla ennustaa nykyhetken ja lähitulevaisuuden työttömyyttä Suomessa. Nykyhetken ja lähitulevaisuuden ennustaminen on kiinnostavaa, sillä viralliset tiedot talouden tilasta julkaistaan viiveellä. Google-hakujen sisältämän informaation arvioimiseksi raportissa vertaillaan yksinkertaista työttömyyttä kuvaavaa mallia sellaiseen malliin, johon on lisätty Google-aineistosta muodostettu muuttuja, Google Index. Tämän lisäksi tarkastellaan muuttujien välisiä ristikorrelaatioita ja suoritetaan Granger-kausaalisuustesti. Yksinkertaiseen vertailukohtaan nähden Google-haut tarkentavat nykyhetken ennustetta 10 % absoluuttisella keskivirheellä mitattuna. Lisäksi Google-hakujen lisääminen malliin parantaa kolme kuukautta eteenpäin tehtyä ennustetta 39 %. Havaitaan myös, että Google-haut tarkentavat ennustetta erityisesti käännekohdissa. Tulokset viittaavat siihen, että Google-haut sisältävät hyödyllistä informaatiota nykyhetken ja lähitulevaisuuden työttömyydestä Suomessa."
abstract_translations:
  en: "There are over 3 billion searches globally on Google every day. This report examines whether Google search queries can be used to predict the present and the near future unemployment rate in Finland. Predicting the present and the near future is of interest, as the official records of the state of the economy are published with a delay. To assess the information contained in Google search queries, the report compares a simple predictive model of unemployment to a model that contains a variable, Google Index, formed from Google data. In addition, cross-correlation analysis and Granger-causality tests are performed. Compared to a simple benchmark, Google search queries improve the prediction of the present by 10 % measured by mean absolute error. Moreover, predictions using search terms perform 39 % better over the benchmark for near future unemployment 3 months ahead. Google search queries also tend to improve the prediction accuracy around turning points. The results suggest that Google searches contain useful information of the present and the near future unemployment rate in Finland."
---

# Big Data: Google-haut ennustavat työttömyyttä Suomessa

**Published:** 2014-08-14  
**Categories:** Julkaisut, Raportit  
**URL:** https://www.etla.fi/julkaisut/33195/

#### Tiivistelmä

Suomessa tehdään päivittäin 30 miljoonaa Google-hakua. Tämä raportti selvittää, voiko Google-hauilla ennustaa nykyhetken ja lähitulevaisuuden työttömyyttä Suomessa. Nykyhetken ja lähitulevaisuuden ennustaminen on kiinnostavaa, sillä viralliset tiedot talouden tilasta julkaistaan viiveellä. Google-hakujen sisältämän informaation arvioimiseksi raportissa vertaillaan yksinkertaista työttömyyttä kuvaavaa mallia sellaiseen malliin, johon on lisätty Google-aineistosta muodostettu muuttuja, Google Index. Tämän lisäksi tarkastellaan muuttujien välisiä ristikorrelaatioita ja suoritetaan Granger-kausaalisuustesti. Yksinkertaiseen vertailukohtaan nähden Google-haut tarkentavat nykyhetken ennustetta 10 % absoluuttisella keskivirheellä mitattuna. Lisäksi Google-hakujen lisääminen malliin parantaa kolme kuukautta eteenpäin tehtyä ennustetta 39 %. Havaitaan myös, että Google-haut tarkentavat ennustetta erityisesti käännekohdissa. Tulokset viittaavat siihen, että Google-haut sisältävät hyödyllistä informaatiota nykyhetken ja lähitulevaisuuden työttömyydestä Suomessa.

# Big Data: Google Searches Predict Unemployment in Finland

#### Abstract

There are over 3 billion searches globally on Google every day. This report examines whether Google search queries can be used to predict the present and the near future unemployment rate in Finland. Predicting the present and the near future is of interest, as the official records of the state of the economy are published with a delay. To assess the information contained in Google search queries, the report compares a simple predictive model of unemployment to a model that contains a variable, Google Index, formed from Google data. In addition, cross-correlation analysis and Granger-causality tests are performed. Compared to a simple benchmark, Google search queries improve the prediction of the present by 10 % measured by mean absolute error. Moreover, predictions using search terms perform 39 % better over the benchmark for near future unemployment 3 months ahead. Google search queries also tend to improve the prediction accuracy around turning points. The results suggest that Google searches contain useful information of the present and the near future unemployment rate in Finland.

---

## Additional Information

**Kirjoittajat:** Tuhkuri, Joonas

**Kansikuva:** https://www.etla.fi/wp-content/uploads/ETLA-Raportit-Reports-31-kansi.jpg

**Lataa Pdf:** https://www.etla.fi/wp-content/uploads/ETLA-Raportit-Reports-31.pdf

**Key Words:** Big Data, Google, Internet, Nowcasting, Forecasting, Unemployment, Time-series analysis

**Avainsanat:** Big Data, Google, Internet, Nykyhetken ennustaminen, Ennustaminen, Työttömyys, Aikasarja-analyysi

**Jel:** C1, C22, C43, C53, C82, E27

**Paivays:** 14.08.2014

**Sivuja:** 36

**Kieli:** fi

**Sarja:** ETLA Raportit - Reports

**Sarja Nro:** 31

**Issn:** 2323-2447, 2323-2455 (Pdf)

http://www.etla.fi/etlanow/

**Saatavuus:** 2

**Publication Research:** No



## Bibliographic metadata (JSON-LD)

```json
{
    "@context": "https://schema.org",
    "@type": "ScholarlyArticle",
    "@id": "https://www.etla.fi/julkaisut/id/ETLA-Raportit---Reports-31",
    "headline": "Big Data: Google-haut ennustavat työttömyyttä Suomessa",
    "inLanguage": "fi",
    "publisher": {
        "@type": "Organization",
        "name": "ETLA Economic Research",
        "url": "https://www.etla.fi",
        "logo": {
            "@type": "ImageObject",
            "url": "https://www.etla.fi/wp-content/uploads/logo-etla_logo.svg"
        }
    },
    "datePublished": "2014-08-14T00:00:00+00:00",
    "author": [
        {
            "@type": "Person",
            "name": "Tuhkuri, Joonas",
            "url": "https://www.etla.fi/henkilot/tuhkuri-joonas/",
            "sameAs": [
                "https://twitter.com/joonastuhkuri",
                "https://joonastuhkuri.com/"
            ]
        }
    ],
    "abstract": "Suomessa tehdään päivittäin 30 miljoonaa Google-hakua. Tämä raportti selvittää, voiko Google-hauilla ennustaa nykyhetken ja lähitulevaisuuden työttömyyttä Suomessa. Nykyhetken ja lähitulevaisuuden ennustaminen on kiinnostavaa, sillä viralliset tiedot talouden tilasta julkaistaan viiveellä. Google-hakujen sisältämän informaation arvioimiseksi raportissa vertaillaan yksinkertaista työttömyyttä kuvaavaa mallia sellaiseen malliin, johon on lisätty Google-aineistosta muodostettu muuttuja, Google Index. Tämän lisäksi tarkastellaan muuttujien välisiä ristikorrelaatioita ja suoritetaan Granger-kausaalisuustesti. Yksinkertaiseen vertailukohtaan nähden Google-haut tarkentavat nykyhetken ennustetta 10 % absoluuttisella keskivirheellä mitattuna. Lisäksi Google-hakujen lisääminen malliin parantaa kolme kuukautta eteenpäin tehtyä ennustetta 39 %. Havaitaan myös, että Google-haut tarkentavat ennustetta erityisesti käännekohdissa. Tulokset viittaavat siihen, että Google-haut sisältävät hyödyllistä informaatiota nykyhetken ja lähitulevaisuuden työttömyydestä Suomessa.",
    "keywords": [
        {
            "@type": "DefinedTerm",
            "name": "Big Data",
            "@language": "fi"
        },
        {
            "@type": "DefinedTerm",
            "name": "Google",
            "@language": "fi"
        },
        {
            "@type": "DefinedTerm",
            "name": "Internet",
            "@language": "fi"
        },
        {
            "@type": "DefinedTerm",
            "name": "Nykyhetken ennustaminen",
            "@language": "fi"
        },
        {
            "@type": "DefinedTerm",
            "name": "Ennustaminen",
            "@language": "fi"
        },
        {
            "@type": "DefinedTerm",
            "name": "Työttömyys",
            "@language": "fi"
        },
        {
            "@type": "DefinedTerm",
            "name": "Aikasarja-analyysi",
            "@language": "fi"
        },
        {
            "@type": "DefinedTerm",
            "name": "Big Data",
            "@language": "en"
        },
        {
            "@type": "DefinedTerm",
            "name": "Google",
            "@language": "en"
        },
        {
            "@type": "DefinedTerm",
            "name": "Internet",
            "@language": "en"
        },
        {
            "@type": "DefinedTerm",
            "name": "Nowcasting",
            "@language": "en"
        },
        {
            "@type": "DefinedTerm",
            "name": "Forecasting",
            "@language": "en"
        },
        {
            "@type": "DefinedTerm",
            "name": "Unemployment",
            "@language": "en"
        },
        {
            "@type": "DefinedTerm",
            "name": "Time-series analysis",
            "@language": "en"
        }
    ],
    "isPartOf": {
        "@type": "PublicationIssue",
        "issueNumber": "31",
        "isPartOf": {
            "@type": "Periodical",
            "name": "ETLA Raportit - Reports",
            "issn": [
                "2323-2447",
                "2323-2455"
            ]
        }
    },
    "mainEntityOfPage": "https://www.etla.fi/julkaisut/33195/",
    "url": "https://www.etla.fi/julkaisut/33195/",
    "hasPart": {
        "@type": "CreativeWork",
        "inLanguage": "en",
        "text": "There are over 3 billion searches globally on Google every day. This report examines whether Google search queries can be used to predict the present and the near future unemployment rate in Finland. Predicting the present and the near future is of interest, as the official records of the state of the economy are published with a delay. To assess the information contained in Google search queries, the report compares a simple predictive model of unemployment to a model that contains a variable, Google Index, formed from Google data. In addition, cross-correlation analysis and Granger-causality tests are performed. Compared to a simple benchmark, Google search queries improve the prediction of the present by 10 % measured by mean absolute error. Moreover, predictions using search terms perform 39 % better over the benchmark for near future unemployment 3 months ahead. Google search queries also tend to improve the prediction accuracy around turning points. The results suggest that Google searches contain useful information of the present and the near future unemployment rate in Finland.",
        "headline": "Big Data: Google Searches Predict Unemployment in Finland",
        "keywords": [
            {
                "@type": "DefinedTerm",
                "name": "Big Data",
                "@language": "en"
            },
            {
                "@type": "DefinedTerm",
                "name": "Google",
                "@language": "en"
            },
            {
                "@type": "DefinedTerm",
                "name": "Internet",
                "@language": "en"
            },
            {
                "@type": "DefinedTerm",
                "name": "Nowcasting",
                "@language": "en"
            },
            {
                "@type": "DefinedTerm",
                "name": "Forecasting",
                "@language": "en"
            },
            {
                "@type": "DefinedTerm",
                "name": "Unemployment",
                "@language": "en"
            },
            {
                "@type": "DefinedTerm",
                "name": "Time-series analysis",
                "@language": "en"
            }
        ]
    },
    "associatedMedia": {
        "@type": "MediaObject",
        "@id": "https://www.etla.fi/wp-content/uploads/ETLA-Raportit-Reports-31.pdf",
        "encodingFormat": "application/pdf",
        "contentUrl": "https://www.etla.fi/wp-content/uploads/ETLA-Raportit-Reports-31.pdf"
    },
    "sameAs": [
        "https://www.etla.fi/julkaisut/33195/",
        "https://www.etla.fi/en/publications/33195/",
        "https://www.etla.fi/sv/publikationer/33195/"
    ]
}
```