Teknologian tehostama tutkimustyö – mahdollisuuksia ja uhkia (muillekin kuin) tietojenkäsittelytieteen tutkijoille

Seppälä TimoMucha Tomasz

Koneoppiminen on löytänyt tiensä yhä enenevissä määrin myös tutkimustyöhön. Mutta miksei koneoppimisen vaikutuksesta akateemisten julkaisujen lukemiseen ja kirjoittamiseen käydä keskustelua, kysyvät yhdessä kirjoittamassaan kolumnissa Etlan Timo Seppälä ja Aalto-yliopiston Tomasz Mucha.

Koneoppimistekniikoiden yleistymistä tutkimustyössä ja käytännössä on vaikea olla huomaamatta. Eri puolilla maailmaa pienet ja suuret organisaatiot startupeista virastoihin haluavat tehostaa toimintaa koneoppimisen avulla. Vastaavasti koneoppiminen on löytänyt nopeasti tiensä myös eri alojen tutkijoiden työkaluvalikoimiin.

Meistä on yllättävää, ettei keskustelua käydä koneoppimisen vaikutuksesta tutkijoiden leipätyöhön eli akateemisten julkaisujen lukemiseen ja kirjoittamiseen. Haluamme herätellä tällä kolumnilla keskustelua mahdollisuuksista ja uhkista, joita nämä koneoppimisteknologiat tuovat elintärkeisiin käytäntöihin, sekä erityisestä roolista, joka tietojenkäsittelytiedeyhteisöllä on asiassa.

Tutkimustyössä käytännön sovelluksia riittää

Jo nyt teknologioita, jotka muuntavat tekstiä puheeksi tai puhetta tekstiksi, on yleisesti saatavilla, mutta niiden hyödyntäminen on vähäistä. Akateemisessa kontekstissa käytännön sovelluksia riittää: kappaleiden sanelu, muistiinpanojen tekeminen autoa ajaessa, kokousten ja aivoriihien litterointi, oman tekstin kuuntelu koneellisesti ääneen luettuna on allekirjoittaneen suosikki – lukunopeuden ja mieleen painamisen tukeminen kuuntelemalla nopeaa koneellista ääneenlukua samalla kun itse lukee tekstiä. Onko tämä vain kikkailua, jolla tehdään samoja asioita kuin nytkin? Me rohkenemme sanoa ei.

Uudet tutkijasukupolvet kasvavat kantaen näitä teknologioita taskussaan. Vielä oleellisempaa on, että näiden työkalujen avulla tutkijat voivat tutustua useampiin ideoihin nopeammin ja vastaavasti julkaista myöhemmin omia uusia ideoitaan. Vaikka nopeus ei olekaan kaikki kaikessa, sillä on ehdottomasti merkitystä, jos yhteisön halutaan iteroivan nopeammin kasvattaessaan kollektiivista tietoaan. Siksi rohkaisemme erityisesti tietojenkäsittelytieteiden lipun alla marssivia tutkijoita ja muitakin astumaan uusille urille, kuten käyttämään ihmisen suorituskykyä tehostavia digitaalisia teknologioita. Ehkä he pääsevät jopa omakätisesti kokeilemaan, miltä tehostettu suorituskyky tuntuu.

Koneoppiminen tutkimustyössä kiihdyttää muutosta

Tutkijoiden näkökulmasta tulevaisuudessa siintää vieläkin merkittävämpi, koneoppimisen kiihdyttämä muutos. Tietojenkäsittelytieteiden tutkijoiden on ensimmäisten joukossa tunnistettava se ja valmistauduttava siihen. Viimeaikainen kehitys suurten kielimallien saralla, joissa hyödynnetään Transformer-arkkitehtuuria sekä merkittävää osaa ihmisten luomasta digitaalisesta tekstisisällöstä, herättää kiistanalaisia reaktioita, niin kuin sen kuuluukin. BERT, GPT-3, T5, BLOOM ja muut mallit ovat saaneet median ja yritysten huomion.

Olemmeko kuitenkaan katsoneet peiliin? Meidän on harkittava, kuinka kehityskulut saattavat muuttaa tai jo nyt muuttavat omaa työtämme tutkijoina, arvioijina, toimittajina ja opettajina. Hyvät uutiset ovat, että saamme pian käsiimme uusia tehokkaita työkaluja. Ja osaavissa käsissä niillä pystytään yhdessä luomaan yhä enemmän ja laadukkaampia tuotoksia. Uudet mallit voivat auttaa rakentamaan vaikuttavia tekstejä irrallisten lauseiden, ranskalaisten viivojen tai hahmotelmien pohjalta. Myös käsikirjoituksen muokkaaminen julkaisun tyyliin sopivaksi saattaa muuttua helpommaksi. Huonona puolena kehitykseen kuuluu myös uusia riskejä, eli sisältömäärien kasvaminen liialliseksi ja uudenlaiset plagioinnin muodot. Jos kokonaisen artikkelin tuottaminen muutaman lyhyen kehotteen perusteella ei vaadi enempää kuin muutaman hiiren klikkauksen, ”lähetyskelpoisten käsikirjoitusten” laatimisesta tulee arkipäivää.

Onkin palattava pohtimaan, mitä ”alkuperäisyys” ja ”kirjoittajuus” tarkoittavat akateemisten artikkeleiden kontekstissa. Vastaavasti myös julkaisumäärien mahdollinen kasvu luo uusia toimittajiin ja arvioijiin kohdistuvia vaatimuksia.

Apua tietojenkäsittelytieteiden tutkijoilta

Nyt tietojenkäsittelytieteiden tutkijoiden on aika pohtia näitä asioita ja laittaa alulle vakava keskustelu niistä. Teknologian, ihmisten ja organisaatioiden risteyskohdassa toimivina asiantuntijoina meillä on velvollisuus johtaa keskustelua akateemisissa piireissä. Nyt meillä on tilaisuus johtaa akateemista yhteisöä näyttämällä omalla esimerkillämme, miten lähestyä uusia mahdollisuuksia ja haasteita. Miten luomme standardit tulevaisuuden kirjoitus- ja lukukäytännöille? Pallo on meillä. Eiköhän tartuta tilaisuuteen?

 

 

Kolumni on käännös myöhemmin julkaistavasta “TREO Talks” tutkimusesityksestä  ”Augmented Scholar: Opportunities and Threats (Not Only) for IS Scholars”. Esitys pidetään 43. kansainvälinen tietojärjestelmäkonferenssin (ICIS 2022) yhteydessä Kööpenhaminassa 11. joulukuuta 2022.