Vi sitter på kontoret til Torbjørn Skardhamar, emneansvarlig for SOS2901 – Anvendt maskinlæring for samfunnsvitere, som også inngår i en emnegruppe i datavitenskap for samfunnsvitere. Det er et samarbeid mellom studieprogrammene sosiologi, statsvitenskap og samfunnsgeografi ved UiO.
– Bakgrunnen for at vi opprettet det kurset er at det så mye datadrevet i samfunnet vårt totalt sett, fra mobiltelefoner og duppedingser, til større samfunnsendringer og hvordan offentlig sektor fungerer. Sosiologer bør egentlig kunne en del om store data og hvordan de brukes, og det går litt utenfor det man har på standard metodekurs. Maskinlæring og det som også kalles prediktiv modellering, det er jo drivkraften bak en del av de endringene som skjer, sier Skardhamar.
Sosiologer bør egentlig kunne en del om store data og hvordan de brukes, og det går litt utenfor det man har på standard metodekurs.
Han forteller at dette blant annet innebærer å kunne evaluere hva som skal håndteres manuelt eller automatisk av tildelinger av ytelser i offentlig sektor, eller håndtering av slike ting som annonsesalg i privat sektor.
– Det er mye diskusjon rundt bias i algoritmer, men den biasen kan jo styres. Men det må noen be om i forkant, og så kan utviklerne som lager disse jobbe imot kjente bias for å lage det vi kaller rettferdige modeller. Noen ganger får man inntrykk av en del diskusjoner rundt det at urettferdige algoritmer er innebygget i algoritmene som sådan. Men det er de ikke. Men de må jo justeres på den måten man mener er riktig. Så må man sammenligne med hva som er alternativet. Det er ikke sånn at skjønnsmessige vurderinger nødvendigvis er noe bedre.
Mens kunstig intelligens diskuteres mye i det offentlige ordskiftet, kan «maskinlæring» høres mer fremmed og teknisk ut. Skardhamar illustrerer forskjellene ved hjelp av et venndiagram:
– Jeg har en bok om «deep learning» som har en illustrasjon av kunstig intelligens som en stor sirkel, tenk et venndiagram, på ting som maskiner gjør som man tidligere trodde at kun mennesker kunne gjøre. Innunder der så er det en undergruppe som heter maskinlæring. Under der igjen er det en undergruppe som heter nevrale nett eller «deep learning», og disse store språkmodellene er basert blant annet på slike modeller. Så store språkmodeller er jo da for eksempel chat-GPT, og Microsoft sin Copilot. De kan være generelle eller mer spesifikke. Så har du tilsvarende for bilde og for lyd. Og en av de mest fantastiske verktøyene som har kommet rent praktisk sett er jo transkribering, som den autotekst løsningen vi har her på Universitetet i Oslo.
Samtidig kan man spørre om det er noen utfordringer med bruk av slik teknologi for kvalitative sosiologer. Teksten som genereres kan bli flat, og viktige nyanser som nøling, tonefall, sosiolekter som kan være veldig viktig i kvalitativ forskning blir utelatt.
– Det fanger ikke opp alt. Men det er tidsbesparende. Det er egentlig det samme med intervjuer som det er med teksting av undervisningsvideoer og slikt, som var min første erfaring med det, at det gir en ganske god transkribering. Så må man gå gjennom og sjekke hva som egentlig ble sagt, og legge inn disse nølingene og andre ting som kan være viktig. Sånn sett er det ikke perfekt, men i forhold til å sitte og skrive alt for hånd, der man må stoppe og spole, så sparer det jo vanvittig med tid. Særlig hvis man har mange intervjuer.
Skardhamar forklarer at som en avvikssosiolog som hovedsakelig jobber med svarte data, har kunstig intelligens hittil ikke hatt stor påvirkning på hvordan han selv forsker.
– Men jeg ser potensialet i det for praktisk hverdagsforskning, for eksempel til transkribering av lyd og tekst i kvalitativ forskning. Men jeg er ikke veldig optimistisk på at bruk av chat-GPT til tekstskriving vil være så nyttig. Ut fra det jeg har sett, og det jeg har prøvd å få ut selv, så er den teksten man får ut av det ganske flat, død og generisk. Det er noe potensial i det til strukturering av tekst, omformulering, oversettelser, og andre slike ting. Men det kan være et ålreit støttesystem. deriblant for systematiske litteraturgjennomganger. Det er vel så langt jeg ser potensialet per nå.
Samtidig er det ikke bare grunn til optimisme, både på samfunnsplan og i akademia internt.
– Hvis jeg skal være litt pessimistisk, så tenker jeg vi får en voldsom produksjon av vrøvl og desinformasjon og faenskap, fordi prisen for å lage dårlige ting går drastisk ned, samtidig som det ikke skjer så mye med prisen for å lage gode ting. Det er kjempelett å lage intetsigende forskningsartikler som man får publisert i dårlige tidsskrifter, og de finnes det en del av. Det er kjempelett, og det kan man gjøre mye fortere nå. Det er samme logikk som med desinformasjon av annen type.
– Nå er vi i en periode med ustabilitet og krig og sånn, og autonome våpen – som det finnes en del av fra før – blir jo stadig bedre. Det er heller ikke et felt som jeg kan mye om, men det er jo kunstig intelligens som driver det og. For eksempel gjennom gjenkjenning av fjes og hvor bomben skal slippes. Det er effektivisering av krig.
De teknologiske utviklingene fører også til økt potensiale i allerede etablerte analytiske metoder og verktøy, ifølge Skardhamar. Han trekker for eksempel fram webscraping, en teknikk for å automatisk innsamling av data fra internett, som noe som har enda større brukspotensiale nå, ettersom at slike verktøy kan brukes enda mer effektivt med kunstig intelligens [1]. Men disse utviklingene medfører også en økning i de grunnleggende kravene for hva sosiologer bør kunne.
– Jeg er jo selv mest engasjert i kvantitative metoder. For noen år siden så kom man langt hvis man håndterte regresjonsanalyse ganske godt. De kravene kommer til å endre seg. Det er så mange maskinlæringsteknikker og andre slike datateknikker, som etter hvert begynner å bli standard og som brukes på forskjellige områder. Og selv om sosiologer kanskje ikke er de som kommer til å bygge modellene, så kommer ganske mange til å sitte i posisjon der de enten skal bestille de, eller en posisjon der de skal anvende de. Det vil da være viktig å kunne evaluere styrker og svakheter, å vite hvordan ting fungerer, og å vite hva som kan justeres. Det er jo egentlig en forutsetning for å kunne kommunisere med IT-folket som utvikler modellene som skal brukes. Jeg tror en grunnleggende teknisk kompetanse vil være viktigere for alle.
For noen år siden så kom man langt hvis man håndterte regresjonsanalyse ganske godt. De kravene kommer til å endre seg.
Kunstig intelligens er ikke bare et verktøy sosiologer kan bruke, men selvfølgelig også en samfunnsendrende teknologi som sosiologer kan forske på. Skardhamar har noen forslag:
– Det er mange ting, men for eksempel desinformasjon i sosiale medier og trollfabrikker. Det er en bit av det. Men vel så mye hvordan prediktive modeller, altså maskinlæring, brukes og hvilke konsekvenser det har og hvem de har konsekvenser for.
Man må likevel vurdere hvilke alternativer man egentlig har, sier Skardhamar. Han påpeker at det ikke nødvendigvis vil være bedre med skjønnsmessige vurderinger enn med prediktive modeller, siden fordommer da vil kunne få råde vel så fritt og ukontrollert. Det som er en fordel med prediktive modeller er at når man bygger dem så kan man kan sjekke hvordan de fungerer før man tar dem i bruk, slik at man kan justere for de skjevhetene man finner. Men man kan heller ikke kontrollere for alt, så man må likevel vurdere hvilke feilrater man er villig til å akseptere, forteller Skardhamar.
– Som når NAV skal implementere kunstig intelligens i sin søknadsbehandling. Det blir antageligvis mye mer effektiv behandling totalt sett, men det vil være noen skjevheter. Da gjelder det å finne de og gjøre noe med dem. Du får ikke et perfekt system, men det er ikke et perfekt system nå heller. Og alt dette gjelder overalt. Hvilke feilrater og hvilken urettferdighet kan man leve med? Og er den urettferdigheten verre slik enn den er nå? Dette gjelder for enkle modeller og det gjelder for veldig kompliserte modeller. Det vil fremdeles være feilrater og ting som man må håndteres. Og dette kommer til å styre ganske mye av hvordan ting gjøres i samfunnet, i stort og smått.
Referanser
(1) Marres, N., & Weltevrede, E. (2013). SCRAPING THE SOCIAL? Issues in live social research. Journal of Cultural Economy, 6(3), 313–335. https://doi.org/10.1080/17530350.2013.772070