Niks meer missen?
Schrijf je in voor onze nieuwsbrief
Foto: Jannes Linders
wetenschap

In dit lab helpen algoritmes verstopte boodschappen van criminelen te ontrafelen

Sija van den Beukel,
30 maart 2023 - 14:57

Om te achterhalen wat er precies gebeurd is bij een misdaad, gebruiken deskundigen van het Nederlands Forensisch Instituut (NFI) steeds vaker kunstmatige intelligentie. Op het Science Park is nu het eerste lab geopend, AI4Forensics, waar het NFI samenwerkt met de UvA. ‘Met statistiek kunnen we achterhalen in welke afbeeldingen een boodschap is verstopt.’

Kunstmatige intelligentie is bezig met een opmars, ook in de criminele wereld. Met behulp van algoritmes versturen criminelen steeds vaker verstopte boodschappen in beeld, tekst, audio en video. Slim hoef je als crimineel niet te zijn om boodschappen met steganografie te versturen, oftewel, het versturen van informatie via onschuldige objecten. Via Google is steganografie software zo te vinden.

Foto: Nederlands Forensisch Instituut
Meike Kombrink

Ook het Nederlands Forensisch Instituut (NFI) zet kunstmatige intelligentie in om deskundigen te ondersteunen bij het forensisch onderzoek. Daarom opende het NFI half maart het AI4Forensics in het Innovation Center for Artificial Intelligence (ICAI) in Lab42. In het nieuwe lab, onder leiding van hoogleraar Multimedia Analytics Marcel Worring en bijzonder hoogleraar Forensic Data Science Zeno Geradts, werken vier promovendi en één postdoc aan kunstmatige intelligentie in het forensisch onderzoek.

 

Onzichtbare inktpen

Promovendus Meike Kombrink is een van hen. Zij werkt aan het opsporen van de digitale, verborgen boodschappen. ‘Steganografie in de fysieke wereld kun je vergelijken met schrijven met een onzichtbare inktpen,’ zegt Kombrink. ‘De boodschap is met het blote oog niet te zien en wordt pas zichtbaar wanneer je er met een lampje op schijnt.’

Steganografie op drie manieren

Je kunt een boodschap in een afbeelding verstoppen door de binaire waardes van kleuren aan te passen. Je verandert alleen de allerlaatste nullen en enen op zo’n manier dat ze ook letters coderen. Daarmee verandert de kleurintensiteit van een pixel een heel klein beetje.

 

Een andere methode is om beelden samen te vatten, denk aan een gecomprimeerde afbeelding. ‘Net als bij een tekst kun je de kernzinnen hetzelfde laten, maar de voorbeelden veranderen. In die voorbeelden zitten de boodschappen verstopt.

 

De derde manier is om AI te trainen om zelf een boodschap te verstoppen in een bestaande afbeelding, video, audio of tekst. Of om ook dat beeld zelf te creëren met de boodschap erin.

Waar begint het NFI met zoeken? Je kunt onmogelijk overal je lampje op schijnen. ‘Een van de give aways is de communicatie vooraf en naderhand,’ zegt Kombrink. ‘Criminelen moeten van elkaar weten dat er een boodschap aankomt en hoe deze verborgen is, dus daar communiceren ze over.’

 

De tweede stap is om de boodschap te onthullen. Daarvoor maakt Kombrink onder andere gebruik van een zelfgecreëerde dataset. Ze legt uit hoe ze het algoritme traint met behulp van de dataset. ‘Met behulp van statistiek kunnen we achterhalen in welke afbeeldingen een boodschap is verstopt.’

 

‘Eh’ en ‘dus’

Kunstmatige intelligentie kan ook helpen om stemmen te vergelijken in spraakopnames. Het algoritme kan geen uitsluitsel geven of een stem van een bepaald persoon is. Het geeft alleen een mate van waarschijnlijkheid. Daarmee kan een taalexpert van het NFI een betere inschatting maken.

 

Voor het NFI is de bestaande automatische sprekervergelijking niet altijd optimaal, vertelt promovendus Eleni Sergidou. ‘De standaard software is voornamelijk getraind met miljoenen Engelstalige YouTube-video’s,’ vertelt Sergidou. ‘Ook wordt daarbij alleen gebruik gemaakt van de klank van de stem en niet van andere kenmerken. Voor zaken van het NFI zijn de opnames vaak Nederlands en van mindere kwaliteit, denk aan getapte telefoonlijnen. Ook kunnen criminelen gebruik maken van stemvervormers als ze weten dat ze worden afgeluisterd. Voor die zaken is het belangrijk om niet alleen naar klank te luisteren, maar ook naar andere kenmerken van de stem.’

Foto: Nederlands Forensisch Instituut
Eleni Sergidou

Daarom richt Sergidou zich voor het forensisch onderzoek ook op de woorden die een persoon gebruikt. Elk individu heeft niet alleen zijn eigen karakteristieke vocabulaire, maar gebruikt ook woorden die geen betekenis hebben zoals ‘eh’ en ‘dus’ op een kenmerkende manier. Door die informatie ook mee te nemen kan het algoritme als geheel meer onderscheid maken. Sergidou werkt aan een model dat zowel gebruik maakt van klank als woordkeuze.

 

Dat model moet worden afgestemd op een zaak. Sergidou: ‘Het is nog geen plug and play. Per zaak kijken we hoe goed het algoritme werkt. Als er bijvoorbeeld telefoongesprekken met veel ruis in de zaak zitten, presteert het algoritme anders dan als het studio-opnamen zijn.’

 

Uiteindelijk is het doel om de AI-modellen van Kombrink en Sergidou te gebruiken in de forensische zoekmachine Hansken, die wordt gebruikt in strafzaken. Dan kun je één stemgeluid terugvinden in duizenden opnames. Of al het beeld, tekst, video en audio in een zaak in één klap controleren op verborgen boodschappen. 

 

Maar zover is het nog niet. Kombrink werkt nu eerst aan het zichbaar maken wélke boodschappen er worden uitgewisseld. ‘Ik zou mijn vriend in stego een boodschappenlijstje kunnen sturen waar tampons op staan, als ik niet wil dat iedereen meeleest,’ grapt ze. ‘Maar dat maakt het voor het strafrecht nog geen interessante informatie. Het doel is om in vier jaar niet alleen de boodschappen op te sporen, maar ook te ontcijferen.’