Niet alleen maar gevaarlijk: waar is AI nú al voor in te zetten?

Overheid - Artificial Intelligence - Blog / 13 June 2024

De opkomst van generatieve AI-toepassingen hebben een sterke reactie teweeggebracht in het overheidsdomein. De reactie van veel (decentrale) overheidsorganen is veelal geweest om een algemeen verbod in te stellen van het gebruik van generatieve AI voor alle daar werkzame ambtenaren. Hiermee moet onder meer worden voorkomen dat gevoelige data – zoals persoonsgegevens – lekken; en moet worden voorkomen dat men de grip verliest over hoe besluiten tot stand komen. Deze reactie is in het licht van het afgelopen decennium niet onverwacht. Men hoeft immers niet ver te zoeken om misstanden te vinden die hebben plaatsgevonden als het gevolg van het gebruik van verschillende algoritmes. Een zekere voorzichtigheid bij de inzet van nieuwe AI-toepassingen is dan ook zeker geen overbodige luxe.

Tegelijkertijd betekent dit niet dat het gebruik van AI altijd uit de weg moet worden gegaan. Er zijn voldoende AI-toepassingen die een overheid vandaag de dag al op verantwoorde wijze kan toepassen en die een grote verbeterslag kunnen bewerkstelligen; zowel op efficiëntie als op het creëren van nieuwe mogelijkheden. In deze blogpost willen we eens inzoomen op een aantal kansen van AI: waar kan AI nu direct en op een verantwoorde wijze voor worden ingezet binnen de overheid?

eDiscovery: slim zoeken in grote bergen data

Een van de grootste frustraties waar iedere moderne kantoormedewerker mee te maken krijgt is de gigantische hoeveelheid documenten, spreadsheets en presentaties die er te vinden zijn binnen een gemiddelde netwerkschijf. Hoe veel pogingen een organisatie ook onderneemt om structuur aan te brengen in de aanwezige data, na een tijd zullen de gegevens toch weer verfrommeld raken. Daarnaast gebeurt het ook veel te vaak dat meerdere teams of afdelingen met dezelfde zaken bezig zijn zonder dat ze van elkaars werk op de hoogte zijn. Dit leidt dan ook tot dubbel werk en vaak inconsistente data.

Dit is waar eDiscovery-software een grote rol kan spelen. eDiscovery is ontworpen om snel en efficiënt door grote hoeveelheden digitale gegevens te zoeken, wat cruciaal is in zowel juridische zaken als dagelijks documentbeheer in organisaties. Deze software maakt gebruik van geavanceerde zoekalgoritmen en machine learning-technieken om relevante informatie te identificeren en te extraheren uit een zee van gegevens. Dit kan bijvoorbeeld belangrijk zijn voor het naleven van regelgeving, het uitvoeren van interne onderzoeken, of het voorbereiden van juridische documentatie en bewijsmateriaal.

Verder helpt eDiscovery bij het organiseren van data door het classificeren van documenten op basis van inhoud en metadata. Hierdoor kunnen gebruikers snel de gewenste documenten vinden zonder dat ze handmatig door mappen hoeven te bladeren. Dit vermindert niet alleen de tijd die besteed wordt aan het zoeken naar informatie, maar verhoogt ook de nauwkeurigheid en veiligheid van gegevensbeheer binnen een organisatie. Door het verminderen van duplicaat werk en het verbeteren van de toegankelijkheid en transparantie van informatie, draagt eDiscovery significant bij aan het verhogen van de operationele efficiëntie en het ondersteunen van een effectief besluitvormingsproces.

Hoe ziet het werken met eDiscovery eruit in dagelijkse praktijk? Nadat informatiebeheer alle data heeft ingeladen in het systeem kan men het gebruiken om zoekopdrachten uit te voeren. Dit gaat een stuk verder dan een zoekterm invoeren waarna de software gaat zoeken naar de exacte tekst in de titels en inhoud van documenten. Met moderne eDiscovery is het mogelijk om te zoeken met een machine learning-module, in feite een soort AI-zoekmachine. Je kunt de software een aantal voorbeelddocumenten geven van waar je naar op zoek bent; en vervolgens gaat de software in de gegevensbank zoeken naar documenten die aan dat signalement voldoen. Hierdoor is het dus niet nodig om exact te weten wat er in een document staat om het te kunnen vinden.

eDiscovery is voor veel processen in te zetten. Onder andere wordt eDiscovery nu al uitgebreid in de praktijk toegepast om de bestanden te vinden die nodig zijn bij de beantwoording van Woo- of AVG-verzoeken. Hierbij is een groot voordeel van de meeste eDiscovery tools dat deze nauw integreren met de Microsoft Office omgeving. Daarnaast kunnen veel eDiscovery tools draaien op de eigen cloudomgeving waardoor er ook geen AVG-problemen ontstaan over het verwerken van data bij een externe verwerker.

Teksten versimpelen met taalmodellen

Laten we eerlijk zijn: schrijven is moeilijk. En laten we ook eerlijk zijn: schrijven in een stijl die je niet gewend bent is vrijwel onmogelijk. Als jurist en ambtenaar ontwikkelt men nu eenmaal een bepaalde stijl doordat je omringt bent in een omgeving met bepaalde communicatiestijlen, complexe bestuurlijke processen en vakjargon. Het is dan ook geen verrassing dat velen zich ongemakkelijk voelen wanneer ze gevraagd worden om een document om te zetten naar versimpelde taal zodat de burger het goed kan begrijpen. Het omzetten van teksten naar bijvoorbeeld B1-niveau voelt ontzettend onnatuurlijk. We zijn het niet gewend, weten niet hoe bepaalde termen vertaald kunnen worden en hebben vaak het gevoel dat de nuance daardoor verloren raakt. Dit is een veld waar AI-taalmodellen direct een oplossing voor kunnen bieden.

AI-taalmodellen – waarvan de bekendste ChatGPT is van OpenAI – zijn getraind op enorme hoeveelheden tekst en hebben een inherent begrip van de diepe patronen van de menselijke taal. Naast dat men ze kan gebruiken voor de toepassingen waar we al heel veel van hebben gezien – zoals het beantwoorden van vragen en zoeken naar informatie – zijn ze uitermate geschikt als middel om tekst om te kunnen zetten tussen verschillende schrijfstijlen zonder dat daarbij de kernboodschap verloren raakt. Dit maakt ze een waardevol hulpmiddel voor professionals die hun communicatie toegankelijker willen maken voor een breder publiek; en dan met name overheidsorganen die hun externe communicatie willen verbeteren.

Wanneer men spreekt over taalmodellen zoals ChatGPT dan ontstaat er al snel veel wantrouwen. Is ChatGPT niet immers die tool die allemaal gegevens lekt zoals persoons- en bedrijfsgegevens; en waarbij je niet op de resultaten kan vertrouwen? Deze zorgen zijn niet geheel onterecht maar hangen vooral af van de manier hoe een taalmodel wordt ingezet.

Ten eerste hangt de privacy problematiek af van de licentie die is afgenomen met de leverancier van een AI-taalmodel. ChatGPT heeft ervoor gekozen om de door de gebruiker ingevoerde gegevens in de gratis versie in te zetten om het model te verbeteren. Tegelijkertijd zijn er betaalde varianten en Enterprise-licenties waarbij dit probleem niet speelt. Ook zijn er vele andere tools buiten ChatGPT die zich specialiseren in het omzetten van teksten in andere schrijfstijlen. Sommige hiervan zijn in Nederland of andere EU-landen ontwikkelt en zijn toegespitst op het bedrijfsleven. Deze tools zullen dan ook niet je gevoelige data gebruiken om het model te verbeteren (check natuurlijk wel altijd je contracten en andere overeenkomsten! Hier helpen wij je graag bij).

Als laatste is er veel te doen geweest over de betrouwbaarheid van AI-taalmodellen. Er zijn genoeg voorbeelden te vinden waarbij een taalmodel een vraag wordt gesteld waarna er vervolgens totale onzin uit komt rollen. Uiteindelijk hangt dit af van de manier waarop een taalmodel wordt ingezet. Een taalmodel werkt aanzienlijk preciezer wanneer het wordt voorzien van alle gegevens die het nodig heeft om een vraag te beantwoorden. Een taalmodel dat een kennisvraag moet beantwoorden zonder nadere context moet gaan zoeken in de onderliggende kennisbank en daarin kunnen fouten ontstaan. Wanneer echter een taalmodel een volledige tekst krijgt met als instructie: ‘zet deze tekst om naar B1-niveau’; dan heeft het taalmodel geen extra kennis nodig en werkt het vele malen preciezer. Dit stelt een taalmodel in staat om te excelleren in waar het voor gemaakt is: het omzetten van een tekst in een andere tekst aan de hand van de diepe patronen van de menselijke taal.

Wat betekent dit?

We snappen de terughoudendheid van bedrijven en overheden om AI in te gaan zetten op de werkvloer. De door algoritmes geïnduceerde schandalen hebben nu eenmaal een grote impact gehad in het vertrouwen dat we hebben in computers. Tegelijkertijd lijkt het ons ook geen optie om dan maar te kiezen voor stilstand. Overheden hebben consistent te maken met een beperkte capaciteit en een alsmaar groter wordende verantwoordelijkheid door de introductie van nieuwe regelgeving. We zullen allemaal slimmer moeten gaan werken om de aanwezige arbeidscapaciteit zo goed mogelijk te kunnen benutten. De eerste stap hierin is het vinden van toepassingen waarbij de risico’s dusdanig klein zijn dat het nu verantwoord is om een begin daarmee te maken. Scepticisme is zeker niet fout, maar kijk er ook niet blind op.