Technische update AI | Oktober 2023

De ontwikkelingen op het gebied van artificiële intelligentie volgen elkaar snel op en zijn amper bij te houden. Iedere dag lezen we over nieuwe technieken en AI-systemen en hoe deze de wereld gaan veranderen. Om het overzicht te bewaren zetten we iedere maand de belangrijkste ontwikkelingen even op een rij.

Uitrol van Microsoft CoPilot

Het heeft een tijd geduurd, maar Microsoft is nu begonnen met de uitrol van hun CoPilot-programma. CoPilot is Microsofts implementatie van ChatGPT in hun brede assortiment van softwareproducten. Zo gaat Microsoft CoPilot integreren in Windows, Office, Edge en Bing; zodat gebruikers met menselijke taal deze programma’s kunnen aansturen. De ambities van Microsoft met CoPilot zijn daarbij duidelijk groot. De lijst met functies die CoPilot kan verrichten is enorm en onmogelijk om allemaal op te sommen. In hoofdlijnen komt het op een aantal functies neer.

Automatiseren van kantoorwerk

De belangrijkste groep producten waar Microsoft CoPilot in aan het integreren is Microsoft Office. Zo wordt CoPilot onder andere geïntegreerd in Word, PowerPoint, Excel, Teams en Outlook. Dit maakt het bijvoorbeeld mogelijk om met simpele instructies Word aan te sturen om documenten te creëren of aan te passen. Zo kan je straks CoPilot vragen om een outline van een memo te genereren en kan je het ook om suggesties vragen over de invulling van bepaalde stukken tekst. Ook kan je straks aan CoPilot vragen om complexere handelingen te verrichten, zoals genereren van documentstijlen.

Ook de mogelijkheden die CoPilot biedt binnen Microsoft Outlook zien er zeer interessant uit. Zo liet Microsoft een demo zien waarbij CoPilot werd gevraagd om een geschreven e-mail te controleren op tone of voice, waardoor het voor gebruikers makkelijk inzichtelijk wordt of hun geschreven e-mails voldoen aan het bedrijfsbeleid rond het gebruik van taal. Daarnaast is het mogelijk om, net zoals met ChatGPT, e-mails samen te vatten tot bullet points en ook om vanuit samenvattingen een gehele e-mail te genereren.

CoPilot voor Windows

Microsoft integreert daarnaast CoPilot ook in Windows 11. Microsoft heeft ervoor gekozen om CoPilot op vele verschillende plekken toe te voegen waardoor het een verscheidenheid aan taken kan verrichten. Zo wordt CoPilot geïntegreerd in de ingebouwde afbeeldingbewerker. Hierdoor kan je instructies geven zodat de afbeelding wordt bewerkt, bijvoorbeeld met als doel om een achtergrond te blurren of te verwijderen. Ook wordt CoPilot nader geïntegreerd in alle plekken waar tekst te bewerken is, bijvoorbeeld in Notepad of de Browser, waardoor er tekst gegenereerd kan worden op basis van een instructie.

Naast deze integraties in bestaande apps voegt Microsoft ook een nieuwe algemene CoPilot app toe aan Windows. Deze app lijkt zeer op de bestaande interface van Bing Chat en werkt ook op eenzelfde manier. Via de app is het mogelijk om algemene instructies aan CoPilot te geven die het dan gaat uitvoeren. Zo liet de demo van Microsoft zien dat het mogelijk is om met CoPilot naar muziek te zoeken en deze dan af te spelen in de geïnstalleerde Spotify- of via YouTube Music-app. Ook kan je hiermee aan de hand van een instructie systeeminstellingen wijzigen, bijvoorbeeld voor het beheren van netwerkadapters of het wijzigen van visuele elementen op het scherm.

De meest indrukwekkende feature van de CoPilot app is de mogelijkheid om op ieder moment tekst op het scherm te kunnen transformeren en samenvatten. Als je bijvoorbeeld een PDF aan het lezen bent kan je aan CoPilot vragen om de tekst op je scherm samen te vatten of om te schrijven in een andere schrijfstijl. Hiermee wordt het voor iedereen mogelijk om bijvoorbeeld een tekst op het scherm om te zetten naar B1-taalniveau.

Wat dit betekent

ChatGPT heeft de wereld veranderd met het gemak waarmee het tekst kan genereren en transformeren. Het grote nadeel van ChatGPT was alleen dat het beperkt was tot de online chatinterface. Om een tekst te bewerken moest er altijd eerst op onpraktische wijze een kopie worden gemaakt, welke vervolgens moet worden geplakt in de interface. Naast dat dit proces niet altijd even makkelijk gaat heb je ook nog te maken met maximale tekstlimieten van ChatGPT. Dit had als gevolg dat ChatGPT eigenlijk niet praktisch is voor documentbewerking.

Met Microsoft CoPilot worden deze problemen goeddeels opgelost. Zeker de integratie in de Office suite gaat naar verwachting een grote verandering brengen in de manier hoe we teksten schrijven en bewerken en over het algemeen kantoorwerk verrichten. Zeker voor juristen zal dit veel voordeel brengen en juridische processen vergemakkelijken. We zullen de komende tijd de mogelijkheden van CoPilot gaan verkennen en jullie op de hoogte brengen van de beste manier om CoPilot in te zetten binnen de organisatie. CoPilot voor Windows wordt de komende weken uitgerold; en CoPilot voor Office is naar verwachting vanaf November beschikbaar.

OpenAI brengt Dall-E 3 uit

OpenAI heeft de nieuwste versie van hun beeldmodel Dall-E gepubliceerd: Dall-E 3. Beeldmodellen zijn AI-applicaties waarmee het mogelijk is om afbeeldingen te genereren of te bewerken. Zo kan je met een simpele instructie, ook wel een prompt genoemd, complete afbeeldingen genereren zonder handmatig in de details te hoeven treden. Met een simpele instructie als “Stock photo of young happy couple sitting on a park bench” kan je al een afbeelding laten genereren met precies zulke inhoud.

Makkelijkere prompting

Dall-E liep al een tijdje achter op de concurrentie. Het kon niet zulke mooie plaatjes genereren zoals de meest populaire MidJourney; en het kon ook niet concurreren met het vrije karakter van Stable Diffusion, waarmee het mogelijk is om beeldmodellen voor specifieke doeleinden en stijlen te maken. OpenAI lost deze achterstand op door vooral in te zetten op het gemak waarmee afbeeldingen kunnen worden gegeneerd: de prompt. OpenAI heeft Dall-E 3 nauw geïntegreerd met hun GPT-taalmodel; waardoor het beeldmodel veel beter dan de concurrentie in staat is om te begrijpen wat de gebruiker precies wil in de afbeelding.

Een goed voorbeeld hiervan zijn afbeeldingen die meerdere mensen bevatten. Vraag aan Stable Diffusion om een afbeelding met: “Two persons in a park”; en geregeld komt er dan een afbeelding uit met drie of meer mensen. Eerdere beeldmodellen snappen zeer goed bepaalde keywords zoals ‘van Gogh’ of ‘Vermeer’ om een stijl te kunnen toekennen aan de afbeelding, maar echt een goed begrip van de prompt hadden deze modellen niet. Dall-E 3 is veel beter in staat om de intentie van de gebruiker te volgen en daarmee makkelijker het juiste resultaat te krijgen.

Gebruiksgemak

OpenAI heeft ervoor gekozen om Dall-E 3 beschikbaar te maken in het Plus- en Enterprise-abonnement van ChatGPT. Om Dall-E 3 te gebruiken moet de gebruiker ChatGPT vragen om een afbeelding te genereren. Dit maakt het gebruik van Dall-E zeer intuïtief en aanzienlijk makkelijker dan de concurrenten MidJourney en Stable Diffusion. Het maakt het mogelijk om te discussiëren met ChatGPT over de uitkomst van de afbeelding en op die manier steeds dichter bij het gewenste resultaat te komen. Als een afbeelding niet precies is wat de gebruiker wil, dan kan deze simpelweg vragen om bijvoorbeeld de achtergrond een andere kleur te geven.

Dall-E 3 is voor nu nog niet beschikbaar binnen ChatGPT. Deze wordt ergens de komende maanden uitgerold. Het is echter wel al geïntegreerd in Bing Chat van Microsoft en kan daar nu al gebruikt worden.

Wat dit betekent

De integratie van Dall-E met het GPT-taalmodel betekent dat het voor gebruikers veel makkelijker wordt om afbeeldingen te genereren met het gewenste resultaat. Dit legt ook de concurrenten vuur aan de schenen om serieus werk te maken aan het gebruiksgemak van deze tools. Met Dall-E 3 komt er een serieuze concurrent die een flink deel van het marktaandeel van beeldgeneratoren kan overnemen. We kijken er dan ook naar uit hoe we deze tool kunnen integreren in ons werkproces.

Andere ontwikkelingen

  • OpenAI heeft een speciale versie van GPT-4 uitgebracht: Advanced Data Analysis.
    Advanced Data Analysis (ADA) is de nieuwe versie van de ChatGPT variant met de focus op het schrijven van computercode. ADA maakt het mogelijk om documenten, afbeeldingen en andere stukken te analyseren. Wanneer je bijvoorbeeld een document uploadt en vraagt daar een samenvatting over te schrijven, dan maakt ChatGPT een stuk computercode om de tekst uit te lezen en vervolgens deze samen te vatten.

    De mogelijkheden van ADA zijn veelbelovend, maar nog een beetje lastig in gebruik. We gaan de komende tijd de kansen bestuderen en laten het weten als we slimme toepassingen vinden.

  • Spotify test een AI-vertaalmodel om podcasts om te zetten naar verschillende talen. De vertalingen zullen beschikbaar zijn in Spaans, Frans en Duits voor een select aantal podcastafleveringen. Hiermee wordt beoogd het bereik van deze podcasts te vergroten.

Meer leren over AI, risico’s en compliance?

Volg dan de Opleiding tot AI Compliance Officer (CAICO) van ICTRecht Academy, die start in januari 2024.

Bekijk de opleiding

Terug naar overzicht