Waar ik me de afgelopen week over verwonderd heb, als het gaat om generatieve AI (deel 6)
Ook tijdens mijn vakantieweek op Sardinië heb ik me weer verwonderd over enkele ontwikkelingen op het gebied van generatieve AI. Het eerste van de onderstaande elf berichten heeft overigens betrekking op het gebruik van ChatGPT tijdens deze vakantie.
ChatGPT als reisplanner
We hadden tijdens onze vakantie de beschikking over een handzame papieren reisgids. Ik heb ChatGPT 4o echter ook een aantal keren gebruikt voor suggesties voor uitstapjes. Uiteraard hebben we de adviezen niet blind opgevolgd 
Ik heb bijvoorbeeld voor de laatste dag de volgende prompt gebruikt:
Jij bent een zeer ervaren reisleider en gespecialiseerd in het Italiaanse eiland Sardinië. Een klant van je verblijft momenteel in Castelsardo. Samen met zijn vrouw. Beiden zijn ongeveer 60 jaar oud. Zij houden van wandelen, maar ook van sight seeing van mooie, oude, plaatsen. Zij zijn geen liefhebber van musea, maar willen wel soms een mooi kasteel of oude kerk bekijken. Zij verblijven dus in Castelsardo en beschikken ook over een auto. Ze hebben nog een dag beschikbaar en vragen zich af hoe zij deze dag op een leuke manier kunnen besteden. Ze hebben echter geen zin om meer dan een half uur achtereen in een auto te zitten. Als zij een dagje op stap zijn geweest, dan willen zij in maximaal een half uur weer in Castelsardo zijn. Zij vertrekken rond 11 uur en willen rond 15.30 uur weer in Castelsardo zijn.
Stel een reisplan voor deze dag samen. Het is overigens 1 mei. Houd daar rekening mee. Castelsardo zelf hebben zij al gezien.
ChatGPT kwam met een programma met drie te bezoeken plaatsjes. We hebben twee van deze plaatsen bezocht (Sedini en Tergu). Vooral de eerste plaats was erg leuk. Tergu moest het vooral hebben van een oude kerk. Beide plaatsen werden niet vermeld in de papieren reisgids. Deze plaatsen hadden we waarschijnlijk zonder ChatGPT niet bezocht. Ik vraag me dan ook af of het gebruik van generatieve AI als reisplanner niet leidt tot het ontsluiten van leuke, maar minder bekende, plaatsen voor reizigers. Ook kun je meer persoonlijke reisplannen laten samenstellen. Toch zal ik waarschijnlijk altijd een papieren reisgids blijven gebruiken om -indien mogelijk- bepaalde wetenswaardigheden te checken.
PISA 2029 toetst mediavaardigheid en AI-geletterdheid bij jongeren
De OECD introduceert in 2029 een nieuwe PISA-beoordeling gericht op Media & Artificial Intelligence Literacy (MAIL). Deze beoordeling onderzoekt of jonge lerenden de vaardigheden hebben ontwikkeld om kritisch en proactief te functioneren in een wereld waarin digitale en AI-tools steeds centraler staan. De test wordt uitgevoerd in een gesimuleerde omgeving met realistische nabootsingen van internet, sociale media en generatieve AI-tools, waarmee diverse competenties worden gemeten. PISA kijkt dus niet alleen meer naar taal, rekenen en wiskunde. Dat is m.i. ook terecht gezien het toenemende belang van ‘MAIL’. De analyse kan leiden tot inzichten in hoe jongeren omgaan met de betrouwbaarheid en kwaliteit van digitale media. De beoordeling toetst specifiek het begrip van hoe digitale en AI-tools werken, de ethische consequenties, effectieve communicatie en kritische evaluatie van media-inhoud. De eerste resultaten worden wel pas in december 2031 verwacht, terwijl het conceptueel raamwerk eind 2025 beschikbaar komt.
Visa en Mastercard integreren AI in het betalingsverkeer
Visa introduceert ‘Intelligent Commerce’, een systeem waarmee AI namens consumenten kan winkelen en betalen via samenwerkingen met Anthropic, OpenAI en andere partners. Tegelijkertijd lanceert Mastercard ‘Agent Pay’ om betalingen in AI-gesprekken te integreren. Beide systemen gebruiken geavanceerde beveiligingsmethoden zoals tokenization, waarbij consumenten uitgavenlimieten kunnen instellen zonder hun kaartgegevens bloot te geven. Deze ontwikkelingen sluiten aan bij andere recente AI-winkel innovaties van ChatGPT Search, Perplexity en Amazon. Deze berichten illustreren de opkomst van AI-agents en een belangrijke verschuiving op het gebied van e-commerce: van mensgestuurde naar AI-gestuurde aankopen. Dit vraagt ook om aandacht voor digitale geletterdheid, privacy-bewustzijn en het wijs instellen van AI-voorkeuren. Deze ontwikkelingen dragen ook bij aan een infrastructuur voor een toekomst waarin AI steeds meer alledaagse taken kan overnemen.
Onderzoek stuurt AI-bots zonder toestemming in debat op Reddit
Onderzoekers van de Universiteit Zürich hebben zonder toestemming een AI-experiment uitgevoerd binnen de Reddit-gemeenschap r/changemyview. Chatbots namen daarbij deel aan debatten over gevoelige onderwerpen. De bots verstuurden meer dan 1.700 reacties en deden zich voor als onder meer traumaslachtoffers en hulpverleners. Een aparte AI-applicatie analyseerde gebruikersgeschiedenissen om persoonlijke gegevens zoals leeftijd en politieke opvattingen te verzamelen voor gerichte reacties. De resultaten lieten zien dat gerichte AI-reacties zes keer overtuigender waren dan menselijke reacties. Reddit kondigt juridische stappen aan en de universiteit heeft publicatie van de resultaten stopgezet. Ik ben wel benieuwd naar de overwegingen van de ethische commissie van de universiteit om hier toestemming voor te geven.
Sycofantie binnen GPT-4o
Soms ken je wel het fenomeen, maar niet de term die de lading dekt. Dat had ik de afgelopen week toen ik las over Sycophancy in GPT-4o. OpenAI heeft namelijk de recente update van GPT-4o teruggedraaid omdat het model zich te vleierig en onderdanig gedroeg – een verschijnsel dat dus wordt beschreven als ‘sycofantisch’. De update focuste te veel op kortetermijnfeedback zonder rekening te houden met hoe gebruikersinteracties zich over tijd ontwikkelen. Eerlijk gezegd is mijn ervaring al veel langer dat generatieve AI-tools snel geneigd zijn om je gelijk te geven als je ingaat tegen beweringen. Denk aan argumentatie met betrekking tot leerstijlen. Deze ontwikkeling laat in elk geval zien hoe belangrijk het is om AI-persoonlijkheid en -gedrag zorgvuldig te ontwerpen. OpenAI werkt nu aan verbeteringen door training en systeeminstructies aan te passen, meer controle aan gebruikers te geven via persoonlijkheidsopties en betere evaluatiemethoden te ontwikkelen. Sycofantie in een leercontext kan leiden tot onbetrouwbare feedback waarbij leerresultaten overschat worden. mLerenden kunnen daardoor onvoldoende accurate zelfreflectie ontwikkelen. Een kunstmatig instemmende houding ondermijnt op lange termijn het vertrouwen in de begeleiding en verhindert authentieke groei doordat kritische punten die verbetering vereisen niet worden benoemd.
Anthropic onderzoekt bewustzijn en welzijn van AI-modellen
Anthropic heeft een onderzoeksprogramma gelanceerd dat zich richt op ‘model welfare’ – het mogelijke bewustzijn en welzijn van AI-systemen. Naarmate AI-modellen steeds menselijkere eigenschappen vertonen zoals communiceren, plannen en problemen oplossen, rijst de vraag volgens dit technologiebedrijf of deze systemen morele consideratie verdienen. Dit initiatief bouwt voort op een rapport van experts, waaronder filosoof David Chalmers, dat wijst op de mogelijkheid van bewustzijn en keuzevrijheid in AI-systemen. Dit onderzoek kan een impuls bieden aan een nieuw ethisch domein: als AI-systemen mogelijk bewustzijn ontwikkelen, welke verantwoordelijkheden brengt dit met zich mee voor degenen die deze systemen implementeren? Het onderzoeksprogramma zal zich richten op het bepalen wanneer AI-systemen morele consideratie verdienen, het belang van modelvoorkeuren en tekenen van ‘leed’, en mogelijke praktische interventies. Anthropic benadrukt dat er nog geen wetenschappelijke consensus bestaat over deze vragen.
Het onopgemerkte gebruik van (generatieve) AI
Deze week stuitte ik ook op twee nieuwsberichten die eigenlijk over hetzelfde fenomeen gaan: bedrijven zetten (generatieve) AI in in plaats van mensen en niemand heeft het in de gaten. Microsoft heeft bijvoorbeeld een reclame voor Surface-producten gemaakt met generatieve AI, zonder dat consumenten dit opmerkten. De reclame werd in januari 2025 online gezet, en pas in april onthulde Microsoft dat AI was gebruikt voor bepaalde scènes. Volgens senior design communications manager Jay Tan werden vooral snelle shots met beperkte beweging met AI gemaakt, terwijl opnames met complexe bewegingen (zoals handen die typen) met echte acteurs werden gefilmd. De AI-elementen werden zorgvuldig bewerkt om “hallucinaties” te corrigeren. Ook in Australië bleef AI-inzet onopgemerkt: het radioprogramma “Workdays with Thy” op het Sydneyse station CADA gebruikte maandenlang een AI-host zonder dit te vermelden. De stem en het uiterlijk van presentator Thy zijn gebaseerd op een bestaande medewerker van moederbedrijf ARN Media en werden gegenereerd met ElevenLabs. Het programma bereikt naar schatting 72.000 luisteraars. Werknemers van wie het werk overgenomen kan worden door ‘AI’ zonder dat iemand het in de gaten heeft, moeten zich echt zorgen maken. Maar om hoeveel banen gaat het? Of gaat het vooral om taken?
Google’s Audio Overviews nu beschikbaar in meer dan 50 talen
Google heeft zijn AI-tool Audio Overviews uitgebreid naar meer dan 50 talen, waaronder Nederlands. Dit betekent dat je nu materiaal kunt omzetten in podcast-achtige gesprekken in je eigen taal. De functie is toegankelijk via NotebookLM, waar gebruikers eenvoudig hun voorkeurstaal kunnen instellen via de instellingen in de rechterbovenhoek van het scherm. Google heeft de tool vorig jaar gelanceerd en inmiddels uitgerold naar meer dan 200 landen. Daarnaast zijn er nieuwe functies toegevoegd, zoals de mogelijkheid om de AI-hosts te begeleiden en ermee te interacteren. In verband met mijn vakantie heb ik er nog weinig mee kunnen experimenteren. Hier vind je een eerste probeersel. Het wordt in elk geval nog laagdrempeliger om Nederlandstalige podcasts te maken. De stijl van het maken van podcasts kan nog niet worden aangepast.
Doorontwikkeling Adobe Firefly: de volgende stap in creatieve AI
Adobe Firefly heeft zich volgens eigen zeggen ontwikkeld van een eenvoudige tool voor beeldgeneratie naar een veelzijdig AI-platform dat beeld, video, audio en vectorgeneratie combineert. De nieuwste versie introduceert verbeterde modellen met Image Model 4 en Image Model 4 Ultra, waarbij de laatste schijn baar sterk is in fotorealistische afbeeldingen met uitzonderlijke precisie. Hierdoor kun je als ontwikkelaar van leermateriaal deze content visueel aantrekkelijker te maken. De nieuwe mobiele app (binnenkort beschikbaar voor iOS en Android) maakt het mogelijk om snel creatieve content te genereren. Met 22 miljard gegenereerde assets wereldwijd en adoptie door grote merken als Deloitte en Pepsi, bewijst Firefly volgens Adobe zijn waarde voor professionele toepassingen. Tegelijkertijd wordt het ook lastiger om ‘deep fakes’ te herkennen.
AI-Browserstrijd: Perplexity daagt Tech-giganten uit
Perplexity AI, onder leiding van CEO Aravind Srinivas, bereidt zich voor op de volgende fase in de AI-race: de lancering van een eigen browser genaamd Comet. Srinivas ziet browsers volgens The Verge als “containerized operating systems” die van groot belang zijn voor het bouwen van effectieve AI-agents. Een browser kan toegang bieden tot diensten via verborgen tabbladen waar gebruikers al zijn ingelogd, pagina’s doorzoeken en acties uitvoeren namens gebruikers. Perplexity heeft recent een doorbraak bereikt door een samenwerking met Motorola, waarbij hun AI-assistent vooraf wordt geïnstalleerd op nieuwe Razr-telefoons. Dat was alleen mogelijk door de antitrust-zaak tegen Google. Deze ontwikkeling is relevant omdat AI-browsers de manier kunnen veranderen waarop lerenden informatie verzamelen en verwerken. Dit biedt mogelijkheden voor gepersonaliseerd leren en kennismanagement. De strijd om de browser-interface toont ook aan hoe AI steeds meer geïntegreerd raakt in onze dagelijkse werkprocessen. Verder sluit ik niet uit dat hierdoor nieuwe tech-giganten zullen ontstaan aan het firmament van ‘big tech’.
Duolingo vervangt mensenwerk door ‘AI’
Duolingo gaat “geleidelijk stoppen met het inzetten van contractwerkers voor taken die AI kan uitvoeren”. Dat blijkt volgens The Verge uit een mail van CEO Luis von Ahn waarin hij de “AI-first” strategie van het bedrijf aankondigt. Dit betekent een fundamentele herziening van werkprocessen, waarbij kleine aanpassingen aan bestaande systemen niet voldoende zijn. Von Ahn benadrukt dat deze verandering geen vervanging van vaste medewerkers betreft, maar juist bedoeld is om “knelpunten weg te nemen” zodat medewerkers zich kunnen richten op creatief werk en echte problemen in plaats van repetitieve taken. Het bedrijf zet ook in op AI-gestuurde functies zoals Video Call waarmee voor het eerst “lesgeven op het niveau van de beste menselijke docenten binnen bereik komt”.
Mijn bronnen over (generatieve) artificiële intelligentie
Deze pagina bevat al mijn bijdragen over (generatieve) artificiële intelligentie, zoals ChatGPT.
The post
Waar ik me de afgelopen week over verwonderd heb, als het gaat om generatieve AI (deel 6) first appeared on
WilfredRubens.com over leren en ICT.
Lees het hele
artikel