Begrippenlijst van AI-termen | Afkortingen & Terminologie

Kunstmatige intelligentie (AI) is een veelbesproken onderwerp op dit moment, vooral vanwege de introductie van AI-writers zoals ChatGPT. Veel mensen zijn geïnteresseerd in de tools, maar er komt veel terminologie bij kijken die intimiderend kan zijn voor leken.

Om je op weg te helpen hebben we een verklarende woordenlijst opgesteld met een groot aantal acroniemen, afkortingen, technische termen en grote namen in de AI-wereld.

Raadpleeg onderstaande tabel voor een snelle definitie van de term waarin je geïnteresseerd bent en klik op de term om een uitgebreidere uitleg te lezen. In veel gevallen hebben we de Engelse term behouden, omdat het gebruikelijker is om Engelse terminologie te gebruiken voor AI-gerelateerde onderwerpen.

Begrippenlijst van AI-termen (beknopt)
Algoritme: Een opeenvolging van instructies die wordt gevolgd door een computersysteem. Alignment: De mate waarin de doelen van een AI in lijn zijn met de doelen van de maker.
AlphaGo: Een AI-systeem dat het bordspel Go speelt. Antropomorfisme: De toekenning van menselijke eigenschappen aan niet-menselijke entiteiten.
Artificial general intelligence (AGI): AI die beter is dan menselijke intelligentie. Artificial intelligence (AI) of kunstmatige intelligentie (KI): Intelligentie die wordt gedemonstreerd door machines.
AI-detector: Een tool die ontworpen is om door AI gegenereerde teksten te detecteren. AI-veiligheid: Onderzoek naar hoe AI op een veilige manier kan worden ontwikkeld en gebruikt.
AI-writing (AI-schrijven): Het gebruik van AI-technologie om teksten te produceren of bewerken (e.g., chatbots, parafraseertools). Automatisering: Het uitvoeren van een proces met machines of software zodat er minder menselijke input nodig is.
Autonoom: In staat om taken uit te voeren zonder menselijke input. Bard: Een door Google ontwikkelde chatbot die in maart 2023 is uitgebracht.
Bias: De aannames die AI doet om de taken te simplificeren. Big data: Hele grote datasets die reguliere dataverwerkers niet aankunnen.
Bing Chat: Een chatbot die is geïntegreerd in Bings zoekmachine in februari 2023. Burstiness: Een maat voor variatie in zinsstructuur en -lengte. Dit wordt ook onregelmatigheid genoemd.
CAPTCHA: Een online test die wordt gebruikt om te controleren of de gebruiker een mens is (en geen robot). Chatbot: Een software-applicatie die menselijke gesprekken imiteert (meestal geschreven).
ChatGPT: Een chatbot die door OpenAI is uitgebracht in november 2022. Chinese kamer: Een filosofisch gedachte-experiment over AI.
Computer: Een machine die automatisch taken kan uitvoeren waarvoor de computer geprogrammeerd is. DALL-E: Een AI-afbeeldingengenerator die OpenAI in januari 2021 heeft uitgebracht.
Deep Blue: Een AI-systeem dat schaakspellen speelt. Deepfake: Door AI gegenereerde afbeeldingen en video’s die ontworpen zijn om zo echt mogelijk te lijken.
Deep learning: Een vorm van machine-gestuurd leren gebaseerd op neurale netwerken. ELIZA: Een van de eerste chatbots die werd ontworpen in de jaren ’60.
Emergent behavior: Complex gedrag dat voorkomt uit basisprocessen. Generative AI: AI-systemen die output genereren als antwoord op prompts.
Generative pre-trained transformer (GPT): Een soort groot taalmodel (large language model, LLM) dat voor ChatGPT en andere AI-applicaties wordt gebruikt. Hallucinatie: De neiging van AI-chatbots om met veel zelfvertrouwen verkeerde informatie te geven.
Large language model (LLM): Een neuraal netwerk dat getraind is op basis van grote hoeveelheden tekst om zo menselijk klinkende tekst te imiteren. Machine learning (ML): Onderzoek naar hoe AI kennis opdoet op basis van trainingsdata.
Machine translation: Het gebruik van software om tekst te vertalen van een taal naar een andere taal. Midjourney: Een AI-afbeeldingengenerator die is uitgebracht in juli 2022.
Natural language processing (NLP): Onderzoek naar de interactie tussen computers en menselijke taal, ook wel natuurlijke taalverwerking genoemd. Neuraal netwerk: Computersystemen die zijn ontworpen om breinstructuren te imiteren.
OpenAI: Een marktleider op het gebied van AI die ChatGPT en DALL-E heeft ontwikkeld. Parameter: Een variabele in een AI-systeem die wordt gebruikt om voorspellingen te doen.
Parafraseertool: Een AI-schrijftool die automatisch de door jou ingevoerde tekst herformuleert. Perplexity: Een maat voor hoe onvoorspelbaar een tekst is. Dit wordt ook perplexiteit genoemd.
Plagiaat: Het gebruik van andermans woorden of ideeën zonder op een juiste manier naar de bron te verwijzen. Programmeren: Het proces van instructies geven aan een computer (met behulp van computercode).
Prompt: De input van de gebruiker waarop het AI-systeem reageert. QuillBotEen bedrijf dat een populaire parafraseertool en andere AI-schrijftools aanbiedt.
Reinforcement learning from human feedback (RLHF): Een trainingsmethode die wordt gebruikt om de antwoorden van ChatGPT te verfijnen. Robot: Een machine die in staat is om fysieke acties automatisch uit te voeren.
Temperatuur: De mate van willekeur (randomness) in de output van een LLM. Trainingsdata: De dataset die werd gebruikt om een AI-systeem te trainen.
Token: De basiseenheid van tekst (een woord of deel van een woord) die wordt verwerkt door LLMs. Turing-test: Een test om te onderzoeken hoe goed een machine in staat is om menselijke intelligentie te tonen.

Begrippenlijst van AI-termen (uitgebreid)

Algoritme

Een algoritme is een eindige reeks regels die een computersysteem volgt om een bepaalde taak uit te voeren. Het is een soort programma dat op een gegeven moment stopt en niet oneindig doorwerkt.

Een algoritme kan bijvoorbeeld een reeks wiskundige stappen zijn om een bepaalde variabele te berekenen. Ze kunnen ook worden ontworpen voor complexere taken, zoals beslissen welke content moet worden gepromoot op iemands for you page op sociale media.

Alignment

Alignment (afstemming) is de mate waarin de doelstellingen en prikkels/stimulansen van een AI-systeem overeenstemmen met de bedoelingen van de makers ervan. AI is “aligned” als de acties leiden tot de resultaten die de makers voor ogen hadden, en “misaligned” als de acties leiden tot andere ongewenste resultaten.

Alignment wordt steeds belangrijker naarmate de mogelijkheden van AI toenemen. Emergent gedrag (emergent behavior) kan zich voordoen, waardoor uitkomsten optreden die we niet kunnen voorspellen.

Dit wordt waarschijnlijker naarmate we ons meer richten op langetermijndoelstellingen zoals artificial general intelligence (AGI), aangezien de manier waarop AI-systemen werken steeds moeilijker te begrijpen wordt voor mensen. AI-veiligheidsonderzoek is sterk gericht op alignment.

AlphaGo

AlphaGo is een AI-programma dat is ontworpen om het populaire bordspel Go te spelen. Het spel staat bekend om zijn hoge mate van complexiteit, waardoor eerdere computersystemen moeite hadden om het goed te spelen.

AlphaGo wist in 2017 de beste Go-speler, Ke Jie, te verslaan, net zoals Deep Blue in 1997 Garry Kasparov wist te verslaan bij het schaken.

Antropomorfisme

Antropomorfisme is het toekennen van menselijke eigenschappen, motivaties, bedoelingen en emoties aan niet-menselijke entiteiten. Mensen hebben de neiging allerlei dingen te antropomorfiseren, van dieren tot het weer.

We antropomorfiseren ook steeds meer technologie, met name AI die menselijke intelligentie lijkt te vertonen.

Mensen hechten zich bijvoorbeeld vaak emotioneel aan chatbots of geloven dat een chatbot die hallucineert opzettelijk tegen hen liegt. Ze kunnen naar AI-systemen of robots verwijzen met geslachtsaanduidingen, waardoor ze menselijke eigenschappen krijgen die ze in feite niet bezitten.

Artificial general intelligence (AGI)

Artificial general intelligence (AGI) of kunstmatige algemene intelligentie (KAI) verwijst naar een hypothetisch toekomstig AI-systeem waarvan de intelligentie die van de mens voor alle intellectuele taken evenaart of overtreft.

Veel AI-onderzoekers geloven dat AI dit punt waarschijnlijk zal bereiken en de menselijke intelligentie ergens deze eeuw zal overtreffen als gevolg van de versnelling van machine learning.

Dit scenario wordt vaak besproken in de context van alignment en AI-veiligheid: als AI intelligenter wordt dan mensen, is het essentieel dat het blijft werken aan onze doelen en geen mensen in gevaar brengt.

Artificial intelligence (AI)

Artificial intelligence (AI) of kunstmatige intelligentie (KI) is menselijke of dierlijke intelligentie die door machines wordt vertoond. Een voorbeeld hiervan is het vermogen om de wereld op dezelfde manier als mensen waar te nemen, te begrijpen en te beredeneren.

In de praktijk wordt AI gebruikt voor een breed scala aan toepassingen. AI-technologie wordt gebruikt in chatbots op basis van natuurlijke taalverwerking (natural language processing, NLP), in autonome (zelfrijdende) voertuigen, in zoekmachines en in bots die spelletjes spelen, zoals AlphaGo en Deep Blue.

AI-detector

Een AI-detector is een hulpmiddel dat is ontworpen om te detecteren wanneer een stuk tekst (of soms een afbeelding of video) is gemaakt door AI-tools (zoals ChatGPT en DALL-E). Deze detectoren zijn niet 100% betrouwbaar, maar ze kunnen een indicatie geven van de waarschijnlijkheid dat een tekst door AI is gegenereerd.

AI-detectoren werken met soortgelijke grote taalmodellen (large language models, LLMs) als de tools die ze proberen te detecteren. Deze modellen kijken in wezen naar een tekst (of afbeelding of video) en vragen zich af: “Is dit iets wat ik zou hebben gegenereerd?”. Ze zoeken naar lage niveaus van twee criteria: perplexiteit (perplexity) en onregelmatigheid (burstiness).

AI-detectoren kunnen worden gebruikt door universiteiten en andere instellingen om door AI gegenereerde inhoud te identificeren.

AI-veiligheid

AI-veiligheid (ook wel AI safety genoemd) is een onderzoeksgebied dat zich bezighoudt met de vraag hoe AI op een veilige en ethische manier kan worden ontwikkeld en gebruikt. Onderwerpen die door AI-veiligheidsonderzoekers worden besproken zijn onder meer afstemming (alignment), vooringenomenheid (bias), de effecten van automatisering, hallucinatie en het gebruik van generatieve AI om deepfakes en verkeerde informatie te genereren.

AI-writing

AI-writing of AI-schrijven is een algemene term voor het gebruik van AI (meestal LLMs) om tekst te genereren of aan te passen. Het omvat chatbots zoals ChatGPT, maar ook parafraseerstools en grammaticacheckers, zoals die van QuillBot en Scribbr.

Automatisering

Automatisering houdt in dat een proces of systeem automatisch en onafhankelijk werkt, zonder menselijke inbreng. Automatisering kan de hoeveelheid menselijke arbeid in een proces verminderen of bepaalde soorten menselijke arbeid volledig overbodig maken.

Sinds de industriële revolutie zijn steeds meer soorten werk geautomatiseerd. Dit heeft geleid tot een enorme toename van de efficiëntie, maar ook tot ontwrichting van de betrokken beroepen, wat tot werkloosheid kan leiden.

AI-hulpmiddelen kunnen worden gezien als een manier om het schrijfproces te automatiseren. Ze zullen mogelijk leiden tot een ontwrichting van bepaalde gebieden, zoals onderwijs en administratief werk.

Autonoom

Het bijvoeglijk naamwoord autonoom betekent “werken zonder controle van buitenaf”. In de wereld van AI wordt het vaak gebruikt om te verwijzen naar systemen, robots, software, etc. die zelfstandig kunnen werken, zonder directe menselijke input.

Bard

Bard is een door Google ontwikkelde chatbot die op 21 maart 2023 is uitgebracht. Net als ChatGPT en Bing Chat is de tool gebaseerd op LLM-technologie.

Sinds de lancering heeft Bard echter gemengde reacties ontvangen. Gebruikers beweren dat het minder krachtig is dan ChatGPT bij vergelijkbare prompts.

Bias

In de context van AI verwijst bias of vooringenomenheid naar de aannames die een AI-systeem doet om het leerproces en de taakuitvoer te vereenvoudigen. AI-onderzoekers proberen bias tot een minimum te beperken, omdat deze kan leiden tot slechte resultaten of onverwachte uitkomsten.

Bias kan ook verwijzen naar de neiging van AI-systemen om vooroordelen zoals seksisme, racisme of verschillende soorten onderzoeksbias te reproduceren. Dit is een punt van zorg dat door AI-veiligheidsonderzoekers aan de orde wordt gesteld.

Big data

Big data verwijst naar datasets die zo groot of complex zijn dat normale dataverwerkingssoftware ze niet kunnen verwerken. Dit is de sleutel tot de kracht van technologieën zoals LLMs, waarvan de trainingsdata bestaan uit enorme hoeveelheden tekst.

Bing Chat

Bing Chat (ook Bing AI genoemd) is een door Microsoft ontwikkelde chatbot die sinds 7 februari 2023 wordt geïntegreerd in hun zoekmachine Bing. De chatbot werd ontwikkeld in samenwerking met OpenAI op basis van hun GPT-4-technologie.

Bij de lancering zorgde Bing Chat voor enige controverse vanwege zijn neiging om te hallucineren en ongepaste antwoorden te geven. Velen op het gebied van AI-veiligheid leverden kritiek op de slechte alignment voorafgaand aan de release.

Anderen waren enthousiast over de mogelijkheid om GPT-technologie in een zoekmachine te integreren, aangezien ChatGPT (destijds) het internet niet kon doorzoeken.

Burstiness

Burstiness of onregelmatigheid is een maat voor de variatie in zinsbouw en -lengte. AI-teksten vertonen doorgaans een lage mate van burstiness, terwijl menselijke teksten doorgaans een hogere burstiness vertonen.

Een AI-detector combineert burstiness en perplexity (perplexiteit) meestal om te bepalen of een tekst door AI gegenereerd is. Een hogere temperatuurinstelling in een LLM resulteert in tekst met een hogere perplexity en burstiness.

CAPTCHA

Een CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) is een test die vaak online wordt gebruikt om te controleren of de gebruiker menselijk is. Ze worden bijvoorbeeld gebruikt om te voorkomen dat spambots sites overspoelen met spamcomments.

Om een CAPTCHA te voltooien, moet de gebruiker eenvoudige taken uitvoeren, zoals het intypen van wat tekst van een vervormde afbeelding of het klikken op afbeeldingen die een bepaald object bevatten.

Ze zijn ontworpen om eenvoudig te zijn voor mensen, maar moeilijk op te lossen voor computersystemen. Toch zijn sommigen erin geslaagd ze automatisch op te lossen met behulp van machine learning.

Chatbot

Een chatbot is een softwaretoepassing die een menselijk gesprek simuleert, meestal in de vorm van een schriftelijke chat. Ze zijn gebaseerd op deep learning en NLP-technologie en kunnen worden gebruikt voor taken als klantenondersteuning en het schrijven van content.

Op LLM gebaseerde chatbots zijn in populariteit toegenomen sinds de release van ChatGPT, Bing Chat en Bard in de afgelopen maanden. Minder geavanceerde chatbots bestonden al langer. Zo werd een van de eerste chatbots, ELIZA, uitgebracht in de jaren ’60.

ChatGPT

ChatGPT is een door OpenAI ontwikkelde chatbot die werd uitgebracht op 30 november 2022. De tool is gebaseerd op LLM-technologie en verfijnd met RLHF.

ChatGPT is een enorm succes en is naar verluidt de snelst groeiende applicatie aller tijden geworden. De tool wordt gezien als een grote stap voorwaarts in AI-technologie en heeft het onderwerp AI-writing onder de aandacht van het publiek gebracht.

OpenAI heeft ook kritiek gekregen van AI-veiligheidsonderzoekers, die stellen dat de tool niet goed is afgestemd (aligned) en het risico op verspreiding van desinformatie met zich meebrengt. Sommigen beweren ook dat het bedrijf niet in lijn met zijn waarden heeft gehandeld, aangezien OpenAI de technische gegevens van de modellen niet openbaar heeft gemaakt.

Chinese kamer

De Chinese kamer (of Chinese room) is een filosofisch gedachte-experiment van John Searle. De lezer wordt gevraagd zich een AI-systeem voor te stellen dat zich gedraagt alsof het Chinees begrijpt. Het slaagt voor de Turing-test en overtuigt een Chinese spreker ervan dat hij met een mens spreekt. Searle vraagt vervolgens: Begrijpt de AI Chinees of simuleert hij slechts het vermogen om Chinees te begrijpen?

Daarna stelt hij een tweede scenario voor waarin hij (Searle) zich in een gesloten kamer bevindt, de input van de Chinese spreker buiten de kamer ontvangt en samenhangende antwoorden produceert door de instructies van de AI op te volgen. De Chinese spreker denkt opnieuw dat hij met een mens praat.

Searle, die geen Chinees spreekt, betoogt dat het onredelijk zou zijn om te zeggen dat hij Chinees “begrijpt”, alleen omdat hij het gesprek kon vereenvoudigen door een programma te volgen. Hij stelt dat aangezien de AI precies dat doet (een programma volgen om antwoorden te produceren), hij ook niet “begrijpt” wat hij “zegt”.

Het argument zet de lezer ertoe aan na te denken over de vraag of en hoe kunstmatige intelligentie verschilt van menselijke intelligentie en over de vraag waar “intelligentie” en “begrip” vandaan komen.

Computer

Een computer is een soort machine die geprogrammeerd is om verschillende taken automatisch uit te voeren. De term kan verwijzen naar een grote verscheidenheid aan apparaten, waaronder pc’s, smartphones, spelconsoles, rekenmachines en supercomputers.

Charles Babbage wordt meestal aangehaald als de “vader van de computer”. Hij vond de eerste mechanische computers uit aan het begin van de 19e eeuw. Sinds halverwege de 20e eeuw zijn computers steeds meer verspreid en toegankelijk geworden voor het grote publiek.

Computers of supercomputers zijn essentieel voor de ontwikkeling van AI-systemen.

DALL-E

DALL-E is een AI-beeldgenerator die op 5 januari 2021 door OpenAI werd uitgebracht. Een tweede versie, DALL-E 2, begon uit te rollen op 20 juli 2022. De naam is een portmanteau (vlechtwoord) van de namen van het Pixar-personage WALL-E en de kunstenaar Salvador Dalí.

Beide versies worden aangedreven door een versie van GPT-3 die is aangepast om beelden te genereren in plaats van tekst. Ze hebben dus dezelfde technologische bouwstenen als ChatGPT, ondanks de zeer verschillende output.

Net als bij andere AI-beeldgeneratoren (e.g., Midjourney) is er veel discussie geweest over hoe DALL-E de toekomst van de kunst kan beïnvloeden, waarbij sommige tegenstanders beweren dat deze tools bestaande beelden plagiëren en kunnen worden gebruikt om deepfakes te maken.

Deep Blue

Deep Blue was een AI-systeem ontworpen om te schaken. Het versloeg in 1997 de wereldkampioen Garry Kasparov en werd daarmee het eerste computersysteem dat de menselijke vaardigheid in schaken overtrof.

Dit werd gezien als een mijlpaal in de ontwikkeling van AI, omdat het aantoonde dat het systeem de complexe strategieën van het schaakspel beheerste. Jaren later zou een systeem met de naam AlphaGo dezelfde prestatie leveren in het bordspel Go.

Deepfake

Een deepfake is een stukje media dat door deep learning of andere AI-technologie is gemaakt om de werkelijkheid verkeerd voor te stellen, bijvoorbeeld door te laten zien dat iemand iets doet of zegt wat diegene niet heeft gedaan of gezegd. Deepfakes kunnen afbeeldingen, video of audio zijn. Momenteel kun je vaak herkennen dat ze nep zijn, maar ze worden steeds overtuigender.

Deepfakes zijn een belangrijk punt van zorg voor AI-veiligheidsdeskundigen, omdat ze kunnen worden gebruikt om desinformatie en nepnieuws te verspreiden, om seksueel expliciete beelden van mensen te genereren zonder hun toestemming, of om fraude te faciliteren.

Socialemediaplatforms, overheden en andere instellingen stellen vaak regels op tegen deepfakes, maar die zijn moeilijk te handhaven als ze niet op betrouwbare wijze kunnen worden gedetecteerd. Sommige AI-detectoren zijn ontworpen om deepfakes op te sporen, hoewel ze naar verluidt nog niet erg betrouwbaar zijn.

Deep learning

Deep learning is een vorm van machine learning. Deep learning-modellen zijn gebaseerd op neurale netwerken.

Ze bestaan uit een reeks lagen die onbewerkte data (raw data, zoals pixels) geleidelijk omzetten in een abstractere vorm (zoals een afbeelding van een gezicht), waardoor het model ze op een hoger niveau kan begrijpen.

ELIZA

ELIZA was een van de eerste chatbots die in de jaren zestig werd ontwikkeld door MIT-computerwetenschapper Joseph Weizenbaum. ELIZA speelde een psychotherapeut, waarbij de gebruiker optrad als de patiënt.

De programmering was vrij eenvoudig en ELIZA herhaalde meestal simpelweg de input van de gebruiker in de vorm van een vraag. Toch bleek het verrassend realistisch voor gebruikers, die er vaak van overtuigd raakten dat ELIZA hen kon begrijpen. Dit is een voorbeeld van een antropomorfisme.

Emergent behavior

Emergent behavior of emergent gedrag verwijst naar onverwachte vaardigheden of acties van AI-systemen. Dit zijn dingen waarvoor zij niet expliciet zijn opgeleid, maar die uit hun opleiding zijn voortgekomen. Complexe gedragingen ontstaan uit de interactie van een groot aantal eenvoudige elementen.

Zo werken LLMs op een basisniveau door te raden welk token (woord) als volgende in een zin komt. Ondanks dit vrij eenvoudige mechanisme zijn ze in staat om samenhangende, intelligent lijkende antwoorden te geven op een groot aantal vragen.

Andere gedragingen kunnen negatiever zijn, zoals de neiging van LLMs om te hallucineren of ongepaste antwoorden te geven. Veel AI-onderzoek berust op het invoeren van big data in een model en kijken wat er gebeurt, wat gepaard gaat met veel vallen en opstaan en onvoorspelbare resultaten.

Generative AI

Generative AI verwijst naar AI-systemen die tekst, afbeeldingen, video, audio of andere media genereren als reactie op prompts van de gebruiker. Hieronder vallen chatbots zoals ChatGPT, beeldgeneratoren zoals Midjourney, videogeneratoren, muziekgeneratoren, et cetera.

Generative pre-trained transformer (GPT)

Een generative pre-trained transformer (GPT) is een soort large language model (LLM) dat wordt gebruikt voor generatieve AI-toepassingen. GPT-modellen zijn neurale netwerken gebaseerd op een soort deep learning-model dat een transformator wordt genoemd. Het is momenteel de populairste vorm van LLM.

Het AI-bedrijf OpenAI heeft een aantal GPT-modellen uitgebracht: GPT-1 in 2018, GPT-2 in 2019, GPT-3 in 2020, GPT-3.5 in 2022 en GPT-4 in 2023. GPT-3.5 en GPT-4 worden gebruikt om ChatGPT aan te drijven, terwijl DALL-E draait op GPT-3.

Hallucinatie

In de context van AI verwijst hallucinatie naar het verschijnsel dat een AI-model vol vertrouwen reageert op een manier die niet wordt gerechtvaardigd door de trainingsdata. Dit betekent dat het model op dat moment een antwoord verzint. ChatGPT kan bijvoorbeeld een zelfverzekerd antwoord geven dat volledig fout is als iemand een vraag stelt waarop het model het antwoord niet weet 

Hallucinatie is een emergent behavior en het gedrag is waargenomen in verschillende LLM-aangedreven chatbots. Het lijkt het gevolg te zijn van het feit dat deze modellen slechts waarschijnlijke antwoorden voorspellen en deze niet kunnen toetsen aan betrouwbare bronnen. Aangezien ze worden aangemoedigd om nuttige antwoorden te geven, proberen ze dat ook te doen als ze de gevraagde informatie niet hebben.

Hallucinatie is een probleem dat wordt besproken door AI-veiligheidsonderzoekers, die vrezen dat AI-systemen onbedoeld verkeerde informatie kunnen verspreiden.

Large language model (LLM)

Een large language model (LLM) of groot taalmodel is een neuraal netwerk met een groot aantal (meestal miljarden) parameters, waarbij grote hoeveelheden tekst worden gebruikt als trainingsdata. Het is momenteel een zeer populaire benadering van onderzoek naar natural language processing (NLP).

LLM’s worden eerder getraind voor algemene doeleinden dan voor specifieke taken. Ze blijken goed te functioneren vanwege de grote hoeveelheden data die bij hun training worden gebruikt, vertonen diverse emergent behaviors en kunnen zeer geavanceerde reacties produceren.

Het populairste type LLM op dit moment is de generative pre-trained transformer (GPT), die wordt gebruikt voor de populaire chatbot ChatGPT.

Machine learning (ML)

Machine learning (ML) is een onderzoeksgebied dat zich richt op de vraag hoe machines kunnen “leren” (d.w.z. steeds geavanceerdere taken kunnen uitvoeren). Het gaat om het gebruik van algoritmen die in interactie met trainingsdata geheel autonome beslissingen en voorspellingen maken.

Een momenteel populaire benadering van ML is deep learning, waarbij neurale netwerken worden gebruikt die uit meerdere lagen bestaan.

Machine translation

Machine translation of machinevertaling is het gebruik van software om tekst of spraak tussen talen te vertalen. Deze apps, zoals Google Translate en DeepL, maken meestal gebruik van neurale netwerken.

Op een basisniveau kan dit proces bestaan uit het vervangen van een woord in de ene taal door zijn equivalent in een andere taal. Maar voor betere resultaten moeten automatische vertaalsystemen rekening houden met de zinsbouw van de twee talen en de context waarin elk woord voorkomt, zodat ze tot de meest waarschijnlijke vertaling kunnen komen.

Midjourney

Midjourney is een generative AI-systeem dat beelden produceert als reactie op prompts van de gebruiker. Het is ontwikkeld en uitgebracht door het in San Francisco gevestigde bedrijf Midjourney, Inc. Het is momenteel in open bèta.

Net als DALL-E en andere AI-beeldgeneratoren is Midjourney het onderwerp geweest van zowel lof als kritiek, waarbij sommigen beweren dat de app kan worden gebruikt om deepfakes te maken of dat het het werk van menselijke kunstenaars plagieert, terwijl anderen de creatieve mogelijkheden en de toegankelijkheid van de tool benadrukken.

Natural language processing (NLP)

Natural language processing (NLP) of natuurlijke taalverwerking is het onderzoek naar hoe AI-systemen kunnen worden gebruikt om menselijke taal te verwerken en te genereren.

Momenteel ligt de nadruk op neurale netwerken en large language models (LLM’s), die een groot potentieel hebben om vloeiende tekst te genereren in antwoord op prompts van de gebruiker (zoals bij ChatGPT het geval is).

Neuraal netwerk

Een neuraal netwerk is een computersysteem dat is gebaseerd op de structuren van menselijke en dierlijke hersenen. Ze worden kunstmatige neurale netwerken (artificial neural networks, ANNs) genoemd om ze te onderscheiden van de biologische neurale netwerken waaruit de hersenen bestaan.

Een neuraal netwerk bestaat uit een verzameling kunstmatige “neuronen” (gebaseerd op de neuronen in biologische hersenen) die signalen zenden en ontvangen naar andere neuronen in het netwerk. Door deze structuur kan het netwerk geleidelijk leren om taken nauwkeuriger uit te voeren.

Neurale netwerken zijn essentieel voor large language models (LLMs) en andere manieren van deep learning.

OpenAI

OpenAI is een groot AI-onderzoeks- en ontwikkelingsbedrijf. Het heeft populaire tools uitgebracht, waaronder ChatGPT en DALL-E, en het ontwikkelde de generative pre-trained transformer-technologie achter deze tools.

Het bedrijf werd in 2015 opgericht door Ilya Sutskever, Greg Brockman, Sam Altman en Elon Musk (die niet langer betrokken is). De huidige CEO is Sam Altman. OpenAI begon als een non-profit, maar ging in 2019 over naar for-profit.

Parameter

Een parameter is een variabele binnen een AI-systeem die wordt gebruikt om voorspellingen te doen. Hoe geavanceerder het LLM, des te meer parameters het model bevat. Er wordt aangenomen dat GPT-4 enkele honderden miljarden parameters bevat.

Parafraseertool

Een parafraseertool, paraphraser of paraphrasing tool is een soort AI-writer die automatisch een tekst van de gebruiker herschrijft (in andere woorden omzet).

Je kunt de Scribbr parafraseertool, aangedreven door QuillBot, gratis gebruiken.

Perplexity

Perplexity of perplexiteit is een maat voor hoe onvoorspelbaar een tekst is. Een tekst met een hoge perplexity leest eerder onnatuurlijk of onzinnig dan een tekst met een lage perplexity. AI-writers produceren doorgaans teksten met een relatief lage perplexity, omdat de kans dan groter is dat ze zinvol zijn.

Daarom wordt perplexity in combinatie met burstiness gebruikt als een manier voor AI-detectors om AI-teksten van menselijke teksten te onderscheiden. AI-writers kunnen een temperatuurinstelling hebben waarmee de gebruiker tekst met een hogere perplexity kan produceren.

Plagiaat

Plagiaat is het presenteren van andermans woorden of ideeën als die van jezelf. Dit gebeurt bijvoorbeeld als je tekst van een andere schrijver kopieert en als je eigen werk presenteert zonder de bron te vermelden.

Op dit moment is er een hevig debat over de vraag of de tools zelf plagiaat plegen op basis van hun trainingsdata (bijvoorbeeld: stelen AI-beeldgeneratoren het werk van kunstenaars?) en of het niet-vermelde gebruik van AI-writers in academische teksten als plagiaat kan worden beschouwd.

Onderwijsinstellingen zijn nog bezig met de ontwikkeling van een beleid over het gebruik van AI-tools en de eventuele bronvermeldingen. Je kunt ons actuele overzicht van AI-richtlijnen per onderwijsinstelling raadplegen.

Programmeren

Programmeren is het geven van instructies aan een computer in de vorm van programma’s die bestaan uit computercode. Deze code kan zijn opgesteld in verschillende programmeertalen, zoals C++ of Python. Computerprogramma’s maken vaak gebruik van algoritmen.

Prompt

Een prompt is de (tekstuele) input van de gebruiker waarop een generatief AI-model (zoals ChatGPT) reageert. De ontwikkeling van duidelijke prompts die nuttige resultaten opleveren en ongewenste uitkomsten vermijden wordt prompt engineering genoemd.

QuillBot

QuillBot is een bedrijf dat bekend staat om zijn krachtige paraphraser. Het biedt ook veel andere AI-tools aan, zoals een spellingchecker, samenvatter en plagiaatchecker.

QuillBot is verbonden met Scribbr via ons gemeenschappelijke moederbedrijf, Learneo. De QuillBot-technologie drijft ook de Scribbr Parafraseertool en de Scribbr Grammatica Check aan.

Reinforcement learning from human feedback (RLHF)

Reinforcement learning from human feedback (RLHF) is een methode voor machine learning (ML) die wordt gebruikt bij de ontwikkeling vanlarge language models(LLM’s).

Er wordt gebruikgemaakt van menselijke feedback om een “beloningsmodel” op te stellen dat vervolgens automatisch de reacties van het systeem optimaliseert. Het werd gebruikt bij de ontwikkeling van ChatGPT om de reacties van het model te verfijnen voordat het werd uitgebracht.

Robot

Een robot is een machine die automatisch (soms autonoom) handelingen kan verrichten. Robots bevatten meestal computersystemen die zijn geprogrammeerd om hun taken te kunnen uitvoeren. Onderzoek naar en de ontwikkeling van robots wordt robotica genoemd.

Robots worden vaak gebruikt in een industriële context, zoals in fabrieken, om repetitieve werkzaamheden te verrichten (waardoor taken die vroeger door mensen werden gedaan kunnen worden geautomatiseerd).

Temperatuur

Temperatuur is een parameter in LLMs, zoals GPT-4. Meestal wordt de optie gegeven om een waarde tussen 0 en 1 te kiezen, waarmee je mate van willekeur in de output bepaalt.

  • Bij een relatief lage temperatuur zal het model waarschijnlijk voorspelbare, maar samenhangende, tekst produceren en zeer vergelijkbare antwoorden geven als je je vraag herhaalt.
  • Bij een hogere temperatuur heeft het model de neiging tekst te produceren die minder voorspelbaar is en mogelijk meer fouten bevat. Bij zeer hoge temperaturen produceert een LLM vaak onzin.

Voor hulpmiddelen als ChatGPT staat de temperatuurinstelling meestal standaard rond de 0,7: hoog genoeg om onvoorspelbare antwoorden te geven, maar laag genoeg om geen onzin te genereren.

Trainingsdata

De trainingsdata van een AI-systeem zijn de data (e.g., tekst, afbeeldingen) die zijn gebruikt om het systeem te trainen. Bij machine learning (ML) wordt het systeem gewoonlijk getraind op een grote hoeveelheid gegevens om patronen te herkennen en te leren om gewenste reacties te produceren.

Gesprekken met gebruikers in tools als ChatGPT kunnen worden gebruikt als trainingsdata voor toekomstige modellen.

Token

Een token is de basiseenheid van tekst die door een large language model (LLM) wordt verwerkt. Vaak is het een volledig woord, maar het kan ook een deel van een woord zijn, of een leesteken.

LLMs produceren tekst door herhaaldelijk te voorspellen welk token als volgende moet komen op basis van patronen die ze op basis van de trainingsdata hebben geleerd. Het is bijvoorbeeld zeer waarschijnlijk dat het volgende token na de tekst “Ik kon afgelopen niet in slaap komen afgelopen …” het woord “nacht” is.

LLMs kiezen echter niet altijd het token met de hoogste waarschijnlijkheid, omdat dit een hele repetitieve tekst zou opleveren die niet menselijk lijkt. In plaats daarvan hebben ze een temperatuurinstelling die beïnvloedt hoe waarschijnlijk het is dat ze bijvoorbeeld in elk geval het derde meest waarschijnlijke token kiezen. Daarom kunnen AI-writers verschillende antwoorden geven op één enkele vraag.

Turing-test

De Turing-test (ook wel imitation game genoemd) is een test die is uitgevonden door de computerwetenschapper Alan Turing in 1950. Hij is ontworpen om te testen of een machine in staat is om ogenschijnlijk menselijke intelligentie te vertonen.

De test omvat een menselijke beoordelaar die tekstuele gesprekken voert met een machine en een mens, zonder te weten wie wie is. De beoordelaar moet proberen vast te stellen wie een machine is en wie een mens. Als geen betrouwbaar onderscheid kan worden gemaakt tussen de twee, is de machine geslaagd voor de test.

Het “slagen voor de Turing-test” is onder liefhebbers van AI een norm geworden waaraan AI-systemen zouden moeten voldoen, maar AI-onderzoekers aanvaarden de test zelf niet als een betrouwbare, wetenschappelijke maatstaf voor intelligentie. Ook wordt de test bekritiseerd in andere gedachte-experimenten, zoals de Chinese kamer.

Veelgestelde vragen over AI en ChatGPT

Hoe kan ik AI tools gebruiken?

AI tools (of AI writing tools) kunnen voor verschillende taken worden gebruikt.

Generatieve AI tools (zoals ChatGPT) genereren tekst op basis van menselijke input (of prompts) en kunnen worden gebruikt voor interactief leren, het geven van feedback of het genereren van je onderzoeksvragen of je scriptiestructuur.

Daarnaast kunnen deze tools worden gebruikt om tekst te parafraseren of samen te vatten of om grammatica- en interpunctiefouten op te sporen. Hier zijn ook specifiekere tools voor, zoals Scribbrs gratis parafraseertool, Scribbrs samenvatter en Scribbrs Grammatica Check.

Hoe werkt ChatGPT?

ChatGPT is een chatbot gebaseerd op een large language model (LLM). Deze modellen worden getraind op basis van enorme datasets die bestaan uit honderden miljarden woorden tekst, waardoor het model leert om effectief natuurlijke reacties te voorspellen op de prompts die je invoert.

ChatGPT is daarnaast ook verfijnd via een proces dat reinforcement learning from human feedback (RLHF) heet, waarbij het model wordt “beloond” voor nuttige antwoorden en ongepaste antwoorden worden ontmoedigd, zodat het minder fouten maakt.

In wezen baseert ChatGPT de respons door te voorspellen wat het meest waarschijnlijke antwoord is op basis van de trainingsdata en het beloningssysteem. In feite is ChatGPT dus een extreem geavanceerde versie van een tool die tekst voorspelt. Dit is ook een van de beperkingen van ChatGPT: aangezien de antwoorden gebaseerd zijn op waarschijnlijkheden, zijn ze niet altijd betrouwbaar.

Is ChatGPT een betrouwbare bron?

Nee, ChatGPT is geen betrouwbare bron voor feitelijke informatie en je kunt beter niet verwijzen naar de tool bij wetenschappelijk onderzoek. Hoewel de chatbot probeert nauwkeurige en correcte antwoorden te geven, zit de tool er vaak naast omdat de antwoorden gebaseerd zijn op patronen in plaats van feiten en data.

De CRAAP-test om de betrouwbaarheid van bronnen te evalueren maakt gebruik van vijf criteria: recentelijkheid, relevantie, autoriteit, accuraatheid en doel. ChatGPT voldoet aan minstens drie daarvan niet:

  • Recentelijkheid: De dataset waarop ChatGPT is getraind stopt bij 2021, waardoor de data enigszins verouderd zijn.
  • Autoriteit: Het is slechts een taalmodel en daarmee geen betrouwbare bron van feitelijke informatie.
  • Accuraatheid: De tool baseert de antwoorden eerder op patronen dan op bewijs en kan geen bronnen citeren ter ondersteuning.

Je kunt ChatGPT dus beter niet aanhalen als betrouwbare bron voor een feitelijke bewering. Je kunt wel naar ChatGPT verwijzen om andere redenen, bijvoorbeeld als je een prompt hebt gebruikt voor je onderzoek.

Citeer dit Scribbr-artikel

Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.

Merkus, J. (2023, 23 mei). Begrippenlijst van AI-termen | Afkortingen & Terminologie. Scribbr. Geraadpleegd op 18 juni 2024, van https://www.scribbr.nl/ai-tools-gebruiken/ai-termen-begrippenlijst/

Wat vind jij van dit artikel?
Julia Merkus

Julia heeft onder andere een bachelor in Nederlandse Taal en Cultuur en twee masters in Linguistics en Taal- en Spraakpathologie. Na enkele jaren als editor, onderzoeker en docent schrijft ze nu artikelen over scripties, taalkunde, methodologie en statistiek om studenten te helpen.