Recente Test Toont Aan Dat ChatGPT-4 Goed Genoeg Is Om De Meeste Mensen Te Misleiden

Recente Test Toont Aan Dat ChatGPT-4 Goed Genoeg Is Om De Meeste Mensen Te Misleiden

Recente Test Toont Aan Dat ChatGPT-4 Voldoende Is Om De Meeste Mensen Te Misleiden

Onderzoekers hebben al een tijdje voorspeld dat AI-tools zoals ChatGPT zich voldoende zullen ontwikkelen om als mens door te gaan. Nu lijkt het erop dat GPT-4 dit punt heeft bereikt, aangezien het erin slaagt om een aanzienlijk deel van de mensen te misleiden.

De Universiteit van Californië, San Diego, heeft in een nieuw onderzoek geconcludeerd dat GPT-4 de eerste grote taalmodel (LLM) is die volledig de Turing-test doorstaat. In hun experiment met 500 deelnemers, bleek dat meer dan 50% van de mensen niet kon onderscheiden of ze met een mens of met de op GPT-4 gebaseerde chatbot spraken.

Bron Onderzoekspapier

In dit experiment werden deelnemers gevraagd om een vijf minuten durend tekstgesprek te voeren met ofwel een mens, ofwel een chatbot en vervolgens werd hen gevraagd of ze dachten dat ze met een mens of een AI aan het praten waren.

Uit de resultaten bleek dat 54% van de deelnemers geloofde dat ze met een mens spraken, terwijl ze in werkelijkheid met OpenAI's ChatGPT-4 aan het communiceren waren.

De Turing-test werd in de jaren 1950 bedacht door de computerwetenschapper Alan Turing. In de oorspronkelijke test stelde Turing drie 'spelers' voor: een menselijke ondervrager, een getuige van onbepaalde menselijkheid of machinaal karakter, en een menselijke waarnemer. Het team van de UC San Diego heeft deze formule aangepast door de derde menselijke waarnemer weg te laten en een extra getuige toe te voegen.

In het UC San Diego-experiment moesten de deelnemers praten met een mens, GPT-4, GPT-3.5 en ELIZA, een chatbot uit de jaren 1960. Het onderzoeksteam voorspelde dat de deelnemers ELIZA gemakkelijk zouden herkennen, maar dat ze bij de nieuwere modellen slechts in ongeveer 50% van de gevallen succesvol zouden zijn in het onderscheiden van mens en machine. Deze hypothese werd bevestigd.

Slechts 22% van de deelnemers dacht dat ELIZA een mens was, terwijl 50% geloofde dat GPT-3.5 echt was, vergeleken met de 54% die geloofde dat GPT-4 menselijk was.

De paper is nog in beoordeling, maar heeft al steun gekregen van Ethereum-medeoprichter Vitalik Buterin, die zegt dat dit onderzoek "telt als het doorstaan van de Turing-test door GPT-4."

We kunnen dus binnenkort allemaal aan boord stappen, of met onze fakkels zwaaien. Hoe dan ook, deze ontwikkeling toont de vooruitgang in AI aan en hoe dichtbij we zijn om deze technologie als menselijk aan te zien.

Als je van dit verhaal genoten hebt, bekijk dan ook wat er gebeurde toen iemand ChatGPT $100 gaf om zoveel mogelijk geld te verdienen. Het resultaat was precies zoals je zou verwachten.

Schrijf je in voor onze nieuwsbrief om op de hoogte te blijven van de laatste ontwikkelingen in AI.

Bron

Abonneer je op onze nieuwsbrief:

Inschrijven

Terug naar blog