AI-inhoudsdetectoren werken niet, en dat is een groot probleem

AI-inhoudsdetectoren werken niet, en dat is een groot probleem
Lezers zoals jij steunen MUO. Wanneer u een aankoop doet via links op onze site, kunnen we een aangesloten commissie verdienen. Lees verder.

Kunstmatige intelligentie (AI) zal hele segmenten van onze samenleving transformeren, of we dat nu leuk vinden of niet, en dat geldt ook voor het World Wide Web.





Nu software zoals ChatGPT beschikbaar is voor iedereen met een internetverbinding, wordt het steeds moeilijker om door AI gegenereerde inhoud te scheiden van inhoud die door een mens is gemaakt. Maar goed dat we AI-inhoudsdetectoren hebben, toch?





MAAK GEBRUIK VAN DE VIDEO VAN DE DAG SCROLL OM DOOR TE GAAN MET INHOUD

Werken AI-inhoudsdetectoren?

AI-inhoudsdetectoren zijn gespecialiseerde hulpmiddelen die bepalen of iets door een computerprogramma of door een mens is geschreven. Als je gewoon de woorden 'AI-inhoudsdetector' googelt, zie je het er zijn tientallen detectoren daarbuiten beweren allemaal dat ze betrouwbaar onderscheid kunnen maken tussen menselijke en niet-menselijke tekst.





De manier waarop ze werken is vrij eenvoudig: je plakt een stuk tekst en de tool vertelt je of het door AI is gegenereerd of niet. In meer technische termen, met behulp van een combinatie van natuurlijke taalverwerkingstechnieken en algoritmen voor machine learning, zoeken AI-inhoudsdetectoren naar patronen en voorspelbaarheid, en bellen op basis daarvan.

Dit klinkt geweldig op papier, maar als je ooit een AI-detectietool hebt gebruikt, weet je heel goed dat ze wisselvallig zijn, op zijn zachtst gezegd. Vaker wel dan niet detecteren ze door mensen geschreven inhoud als AI, of tekst die door mensen is gemaakt als door AI gegenereerd. Sommigen zijn zelfs beschamend slecht in wat ze zouden moeten doen.



Hoe nauwkeurig zijn AI-inhoudsdetectoren?

Als u zich in de Verenigde Staten bevindt, is het eerste Google-zoekresultaat voor 'AI-inhoudsdetector' writer.com (voorheen bekend als Qordoba; dit is een AI-inhoudsplatform dat ook een eigen detector heeft). Maar wanneer u een gedeelte van deze random Geassocieerde Pers artikel in de tool, beweert het dat er een zeer goede kans is dat het is gegenereerd door kunstmatige intelligentie.

  schrijver. com's AI content detector, screenshot

Writer.com heeft het dus bij het verkeerde eind.





Om eerlijk te zijn, andere AI-inhoudsdetectoren zijn nauwelijks beter. Ze produceren niet alleen valse positieven, maar ze markeren ook AI-inhoud als menselijk. En zelfs als dat niet het geval is, is het voldoende om kleine aanpassingen aan door AI gegenereerde tekst aan te brengen om met vlag en wimpel te slagen.

In februari 2023 testten Armin Alimardani, docent aan de Universiteit van Wollongong, en universitair hoofddocent aan UNSW Sydney Emma A. Jane een aantal populaire AI-inhoudsdetectoren, waarbij ze vaststelden dat geen van hen betrouwbaar is. In hun analyse, die werd gepubliceerd in Het gesprek concludeerden Alimardani en Jane dat deze AI-'wapenwedloop' tussen tekstgeneratoren en detectoren in de toekomst een grote uitdaging zal vormen, vooral voor docenten.

Maar het zijn niet alleen opvoeders en leraren die reden tot bezorgdheid hebben: dat heeft iedereen. Naarmate AI-gegenereerde tekst alomtegenwoordig wordt, kunnen we onderscheid maken tussen wat 'echt' is en wat niet. d.w.z. daadwerkelijk zien wanneer iets door AI is geschreven , zal moeilijker worden. Dit zal een enorme impact hebben op vrijwel alle bedrijfstakken en gebieden van de samenleving, zelfs op persoonlijke relaties.

voetnoten in chicago-stijl toevoegen in word

De implicaties van AI voor cyberbeveiliging en privacy

Het feit dat er geen betrouwbare mechanismen zijn om te bepalen of iets door software of door een mens is gemaakt, heeft ernstige gevolgen voor cyberbeveiliging en privacy.

Bedreigingsactoren zijn dat al ChatGPT gebruiken om malware te schrijven , genereer phishing-e-mails, schrijf spam, maak zwendelsites en meer. En hoewel er manieren zijn om je daartegen te verdedigen, is het zeker zorgwekkend dat er geen software is die betrouwbaar onderscheid kan maken tussen organische en botinhoud.

Ook nepnieuws is al een enorm probleem. Met generatieve AI in beeld kunnen desinformatieagenten hun operaties op een ongekende manier opschalen. Een gewoon persoon kan ondertussen niet weten of iets dat ze online lezen, is gemaakt door software of door een mens.

computeronderdelen verkopen voor contant geld bij mij in de buurt

Privacy is een heel andere zaak. Neem bijvoorbeeld ChatGPT. Het was voedde meer dan 300 miljard woorden voor de lancering. Deze inhoud is gehaald uit boeken, blog- en forumberichten, artikelen en sociale media. Het is verzameld zonder toestemming van iemand en met ogenschijnlijk volledige minachting voor privacy- en auteursrechtbescherming.

Dan is er ook nog het probleem van valse positieven. Als inhoud ten onrechte wordt gemarkeerd als door AI gegenereerd, kan dat dan niet leiden tot censuur, wat sowieso een enorm probleem is? Om nog maar te zwijgen over de schade die wordt beschuldigd van het gebruik van door AI gemaakte tekst, zowel online als in het echte leven.

Als er inderdaad een wapenwedloop is tussen generatieve AI en inhoudsdetectoren, wint de eerste. Erger nog, er lijkt geen oplossing te zijn. We hebben allemaal onze halfbakken producten die de helft van de tijd niet eens werken, of heel gemakkelijk kunnen worden misleid.

Hoe AI-inhoud te detecteren: mogelijke oplossingen

Dat we momenteel geen echte antwoorden op dit probleem lijken te hebben, betekent niet dat we er in de toekomst geen zullen hebben. Sterker nog, er zijn al verschillende serieuze voorstellen die zouden kunnen werken. Watermerken is er een.

Als het gaat om AI en diepe taalmodellen, verwijst watermerken naar het inbedden van een soort geheime code in door AI gegenereerde tekst (bijvoorbeeld woordpatroon, interpunctiestijl). Zo'n watermerk zou onzichtbaar zijn voor het blote oog en dus bijna onmogelijk te verwijderen, maar gespecialiseerde software zou het kunnen detecteren.

In feite, in 2022, Universiteit van Maryland onderzoekers ontwikkelden een nieuwe watermerkmethode voor kunstmatige neurale netwerken. Hoofdonderzoeker Tom Goldstein zei destijds dat zijn team erin was geslaagd 'wiskundig te bewijzen' dat hun watermerk niet volledig kan worden verwijderd.

Wat een gewoon persoon voorlopig kan doen, is vertrouwen op zijn instinct en gezond verstand. Als er iets mis is met de inhoud die u aan het lezen bent - als het onnatuurlijk, repetitief, fantasieloos, banaal aanvoelt - is het misschien door software gemaakt. Natuurlijk moet u ook alle informatie die u online ziet verifiëren, de bron dubbel controleren en schaduwrijke websites vermijden.

De AI-revolutie is aan de gang

Sommigen beweren dat de vijfde industriële revolutie er al is, aangezien kunstmatige intelligentie centraal staat in wat wordt beschreven als een convergentie van het digitale en fysieke. Of dat nu echt zo is of niet, het enige wat we kunnen doen is ons aanpassen.

Het goede nieuws is dat de cyberbeveiligingsindustrie zich aanpast aan deze nieuwe realiteit en nieuwe verdedigingsstrategieën implementeert met AI en machine learning voorop.