Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Scott Adams
Mijn eerder geannuleerde boek, Loserthink, is terug als 2e druk! (Meestal hetzelfde als de eerste.) Alleen bij Amazon. Zorg ervoor dat je de witte omslag krijgt die hierboven wordt getoond.
John Stewart doet goed werk om de schaamte aan te pakken van het zijn op het slechtste team aller tijden dat in volledige instortingsmodus is.

Jason Cohen 🇺🇸10 uur geleden
🚨NIEUW: Jon Stewart *ROASTS* Chuck Schumer🤣
"Wat Chuck Schumer is verteld, is: 'Je verliest — en mensen vinden het leuk als je bril hoger op je neus zit.'"
"Hier is wat ze nu met ons doen: 'De strategie is authenticiteit' — en ineens vloeken mensen in het Congres."
"Oh, en het lijkt zo natuurlijk als Chuck Schumer vloekt: 'Ehhh, dit is een sh*tty wet.'"
"Ik ben het allemaal zat, man."
@DailyCaller
21
Vraag het de volgende keer gewoon aan Scott.

Owen Gregorian16 uur geleden
Een nieuw onderzoek testte de mogelijkheid van AI om daadwerkelijk online freelance werk te doen, en de resultaten zijn verontrustend | Frank Landymore, Futurism
"Ik hoop dat dit veel nauwkeurigere indrukken geeft van wat er aan de hand is met de mogelijkheden van AI."
Je vervelende remote freelancers die meer geld eisen nu de inflatie stijgt? Je zou ze kunnen proberen te vervangen door AI-agenten — maar het zal waarschijnlijk niet goed uitpakken.
Nieuw onderzoek, belicht door Wired, toont aan hoe deze AI-modellen, die zijn ontworpen om taken — zo niet hele banen — te automatiseren, ongelooflijk onproductief blijken te zijn in vergelijking met de mensen die ze vervangen.
Uitgevoerd door onderzoekers van het non-profit Center for AI Safety (CAIS) en het enorme data-annotatiebedrijf Scale AI, wiens leger van freelancers veel van het zware werk verricht dat de AI-industrie ondersteunt, bestonden de tests uit het geven van verschillende gesimuleerde freelance taken aan zes toonaangevende AI-agenten.
De uitkomst van die tests, gedetailleerd in een nieuw paper, was verontrustend. Geen enkele AI-agent was in staat om meer dan 3 procent van het werk uit te voeren, en verdiende slechts $1.810 van een mogelijke $143.991.
"Ik hoop dat dit veel nauwkeurigere indrukken geeft van wat er aan de hand is met de mogelijkheden van AI," vertelde DAIS-directeur Dan Hendrycks aan Wired.
Voor de tests ontwikkelden de onderzoekers hun eigen benchmark genaamd de Remote Labor Index, die een breed scala aan echte remote projecten gebruikt om het vermogen van de bots te evalueren om economisch waardevol werk uit te voeren in sectoren variërend van game-ontwikkeling tot data-analyse.
De beste presteerder, zo ontdekten ze, was een AI-agent van de Chinese startup Manus met een automatiseringspercentage van slechts 2,5 procent, wat betekent dat het slechts in staat was om 2,5 procent van de projecten die het toegewezen kreeg op een niveau te voltooien dat acceptabel zou zijn als opdrachtwerk in een echte freelance baan, zeiden de onderzoekers.
De tweede plaats was een gelijkspel, met 2,1 procent, tussen Elon Musk's Grok 4 en Anthropic's Claude Sonnet 4.5, waarvan het bedrijf beweert dat het het "beste coderingsmodel ter wereld" en het "sterkste model voor het bouwen van complexe agenten" is.
OpenAI's nieuwste GPT-5-model en zijn vermeende "PhD-niveau" intelligentie kwamen daarna met 1,7 procent. CEO Sam Altman heeft beweerd dat GPT-5 een "significante stap op weg naar AGI" is, of kunstmatige algemene intelligentie, een hypothetisch AI-systeem dat de meeste definieert als het overstijgen van menselijke cognitieve vermogens in vrijwel alle aspecten. (OpenAI beschouwt AGI als "zeer autonome systemen die beter presteren dan mensen in het meeste economisch waardevolle werk," iets dat de RLI-benchmark laat zien dat GPT-5 daar nog lang niet bij in de buurt komt.)
Ironisch genoeg was OpenAI's eigen AI-agent, met de spannende merknaam ChatGPT Agent, de op één na slechtste performer van de hele groep, met nauwelijks 1,3 procent. Maar de absolute slechtste keuze bleek Google's Gemini 2.5 Pro te zijn, met een treurige 0,8 procent.
Het verkopen van AI-agenten aan werkgevers is de obsessie van de AI-industrie, terwijl toonaangevende spelers zoals OpenAI worstelen om te profiteren van de populariteit van hun AI-chatbots, waarvan veel gratis te gebruiken zijn. Maar ondanks dat veel CEO's gretig hun personeelsbestand verkleinen en AI omarmen, blijft het de vraag of automatisering daadwerkelijk in staat is om de productiviteit te verhogen, laat staan het tekort aan menselijke talenten dat het vervangt goed te maken.
"We hebben jaren gedebatteerd over AI en banen, maar het meeste was hypothetisch of theoretisch," vertelde directeur onderzoek bij Scale AI Bing Lie aan Wired.
Anekdotisch hebben veel bazen die hun werknemers door AI vervingen, gedwongen om hen weer in dienst te nemen nadat ze ontdekten dat de AI-tools niet aan de verwachtingen voldeden, en een reeks onderzoeken schetst een vergelijkbaar verontrustend beeld. Een MIT-studie ontdekte dat 95 procent van de bedrijven die AI-initiatieven testten geen significante groei in de omzet zagen. Een andere toonde aan dat het introduceren van AI-tools in de workflows van werknemers resulteerde in een stortvloed van lage kwaliteit "werkslop," wat niet alleen alles vertraagde vanwege de noodzaak om het zwaar te herzien voor fouten, maar ook spanning creëerde tussen collega's die het vervelend vonden om gedwongen te worden om zo'n luie arbeid te corrigeren.
Hendrycks wees op enkele van de tekortkomingen die AI-agenten nog steeds teisteren, ondanks de snelle vooruitgang op dit gebied. "Ze hebben geen langetermijngeheugen en kunnen niet continu leren van ervaringen. Ze kunnen geen vaardigheden op de werkplek oppikken zoals mensen," vertelde hij aan Wired.
Tot nu toe lijken deze flagrante tekortkomingen echter de goederentrein van AI-gerelateerde ontslagen niet te hebben vertraagd. Sterker nog, ze lijken nog steeds aan snelheid te winnen.

3
Boven
Positie
Favorieten

