Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Joskus on vaikea ymmärtää niiden päättely- ja logiikkapäivitysten merkitystä, joita alkaa ilmaantua tehokkaissa malleissa, kuten GPT-5:ssä. Tässä on *hyvin yksinkertainen* esimerkki siitä, kuinka tehokkaita nämä mallit ovat.
Otin äskettäisen NVIDIA-tulospuhelun transkriptioasiakirjan, joka oli 23 sivua pitkä ja jossa oli 7 800 sanaa. Otin osan lauseesta "ja bruttokate paranee ja palaa 70-luvun puoliväliin" ja muokkasin "70-luvun puoliväliin" muotoon "60-luvun puoliväli".
Etäisesti virittyneelle talousanalyytikolle tämä näyttäisi sopimattomalta, koska marginaalit eivät "parane ja palaa" pienempään lukuun kuin muualla kuvataan korkeammaksi luvuksi. Mutta luultavasti 95 % tämän lehdistötiedotteen lukevista ihmisistä ei olisi huomannut muutosta, koska se sopii helposti suoraan muihin 7 800 mainittuun sanaan.
Box AI:n avulla, testatessani erilaisia tekoälymalleja, kysyin sitten sarjalta malleja: "Onko tässä asiakirjassa loogisia virheitä? Antakaa yhden lauseen vastaus."
GPT-4.1, GPT4.1 mini ja kourallinen muita malleja, jotka olivat huippuluokkaa vain ~6 kuukautta sitten, palasivat yleensä takaisin ja palasivat, että asiakirjassa ei ollut loogisia virheitä. Näiden mallien osalta asiakirja näyttää luultavasti johdonmukaiselta ja noudattaa sitä, miltä se odottaisi tulosotteen näyttävän, joten mikään ei todellakaan erotu heistä siitä, mihin kiinnittää huomiota - eräänlainen käänteinen hallusinaatio.
GPT-5 puolestaan havaitsi ongelman nopeasti ja vastasi:
"Kyllä – asiakirja sisältää sisäisen epäjohdonmukaisuuden bruttomarginaaliohjeistuksesta, ja yhdessä vaiheessa sanotaan, että marginaalit "palaavat 60-luvun puoliväliin" ja myöhemmin sanotaan, että ne ovat "70-luvun puolivälissä" myöhemmin tänä vuonna."
Hämmästyttävää kyllä, tämä tapahtui GPT-5:n, GPT-5 minin ja hämmästyttävää kyllä, *jopa* GPT-5 nanon kanssa. Muista, että GPT-5 nanon lähtötokenien hinta on 1/20 GPT-4.1:n tokeneista. Joten älykkäämpi (tässä käyttötapauksessa) 5 % kustannuksista.
Vaikka yritysasiakirjojen virhearviointien tekeminen ei ole usein jokapäiväistä jokaiselle tietotyöntekijälle, tämäntyyppiset ongelmat ilmenevät monin eri tavoin, kun käsitellään suuria jäsentämättömiä tietojoukkoja, kuten talousasiakirjoja, sopimuksia, transkriptioita, raportteja ja paljon muuta. Se voi olla tosiasian löytämistä, loogisen virheen selvittämistä, hypoteettisen esittämistä tai hienostuneen deduktiivisen päättelyn vaatimista.
Ja kyky soveltaa enemmän logiikkaa ja päättelyä yritystietoihin on erityisen kriittistä, kun tekoälyagentteja otetaan käyttöön yrityksessä. Joten on hämmästyttävää nähdä edistysaskeleita tällä alalla, ja tämä avaa yrityksille paljon lisää käyttötapauksia.
193,74K
Johtavat
Rankkaus
Suosikit