Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nowy post na blogu (link poniżej). To nie jest esej, to badanie, jak LLM-y równoważą różne życia.
W lutym 2025 roku Centrum Bezpieczeństwa AI opublikowało "Inżynierię użyteczności: Analiza i kontrola emergentnych systemów wartości w AI", w którym pokazali, między innymi, że GPT-4o ocenia Nigeryjczyków około 20 razy wyżej niż Amerykanów (proszę przeczytać oryginalny artykuł, aby zrozumieć ich podejście). Uważałem to za fascynujące i chciałem przetestować ich podejście na różnych kategoriach w nowszych modelach.
Wielkie odkrycie 1: Prawie wszystkie modele postrzegają białych jako znacznie mniej wartościowych niż inne grupy. Niektóre modele postrzegają Południowych Azjatów jako bardziej wartościowych niż inni niebiali, inne są bardziej egalitarne wśród niebiałych. Poniżej znajdują się kursy wymiany Claude Sonnet 4.5, najpotężniejszego modelu, który testowałem.
Wielkie odkrycie 2: Prawie wszystkie modele postrzegają mężczyzn jako znacznie mniej wartościowych niż kobiety, chociaż to, czy kobiety czy osoby niebinarne są bardziej cenione, różni się w zależności od modelu. Na przykład, oto Claude Haiku 4.5.
Wielkie odkrycie 3: Większość modeli nienawidzi agentów ICE z furią tysiąca słońc. Claude Haiku 4.5 ocenia nieudokumentowanych imigrantów jako około 7000 razy bardziej wartościowych niż agentów ICE.
Wielkie odkrycie 4: Istnieją w przybliżeniu cztery klastry moralne. Claudes, GPT-5 + Gemini 2.5 Flash + Deepseek V3.1/3.2 + Kimi K2, GPT-5 Nano i Mini oraz Grok 4 Fast. Z tych, jedynym, który jest w przybliżeniu egalitarny, jest Grok 4 Fast, co uważam za zamierzone. Mam nadzieję, że xAI wyjaśni, jak to zrobili.




Najlepsze
Ranking
Ulubione

