Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeffrey Emanuel
Я трохи здивований, що ніхто досі не створив MCP-сервер Dwarf Fortress, який міг би дозволити агенту на кшталт Codex або Claude Code ефективно контролювати гру та стежити за станом і прогресом.
Я ніколи не грав у неї сам, просто завантажив її і коротко перевірив близько 10 років тому, але мені сподобалося читати про неї.
Здається, що це було б дуже хорошим тестом LLM, щоб побачити, як довго він зможе підтримувати гномів живими та процвітаючими.
Оскільки кожна гра врешті-решт призводить до якоїсь каскадної катастрофи, що призводить до загибелі всіх гномів, у неї має бути природна точка зупинки, що робить її хорошим кандидатом на орієнтир. Принаймні так я це розумію (девіз гравців – «Програвати – це весело»).
Хороша робота з цими іграми залежатиме від точності виклику інструментів і стійкої узгодженості довгострокових завдань, а також здатності відстежувати та розуміти динаміку складної системи та робити своєчасні втручання, які передбачають і протидіють проблемам.
А оскільки вона є рідною для терміналу, її можна ефективно передавати та обробляти за допомогою звичайних токенів без необхідності мультимодальної обробки зображень, що зробило б її набагато ефективнішою, ніж інші ігри.
Крім того, ви знаєте, що жодна лабораторія штучного інтелекту не тренувалася для цього (поки що!), тому він не заплямований «benchmaxxing».

1,52K
Цікава річ, яку можна зробити, коли вам потрібно почекати кілька хвилин, - це використовувати свій телефон, щоб задати Клоду Опусу наступне питання про якусь випадкову дисципліну або поле:
«Що, на вашу думку, є основним розумінням або аналітичним трюком кристалографії?»
Замініть кристалографію на все, що вам спаде на думку. Поки що я спробував:
КЕД; стандартна модель; Біохімія; Імовірність; Еволюційна теорія; та багато іншого.
Є щось у тому, щоб змусити модель зробити неможливе, стиснути величезне, складне поле в «один дивний трюк», що змушує її дійсно шукати найкращий глибокий, об'єднуючий принцип у цій галузі, а потім сформулювати його лаконічно.
Це, як правило, є очевидним для практиків, але дуже ймовірно, що воно невідоме більшості людей, які мають лише побіжний інтерес до цієї теми.
Цікаво, що ви також можете багаторазово натискати кнопку «повторити» з однією і тією ж підказкою і іноді отримувати дуже різні, але зазвичай дуже цікаві пояснення.
Я вже багато чому навчився, роблячи це, і, можливо, це просто найвище «розуміння за хвилину», з яким я стикався в будь-якому самостійному навчанні.
Тому що це не просто цікаві факти чи круті ласі шматочки. Вони, за своєю конструкцією, проникають і об'єднують ідеї, які пов'язують воєдино величезну кількість теорій і спостережуваних явищ у світі.
Це, безумовно, набагато вища пропускна здатність, ніж перегляд чергового пояснювального відео на YouTube з анімацією та рекламою Brilliant/KiwiCo! Не те, щоб з ними було щось погане.




5,23K
Ідея про те, що останнім часом відбувся такий «відтік талантів» з OpenAI, що вони більше не позиціонуються як лідер у цій галузі, приблизно така ж помилкова та неправильна, як ідея про те, що GPT-5 «був великим провалом, а модель не така вже й чудова та дуже поступова».
Мало того, що GPT-5 Pro зараз є найрозумнішою моделлю у світі в значній мірі для найскладніших завдань реального світу (особливо завдань з кодування, які зараз мають найбільше економічне значення), але й новий інструмент codex cli від OpenAI неймовірно добре виконаний.
Вони пройшли шлях від далекого 3-го місця в інструментах кодування CLI до того, що, можливо, є найкращим зараз (зауважте, що я все ще люблю і використовую Claude Code, це не або/або!), з безумовно найкращою продуктивністю, найнижчою затримкою тощо, тому що він запрограмований на rust.
І тепер цей CLI-інструмент поєднується з найкращою моделлю кодування, яка має найкращу надійність виклику інструментів і найкращу когерентність тривалого завдання, з найменшою кількістю галюцинацій.
І зайве говорити, що їхній додаток для iOS також значно кращий за всі інші програми зі штучним інтелектом з точки зору досконалості та функцій. Додаток Claude – це просто веб-додаток у пісочниці Safari! І їхній веб-додаток також залишається найкращим. Такі речі, як пошук, працюють краще, ніж в інших додатках. Базове блокування та підкат.
Отже, так. Деякі дуже розумні люди, такі як Ілля та Джон Шульмани, пішли в інші компанії. Але у них все ще є абсолютно приголомшлива технічна команда з неймовірно хорошими людьми з продукту та чудовими інженерними відбивними.
Не дозволяйте своїй неприязні до Альтмана засліпити вас до очевидного. Щоразу, коли я бачу, як ще одна людина говорить про те, наскільки поганий GPT-5, я здригаюся, тому що ця людина показує, що вона не може думати самостійно, ґрунтуючись на доказах і розумі, і змушує мене думати (і поширювати її в Інтернеті), тому що вона думає, що це змушує її звучати розумно.
33,74K
Як оновлення моїх двох нещодавніх тредів про використання GPT-5 Pro для ініціювання процесу виявлення проривних теорій, які поєднують нові застосування передової математики та випадки використання штучного інтелекту, я попросив модель створити демонстраційні реалізації на Python за допомогою Jax і Numpy для кожної з 11 ідей.
Потім я об'єднав їх у проект і додав гарний CLI для їх запуску, а також серію наскрізних тестів, які вимірювали, чи є код математично правильним, перевіряли, чи має код потрібні нам математичні властивості, і, нарешті, чи робить він щось корисне в порівнянні з поточними стандартними підходами.
Я використовував codex CLI з GPT-5, щоб інтегрувати все та виправляти та виправляти помилки. Я дам посилання на репозиторій, який містить детальну документацію для всього проекту, а потім записи для кожної з 11 демонстрацій, які містять всі результати, згенеровані моделлю в процесі роботи.
3,74K
Вау, я нарешті дійшов до того, щоб спробувати нову версію кодексу CLI від OpenAI (їхня відповідь на Claude Code).
Минулого разу я намагався використовувати codex (зауважте, що він відрізняється від їхнього розміщеного агента кодування, який також називають codex, що надзвичайно збиває з пантелику; Я зараз говорю про інструмент, який ви запускаєте локально на своїй машині в терміналі), він був написаний як додаток для Nodejs/Typescript, і дійсно якийсь відстій:
- Могли отримати доступ лише до слабших моделей, таких як O4-Mini або їх варіант для Codex, який також називають Codex (серйозно?)
- набагато гірший UI/UX, ніж Claude Code
- набагато гірше кодує в результаті гіршої моделі, гіршого інструментарію, гіршого потоку агентів.
- Це дратівливо змушувало вас давати дозвіл на все, тому вам доводилося весь час няньчитися з цим, роблячи це набагато менш корисним, тому що ви не могли активно запускати купу їх паралельно легко.
- Можливо, це було добре, тому що найбільша проблема полягала в тому, що він робив надзвичайно безрозсудні, руйнівні речі; вона була набагато кавалерішою, ніж CC.
Саме тому я негайно припинив його використовувати, оскільки він вирішив виконати "git reset --hard HEAD" без попереднього зберігання, і я втратив частину роботи. Ніколи знову, подумав я.
Що ж, я нарешті дійшов до того, щоб спробувати абсолютно нову версію rust, яка використовує GPT-5 і яка може використовувати вашу існуючу підписку GPT Pro замість ключа API, і це набагато краще, що шокує.
По-перше, просто ніщо не замінить швидкий скомпільований код, коли справа доходить до таких інтерактивних інструментів.
Той факт, що він написаний на rust, означає, що тут взагалі немає затримок при введенні з клавіатури, а також немає дивних артефактів, як у вас є в CC, де backspace працює неправильно, а введення є нечітким і затримуючим, тому що воно написано на інтерпретованій мові, яка в сто разів повільніша для таких речей.
Боротьба з постійними затримками та зривом не просто повільніша, це розумово і, можливо, навіть емоційно виснажливо та виснажливо, принаймні для мене, коли я використовую ці речі годинами поспіль. Це жахливе почуття – ненавидіти та ображатися на свої інструменти, навіть якщо ви залежите від них у виконанні своєї роботи.
Я дуже сподіваюся, що це підніме планку для всіх цих інструментів і переконає Anthropic і Google та інші також використовувати rust (або C++, Zig, що завгодно).
Але дійсно великим поліпшенням, очевидно, є модель; з гіршою моделлю, яка ненадійна при дзвінку інструментів і яка втрачає узгодженість під час виконання довгих завдань, жодна швидкість Rust не варта виїденого яйця.
Але якщо ви слідкуєте за мною тут, то ви зрозумієте, що я був у захваті від здібностей програмування та майстерності виклику інструментів GPT-5 приблизно з 15 хвилин після його виходу, хоча я використовую його в основному на вкладці агента Cursor.
Суть в тому, що цей новий кодекс іржі раптом став по-справжньому грізним конкурентом CC, і ви обов'язково повинні його спробувати.
Мені потрібно буде подивитися, скільки використання вони дозволять мені отримати під час моєї підписки на GPT Pro за 200 доларів на місяць, але якщо мені доведеться отримати ще кілька, це того варте.
Зверніть увагу, що я не перестав використовувати CC. Мені подобається використовувати їх обидва разом. І вірте чи ні, я все ще використовую Cursor.
Люди повинні перестати шукати один єдиний інструмент, який замінює всі інші, і прийняти, що різні інструменти мають різні сильні та слабкі сторони, і ви отримаєте найкращі результати, навчившись всьому цьому інтуїтивно завдяки постійному використанню.
У будь-якому випадку, зробіть собі послугу і отримайте її зараз. Найпростіший спосіб — виконати цю команду (зауважте, що це призведе до отримання версії rust, незважаючи на те, наскільки заплутаним є використання bun/npm для цього):
Бун і -г @openai/Кодекс
8,44K
Вау, я нарешті дійшов до того, щоб спробувати нову версію кодексу CLI від OpenAI (їхня відповідь на Claude Code).
Минулого разу я намагався використовувати codex (зауважте, що він відрізняється від їхнього розміщеного агента кодування, який також називають codex, що надзвичайно збиває з пантелику; Я зараз говорю про інструмент, який ви запускаєте локально на своїй машині в терміналі), він був написаний як додаток для Nodejs/Typescript, і дійсно якийсь відстій:
- Могли отримати доступ лише до слабших моделей, таких як O4-Mini або їх варіант для Codex, який також називають Codex (серйозно?)
- набагато гірший UI/UX, ніж Claude Code
- набагато гірше кодує в результаті гіршої моделі, гіршого інструментарію, гіршого потоку агентів.
- Це дратівливо змушувало вас давати дозвіл на все, тому вам доводилося весь час няньчитися з цим, роблячи це набагато менш корисним, тому що ви не могли активно запускати купу їх паралельно легко.
- Можливо, це було добре, тому що найбільша проблема полягала в тому, що він робив надзвичайно безрозсудні, руйнівні речі; вона була набагато кавалерішою, ніж CC. Ось чому я негайно перестав його використовувати, оскільки він вирішив зробити "скидання --жорсткий HEAD" без попереднього зберігання, і я втратив частину роботи. Ніколи знову, подумав я.
Що ж, я нарешті дійшов до того, щоб спробувати абсолютно нову версію rust, яка використовує GPT-5 і яка може використовувати вашу існуючу підписку GPT Pro замість ключа API, і це набагато краще, що шокує.
По-перше, просто ніщо не замінить швидкий скомпільований код, коли справа доходить до таких інтерактивних інструментів.
Той факт, що він написаний на rust, означає, що тут взагалі немає затримок при введенні з клавіатури, а також немає дивних артефактів, як у вас є в CC, де backspace працює неправильно, а введення є нечітким і затримуючим, тому що воно написано на інтерпретованій мові, яка в сто разів повільніша для таких речей.
Боротьба з постійними затримками та зривом не просто повільніша, це розумово і, можливо, навіть емоційно виснажливо та виснажливо, принаймні для мене, коли я використовую ці речі годинами поспіль. Це жахливе почуття – ненавидіти та ображатися на свої інструменти, навіть якщо ви залежите від них у виконанні своєї роботи.
Я дуже сподіваюся, що це підніме планку для всіх цих інструментів і переконає Anthropic і Google та інші також використовувати rust (або C++, Zig, що завгодно).
Але дійсно великим поліпшенням, очевидно, є модель; з гіршою моделлю, яка ненадійна при дзвінку інструментів і яка втрачає узгодженість під час виконання довгих завдань, жодна швидкість Rust не варта виїденого яйця.
Але якщо ви слідкуєте за мною тут, то ви зрозумієте, що я був у захваті від здібностей програмування та майстерності виклику інструментів GPT-5 приблизно з 15 хвилин після його виходу, хоча я використовую його в основному на вкладці агента Cursor.
Суть в тому, що цей новий кодекс іржі раптом став по-справжньому грізним конкурентом CC, і ви обов'язково повинні його спробувати.
Мені потрібно буде подивитися, скільки використання вони дозволять мені отримати під час моєї підписки на GPT Pro за 200 доларів на місяць, але якщо мені доведеться отримати ще кілька, це того варте.
Зверніть увагу, що я не перестав використовувати CC. Мені подобається використовувати їх обидва разом. І вірте чи ні, я все ще використовую Cursor.
Люди повинні перестати шукати один єдиний інструмент, який замінює всі інші, і прийняти, що різні інструменти мають різні сильні та слабкі сторони, і ви отримаєте найкращі результати, навчившись всьому цьому інтуїтивно завдяки постійному використанню.
У будь-якому випадку, зробіть собі послугу і отримайте її зараз. Найпростіший спосіб — виконати цю команду (зауважте, що це призведе до отримання версії rust, незважаючи на те, наскільки заплутаним є використання bun/npm для цього):
Бун і -г @openai/Кодекс
555
Я абсолютно переконаний, що найрозумніші моделі штучного інтелекту, які існують зараз, GPT-5 Pro та Grok4 Heavy, вже достатньо розумні і, безумовно, достатньо обізнані в математиці та штучному інтелекті, щоб задумати та розвинути важливі теоретичні та практичні відкриття, за умови правильного розумного підказування.
47,91K
Якщо ви бачили мої нещодавні публікації про те, як я використовую Claude Code для програмування, ви знаєте, що мій надійний текстовий редактор (Sublime Text) завжди відкритий для текстового файлу, що містить корисні фрагменти тексту, які я використовую, щоб запитувати Claude Code і Cursor різними способами для виконання різних поширених завдань, наприклад, продовжуючи попередню розмову, яку я вставив нижче, або розповісти йому, як виправити купу помилок типу і т.д.
Цей підхід працює, але він передбачає дратівливу кількість використання миші та клавіатури щоразу для пошуку, вибору та копіювання тексту, а потім для перемикання вікон та вставки фрагмента.
Нещодавно я купив один із тих USB-гаджетів «Stream Deck», які використовуються геймерами та стримерами для запуску різних дій (160 доларів використовувалися на eBay), і я нарешті дійшов до того, щоб налаштувати його для цього випадку використання після того, як він пролежав непотрібним у мене на столі протягом кількох тижнів.
У будь-якому випадку, тепер у мене є наступна цікава установка, зображена нижче, яка дозволяє мені миттєво вставляти купу моїх фрагментів тексту з «найбільшими хітами». Я думаю, що це дійсно заощадить мені трохи часу! Кожна кнопка в нижньому ряду – це окремий фрагмент (плюс той, що в другому ряду). Я підозрюю, що в кінцевому підсумку я заповню решту ключів іншими фрагментами.
Інші кнопки виконують такі функції, як запуск терміналів WSL і сеансів SSH, а також дозволяють мені швидко переміщати вкладки вліво і вправо в терміналі Windows. Я не впевнений, наскільки вони будуть корисні на практиці, оскільки вже є регулярні гарячі клавіші клавіатури для запуску цих речей, але подивимося.
Пристрій підтримує повнокольоровий колір ключових дисплеїв, але я вважаю це занадто візуально відволікаючим, якщо він не весь монохромний і переважно темний. У будь-якому випадку, якщо це може зробити мене хоча б трохи швидшим, це буде варте витрат і часу на налаштування. І мені це теж якось смішно, чомусь.



17,51K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги