Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeffrey Emanuel
Я немного удивлён, что никто ещё не создал сервер Dwarf Fortress MCP, который мог бы позволить агенту, как Codex или Claude Code, эффективно управлять игрой и следить за состоянием и прогрессом.
Я сам никогда не играл в это, просто скачал и кратко ознакомился с ним около 10 лет назад, но мне было интересно читать о нём.
Кажется, это было бы очень хорошим тестом для LLM, чтобы увидеть, как долго он сможет поддерживать гномов в живых и процветающих.
Поскольку каждая игра в конечном итоге приводит к какой-то каскадной катастрофе, из-за которой все гномы погибают, должно быть естественное место остановки, что делает её хорошим кандидатом для бенчмарка. По крайней мере, это моё понимание (девиз игроков — "Проигрывать весело").
Хорошая работа с этой игрой будет зависеть от точности вызова инструментов и устойчивой согласованности долгосрочных задач, а также от способности следить за динамикой сложной системы и делать своевременные вмешательства, которые предвосхищают и противодействуют проблемам.
И поскольку она терминально нативна, её можно эффективно передавать и обрабатывать с использованием обычных токенов без необходимости в многомодальной обработке изображений, что сделает её гораздо более эффективной, чем другие игры.
Плюс, вы знаете, что ни одна лаборатория ИИ ещё не обучалась этому (пока!), так что она не испорчена "benchmaxxing."

1,53K
Веселое занятие, когда нужно подождать несколько минут, — это использовать свой телефон, чтобы задать Клоду Опусу следующий вопрос о какой-либо случайной дисциплине или области:
"Какое, по вашему мнению, является ОСНОВНЫМ пониманием или аналитическим трюком кристаллографии?"
Замените кристаллографию на что угодно, что вам приходит в голову. На данный момент я пробовал:
КЭД; Стандартная модель; Биохимия; Вероятность; Теория эволюции; и многое другое.
Есть что-то в том, чтобы заставить модель сделать невозможное, сжать обширную, сложную область в "один странный трюк", что заставляет ее действительно искать лучший глубокий, объединяющий принцип в этой области и затем кратко его сформулировать.
Это, как правило, что-то очевидное для практиков, но, вероятно, неизвестное большинству людей, которые просто имеют поверхностный интерес к предмету.
Интересно, что вы также можете многократно нажимать кнопку "повторить" с тем же запросом и иногда получать очень разные, но обычно очень увлекательные объяснения.
Я уже многому научился, делая это, и это может быть самым высоким "пониманием за минуту", с которым я сталкивался в любом самообучении.
Потому что это не просто интересные факты или классные детали. Это, по своей сути, проникающие и объединяющие идеи, которые связывают огромное количество теорий и наблюдаемых явлений в мире.
Это определенно гораздо более высокоскоростной способ, чем смотреть еще одно объясняющее видео на YouTube с анимациями и рекламой Brilliant/KiwiCo! Не то чтобы в этом было что-то плохое.




5,24K
Идея о том, что из OpenAI произошел такой "эксодус талантов", что они больше не могут быть лидерами в этой области, так же заблуждена и неверна, как и идея о том, что GPT-5 "был большим провалом, и модель не так уж хороша и очень инкрементальна."
GPT-5 Pro не только является самым умным моделем в мире сейчас, но и значительно превосходит большинство сложных задач из реальной жизни (особенно задач программирования, которые сейчас имеют наибольшее экономическое значение). Новый инструмент codex cli от OpenAI также невероятно хорошо выполнен.
Они перешли с далекого 3-го места в инструментах командной строки для программирования к тому, что, безусловно, является лучшим инструментом на данный момент (обратите внимание, что мне все еще нравится и я использую Claude Code, это не либо/или!), с безусловно лучшей производительностью, наименьшей задержкой и т.д., потому что он написан на Rust.
И теперь этот инструмент командной строки объединен с лучшей моделью программирования, которая имеет наилучшую надежность вызова инструментов и наилучшую согласованность при длительных задачах, с наименьшим количеством галлюцинаций.
И, разумеется, их приложение для iOS также значительно лучше всех других AI-приложений с точки зрения полировки и функций. Приложение Claude — это просто веб-приложение в песочнице Safari! И их веб-приложение также по-прежнему лучшее. Такие вещи, как поиск, просто работают лучше, чем в других приложениях. Базовые блокировки и тактика.
Так что да. Некоторые очень умные люди, такие как Илья и Джон Шульман, ушли в другие компании. Но у них все еще есть абсолютно потрясающая техническая команда с невероятно хорошими продуктологами и отличными инженерными навыками.
Не позволяйте вашей неприязни к Алтману ослепить вас очевидным. Каждый раз, когда я вижу, как кто-то снова говорит о том, как плох GPT-5, мне становится неловко, потому что этот человек показывает, что не может мыслить самостоятельно на основе доказательств и разума, и попал в мем, думая, что мнение (и высказывая его в интернете) делает их умными.
33,74K
В качестве обновления к моим двум недавним темам о том, как использовать GPT-5 Pro для начала процесса открытия прорывных теорий, которые объединяют новые приложения продвинутой математики и случаи использования ИИ, я заставил модель создать демонстрационные реализации на Python с использованием Jax и Numpy для каждой из 11 идей.
Затем я собрал их в проект и добавил удобный интерфейс командной строки для их запуска, а также серию тестов от начала до конца, которые измеряли, является ли код математически корректным, проверяли, имеет ли код те математические свойства, которые мы хотим, и, наконец, делает ли он что-то полезное по сравнению с текущими стандартными подходами.
Я использовал codex CLI с GPT-5 для интеграции всего и исправления ошибок. Я дам ссылку на репозиторий, который содержит подробную документацию для всего проекта, а затем описания для каждой из 11 демонстраций, которые содержат все выходные данные, сгенерированные моделью в процессе.
3,75K
Вау, я наконец-то добрался до того, чтобы попробовать новую версию CLI codex от OpenAI (их ответ на Claude Code).
В прошлый раз, когда я пытался использовать codex (обратите внимание, что это отличается от их хостингового кода, также называемого codex, что крайне запутанно; я говорю сейчас о инструменте, который вы запускаете локально на своем компьютере в терминале), он был написан как приложение на Nodejs/Typescript и действительно был довольно плох:
- можно было получить доступ только к более слабым моделям, таким как o4-mini или их варианту для codex, запутанно также называемому codex (серьезно?)
- гораздо худший интерфейс/опыт пользователя, чем у Claude Code
- гораздо хуже в кодировании из-за худшей модели, худших инструментов, худшего потока агентов.
- он раздражающе заставлял вас давать разрешение на все, так что вам приходилось постоянно за ним присматривать, что делало его гораздо менее полезным, потому что вы не могли активно запускать несколько из них параллельно.
- возможно, это было и хорошо, потому что самой большой проблемой было то, что он делал супер безрассудные, разрушительные вещи; он был гораздо более легкомысленным, чем CC.
Вот почему я сразу же перестал его использовать, так как он решил сделать "git reset --hard HEAD" без предварительного сохранения, и я потерял часть работы. Никогда больше, подумал я.
Ну, я наконец-то добрался до того, чтобы попробовать совершенно новую версию на rust, которая использует GPT-5 и может использовать вашу существующую подписку на GPT Pro вместо ключа API, и это так намного лучше, что это шокирует.
Прежде всего, просто нет замены для быстрого скомпилированного кода, когда дело касается интерактивных инструментов, таких как этот.
Тот факт, что он написан на rust, означает, что нет никакой задержки при вводе с клавиатуры, и также нет странных артефактов, как в CC, где клавиша удаления не работает правильно, а ввод происходит с задержкой и сбоями, потому что он написан на интерпретируемом языке, который в сто раз медленнее для таких вещей.
Столкновение с постоянной задержкой и сбоями не только замедляет работу, но и умственно, а может быть, даже эмоционально утомляет и изнуряет, по крайней мере для меня, когда я использую эти вещи часами. Это ужасное чувство ненавидеть и презирать свои инструменты, даже когда вы зависите от них, чтобы выполнять свою работу.
Я действительно надеюсь, что это поднимет планку для всех этих инструментов и убедит Anthropic, Google и других также использовать rust (или C++, Zig, что угодно).
Но действительно большое улучшение, очевидно, модель; с худшей моделью, которая ненадежна в вызове инструментов и теряет согласованность при более длительных задачах, ни одна из быстродействий Rust не стоила бы и гроша.
Но если вы следите за мной здесь, то вы знаете, что я был в восторге от способностей кодирования и мастерства вызова инструментов GPT-5 Thinking примерно через 15 минут после его выхода, хотя я использовал его в основном из вкладки агента Cursor.
Суть в том, что этот новый rust codex внезапно стал действительно серьезным конкурентом CC, и вам определенно стоит его попробовать.
Мне нужно будет посмотреть, сколько использования они позволят мне получить на моей подписке GPT Pro за $200 в месяц, но если мне придется получить еще пару, это будет того стоить.
Обратите внимание, что я не перестал использовать CC. Мне нравится использовать их вместе. И верите или нет, я все еще использую Cursor.
Людям следует прекратить искать один единственный инструмент, который заменит все остальные, и принять, что разные инструменты имеют разные сильные и слабые стороны, и вы получите лучшие результаты, изучая все это интуитивно через постоянное использование.
В любом случае, сделайте себе одолжение и получите его сейчас. Самый простой способ сделать это — выполнить эту команду (обратите внимание, что это приведет вас к версии на rust, несмотря на то, как запутанно использовать bun/npm для этого):
bun i -g @openai/codex
8,44K
Вау, я наконец-то добрался до новой версии CLI codex от OpenAI (их ответ на Claude Code).
В последний раз, когда я пробовал использовать codex (обратите внимание, что это отличается от их хостингового кода, также называемого codex, что крайне запутанно; я говорю сейчас о инструменте, который вы запускаете локально на своем компьютере в терминале), он был написан как приложение на Nodejs/Typescript и действительно был довольно плох:
- мог получить доступ только к более слабым моделям, таким как o4-mini или их варианту для codex, запутанно также называемому codex (серьезно?)
- гораздо худший интерфейс/опыт пользователя, чем у Claude Code
- гораздо хуже в кодировании из-за худшей модели, худших инструментов, худшего потока агентов.
- он раздражающе заставлял вас давать разрешение на все, так что вам приходилось постоянно за ним присматривать, что делало его гораздо менее полезным, потому что вы не могли активно запускать несколько из них параллельно.
- возможно, это было и хорошо, потому что самой большой проблемой было то, что он делал супер безрассудные, разрушительные вещи; он был гораздо более легкомысленным, чем CC. Именно поэтому я немедленно перестал его использовать, так как он решил сделать "reset --hard HEAD" без предварительного сохранения, и я потерял часть работы. Никогда больше, подумал я.
Ну, я наконец-то добрался до новой версии на rust, которая использует GPT-5 и может использовать вашу существующую подписку на GPT Pro вместо ключа API, и это настолько лучше, что это шокирует.
Прежде всего, нет ничего лучше быстрого скомпилированного кода, когда дело касается интерактивных инструментов, таких как этот.
Тот факт, что он написан на rust, означает, что нет никакой задержки при вводе с клавиатуры, и также нет странных артефактов, как в CC, где клавиша удаления не работает правильно, а ввод происходит с задержками и сбоями, потому что он написан на интерпретируемом языке, который в сто раз медленнее для таких задач.
Постоянная задержка и сбои не только замедляют работу, но и морально, а может быть, даже эмоционально утомляют и изнуряют, по крайней мере для меня, когда я использую эти вещи часами. Это ужасное чувство ненавидеть и презирать свои инструменты, даже когда вы зависите от них для выполнения своей работы.
Я действительно надеюсь, что это поднимет планку для всех этих инструментов и убедит Anthropic, Google и других также использовать rust (или C++, Zig, что угодно).
Но действительно большое улучшение, очевидно, модель; с худшей моделью, которая ненадежна в вызове инструментов и теряет согласованность при более длительных задачах, никакая скорость rust не имела бы значения.
Но если вы следите за мной здесь, то вы знаете, что я был в восторге от способностей кодирования и мастерства вызова инструментов GPT-5 Thinking примерно через 15 минут после его выхода, хотя я использовал его в основном из вкладки агента Cursor.
Суть в том, что этот новый rust codex внезапно стал действительно серьезным конкурентом CC, и вам определенно стоит его попробовать.
Мне нужно будет посмотреть, сколько использования они позволят мне получить на моей подписке GPT Pro за $200 в месяц, но если мне придется получить еще пару, это будет того стоить.
Обратите внимание, что я не перестал использовать CC. Мне нравится использовать их вместе. И верите или нет, я все еще использую Cursor.
Людям следует прекратить искать один единственный инструмент, который заменит все остальные, и принять, что разные инструменты имеют разные сильные и слабые стороны, и вы получите лучшие результаты, изучая это интуитивно через постоянное использование.
В любом случае, сделайте себе одолжение и получите его сейчас. Самый простой способ сделать это — выполнить эту команду (обратите внимание, что это приведет вас к версии на rust, несмотря на то, как запутанно использовать bun/npm для этого):
bun i -g @openai/codex
561
Если вы видели мои недавние посты о том, как я использую Claude Code для программирования, вы знаете, что у меня всегда открыт мой надежный текстовый редактор (Sublime Text) с текстовым файлом, содержащим полезные фрагменты текста, которые я использую для запроса Claude Code и Cursor различными способами для выполнения различных общих задач, таких как продолжение предыдущего разговора, который я вставил ниже, или указание, как исправить кучу ошибок типа и т. д.
Этот подход работает, но он требует раздражающего количества использования мыши и клавиатуры каждый раз, чтобы найти, выбрать и скопировать текст, а затем переключиться между окнами и вставить фрагмент.
Недавно я купил одно из этих "Stream Deck" USB-устройств, используемых геймерами и стримерами для запуска различных действий (160 долларов на eBay), и наконец-то добрался до его настройки для этого случая использования после того, как оно несколько недель лежало бесполезно на моем столе.
В любом случае, теперь у меня есть следующая забавная настройка, изображенная ниже, которая позволяет мне мгновенно вставлять кучу моих "лучших хитов" текстовых фрагментов. Я думаю, что это действительно сэкономит мне время! Каждая кнопка на нижнем ряду — это другой фрагмент (плюс одна на втором ряду). Я подозреваю, что в конечном итоге заполню остальные клавиши другими фрагментами.
Другие кнопки выполняют такие действия, как запуск терминалов WSL и SSH-сессий и позволяют мне быстро перемещать вкладки влево и вправо в Windows Terminal. Я не уверен, насколько полезными они будут на практике, поскольку уже существуют обычные горячие клавиши для запуска этих вещей, но посмотрим.
Устройство поддерживает полный цвет для дисплеев клавиш, но я нахожу это слишком визуально отвлекающим, если оно не полностью монохромное и в основном темное. В любом случае, если оно сможет сделать меня хоть немного быстрее, это будет стоить своих затрат и времени на настройку. И это как-то смешно для меня, тоже, по какой-то причине.



17,51K
Топ
Рейтинг
Избранное
В тренде ончейн
В тренде в Х
Самые инвестируемые
Наиболее известные