Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeffrey Emanuel
Saya agak terkejut bahwa belum ada yang membuat server MCP Dwarf Fortress yang memungkinkan agen seperti Codex atau Claude Code untuk mengontrol permainan secara efisien dan memantau keadaan dan kemajuan.
Saya tidak pernah benar-benar memainkannya sendiri, hanya mengunduhnya dan memeriksanya sebentar sekitar 10 tahun yang lalu, tetapi saya senang membacanya.
Rasanya seperti itu akan menjadi ujian yang sangat bagus dari LLM untuk melihat berapa lama itu bisa membuat para kurcaci tetap hidup dan berkembang.
Karena setiap permainan akhirnya menghasilkan beberapa bencana yang menyebabkan semua kurcaci mati, harus ada titik penghentian alami untuk itu, yang menjadikannya kandidat tolok ukur yang baik. Setidaknya itulah pemahaman saya tentang itu (moto pemain adalah "Kalah itu menyenangkan").
Melakukan pekerjaan dengan baik dengan game ini akan bergantung pada akurasi pemanggilan alat dan koherensi tugas panjang yang berkelanjutan, ditambah kemampuan untuk memantau dan memahami dinamika sistem yang kompleks dan melakukan intervensi tepat waktu yang mengantisipasi dan menangkal masalah.
Dan karena ini asli terminal, itu dapat ditransmisikan dan diproses secara efisien menggunakan token biasa tanpa memerlukan pemrosesan gambar multi-modal, yang akan membuatnya jauh lebih efisien daripada game lain.
Ditambah lagi, Anda tahu bahwa tidak ada laboratorium AI yang dilatih untuk ini (belum!), jadi tidak ternoda oleh "benchmaxxing".

2,4K
Hal yang menyenangkan untuk dilakukan ketika Anda perlu menunggu beberapa menit adalah menggunakan ponsel Anda untuk mengajukan pertanyaan berikut kepada Claude Opus tentang beberapa disiplin atau bidang acak:
"Apa yang menurut Anda adalah wawasan inti atau trik analitis kristalografi?"
Ganti kristalografi dengan apa pun yang dapat Anda pikirkan. Sejauh ini, saya telah mencoba:
QED; Model Standar; Biokimia; Probabilitas; Teori evolusi; dan banyak lagi.
Ada sesuatu tentang memaksa model untuk melakukan hal yang mustahil, untuk memadatkan bidang yang luas dan kompleks menjadi "satu trik aneh," yang membuatnya benar-benar mencari prinsip pemersatu yang terbaik di lapangan dan kemudian mengartikulasikannya secara ringkas.
Ini cenderung menjadi sesuatu yang jelas bagi praktisi tetapi sangat mungkin tidak diketahui oleh kebanyakan orang dengan minat sesaat dalam subjek tersebut.
Menariknya, Anda juga dapat berulang kali menekan tombol "coba lagi" dengan prompt yang sama dan terkadang mendapatkan penjelasan yang sangat berbeda, tetapi biasanya sangat menarik.
Saya telah belajar BANYAK dari melakukan ini, dan itu mungkin hanya "pemahaman per menit" tertinggi yang pernah saya temui dalam pembelajaran mandiri.
Karena itu bukan hanya fakta menyenangkan atau berita keren. Mereka, dengan konstruksi, menembus dan menyatukan ide-ide yang menyatukan sejumlah besar teori dan fenomena yang diamati di dunia.
Ini tentu saja jauh lebih bandwidth tinggi daripada menonton video penjelasan YouTube lainnya dengan animasi dan iklan untuk Brilliant / KiwiCo! Bukan berarti ada yang salah dengan itu.




6,68K
Gagasan bahwa ada "eksodus bakat" dari OpenAI baru-baru ini sehingga mereka tidak lagi diposisikan untuk menjadi pemimpin di ruang ini sama salahnya dengan gagasan bahwa GPT-5 "adalah kegagalan besar dan modelnya tidak terlalu bagus dan sangat bertahap."
GPT-5 Pro tidak hanya model paling cerdas di dunia sekarang dengan sangat banyak pada tugas dunia nyata yang paling menantang (terutama tugas pengkodean, yang memiliki kepentingan ekonomi paling besar sekarang), tetapi alat cli codex baru dari OpenAI dijalankan dengan sangat baik.
Mereka berubah dari tempat ke-3 yang jauh dalam alat pengkodean cli menjadi memiliki apa yang bisa dibilang yang terbaik sekarang (perhatikan bahwa saya masih suka dan menggunakan Claude Code, itu bukan salah satu / atau!), dengan sejauh ini kinerja terbaik, latensi terendah, dll. karena diprogram dalam karat.
Dan sekarang alat cli ini dikombinasikan dengan model pengkodean terbaik yang memiliki keandalan pemanggilan alat terbaik dan koherensi tugas panjang terbaik, dengan jumlah halusinasi paling sedikit.
Dan tak perlu dikatakan, aplikasi iOS mereka juga secara dramatis lebih baik daripada semua aplikasi AI lainnya dalam hal polesan dan fitur. Aplikasi Claude hanyalah aplikasi web di kotak pasir Safari! Dan webapp mereka juga masih yang terbaik. Hal-hal seperti pencarian bekerja lebih baik daripada di aplikasi lain. Pemblokiran dan tekel dasar.
Jadi, ya. Beberapa orang yang sangat pintar seperti Ilya dan John Schulman pergi ke perusahaan lain. Tetapi mereka masih memiliki tim teknis yang benar-benar luar biasa dengan orang-orang produk yang sangat bagus dan teknik yang luar biasa.
Jangan biarkan ketidaksukaan Anda terhadap Altman membutakan Anda terhadap yang jelas. Setiap kali saya melihat orang lain berbicara tentang betapa buruknya GPT-5, saya ngeri, karena orang tersebut menunjukkan bahwa mereka tidak dapat berpikir sendiri berdasarkan bukti dan alasan, dan meme untuk memikirkan opini (dan menyemburkannya secara online) karena mereka pikir itu membuat mereka terdengar pintar.
33,89K
Seberapa keren bahwa masing-masing chip kecil itu memiliki penyimpanan super cepat 8 terabyte? Dan Anda dapat mencolokkan keduanya ke penutup biru itu dan mendapatkan 20 Gbps melalui USB 3.3 (saya tidak memiliki port USB 4 dan semua slot pci-e saya ditempati oleh GPU)
Kita hidup di zaman yang begitu melimpah.

3,15K
Sebagai pembaruan untuk dua utas terbaru saya tentang penggunaan GPT-5 Pro untuk memulai proses penemuan teori terobosan yang menggabungkan aplikasi baru matematika tingkat lanjut kasus penggunaan AI, saya meminta model membuat implementasi demo dalam Python menggunakan Jax dan Numpy untuk masing-masing dari 11 ide.
Kemudian saya menyatukannya dalam sebuah proyek dan menambahkan CLI yang bagus untuk menjalankannya, dan serangkaian tes ujung ke ujung yang mengukur apakah kode tersebut benar secara matematis, memeriksa apakah kode tersebut memiliki sifat matematis yang kita inginkan, dan akhirnya, apakah kode tersebut melakukan sesuatu yang berguna dibandingkan dengan pendekatan standar saat ini.
Saya menggunakan codex CLI dengan GPT-5 untuk mengintegrasikan semuanya dan memperbaiki dan bug. Saya akan menautkan ke repo, yang berisi dokumentasi terperinci untuk seluruh proyek dan kemudian menulis untuk masing-masing dari 11 demo yang berisi semua output yang dihasilkan oleh model selama proses.
3,77K
Wow, saya akhirnya mencoba versi baru codex CLI OpenAI (jawaban mereka untuk Claude Code).
Terakhir kali saya mencoba menggunakan codex (perhatikan bahwa ini berbeda dari agen pengkodean yang dihosting mereka juga disebut codex, yang sangat membingungkan; Saya berbicara sekarang tentang alat yang Anda jalankan secara lokal di mesin Anda di terminal), itu ditulis sebagai aplikasi Nodejs/Typescript, dan benar-benar menyebalkan:
- hanya dapat mengakses model yang lebih lemah seperti O4-mini atau variannya untuk Codex, yang membingungkan juga disebut Codex (serius?)
- UI/UX yang jauh lebih buruk daripada Claude Code
- jauh lebih buruk dalam pengkodean sebagai akibat dari model yang lebih buruk, perkakas yang lebih buruk, aliran agen yang lebih buruk.
- Itu menjengkelkan memaksa Anda untuk memberikan izin untuk semuanya sehingga Anda harus mengasuhnya sepanjang waktu, membuatnya kurang berguna karena Anda tidak dapat secara aktif menjalankan banyak dari mereka secara paralel dengan mudah.
- Mungkin itu hal yang baik, karena sejauh ini masalah terbesar adalah bahwa itu melakukan hal-hal yang sangat sembrono dan merusak; itu jauh lebih angkuh daripada CC.
Itu sebabnya saya segera berhenti menggunakannya, karena memutuskan untuk melakukan "reset git --hard HEAD" tanpa menyimpan terlebih dahulu, dan saya kehilangan beberapa pekerjaan. Tidak pernah lagi, pikirku.
Nah, saya akhirnya mencoba versi rust baru yang menggunakan GPT-5 dan yang dapat menggunakan langganan GPT Pro Anda yang ada alih-alih kunci API, dan ini jauh lebih baik sehingga mengejutkan.
Pertama-tama, tidak ada pengganti kode yang dikompilasi dengan cepat dalam hal alat interaktif seperti ini.
Fakta bahwa itu ditulis dengan karat berarti tidak ada lag sama sekali dengan input keyboard, dan juga tidak ada artefak aneh seperti yang Anda miliki di CC di mana backspace tidak berfungsi dengan benar dan input janky dan lamban karena ditulis dalam bahasa yang ditafsirkan yang seratus kali lebih lambat untuk hal-hal seperti ini.
Berurusan dengan lag dan jank yang konstan tidak hanya lebih lambat, tetapi juga secara mental dan bahkan mungkin secara emosional melelahkan dan melelahkan, setidaknya bagi saya ketika saya menggunakan hal-hal ini selama berjam-jam. Adalah perasaan yang mengerikan untuk membenci dan membenci alat Anda bahkan ketika Anda bergantung padanya untuk melakukan pekerjaan Anda.
Saya sangat berharap ini meningkatkan standar untuk semua alat ini dan meyakinkan Anthropic dan Google dan lainnya untuk juga menggunakan karat (atau C++, Zig, apa pun).
Tapi peningkatan yang benar-benar besar jelas adalah modelnya; dengan model yang lebih buruk yang tidak dapat diandalkan dalam pemanggilan alat dan yang kehilangan koherensi atas tugas yang lebih lama, tidak ada ketagihan Rust yang akan berharga.
Tetapi jika Anda mengikuti saya di sini, maka Anda akan tahu bahwa saya telah kagum dengan kemampuan pengkodean dan kehebatan pemanggilan alat GPT-5 Thinking sejak sekitar 15 menit setelah keluar, meskipun saya telah menggunakannya terutama dari dalam tab agen Cursor.
Intinya adalah bahwa codex karat baru ini tiba-tiba menjadi pesaing CC yang benar-benar tangguh, dan Anda harus benar-benar mencobanya.
Saya perlu melihat berapa banyak penggunaan yang mereka biarkan saya lolos dengan langganan GPT Pro saya $200/bulan, tetapi jika saya harus mendapatkan beberapa lagi, itu akan sangat berharga.
Perhatikan bahwa saya belum berhenti menggunakan CC. Saya suka menggunakan keduanya bersama-sama. Dan percaya atau tidak, saya masih menggunakan Cursor.
Orang harus berhenti mencari satu alat tunggal yang menggantikan semua yang lain dan merangkul bahwa alat yang berbeda memiliki kekuatan dan kelemahan yang berbeda, dan Anda mendapatkan hasil terbaik dengan mempelajari semua itu secara intuitif dari penggunaan terus-menerus.
Bagaimanapun, bantulah diri Anda sendiri dan dapatkan sekarang. Cara termudah adalah dengan melakukan perintah ini (perhatikan bahwa ini akan memberi Anda versi karat, terlepas dari betapa membingungkannya menggunakan bun/npm untuk ini):
bun i -g @openai/codex
8,51K
Wow, saya akhirnya mencoba versi baru codex CLI OpenAI (jawaban mereka untuk Claude Code).
Terakhir kali saya mencoba menggunakan codex (perhatikan bahwa ini berbeda dari agen pengkodean yang dihosting mereka juga disebut codex, yang sangat membingungkan; Saya berbicara sekarang tentang alat yang Anda jalankan secara lokal di mesin Anda di terminal), itu ditulis sebagai aplikasi Nodejs/Typescript, dan benar-benar menyebalkan:
- hanya dapat mengakses model yang lebih lemah seperti O4-mini atau variannya untuk Codex, yang membingungkan juga disebut Codex (serius?)
- UI/UX yang jauh lebih buruk daripada Claude Code
- jauh lebih buruk dalam pengkodean sebagai akibat dari model yang lebih buruk, perkakas yang lebih buruk, aliran agen yang lebih buruk.
- Itu menjengkelkan memaksa Anda untuk memberikan izin untuk semuanya sehingga Anda harus mengasuhnya sepanjang waktu, membuatnya kurang berguna karena Anda tidak dapat secara aktif menjalankan banyak dari mereka secara paralel dengan mudah.
- Mungkin itu hal yang baik, karena sejauh ini masalah terbesar adalah bahwa itu melakukan hal-hal yang sangat sembrono dan merusak; itu jauh lebih angkuh daripada CC. Itu sebabnya saya segera berhenti menggunakannya, karena memutuskan untuk melakukan "reset --hard HEAD" tanpa menyimpan terlebih dahulu, dan saya kehilangan beberapa pekerjaan. Tidak pernah lagi, pikirku.
Nah, saya akhirnya mencoba versi rust baru yang menggunakan GPT-5 dan yang dapat menggunakan langganan GPT Pro Anda yang ada alih-alih kunci API, dan ini jauh lebih baik sehingga mengejutkan.
Pertama-tama, tidak ada pengganti kode yang dikompilasi dengan cepat dalam hal alat interaktif seperti ini.
Fakta bahwa itu ditulis dengan karat berarti tidak ada lag sama sekali dengan input keyboard, dan juga tidak ada artefak aneh seperti yang Anda miliki di CC di mana backspace tidak berfungsi dengan benar dan input janky dan lamban karena ditulis dalam bahasa yang ditafsirkan yang seratus kali lebih lambat untuk hal-hal seperti ini.
Berurusan dengan lag dan jank yang konstan tidak hanya lebih lambat, tetapi juga secara mental dan bahkan mungkin secara emosional melelahkan dan melelahkan, setidaknya bagi saya ketika saya menggunakan hal-hal ini selama berjam-jam. Adalah perasaan yang mengerikan untuk membenci dan membenci alat Anda bahkan ketika Anda bergantung padanya untuk melakukan pekerjaan Anda.
Saya sangat berharap ini meningkatkan standar untuk semua alat ini dan meyakinkan Anthropic dan Google dan lainnya untuk juga menggunakan karat (atau C++, Zig, apa pun).
Tapi peningkatan yang benar-benar besar jelas adalah modelnya; dengan model yang lebih buruk yang tidak dapat diandalkan dalam pemanggilan alat dan yang kehilangan koherensi atas tugas yang lebih lama, tidak ada ketagihan Rust yang akan berharga.
Tetapi jika Anda mengikuti saya di sini, maka Anda akan tahu bahwa saya telah kagum dengan kemampuan pengkodean dan kehebatan pemanggilan alat GPT-5 Thinking sejak sekitar 15 menit setelah keluar, meskipun saya telah menggunakannya terutama dari dalam tab agen Cursor.
Intinya adalah bahwa codex karat baru ini tiba-tiba menjadi pesaing CC yang benar-benar tangguh, dan Anda harus benar-benar mencobanya.
Saya perlu melihat berapa banyak penggunaan yang mereka biarkan saya lolos dengan langganan GPT Pro saya $200/bulan, tetapi jika saya harus mendapatkan beberapa lagi, itu akan sangat berharga.
Perhatikan bahwa saya belum berhenti menggunakan CC. Saya suka menggunakan keduanya bersama-sama. Dan percaya atau tidak, saya masih menggunakan Cursor.
Orang harus berhenti mencari satu alat tunggal yang menggantikan semua yang lain dan merangkul bahwa alat yang berbeda memiliki kekuatan dan kelemahan yang berbeda, dan Anda mendapatkan hasil terbaik dengan mempelajari semua itu secara intuitif dari penggunaan terus-menerus.
Bagaimanapun, bantulah diri Anda sendiri dan dapatkan sekarang. Cara termudah adalah dengan melakukan perintah ini (perhatikan bahwa ini akan memberi Anda versi karat, terlepas dari betapa membingungkannya menggunakan bun/npm untuk ini):
bun i -g @openai/codex
626
Saya benar-benar yakin bahwa model AI terpintar yang keluar sekarang, GPT-5 Pro dan Grok4 Heavy, sudah cukup pintar, dan tentunya cukup berpengetahuan tentang matematika dan AI, untuk menyusun dan mengembangkan penemuan teoretis dan praktis yang penting, dengan jenis dorongan cerdas yang tepat.
47,95K
Jika Anda telah melihat posting saya baru-baru ini tentang bagaimana saya menggunakan Claude Code untuk pemrograman, Anda akan tahu bahwa saya memiliki editor teks tepercaya saya (Sublime Text) yang terbuka setiap saat ke file teks yang berisi cuplikan teks berguna yang saya gunakan untuk meminta Claude Code dan Cursor dalam berbagai cara untuk melakukan tugas umum yang berbeda, seperti melanjutkan dari percakapan sebelumnya yang telah saya tempelkan di bawah ini, atau memberitahunya cara memperbaiki banyak kesalahan jenis, dll.
Pendekatan ini berhasil, tetapi melibatkan jumlah penggunaan mouse dan keyboard yang mengganggu setiap kali untuk menemukan, memilih, dan menyalin teks, lalu mengganti jendela dan menempelkan cuplikan.
Saya baru-baru ini membeli salah satu gadget USB "Stream Deck" yang digunakan oleh para gamer dan streamer untuk memicu berbagai tindakan ($ 160 yang digunakan di eBay), dan saya akhirnya bisa mengaturnya untuk kasus penggunaan ini setelah tidak berguna di meja saya selama beberapa minggu.
Bagaimanapun, saya sekarang memiliki pengaturan lucu berikut yang digambarkan di bawah ini yang memungkinkan saya untuk langsung menempelkan banyak cuplikan teks "hit terbesar" saya. Saya pikir itu benar-benar akan menghemat waktu saya! Setiap tombol di baris bawah adalah cuplikan yang berbeda (ditambah yang ada di baris kedua). Saya menduga saya akan mengisi sisa kunci dengan cuplikan lain pada akhirnya.
Tombol lain melakukan hal-hal seperti meluncurkan terminal WSL dan sesi SSH dan memungkinkan saya dengan cepat memindahkan tab ke kiri dan kanan di Terminal Windows. Saya tidak yakin seberapa berguna itu dalam praktiknya karena sudah ada tombol pintas keyboard biasa untuk memicu hal-hal itu, tetapi kita lihat saja.
Perangkat ini mendukung warna penuh untuk tampilan tombol, tetapi saya merasa terlalu mengganggu secara visual jika tidak semuanya monokrom dan sebagian besar gelap. Bagaimanapun, jika itu bisa membuat saya sedikit lebih cepat, itu akan sepadan dengan biaya dan waktu penyiapan. Dan itu juga lucu bagi saya, karena suatu alasan.



17,56K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal