На этих выходных я изменил реализацию с помощью GPT-5 и использовал его для проектирования на более высоком уровне, и это было действительно хорошо. Затем я решил позволить ему попробовать реализовать это, и код на Elixir был странным, с влиянием Ruby и ужасным, поэтому я вернулся к Claude для реализации.
Perry E. Metzger
Perry E. Metzger11 авг., 22:57
Я заметил, что многие люди говорят о том, что они считают GPT-5 шагом назад по сравнению с предыдущими моделями. Я не могу говорить об их опыте, но мой собственный был противоположным. Вчера я попросил GPT-5 Thinking разработать сложный специализированный язык для указания семантики машинных инструкций в ЦП. (Цель этого заключается в том, чтобы упростить создание и поддержку эмуляторов для старых компьютеров, что является моим хобби.) LLM не был идеален, но справился с задачей на отлично и продемонстрировал настоящую креативность. Получившийся DSL отличный и потребовал бы кучу работы, если бы я делал это вручную. Я еще не закончил работу с LLM над спецификацией, но когда я это сделаю, я подозреваю, что он сможет выполнить большую часть компилятора с одного раза. Возможно, для некоторых людей эта вещь работает плохо; я не знаю, что они пытаются сделать. Я также не могу говорить о их вкусах в таких вещах, как "личность", и кроме того, мой системный запрос неявно просит модель быть ультра профессиональной и безликой. (Мне также не интересно, чтобы ИИ предоставлял мне компанию или эмоциональную поддержку, и я не хочу иметь парасоциальные отношения с ним.) Для меня он определенно делает отличную работу, и это касается крайне сложной технической задачи. Обратите внимание, что я прекрасно понимаю работу, которую я прошу систему выполнить, я в состоянии заметить ошибки, которые она делает, и исправить их, и я считаю работу, выполненную на 95% после нескольких итераций, действительно хорошим результатом, потому что я могу исправить остальное. Возможно, если вы пытаетесь заставить эту вещь с одного раза создать рабочий проект схемы и не знаете электротехнику, она все еще не делает то, что вам нужно. Для меня же это удивительный инструмент и явное улучшение по сравнению с o3.
Но в плане понимания того, что я пытался сделать, и разработки отличного шаблона для этого, а также высокоуровневого плана, это было лучше, чем все, что я видел до сих пор. Это было только на уровне низкоуровневого кода, где оно не справилось — обычно с LLM для кодирования наоборот.
1,81K