Автоматизация преобразования текста в SQL по-прежнему является большой задачей, и существует очень мало хороших открытых моделей для этой задачи. Давайте разберем это - > Модели преобразования текста в SQL по сути представляют собой модели кодировщик-декодировщик с многоуровневым вниманием и слоем связывания схемы между ними. > Кодировщик обрабатывает как запрос пользователя, так и схему базы данных и генерирует контекстные встраивания (кодирование с учетом отношений) > Через связывание схемы токены в запросе выравниваются с соответствующими сущностями схемы > Механизм внимания с учетом схемы затем позволяет модели сосредоточиться на соответствующих частях схемы во время декодирования > Декодировщик последовательно производит токены SQL (декодирование на основе ограничений) Где эти модели недостаточны? - > Большинство доступных моделей не имеют сложных запросов в обучающих данных и, следовательно, плохо работают с междоменными или циклическими запросами. > Язык и требования к запросу не всегда корректны со стороны обычного пользователя. Даже орфографические ошибки приводят к неправильным записям и вызывают проблемы при извлечении, поэтому подсказка является важной частью этой задачи. Я лично работал над этим подробно, когда создавал проект от начала до конца, даже создал синтетические данные и пытался обучить свою собственную SLM, но потерпел неудачу и затем перешел к использованию открытой модели. Если вы хотите углубиться в это, я рекомендую сначала прочитать эти научные статьи - > Усовершенствованное генерация текста в SQL с помощью LLM > Интерфейсы баз данных следующего поколения: > Парсинг текста в SQL: концепции и методы > RASAT: интеграция реляционных структур в предобученную модель Seq2Seq