Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Первое исследование основ тренировки характера — т.е. применение современных методов пост-тренировки для внедрения конкретных черт характера в модели.
Все модели, наборы данных, код и т.д. выпущены.
Действительно рад этому проекту! Шаран был радостью в работе.


4 нояб., 22:09
ИИ, который "вынужден быть хорошим" против "по-настоящему хорошего"
Должны ли мы заботиться о разнице? (да!)
Мы выпускаем первую открытую реализацию обучения персонажей. Мы формируем личность ИИ-ассистентов более надежным способом, чем альтернативы, такие как подсказки или управление активацией.

Для тех, кто следит за мной уже некоторое время, вы знаете, что это была моя тема, которая является крайне недостаточно изученной областью, что-то, что все больше влияет на передовые технологии развертывания моделей, не изучается в академической среде, но доступно по стоимости.
Надеюсь, что смогу заложить небольшую исследовательскую область здесь!
Люди, на которых я долго смотрел как на создателей области тренировки характера (публично, конечно, больше всего внесли): @AmandaAskell, @joannejang и @johnschulman2
38,76K
Топ
Рейтинг
Избранное

