категорически поддерживается. Наши модели учатся на мусоре, и я думаю, что это не просто плоский налог на производительность – это добавляет поверхностность, нежелательную запоминание и "шпильчатые сингулярности", которые, вероятно, увеличиваются с масштабом. Мне интересно, как различные методы разреженности способствуют этой проблеме.