Aegaeon: ефективне об'єднання графічних процесорів для одночасного обслуговування LLM на ринку Beida та Alibaba Cloud Aegaeon вже понад три місяці розгортається в Alibaba Cloud Model Studio, наразі обслуговуючи десятки моделей із параметрами від 1,8 до 72 мільярдів. Це зменшує кількість графічних процесорів, необхідних для обслуговування цих моделей, з 1,192 до 213, що підкреслює 82% економії ресурсів графічного процесора