Durch den Einsatz von viel Rechenleistung zur Indexierungszeit können Sie diese Berechnungen wiederverwenden, um eine bessere Leistung zu erzielen, ohne die Rechenleistung zur Inferenzzeit zu erhöhen!
Embeddings sind der einfachste Mechanismus, um dies zu erreichen!