Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Fakt, że wszystkie duże modele głosowe AI są napędzane przez głupie modele, nie mówiąc już o sycophantycznych głupich modelach, które są zaprojektowane tak, aby miały niepłynności, które udają ludzką rozmowę ("um"), umniejsza wartość głosu w zarządzaniu agentami.
"Poważny tryb głosowy" do pracy byłby bardzo przydatny.
Są lepsze modele: Głosy AI były stałym elementem mediów przez większą część wieku. I jest powód, dla którego komputer z Star Treka nie chichotał, nie wzdychał, nie mówił "um" i nie mówił, jak wspaniały jesteś w trakcie zadania o wysokiej stawce.
Jest również niezwykle trudno stworzyć ten inteligentny tryb głosowy z obecnymi interfejsami API. Musisz zasadniczo transkrybować głos do inteligentnego modelu za pomocą jednego narzędzia, a następnie użyć TTS za pomocą innego, co nie ma tej interakcji i możliwości przerywania, które pełny multimodalny głos jest w stanie zaoferować.
118
Najlepsze
Ranking
Ulubione
