Gabriel och jag började med affärsprogrammering på ett litet kontor i ett år i sträck. Vi började med idén att AI-system måste kunna lära sig av verkliga erfarenheter för att lösa verkliga problem. Så småningom stod det klart att detta var mycket mer av ett system- och dataproblem än ett maskininlärningsproblem. Lösningen behövde vara programvara i industriell klass som var fritt tillgänglig och enkel att använda för enskilda utvecklare, men som kunde skalas för att passa behoven hos stora organisationer. Så vi öppnade upp projektet och sa till våra tidigaste användare att sluta betala oss. Det kändes helt galet. Nu för tiden rundar vi ett hörn. Vi har ett litet men otroligt tekniskt team: Aaron (Rust compiler maintainer, Svix, AWS), @anndvision (Columbia postdoc, Oxford PhD) och Alan (CMU PhD, VP på JPM AI Research) som snart kommer att få sällskap av Shuyang (personal SWE på LLM infra på Google, Palantir) och Cole (Cognition, Windsurf, Stanford). Vår community är aktiv och växer (snart till 10k stjärnor!). Det finns en tydlig väg mot att skapa agenten som optimerar varje TensorZero-distribution mot den verkliga feedback som den samlar in. Om du hade berättat för mig när jag började min doktorsexamen att många företag en dag frivilligt skulle börja lagra RL-banor i en datamodell som jag hjälpte till att bygga så att vi kunde optimera deras policyer mot de belöningar de bryr sig om, skulle jag ha blivit förvånad. Snart kommer detta inte att göras för hand.
TensorZero
TensorZero19 aug. 04:14
Vi presenterar vår såddrunda på $7,3 miljoner! TensorZero möjliggör ett svänghjul för data och inlärning för att optimera LLM-applikationer: en återkopplingsslinga som förvandlar produktionsstatistik och mänsklig feedback till smartare, snabbare och billigare modeller och agenter. Idag tillhandahåller vi en stack med öppen källkod för att bygga LLM-applikationer av industriell kvalitet som förenar en LLM-gateway, observerbarhet, optimering, utvärdering och experiment. Du kan ta det du behöver, införa stegvis och komplettera med andra verktyg. Med tiden gör dessa komponenter att du kan ställa in en principiell återkopplingsslinga för din LLM-applikation. De data du samlar in är knutna till dina KPI:er, överförs mellan modellleverantörer och blir en konkurrensfördel för ditt företag. Vår vision är att automatisera mycket av LLM-teknik. Vi lägger grunden för det med TensorZero med öppen källkod. Med vår datamodell och vårt arbetsflöde från början till slut kommer vi till exempel att proaktivt kunna föreslå nya varianter (t.ex. en ny finjusterad modell), testa den på historiska data (t.ex. med hjälp av olika tekniker från förstärkningsinlärning), möjliggöra ett gradvist, levande A/B-test och upprepa processen. Med ett verktyg som detta kan ingenjörer fokusera på arbetsflöden på högre nivå – bestämma vilka data som ska gå in och ut ur dessa modeller, hur framgång ska mätas, vilka beteenden som ska stimuleras och avskräckas och så vidare – och lämna implementeringsdetaljerna på låg nivå till ett automatiserat system. Detta är den framtid vi ser för LLM-teknik som disciplin. Nyligen nådde TensorZero #1 trending repository of the week globalt på GitHub (och vi är på väg att passera 10k stjärnor). Vi är lyckligt lottade som har fått bidrag från dussintals utvecklare över hela världen, och det är spännande att se TensorZero redan driva banbrytande LLM-produkter hos avancerade AI-startups och stora organisationer, inklusive en av Europas största banker. Vi är glada att kunna dela med oss av att vi har samlat in 7.3 miljoner dollar för att påskynda TensorZeros ansträngningar att bygga klassens bästa infrastruktur med öppen källkod för LLM-ingenjörer (vi anställer!). Rundan leddes av @FirstMarkCap, med deltagande från @BessemerVP, @bedrock, @DRWTrading, @coalitionvc och dussintals strategiska änglar.
25,92K