Провали на бичачому ринку призначені для покупки, особливо на проектах з великими каталізаторами Ми всі знаємо, що штучний інтелект – це наратив цього циклу, розпочатого ai16z та Virtuals минулого року. Я впевнений, що ринок зосередиться на більш складних і витончених технологіях, таких як VLA, і дозвольте мені пояснити вам чому. LLM (великі мовні моделі) в основному читають і записують текст: вони чудово пояснюють, планують і генерують інструкції, але самі по собі не керують моторами або не взаємодіють з фізичним світом (як ви, можливо, відчували з chatgpt). VLA (Vision Language Action models) відрізняються від LLM тим, що це мультимодальні системи, які дивляться на речі (vision), розуміють інструкції (мова) і безпосередньо виробляють дії. Це все одно, що сказати роботу підняти червону чашку, а потім рухати його рукою, щоб зробити це. ВЛА навчаються на прикладах, які поєднують зображення/відео + інструкції + сліди реальних дій (як насправді рухався робот), і вони повинні працювати швидко та безпечно в режимі реального часу. LLM зі свого боку тренуються на величезних колекціях текстів і зосереджуються на міркуваннях і мовних завданнях. ТЛ; DR LLM думають і говорять, а VLA бачать, міркують і діють. Як ви можете бачити, VLA є важливим доповненням до LLM і, зокрема, забезпечать наступну інновацію 0 до 1 у загальній економіці, якою стане робототехніка. Більшість інвестиційних фондів спрямовують значну частину своїх інвестицій у цей сектор, що розглядається як наступна логічна еволюція в індустрії штучного інтелекту. Деякий час тому я вже зробив пост про нинішнього лідера на крипторинку @codecopenflow, який ще не залучив капітал (справедливий запуск), ще не постачає передові продукти і в даний час коштує 23 мільйони доларів FDV. Для інформації, інші криптовалютні конкуренти залучили 20 мільйонів доларів ( @openmind_agi) за ціною, ймовірно, від 200 до 300 мільйонів доларів ++ FDV, хоча жоден продукт або спільнота ще не були створені та доставлені. Що робить Codec провідним проектом у цьому секторі, так це те, що вони вирішують важливе вузьке місце в робототехніці та штучному інтелекті, яке полягає в складності взаємодії всіх інструментів штучного інтелекту разом. Дозвольте мені пояснити. Їхній останній реліз, OPTR (operator), є набором інструментів, який допомагає створювати операторів, здатних взаємодіяти на кількох платформах, таких як роботи, настільні комп'ютери, браузери або симуляції. Мета оператора полягає в тому, щоб бачити, міркувати і діяти (VLA) як в цифровому (комп'ютери), так і у фізичному (роботи) світах. Цей набір інструментів слугує основною інфраструктурою для команд роботів, які прагнуть протестувати свій продукт і покращити загальний процес, надаючи уніфікований досвід замість окремих для веб-браузерів, симуляцій або роботів. Це, по суті, робить оператора адаптивним і автономним незалежно від навколишнього середовища. Отже, ви це зрозумієте, це значно заощадить час компаніям і розробникам, яким раніше доводилося проходити кожен крок вручну, і де ви можете заощадити час, ви можете заощадити гроші. Це також дозволить Codec створювати власні проекти для операторів і відносно швидко запускати нові потужності на ринок, зокрема через свій ринок. ТЛ; Д.Р.: Ви, напевно, бачили відео, як роботи складають серветки, сортують коробки або стрибають на різних елементах. Всі вони були навчені для цього дуже специфічного випадку використання, і, на жаль, одна навичка не може бути повторно використана в іншому середовищі, як це могла б зробити людина. OPTR від Codec вирішує це, роблячи навички доступними для передачі між середовищами та ситуаціями, роблячи навчання та розвиток набагато швидшими та дешевшими для підприємств. Ось чому Codec так цікавий в об'єднанні цифрового світу з фізичним. $CODEC, закодований.
7,24K