Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nils Pihl (broodsugar.eth)
Меметичний інженер і кіберделічний трансгуманіст. Будуємо @AukiNetwork за допомогою @AukiLabs, трансформуємо роздрібну торгівлю за допомогою @CactusXR
Спільне сприйняття та відчуття простору – це те, що це виправить.

Massimo5 годин тому
Два однаково розумних робота Amazon
298
Користувач Nils Pihl (broodsugar.eth) поділився
Епічне бачення просторового позиціонування, якщо ви розробник доповненої реальності, подивіться це, ДВІЧІ. Не надто технічна, а про бачення того, як повинні працювати наші додатки. Більше не потрібно починати користувача з нуля, усі 3D-активи залишаються там, де вони зупинилися востаннє, об'єднуючи їх у простір для м'яса.
310
Користувач Nils Pihl (broodsugar.eth) поділився
Останнім часом я часто чув таке: «Ми тренували нашого робота на одному об'єкті, і він перетворився на новий об'єкт – ці нові моделі VLA божевільні!»
Давайте поговоримо про те, що насправді відбувається в цій частині «А» (дія) вашої моделі VLA.
Візія та мовна складові? Вони неймовірні. Попередньо навчені на даних масштабу Інтернету, вони розуміють об'єкти, просторові відносини та інструкції щодо завдань краще, ніж будь-коли.
А що стосується діяльної складової? Це все ще вивчено з нуля на ваших конкретних демонстраціях роботів.
Реальність така: ваша модель VLA має уявлення про те, як виглядає викрутка і що означає «закрутити гвинт». Але фактична рухова схема для «обертання зап'ястя з одночасним тиском вниз»? Це випливає з ваших 500 демонстрацій роботів.
Що це означає для «узагальнення»:
• Узагальнення зору: миттєво впізнає нові об'єкти (завдяки попередньому навчанню)
• Узагальнення мови: Розуміє інструкції з нових завдань (завдяки попередньому навчанню)
• Узагальнення дій: все ще обмежується руховими патернами, які спостерігаються під час навчання роботів
Попросіть того ж робота «відкрутити кришку від пляшки», і він не вийде, тому що:
• Vision: розпізнає пляшку та кришку
• Мова: Розуміє "відкрутити"
• Дія: Так і не вивчив схему мотора «крутити під час тяги»
Гірка правда про моделі VLA:
«VL» дає неймовірне розуміння з нульовим пострілом. «А», як і раніше, вимагає демонстрації з урахуванням конкретного завдання.
Ми розв'язали проблему сприйняття та міркування. Ми не розв'язали проблему узагальнення моторів.
25,96K
Користувач Nils Pihl (broodsugar.eth) поділився
Ми створюємо новий інтернет для робототехніки та XR, щоб зробити фізичний світ доступним для штучного інтелекту.
У цьогорічному відео State of the Auki Network ми висвітлюємо деякі з дивовижних речей, які вже будуються на децентралізованій мережі сприйняття машин:
5,15K
Користувач Nils Pihl (broodsugar.eth) поділився
У 2009 році Чарлі Роуз запитав Дженсена Хуанга про порівняння Nvidia проти Intel.
Виробники чіпів не конкурували безпосередньо, але Дженсен сказав, що GPU проти CPU — це «битва за душу» обчислень, і графічні процесори стануть «більш актуальними» з часом.
Intel коштувала $100 млрд, а Nvidia – $4 млрд. Сьогодні Intel коштує $107 млрд, а Nvidia коштує в ~1,000 разів більше – $4,4 трлн.
292,79K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги