Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tomasz Tunguz
Cuando trabajé en Google, tuve la suerte de colaborar con algunos de los ingenieros de aprendizaje automático (ML) más brillantes. Trabajaron en ingeniería de características. Al elegir los factores para guiar el modelo de ML, sus avances podrían generar decenas o cientos de millones de ingresos adicionales.
Imagine una hoja de cálculo de Excel con cientos de columnas de datos. Suma dos columnas, multiplica dos, divide por otra y resta una cuarta. Cada uno de estos es una característica. Los modelos de AA usaban funciones para predecir el mejor anuncio para mostrar.
Comenzó como una artesanía, reflejando las vibraciones de la época. Con el tiempo, hemos mecanizado este arte en una máquina llamada AutoML que acelera enormemente el descubrimiento de las características correctas.
Hoy en día, el aprendizaje por refuerzo (RL) está en el mismo lugar que la ingeniería de características hace 15 años.
¿Qué es RL? Es una técnica para enseñar a la IA a lograr objetivos.
Considere un Roomba valiente. Presiona en una habitación sucia.
Luego debe hacer un plan de limpieza y ejecutarlo. Crear el plan es el paso 1. Para completar el plan, como cualquier buen trabajador, se recompensará a sí mismo, no con un descanso de futbolín, sino con algunos puntos.
Su función de recompensa podría ser: +0.1 por cada nuevo pie cuadrado limpiado, -5 por chocar contra una pared y +100 por regresar a su muelle con un cubo de basura lleno. El comportamiento del vacío incansable está moldeado por esta simple aritmética. (NB: Estoy simplificando bastante aquí).
Hoy en día, la IA puede crear el plan, pero aún no puede desarrollar las funciones de recompensa. La gente hace esto, al igual que desarrollamos funciones hace 15 años.
¿Veremos un AutoRL? No por un tiempo. Las técnicas para RL aún están en debate. Andrej Karpathy destacó el debate en un podcast reciente.
Esta ola actual de mejora de la IA podría depender del éxito de RL. Hoy en día, es en gran medida un oficio. El potencial de automatizarlo, hasta cierto punto o por completo, transformará la forma en que construimos sistemas agenciales.

2.85K
Son las 9:30 a.m. ¿Sabes dónde está tu agente?
A medida que entramos en la era de la IA agencial, esta es una pregunta cada vez más importante. ChatGPT lanzó el uso de la IA por parte de los consumidores, comprimiendo todo el conocimiento humano en un solo modelo. Ahora le pedimos a la IA que actúe en nuestro nombre en el trabajo.
Analice este estado de cuenta de la hipoteca. Averigüe si esta persona tiene seguro médico. Responda esta llamada entrante sobre una minivan Honda Odyssey 2026. Los agentes de IA están haciendo todo esto hoy. Además, la IA codifica millones de líneas todos los días.
Mi agente de codificación, Claude Code, me ayuda a escribir software. Se ejecuta en mi computadora en mi terminal, el cursor naranja parpadea. Cuando uso Notion AI para resumir un documento, se ejecuta en la nube de Notion. Una gran empresa que maneja consultas de atención al cliente ejecuta su IA en su nube, ya sea Azure, Google, Amazon u otro.
¿Qué tipo de agentes deben ejecutarse en qué ubicación: en el dispositivo, en mi nube o en la nube de un proveedor de software?
Para un proveedor: Un proveedor debe ofrecer los tres, pero por diferentes razones. Los agentes del lado del cliente manejan tareas sensibles a la privacidad, incluido el acceso a datos que solo están disponibles localmente, como el historial del navegador, los archivos locales y el contenido del portapapeles. También pueden aprovechar los recursos locales. Las implementaciones propias en la nube cumplen con los requisitos de control y cumplimiento de la empresa. La nube alojada proporciona escalabilidad y conveniencia para la mayoría de los casos de uso.
Para una empresa: Una empresa tendrá que gestionar los tres. Es muy probable que los agentes de codificación permanezcan ejecutándose en los dispositivos de los empleados. Es probable que ciertos agentes de alta velocidad estén en nubes alojadas. El software central y la infraestructura se ejecutarán en su propia nube. Esto presenta la topología más compleja, pero es una realidad empresarial.
Para un usuario individual: Los usuarios individuales utilizarán predominantemente nubes alojadas y del lado del cliente. Aparte de los desarrolladores de software, no muchas personas ejecutan su propia infraestructura.
Estas implementaciones híbridas se multiplexan por todos los protocolos de comunicación entre agentes, ya sea MCP o A2A o los que vendrán en el futuro. La red de esto es que estamos creando nuevas redes agenciales dentro de las empresas.
Así que la próxima vez que sean las 9:30 a.m. y su agente salga a correr, sabrá si debe revisar su computadora portátil, su nube o el centro de datos de su proveedor.

2.96K
Populares
Ranking
Favoritas