Hoy estaba leyendo en un libro aún no publicado, de un lider técnico de google, acerca de las optimiezaciones ligeras en agentes IA y explicaban un par de técnicas de optimizacion de LLMs que se utilizan mucho en robótica, basadas off course, en Reinforcement Learning).
Las conclusiones están, a grandes rasgos, muy alineadas con el concepto de dejar que las máquinas vayan avanzando por sí mismas, lo que también tiene mucho que ver con los modelos de razonamiento agénticos y especialmente en planes no deterministas,....
Parece que todo va alineándose (para que luego lleguemos los humanos y desbaratemos los planes!) ....
Muy interesante la reflexión!
Hoy estaba leyendo en un libro aún no publicado, de un lider técnico de google, acerca de las optimiezaciones ligeras en agentes IA y explicaban un par de técnicas de optimizacion de LLMs que se utilizan mucho en robótica, basadas off course, en Reinforcement Learning).
Las conclusiones están, a grandes rasgos, muy alineadas con el concepto de dejar que las máquinas vayan avanzando por sí mismas, lo que también tiene mucho que ver con los modelos de razonamiento agénticos y especialmente en planes no deterministas,....
Parece que todo va alineándose (para que luego lleguemos los humanos y desbaratemos los planes!) ....
Un abrazo!