Ir al contenido principal
MIT News

Enseñar a los agentes de IA a hacer mejores preguntas jugando a “Hundir la Flota”

Investigadores del MIT han utilizado el clásico juego "Hundir la Flota" como banco de pruebas para agentes de IA. Descubrieron que un modelo de IA pequeño puede superar a los más grandes con un 1% del coste. La clave reside en una estrategia de inferencia Monte Carlo que permite a los modelos sopesar cuidadosamente las opciones sobre dónde pueden estar ocultas las piezas del juego. Este enfoque mejoró significativamente la capacidad de los agentes para formular preguntas informativas, reduciendo el número de turnos necesarios para completar el juego y mostrando un gran potencial en la búsqueda de información en entornos inciertos.

agentes IAHundir la FlotaMonte CarloLlama 4 ScoutGPT-5modelos de lenguajeIA de código abierto
Leer noticia original
Escríbenos por WhatsApp
Asesor VirtualAsesor Virtual 24h