Investigadores del MIT enseñan a modelos de IA a interpretar gráficos
Investigadores del MIT y del MIT-IBM Computing Research Lab han desarrollado ChartNet, un recurso multifacético diseñado para enseñar a los modelos de visión-lenguaje (VLMs) a interpretar gráficos de manera efectiva. Utilizando un método de generación de datos novedoso, crearon un conjunto de datos de más de un millón de gráficos variados y lo usaron para entrenar VLMs de código abierto. Estos modelos más pequeños superaron significativamente a modelos comerciales mucho más grandes en tareas como la extracción y el resumen de datos, lo que podría permitir a empresas con presupuestos limitados utilizar la IA más fácilmente para el análisis de tendencias comerciales e interpretación de figuras científicas.
Jovana KondicAude OlivaRogerio Ferismodelos de visión-lenguajeIA generativadatos sintéticosinterpretación de gráficos
Leer noticia original