Investigaciones del U.S. Army avanzan en el diálogo soldados y robots

diálogo soldados robotsInvestigadores del Ejército de EE. UU trabajan en la mejora del trabajo en equipo entre soldados y robots en entornos tácticos, permitiendo a los robots hacer preguntas y aprender en tiempo real a través del diálogo.

Según el Dr. Felix Gervits, investigador del Laboratorio de Investigación del Ejército, los entornos tácticos para el trabajo en equipo entre soldados y robots se caracterizan por un alto grado de novedad e incertidumbre. Los robots que operan en estos entornos se encontrarán naturalmente con conceptos desconocidos, como objetos y lugares, y necesitarán métodos para aprender qué son, dijo.

Una solución a este problema es aprovechar al soldado y permitir que los robots hagan preguntas para apoyar el aprendizaje; sin embargo, no está claro qué tipo de preguntas deben hacer los robots, ni cómo deben formularlas, dijo Gervits.

Los investigadores transcribieron y etiquetaron los diálogos del estudio en función de los distintos tipos de preguntas, y luego los dieron a conocer públicamente como corpus Human-Robot Dialogue Learning, o HuRDL.

Esta investigación tiene tres aportaciones principales:

  • Plataforma de software para la experimentación en línea
  • Esquema de etiquetado para categorizar las preguntas
  • Corpus HuRDL etiquetado

Como paso para mejorar el diálogo entre soldados y robots, los investigadores recopilaron datos de diálogo de un estudio de interacción entre humanos y robots para investigar cómo los robots deben hacer preguntas cuando se enfrentan a conceptos nuevos. Este estudio es la primera parte de un esfuerzo de investigación más amplio para el desarrollo de algoritmos que apoyen la generación automática de preguntas y el aprendizaje para el equipo soldado-robot, dijo Gervits.

«El objetivo general de esta investigación es mejorar el trabajo en equipo entre soldados y robots en entornos tácticos, permitiendo a los robots hacer preguntas y aprender en tiempo real a través del diálogo», dijo Gervits. «La investigación actual es un paso hacia este objetivo, porque pone de relieve los tipos de preguntas que la gente hace cuando se encuentra con conceptos desconocidos. Los datos que hemos recogido en el corpus HuRDL pueden emplearse para entrenar a los robots a que hagan preguntas específicas cuando se encuentren con tipos de incertidumbre similares. Luego pueden aprender de las respuestas o hacer preguntas de seguimiento si es necesario».

Un problema potencial del aprendizaje mediante el diálogo es que el robot puede hacer muchas preguntas y causar frustración o interrupción al equipo, por lo que esta investigación pretende evitar este problema, haciendo que el robot formule el menor número posible de ellas para aprender un concepto, dijo Gervits. Analizando las estrategias de diálogo efectivas y los tipos de preguntas hechas en el estudio, se pueden aplicar políticas que garanticen que los robots causen la mínima interrupción mientras aprenden.

Para llevar a cabo estudios interactivos en medio de la pandemia de COVID-19, Gervits y sus colegas desarrollaron una plataforma de software para la experimentación en línea. La plataforma permite la recopilación de datos por crowdsourcing, en la que personas de todo el país pueden participar a distancia en experimentos virtuales de ARL.

En el estudio actual, los participantes controlaban un robot en un entorno virtual en 3D que contenía diversos objetos y lugares desconocidos.

Según Gervits, la comunicación de ida y vuelta era el núcleo del estudio. Un experimentador daba instrucciones a los participantes para que localizaran y movieran algunos de los objetos. Como los objetos no eran familiares y tenían nombres y propiedades extrañas, la gente tendía a hacer muchas preguntas. Estas preguntas se registraron para su posterior análisis.

El análisis de las preguntas del estudio condujo a la creación de lo que se conoce como un esquema de anotación, o un método para estructurar los datos del diálogo, que clasificaba las preguntas según su forma y función.

Por ejemplo, los investigadores etiquetaron la pregunta «¿Es el rojo?» como una pregunta sí-no del tipo «confirmar objeto por el color».

«Esta forma de estructurar rigurosamente los datos del diálogo es un paso esencial en el proceso de desarrollo de enfoques automatizados de generación de preguntas para el aprendizaje de robots a través del diálogo», dijo Gervits. Este esquema de anotación se aplicó al corpus HuRDL y cada pregunta se etiquetó en consecuencia.

Según los investigadores, esta investigación se distingue en varios aspectos del campo.

En primer lugar, hace hincapié en el diálogo de ida y vuelta como medio de aprendizaje, lo que difiere de los enfoques tradicionales de aprendizaje activo, que suelen centrarse en consultas puntuales o en métodos no lingüísticos como el aprendizaje a partir de una demostración. Dado que el lenguaje es una interfaz natural para los seres humanos, este enfoque es intuitivo y requiere una formación mínima.

En segundo lugar, la investigación se basa en estudios empíricos e interactivos sobre el diálogo humano. A diferencia de los típicos estudios en línea en los que los participantes ven imágenes o vídeos y responden a las preguntas de una encuesta, este estudio supuso una interacción en tiempo real entre el experimentador y el participante. Esto fue posible gracias al novedoso marco de software del equipo para la experimentación en línea.

Por último, el entorno de estudio que emplearon los investigadores fue uno relevante para el Ejército, en el que las personas estaban situadas en una zona inexplorada y dependían de una serie de propiedades perceptivas (características de los objetos, puntos de referencia, etc.) para aprender los nombres de los objetos nuevos. En consecuencia, los resultados del estudio deberían aplicarse ampliamente a los entornos relevantes para el ejército.

En el futuro, el corpus HuRDL etiquetado será un recurso útil para los investigadores que estudian el diálogo entre humanos y robots en la interacción situada.

El análisis adicional del corpus revelará estrategias de diálogo para la generación efectiva de preguntas y otros hallazgos relevantes como el mejor momento para hacer preguntas y cuántas preguntas son apropiadas, dijo Gervits.

Gervits señaló que la principal dirección de la investigación futura será la creación de algoritmos novedosos para la generación automática de preguntas basados en los datos recogidos en el estudio.

Los datos podrán usarse directamente para entrenar un sistema automatizado, o para informar sobre las políticas generales de generación de preguntas. Cualquiera de los dos enfoques acercará al equipo al objetivo de tener robots que puedan hacer preguntas eficaces y aprender de las respuestas, dijo.

«A medida que los equipos de soldados y robots sean cada vez más comunes en el Ejército, será necesario coordinar la actividad de estos grupos», dijo Gervits. «El diálogo es una forma natural y eficaz de lograr este objetivo, y la investigación actual es un paso en la dirección de crear una interfaz de habla natural, que permita a los robots aprender sobre el mundo a través del diálogo con los soldados. Soy optimista y creo que esta investigación tendrá un impacto real en el futuro de los equipos soldado-robot».

Fte. Army.mil