Investigadores del Ejército han desarrollado un nuevo marco basado en el aprendizaje automático, para mejorar la seguridad de las redes informáticas dentro de los vehículos sin mermar su rendimiento.
Con la prevalencia generalizada de los automóviles modernos que confían el control a los ordenadores de a bordo, esta investigación apunta a un esfuerzo mayor del Ejército para invertir en mayores medidas de protección de la ciberseguridad para sus plataformas aéreas y terrestres, especialmente los vehículos pesados.
En colaboración con un equipo internacional de expertos de Virginia Tech, la Universidad de Queensland y el Instituto de Ciencia y Tecnología de Gwangju, los investigadores del Laboratorio de Investigación del Ejército idearon una técnica llamada DESOLATOR para ayudar a optimizar una conocida estrategia de ciberseguridad conocida como defensa de objetivo móvil.
«La idea es que resulta difícil acertar en un blanco móvil», dijo el Dr. Terrence Moore, matemático del Ejército. «Si todo es estático, el adversario puede tomarse su tiempo para observar y elegir sus objetivos. Pero si se barajan las direcciones IP con la suficiente rapidez, la información asignada a ellas se pierde rápidamente y el adversario tiene que volver a buscarla.»
DESOLATOR, que significa «deep reinforcement learning-based resource allocation and moving target defense deployment framework», ayuda a la red del vehículo a identificar la frecuencia de barajado de IP y la asignación de ancho de banda óptimas para ofrecer una defensa eficaz y a largo plazo de los objetivos móviles.
Según la Dra. Frederica Free-Nelson, científica informática del Ejército y directora del programa, la consecución de la primera mantiene la incertidumbre lo suficientemente alta como para frustrar a los posibles atacantes, sin que su mantenimiento resulte demasiado costoso, mientras que la consecución de la segunda evita la ralentización de las áreas críticas de la red con alta prioridad.
«Este nivel de fortificación de los activos prioritarios de una red es un componente integral para cualquier tipo de protección de la red», dijo Nelson. «La tecnología facilita una protección ligera en la que se utilizan menos recursos para una protección maximizada. La utilidad de un menor número de recursos para proteger los sistemas de misión y los dispositivos conectados en los vehículos manteniendo la misma calidad de servicio es una ventaja añadida.»
El equipo de investigación recurrió al aprendizaje de refuerzo profundo para moldear gradualmente el comportamiento del algoritmo basándose en varias funciones de compensación, como el tiempo de exposición y el número de paquetes descartados, para garantizar que DESOLATOR tuviera en cuenta tanto la seguridad como la eficiencia por igual.
«Las redes existentes en los vehículos son muy eficientes, pero no se diseñaron pensando en la seguridad», afirma Moore. «Hoy en día, hay muchas investigaciones que se centran únicamente en mejorar el rendimiento o la seguridad. Tener en cuenta tanto el rendimiento como la seguridad es algo poco habitual, sobre todo en las redes de los vehículos».
Además, DESOLATOR no se limita a identificar la frecuencia de barrido de IP y la asignación de ancho de banda óptimas. Dado que este enfoque existe como un marco basado en el aprendizaje automático, otros investigadores pueden modificar la técnica para perseguir diferentes objetivos dentro del espacio del problema.
«Esta capacidad de modificar la tecnología es muy valiosa no sólo para ampliar la investigación, sino también para combinar la capacidad con otras capacidades cibernéticas para una protección óptima de ciberseguridad», dijo Nelson.
Los investigadores detallan información sobre su enfoque en el documento de investigación, DESOLATER: Deep Reinforcement Learning-Based Resource Allocation and Moving Target Defense Deployment Framework, en la revista revisada por pares IEEE Access.
Fte. Army.mil