Debido a la pandemia de la covid-19, muchas empresas de transporte han visto como un valor añadido la necesidad de informar a sus clientes de la ocupación con que se encontrarán. Esta funcionalidad resulta de utilidad para frenar los contagios y para evitar aglomeraciones de gente si se informa con antelación a los pasajeros sobre cómo irán de llenos los vehículos, pueden optar por viajar en los que vayan más vacíos.
Dado que las empresas de autobuses suelen guardar datos e históricos de los viajes de cada vehículo, surge la posibilidad de abordar el problema con técnicas de inteligencia artificial basada en datos. En concreto, con el aprendizaje supervisado, en el que se construye un modelo predictivo al que se entrena con datos históricos que se etiquetan de alguna manera. A partir de dichos datos, el modelo detecta ocurrencias de patrones.
Al juntar datos históricos de ocupación y validaciones de los usuarios con la información de las líneas de autobús y del calendario, ya se dispondría de los datos necesarios para modelar el comportamiento de los pasajeros.
Cuando hablamos de entrenar una red neuronal, lo que en realidad queremos es ajustar los parámetros de una función para que aprenda una tarea concreta. Es decir, que para que aprenda a obtener unas salidas a partir de unas entradas.
Esto se consigue suministrando como entrada, durante la fase de entrenamiento, grandes cantidades de datos, de modo que se va minimizando el error de predicción del modelo a base de ir ajustando sus parámetros internos. El proceso de entrenamiento de una red neuronal se basa principalmente en la ingeniosa aplicación de La regla de la cadena, que se suele
enseñar para derivar en matemáticas. Esta regla nos permite calcular cómo se deben ir modificando los parámetros de la red para minimizar el error de predicción iterativamente.
En este caso, se pretende que el modelo aprenda a calcular la ocupación de los buses en cada una de las paradas por donde pasan. Para ello, al modelo se le debe dar como entrada una representación numérica de la información del autobús, la parada, el calendario, etc., y se pretende que nos devuelva el número de pasajeros que habrá. Con históricos de unos pocos meses ya se puede llegar a obtener una predicción bastante buena.
La gracia de utilizar redes neuronales es que permiten, con un único modelo, hacer predicciones sobre cualquiera de las líneas de autobús en cada una de sus paradas, sin tener que hacer un modelo o algoritmo especializado para cada una de las líneas. Esto facilita su aplicación en otras ciudades, donde las líneas y las paradas serán completamente distintas.