Por: Ran Sun, Sr. Director de Producto, Jia Wang, Sr. Ingeniero de aprendizaje automático, Gowtham Suresh, Sr. Científico aplicado
Se podría pensar en el negocio de intermediación digital de Uber Freight como una plataforma de citas en línea. Al igual que las citas en línea buscan emparejar a las personas, el corretaje pretende emparejar las cargas de los cargadores con los transportistas dispuestos a aceptarlas. En concreto, los cargadores recurren a nosotros para llegar a una base de transportistas más amplia de la que tienen acceso. Esto no sólo maximiza su potencial para lograr los mejores resultados posibles en cuanto a costes y servicios, sino que además ambas partes pueden confiar en nuestra experiencia y tecnología en la gestión del ciclo de vida de la carga descendente.
Para encontrar ese verdadero amor carga, podríamos pedir al transportista que especifique sus preferencias a través de la búsqueda: ¿eres una persona hogareña, por lo que necesitas una ruta recurrente que te lleve a casa, o tienes una vena viajera y estás dispuesto a conducir por cualquier ruta? Pero la gente no siempre puede articular lo que quiere, ni lo mucho que importan esos deseos.
Este matiz fue el impulso para lanzar un sistema de recomendaciones en Uber Freight. Hasta ahora habíamos hecho recaer sobre los transportistas la carga de decirnos lo que quieren a través de la búsqueda, pero ésta es tediosa, los transportistas tienen múltiples intenciones de búsqueda y no siempre hacen explícitas sus preferencias. Al permitir un proceso de descubrimiento automatizado, podemos dar servicio a las cargas de forma más eficaz y rentable. Esto genera confianza con los cargadores y aumenta la cantidad de carga que ofrecen a nuestra plataforma, lo que beneficia a los transportistas, dándoles más opciones para encontrar la carga perfecta. Un mayor volumen de carga atrae a más transportistas a la plataforma, lo que aumenta la capacidad de los cargadores para licitar su carga de forma eficaz y rentable. En resumen, un sistema de recomendaciones es una forma de activar la rueda volante del corretaje, echando una mano a cargadores y transportistas haciendo de casamenteros.
El volante de corretaje. Las recomendaciones son un componente de una red automatizada e instantánea y facilitan una mejor utilización del operador.
Antes de adentrarnos en nuestra solución, dediquemos un momento a definir mejor la correspondencia de cargas. En una red perfectamente optimizadaseríamos capaces de asignar la carga exacta al transportista exacto en todo el país. Sin embargo, las capacidades y preferencias del transportista complican la adecuación de la carga, al igual que los requisitos de la misma, como el tipo de carga, la distancia a recorrer y el plazo de entrega. Nuestro sistema de recomendaciones juzga el grado de adecuación que puede existir entre un transportista y una carga para ofrecer las mejores combinaciones.
La adaptación de la carga y el DFM son conceptos estrechamente relacionados. Load matching es el término más amplio; se refiere al proceso de conectar cargadores con transportistas para utilizar eficientemente la capacidad de transporte. El cotejo de cargas puede hacerse de forma digital o no digital (por ejemplo, mediante llamadas telefónicas o relaciones personales). DFM se refiere específicamente a la adaptación de la carga mediante métodos digitales. Permite conocer en tiempo real las necesidades de la red y la capacidad del operador, reduciendo la necesidad de intervención manual.
Nuestra hipótesis era que, sustituyendo la página de búsqueda por defecto por una página de recomendaciones, podríamos alejar a los portadores de un modelo de búsqueda de «pesca submarina» y acercarlos a una experiencia de descubrimiento en la que encontrarían cargas que ni siquiera pensaban buscar. Tanto el diseño de la experiencia del usuario como el propio algoritmo fueron fundamentales para el éxito de este producto. En este post, profundizaremos en el algoritmo.
Nuestro sistema de recomendaciones prioriza la conversión y el compromiso, similar a los desplegados en el sector del comercio electrónico. Hay dos componentes: la generación de candidatos y el clasificador/reforzador.
Inicialmente queríamos utilizar el filtrado colaborativo para generar cargas candidatas a recomendar. El filtrado colaborativo examina a los usuarios con un comportamiento similar para deducir las preferencias del usuario en cuestión, de forma parecida a cómo su servicio de streaming favorito aprovecha los datos de los usuarios para recomendar contenidos. Sin embargo, emplear esta técnica utilizando las reservas de carga como unidad de similitud presenta dificultades, ya que las reservas de carga son exclusivas. En el contexto del servicio de streaming, a dos usuarios les puede gustar la misma película. En nuestro contexto, dos usuarios no puedes reservar la misma carga. Para eludir este problema, probamos métodos como buscar en carril reservas y cargas guardadas como señales positivas. (Las reservas de carril son cargas múltiples reservadas en la misma ruta geográfica, por ejemplo, de San Francisco a Los Ángeles). Ambos no adolecen de exclusividad. Sin embargo, la viabilidad de estos enfoques se vio truncada por la escasez de datos.
En última instancia, utilizamos varias señales de interés de los transportistas para generar candidatos a recomendación de carga:
Comparación de precisión y recuperación para distintos tipos de generación de candidatos
El gráfico anterior representa la precisión y la recuperación considerando las 20 cargas mejor clasificadas de cada uno de los tipos de generación candidatos. La precisión mide cuántas de las recomendaciones se reservaron realmente, mientras que el recuerdo comprueba qué proporción de reservas se recomendaron. Normalmente, damos prioridad a la precisión sobre el recuerdo cuando se trata de recomendaciones, ya que es una evaluación directa de la relevancia. Nuestro principal objetivo es cultivar la confianza entre los transportistas presentándoles las cargas más pertinentes. Incluso cuando esas cargas son escasas, nos inclinamos por mostrar menos recomendaciones en lugar de saturar el espacio con otras menos relevantes. En nuestras pruebas fuera de línea, las cargas guardadas arrojaron sistemáticamente la mayor precisión, lo que las convierte en una señal sólida. Los clics y las reservas presentan una precisión relativamente similar y contribuyen significativamente al recuerdo. Proporcionamos intencionadamente un impulso adicional a los candidatos de cargas guardadas gracias a su rendimiento de precisión excepcionalmente alto.
Utilizamos el algoritmo XGBoost para ordenar las cargas candidatas generadas a partir de las fuentes mencionadas. El algoritmo utiliza como características las características de la carga, los personajes de los transportistas establecidos en la investigación de usuarios y corroborados mediante datos, y la intersección entre las características de la carga y las preferencias de los transportistas. A continuación, utiliza la etiqueta de si la carga estaba reservada para fines de formación y predicción.
A continuación se muestran los valores SHAP de las 3 características principales de una carga candidata de muestra. El orden de las características ilustra su importancia, el color indica el impacto positivo (rojo) o negativo (azul) en la variable de resultado y el eje x indica la magnitud del impacto. En este caso, la variable de resultado es la probabilidad de reserva. Tiempo_derivado es la característica más importante para determinar la probabilidad de reserva. El plazo de entrega de esta muestra indica una baja probabilidad de reserva. Tenga en cuenta que el orden de importancia de las características y su magnitud varían según la carga.
Importancia de las características utilizando los valores SHAP para una muestra de cargaDestacamos tres características clave
Probamos nuestro nuevo sistema de recomendaciones con un experimento A/B a nivel de usuario, con resultados positivos. Las mejoras se produjeron a lo largo de todo el embudo de reservas de las aerolíneas, sobre todo un aumento del 12% en las reservas de los usuarios activos y un incremento global del 3% en las reservas y del 5% en los clics.
¿Y ahora qué? Investigaremos varias iteraciones, desde la mejora de la experiencia para determinados grupos de usuarios hasta el aprovechamiento de más fuentes de datos en la generación de candidatos de carga. Con estos cambios, los transportistas pueden confiar en Uber Freight para ayudarles a encontrar la mejor carga posible dadas sus preferencias, de la forma más eficiente posible. Eso sí que es un final feliz.
¿Le interesa saber más sobre cómo nuestro equipo utiliza algoritmos basados en IA para mejorar la logística de cargadores y transportistas? Conozca nuestro modelo de probabilidad de llegada tardía (PLA).