
Par : Mudit Gupta, scientifique principal des données ; Mohit Gulla, scientifique appliqué ; et Angelo Mancini, responsable des sciences appliquées
Mon chargement arrivera-t-il à temps ?
Dans le secteur de la logistique, il est essentiel de comprendre les retards de chargement pour atténuer les problèmes de service. Prévenu à l'avance, Uber Freight peut collaborer avec le transporteur et l'expéditeur pour atténuer l'impact d'un retard. Cependant, les retards sont souvent détectés trop tard pour permettre des ajustements, ou ne sont détectés qu'après l'heure de rendez-vous.
Chez Uber Freight, notre système de suivi est conçu pour offrir un service de la plus haute qualité aux expéditeurs. En combinant nos données de suivi internes, notre connaissance approfondie de la logistique et notre expertise en apprentissage automatique, nous avons développé un système qui affine en permanence nos données sur la localisation des installations et les exploite pour fournir à notre équipe opérationnelle des prévisions en temps réel sur les retards.
Le problème et notre approche pour le résoudre
Prédire l'arrivée ponctuelle d'un transporteur à une installation nécessite trois éléments clés : (1) la localisation de l'installation ; (2) des géorepérages autour de l'installation permettant de détecter l'arrivée ou le départ d'un transporteur ; et (3) un modèle capable de prédire en temps réel les retards d'arrivée en fonction de la localisation du transporteur et de l'installation. Comme nous le verrons dans l'exemple suivant, la défaillance de l'un de ces éléments entraîne l'effondrement du système.

Figure 1 : Deux camions se dirigeant vers la même installation (épingle verte) génèrent différents types d'erreurs de suivi lorsque le système a une localisation d'installation inexacte (le cercle marron, avec une géofence d'arrivée de 1,5 mile et une géofence de départ de 6 miles).
Dans le cas du camion vert, aucune des deux géofences n'est déclenchée, ce qui signifie que, d'après le système, le transporteur n'est jamais arrivé à l'installation (même s'il est peut-être arrivé à l'heure). Dans le cas du camion marron, les deux géofences sont déclenchées < alors que le transporteur est en transit vers l'installation, ce qui signifie que le système enregistrera à tort l'heure d'arrivée du transporteur à l'installation, son temps de présence sur place sera très court (puisqu'il ne fait que passer, ce qu'on appelle un « défaut de séjour ») et son départ à l'heure incorrecte. Pour les deux camions, toute prévision d'arrivée tardive effectuée pendant leur transit ne serait pas fiable, car le modèle effectuerait des prédictions en utilisant l' emplacement incorrect de l'installation <.
Cet exemple illustre l'approche que nous avons adoptée pour développer notre système de suivi : affiner les fondamentaux (localisation et géorepérages) afin de créer un modèle d'arrivée tardive de haute qualité. Tout au long du projet, nous avons exploité la vaste quantité de données historiques de chargement et de suivi dont nous disposions.
Étape 1 : Poser les bases avec Project Pinpoint
Obtenir des données de localisation pour les installations d'expédition semble simple, n'est-ce pas ? Après tout, ce sont les camions qui se déplacent, et non les installations. Malheureusement, ce n'est pas si simple. Lorsque nous avons examiné nos données de localisation d'installations au début de notre projet, nous avons constaté que les localisations obtenues auprès des fournisseurs de navigation GPS traditionnels étaient souvent incorrectes. Sur un échantillon de 500 des plus grandes installations de notre réseau, environ 40 % présentaient des localisations GPS incorrectes, dont 10 % avec une erreur d'au moins 0,3 mile (probablement par rapport au centre du code postal de l'installation). 0,3 mile peut sembler insignifiant, mais pour ces installations, nos données indiquaient qu'environ 24 % des chargements présentaient des heures d'arrivée/départ incorrectes enregistrées par le système.
Nous avons utilisé nos données de suivi GPS internes, collectées quotidiennement via l'application mobile Uber Freight pour des milliers d'expéditions. La figure 2 ci-dessous illustre notre approche.

Figure 2 : L’emplacement de l’installation dans le système (cercle rouge) est incorrect ; l’emplacement correct peut être identifié en analysant l’emplacement des pings GPS des transporteurs visitant l’installation.
Cet exemple montre clairement que la localisation de l'installation du système est incorrecte et que celle-ci se trouve en réalité près du groupe de pings en haut à droite. Cependant, effectuer cette analyse manuellement pour chaque installation est tout simplement impossible compte tenu de l'étendue de notre réseau. Nous avons donc créé un modèle d'apprentissage automatique pour analyser nos données GPS historiques et identifier les groupes de pings associés aux installations. Pour garantir la précision de l'algorithme, nous avons ajouté des vérifications de bon sens, comme la distinction entre les pings reçus des transporteurs en mouvement et ceux à l'arrêt ; l'élimination des groupes associés aux aires de repos, aux ravitaillements en carburant et autres emplacements erronés ; et l'exclusion des signaux GPS des répartiteurs qui n'étaient pas réellement en transit.
Après avoir nettoyé nos données historiques de localisation des installations, nous exécutons désormais l'algorithme Pinpoint de manière récurrente pour nous assurer que les emplacements de nos installations sont toujours à jour et que nous identifions les emplacements des nouvelles installations rejoignant notre réseau le plus rapidement possible.
Étape 2 : Créer de meilleures géorepérages avec Project Lasso
Comme nous l'avons vu dans le premier exemple, le système de suivi automatisé d'Uber Freight (et de nombreux systèmes de suivi du secteur du fret) utilise des géorepérages pour déterminer l'heure d'arrivée et de départ d'un transporteur. Définir des géorepérages efficaces présente plusieurs difficultés :
Les géorepérages trop grands peuvent entraîner des événements d'arrivée/départ inexacts, tandis que les clôtures trop petites peuvent manquer des arrivées et des départs réels.
Il n'existe pas de rayon idéal pour une géorepérage, car les installations varient considérablement en taille : certaines installations sont de petits bâtiments/bâtiments uniques, tandis qu'un supermarché ou un grand centre de distribution peut avoir une adresse et un « emplacement » liés à un complexe de bâtiments et à un parking spacieux, dont aucun ne représente le quai de chargement réel.
Si l'installation est partagée par plusieurs expéditeurs, nous devrons peut-être déplacer l'emplacement de la géorepérage pour nous concentrer sur la zone de l'installation concernée par la charge suivie.
Pour relever ces défis, nous avons de nouveau fait appel à nos données GPS internes de haute qualité. Dans le cadre du projet Lasso, nous avons développé un algorithme qui analyse des centaines de milliers de signaux GPS afin de créer automatiquement des géorepérages sur mesure pour nos installations. Alors que le géorepérage standard est un cercle d'un rayon de 2,4 km, nous avons pu créer des géorepérages d'un rayon aussi petit que 0,2 à 500 mètres autour de l'installation ou du quai de chargement. Les figures 3 et 4 ci-dessous illustrent comment nous avons converti les données GPS en données genfeces pour diverses installations.

Figure 3 : (à gauche) Pings GPS bruts pour les transporteurs visitant l’installation ; (à droite) Localisation de l’installation et géorepérage automatiquement dérivés des pings GPS.

Figure 4 : Deux emplacements et géorepérages différents identifiés dans la même installation mais connectés à des expéditeurs différents.
Le projet Lasso a permis aux expéditeurs et aux transporteurs de gagner du temps en réduisant les litiges concernant les heures d'arrivée et de départ. Nous avons également constaté une réduction relative de 60 % de la proportion de chargements présentant un comportement manifestement incorrect, par exemple des défauts de transit (moins de 15 minutes entre l'arrivée et le départ) et des défauts de transit (plus de 130 km/h en moyenne entre deux arrêts). Ces améliorations nous confortent dans la fiabilité des heures d'arrivée et de départ enregistrées dans notre système.

Figure 5 : Le projet Lasso a entraîné une réduction soutenue de 60 % (relative) des taux de défauts de suivi après le lancement complet.
3 : Prédire les arrivées tardives grâce à l'apprentissage automatique
Après avoir consolidé les fondations de notre système en corrigeant la localisation des installations et en créant des géorepérages sur mesure, nous étions prêts à relever notre défi initial : fournir des prévisions d'arrivées tardives de haute qualité, en temps réel et à grande échelle. Nous avons suivi un processus en quatre étapes :
Nous avons utilisé les emplacements des installations et les géorepérages récemment corrigés pour nettoyer
rétroactivement nos données historiques afin de nous assurer que nous avons utilisé les données les plus précises possibles pour construire notre modèle.
Nous avons ensuite organisé les charges historiques dans nos données pour nous assurer que seules les charges pour lesquelles nous disposions de données de suivi GPS de qualité suffisamment élevée étaient incluses, encore une fois pour aider le modèle à apprendre à partir des données de la plus haute qualité.
Ensuite, nous avons enrichi les données disponibles pour le modèle ; en plus de la position du transporteur, nous avons inclus des informations telles que la direction du déplacement du transporteur, sa vitesse, son rythme, etc., ainsi que ses performances historiques en matière de ponctualité.
Enfin, nous avons formé et ajusté notre modèle à l’aide de notre plateforme interne de science des données, obtenant un modèle capable de prédire le risque d’arrivée tardive à partir de six heures avant la prise en charge.
Grâce à ces prévisions, notre équipe opérationnelle peut se concentrer sur les chargements susceptibles d'arriver en retard et prendre des mesures correctives, comme contacter le transporteur pour vérifier l'état de la marchandise, alerter l'expéditeur afin qu'il puisse prolonger ou reprogrammer le rendez-vous, ou encore réaffecter le chargement à un autre transporteur (ce qu'on appelle aussi « rejeter » le chargement). Depuis le lancement du modèle de probabilité d'arrivée tardive (PLA) en production, nous avons constaté une amélioration significative de notre capacité à signaler les chargements en retard et à détecter les chargements rejetés.

Quelle est la prochaine étape
Nous considérons le projet d'apprentissage automatique sur les arrivées tardives présenté ici comme la première étape d'une feuille de route ambitieuse visant à améliorer les résultats de service pour nos expéditeurs. Nous travaillons activement sur un modèle d'estimation du temps d'arrivée (ETA) pour accompagner notre modèle PLA. La modélisation de l'ETA est omniprésente dans le secteur de la consommation et de la vente au détail (nous avons tous utilisé une application de navigation ou vu des ETA pour des livraisons de repas), mais la prédiction de l'ETA pour le fret pose des défis spécifiques. Par exemple, les trajets de fret durent souvent beaucoup plus longtemps que les trajets de livraison de repas ou de covoiturage, traversent plusieurs zones géographiques avec des conditions de circulation et météorologiques différentes, et sont impactés à la fois par la réglementation sur les horaires de service et par le comportement des transporteurs (par exemple, les arrêts pour dormir, faire le plein, etc.).
Grâce aux modèles PLA et ETA en place, nous allons développer des flux de travail automatisés et auto-réparateurs afin d'améliorer encore le service offert à nos expéditeurs. Par exemple, nous pouvons utiliser le modèle PLA pour signaler les chargements risquant d'arriver en retard à l'enlèvement, puis utiliser les modèles ETA et PLA pour identifier les transporteurs à proximité susceptibles de récupérer le chargement à temps, et enfin demander automatiquement aux transporteurs les plus prometteurs s'ils peuvent intervenir pour éviter un rendez-vous manqué. Nous exploitons également les bases développées dans le cadre du projet sur les retards pour aller au-delà du suivi des chargements pour les expéditeurs. Par exemple, grâce aux heures d'arrivée et de départ améliorées générées par les projets Pinpoint et Lasso, nous avons produit des estimations beaucoup plus précises du temps d'attente des transporteurs dans les installations (« temps de séjour ») et avons combiné ces estimations avec nos données internes d'évaluation des transporteurs pour quantifier l'impact d'une mauvaise gestion des installations des expéditeurs sur leur satisfaction et, in fine, sur leurs coûts.