[Tribune] Arnaud Cassonnet, Vekia : Optimiser ses prévisions de vente avec des données exogènes

|
Twitter Facebook Linkedin Google + Email Imprimer

TRIBUNE D'EXPERTSBIG DATA Arnaud Cassonnet, consultant Supply Chain Senior chez Vekia, explique dans cette tribune exclusive pour LSA l'intérêt pour les distributeurs des prévisions de vente par l'utilisation de données exogènes aux enseignes, comme la météo, la concurrence, les réseaux sociaux par exemple. 

Arnaud Cassonnet consultant supply chain senior chez Vekia.
Arnaud Cassonnet consultant supply chain senior chez Vekia.© DR

Anticiper le futur est toujours plus efficace que de le subir. Cela est vrai dans tous les domaines, et en particulier quand on parle de Supply Chain ou de distribution. Les produits n’étant pas téléportables instantanément, les stocks coûtent et la rupture de stock pénalise les ventes : placer les bons produits au bon endroit au bon moment permet alors de minimiser les coûts en maximisant les chiffres d’affaires. Pour réaliser cela, les acteurs de la chaîne d’approvisionnement cherchent à établir des prévisions de vente.

De la manière la plus basique, certains chercheront juste à reproduire le passé. Simple, mais peu fiable, car on oublie souvent d’analyser ce passé, avec tous les évènements exceptionnels qu’on y a rencontré : période de non vente car rupture de stock, lancement ou fin de vie d’un produit, fermeture de magasin… On risque alors de prévoir naïvement que tous ces événements vont se reproduire à l’identique : si vous aimez la loterie, cela peut être une piste !

Plus sérieusement, des modèles de prévisions toujours plus performants sont alors apparus. Les meilleurs s’appuient à la fois sur le Big Data (capacité à traiter de grosses volumétries de données), et sur la puissance du Machine Learning (algorithmes auto apprenants). Ces logiciels vont pouvoir utiliser la richesse contenue dans la masse de données à disposition : historiques de plusieurs années, analyse au ticket de caisse, caractéristiques produits sans limite… L’expertise de data analyst couplée à des algorithmes de Machine Learning va permettre d’identifier les données expliquant les ventes, de corriger les historiques d’événements exceptionnels, de tenir compte d’événements à venir pour fournir des prévisions de très haute qualité.

Jusqu’à maintenant, les données utilisées sont restées très classiques. Les modèles tiennent compte des historiques de ventes et de stocks, des référentiels articles, des magasins et fournisseurs. Pour beaucoup, ils prennent aussi en compte l’effet des opérations commerciales passées et à venir, de manière plus ou moins poussée. Mais tout cela reste interne à l’enseigne qui réalise les prévisions.

Pourtant, tant d’autres choses, extérieures à l’enseigne, influent sur les comportements d’achat des consommateurs : la météo, la concurrence, les réseaux sociaux… Pourquoi se passer de ces informations ? Comment en tirer des enseignements et enrichir la prévision ? Concrètement, comment utiliser les données exogènes pour améliorer la prévision de vente ? 

Utilisation des données exogènes : pas si simple !

Tout le monde pourra citer un exemple concret, évident, d’évènement exogène ayant un effet sur son acte d’achat : « il fait beau ce week-end, les ventes de merguez vont exploser », « fini l’été, première vraie semaine d’automne, il est temps de racheter un manteau pour mon fils », « concert au Stade, impossible de circuler, je ferai mes courses un autre jour », « Kate Moss a mis une photo de son nouveau sac à main sur Instagram : je veux le même ! »

Il est globalement simple de trouver quelques cas particuliers. En revanche, il est plus complexe d’automatiser cela, d’identifier de manière plus exhaustive, de quantifier les effets… Cela demande à la fois de l’expertise, de la méthode et de la technologie.

La collecte et la qualification des données

Dans un premier temps, celui qui veut se lancer dans ce sujet devra collecter les données classiques citées précédemment (ventes, stocks, articles…). Il utilisera alors un modèle mathématique lui permettant de calculer de la prévision « hors données exogènes ». En parallèle de cela, il va falloir choisir des données exogènes potentiellement influentes, et organiser leur récupération. Pour garantir une bonne collecte et utilisation des données, il faudra se poser les bonnes questions au préalable : quelles données ai-je envie de regarder ? où puis je les trouver ? sous quel format, à quel prix, avec quelle pérennité de la source ? Les réponses pouvant être différentes si je souhaite juste réaliser une étude (collecte unique, remise en forme manuelle) ou construire un modèle utilisable en production (récurrence et automatisation indispensable). Les compétences nécessaires seront aussi différentes.

Dans certains cas, la collecte de données sera assez simple. Les données météo sont disponibles auprès de plusieurs fournisseurs (Météo France, DarkSky…), sous forme de fichiers structurés et parfaitement décrits : on maitrise et connait alors la signification de chaque donnée. La collecte est aisée. La seule contrainte pouvait être la volumétrie (des années d’historiques météo sur des milliers de villes, cela pèse lourd), ce n’en est plus vraiment une aujourd’hui avec l’évolution des moyens de stockage et de traitement.

Pour d’autres sujets, il y aura des étapes de retraitement indispensables. Récupérer tous les concerts et événements sportifs d’importance autour d’un lieu donné nécessitera sans doute de faire le tour de plusieurs sources. Les données alors récupérées le seront sous des formats différents, plus ou moins complets. Un travail de remise en forme et de consolidation sera alors réalisé avant de pouvoir utiliser ces informations. Et bien sûr, si le but est de les utiliser régulièrement, ce travail devra être le plus automatisé possible.

Ensuite, les spécialistes du Machine Learning vont se mettre en action pour réaliser une étape cruciale : le feature engineering. Alimentés par toutes les données disponibles (internes et exogènes), des algorithmes spécialement conçus pour cette tâche vont permettre de classifier les données en fonction de leur poids dans l’explication de la vente. Par exemple, les ventes de bonnets d’une semaine donnée dans un magasin de centre-ville pourraient s’expliquer : à 30% par le mois considéré, à 12% par la famille de l’article, à 6% par le type de magasin, à 3% par la température du jour… Les poids pourront être totalement différents sur un autre produit. Lorsque des données exogènes apparaissent dans le haut du classement, on peut envisager un modèle de prévision améliorable par cette donnée.

La phase d'apprentissage pour affiner le modèle

C’est maintenant que le modèle va être affiné, en lançant la phase d’apprentissage. Les features principales (caractéristiques discriminantes) identifiées lors de la phase précédente vont être injectées dans le modèle. Supervisé par un expert, il va alors s’auto construire en apprenant du passé (comment expliquer l’historique des ventes en fonction des données). Et après plusieurs tours d’apprentissage, on obtiendra un modèle de prévision capable de fournir une prévision de qualité en fonction des features futures. En analysant les historiques de ventes et de météo, les modèles Machine Learning peuvent déterminer que, à Lille, en plus de la saisonnalité normale (printemps, été), ce sont les premiers week-ends avec une température supérieure à 20°C et une pluviométrie nulle qui lancent la saison des barbecues. Ces modèles vont donc pouvoir prévoir le futur : dès que ma prévision météo annonce 20°C et pas de pluie, je vais augmenter l’approvisionnement de mes rayons saucisse pour satisfaire mes clients.

On pourrait objecter qu’un tel cas est souvent déjà couvert par l’expérience des chefs de rayons. C’est vrai … en partie. Mais que se passe-t-il s’il est malade ? Combien d’années d’expérience nécessaire pour cela ? Mon chef de rayon pensera-t-il à tous les produits impactés ?  Sans doute pas. L’avantage de la machine, c’est d’automatiser le processus, de le rendre exhaustif et récurrent. Même si l’humain gardera son rôle : un tel outil peut être considéré comme une aide à la décision, avec une possibilité laissée à l’utilisateur de piloter les prévisions.

L’intérêt de cette construction de modèle par apprentissage et feature engineering est d’apporter une analyse extrêmement fine des phénomènes : 20°C à Lille ou à Marseille n’auront pas le même effet, un vent fort en ville ou au bord de la mer n’amène pas les mêmes réactions, de la neige à Paris paralyse la région alors qu’elle augmentera la fréquentation des stations de ski.

Les données exogènes, une mine d'infos

Nous avons ici décrit l’importance de faire des prévisions, l’utilité de tenir compte d’un maximum de données, et la façon de le faire. Les quelques exemples que nous avons pris pour illustrer cela sont souvent basés sur des données météo. Pourtant, le sujet des données exogènes est bien plus large que cela. Et, au risque de se répéter, tout l’enjeu est d’identifier les bonnes données, adaptées à un contexte donné, et selon l’usage que l’on veut faire de la prévision.

Les réseaux sociaux vont principalement permettre de capter des tendances de fond. Un coloris donné est de plus en plus présent sur des blogs, sur Instagram, Pinterest : mes ventes vont sans aucun doute augmenter. Mais ce type de tendance devra avoir déjà été détectée par les créateurs ou services achats des enseignes bien en amont.

Parfois cependant, on pourra détecter un effet beaucoup plus court terme. Ce sera le cas par exemple en scrutant les posts de certains people : la dernière tenue K-Way portée par Johan, likée des milliers de fois, a une forte probabilité de se vendre fortement dans les semaines qui suivent.

Un autre point affectant énormément les ventes de certains magasins : les événements sportifs ou culturels à proximité immédiate. Un match de football a lieu ce soir dans un stade touchant un centre commercial. L’accès est saturé, occasionnant une baisse de fréquentation globale. Mais, avant le match, les supporters flânent dans le centre commercial. Etant là, ils achèteront peut-être quelques petits produits, mais sans doute pas de meubles ou d’électroménager ! Enfin, les supporters présents vont consommer avant et après le match, occasionnant donc une hausse de fréquentation des restaurants et bars.

Et, bien sûr, pour ce même stade, l’effet sera bien sûr différent s’il s’agit d’un match de football, d’un concert de rock ou d’un opéra. D’où encore une fois l’importance d’obtenir des données parfaitement décrites et qualifiées précisément : savoir qu’il y a un événement est bien. Connaître le type d’événement est bien mieux.

·         Quelques autres exemples : Pour un fournisseur de pièces détachées automobiles, connaître le taux d’accidentologie par zone de chalandise est un plus non négligeable. Il pourra alors dimensionner ses stocks de manière plus précise.

·         Etudier la concurrence de manière automatisée peut aussi aider à prévoir : à la fois en scrutant son site e-commerce, mais aussi les avis circulant sur le web sur une enseigne donnée. Les relevés de prix concurrents pourront aussi – en plus de vous permettre de réagir pour éventuel alignement – influer sur votre prévision, à la hausse ou à la baisse.

Nous vivons dans un monde de plus en plus connecté, générant une masse de données en croissance exponentielle. Le champ des données exogènes paraît alors infini. A nous d’en tirer le meilleur : nous ne sommes qu’au commencement.

L'auteur

Arnaud Cassonnet est Consultant Supply Chain Senior chez Vekia. Diplômé de Centrale Lille, son expérience de 20 ans s’est construite chez des prestataires logistiques et des retailers, sur des fonctions organisationnelles et fonctionnelles. Depuis plus de 2 ans, il apporte son expertise aux clients Vekia de l'avant-vente jusqu'au support post mise en production des outils d'optimisation Supply Chain.

A propos de Vekia. Éditeur français de solutions de Supply Chain de nouvelle génération, Vekia est le pionnier dans l'utilisation du Machine Learning dans les systèmes de pilotage des stocks et des approvisionnements. Les retailers les plus innovants pilotent déjà leurs stocks avec Vekia : Galeries Lafayette, Leroy Merlin, But, Okaidi, Jacadi, Mr Bricolage… Pour en savoir plus : www.vekia.fr

Réagir

Pseudo obligatoire

Email obligatoire

Email incorrect

Commentaire obligatoire

Captcha obligatoire

Testez LeMoniteur.fr en mode abonné. Gratuit et sans engagement pendant 15 jours.
X

Recevez chaque semaine l’actualité des équipements et technologies pour le magasin et de la supply chain des distributeurs.

Ne plus voir ce message
 
Suivre LSA Suivre LSA sur facebook Suivre LSA sur Linked In Suivre LSA sur twitter RSS LSA