
Les ventes en ligne sont en plein essor. Même avant la pandémie de COVID-19, les centres commerciaux étaient en déclin, car de plus en plus de consommateurs et de fabricants se tournaient vers le monde numérique. Mais l 'analyse des performances des produits en ligne est très différente de celle du monde physique. Il n'existe pas de code produit universel (UPC), de nombreux produits ont des noms différents, et même les produits portant le même nom peuvent être différents. Chaque détaillant a ses propres règles, ce qui oblige les fabricants à se démener pour déterminer leur "part d'étagère", les avis sur les produits à prendre en compte, l'évaluation réelle d'un produit particulier, la manière d'analyser leurs concurrents par rapport à leurs performances, la manière d'optimiser leur offre de produits sur un canal de commerce électronique particulier et bien d'autres choses encore. Bref, c'est la jungle.
Le défi de l'extraction d'informations sur le marché du commerce électronique à partir de sites web
Les sites de commerce électronique se comportent très différemment des sites de vente au détail. Avec autant de places de marché ouvertes, telles qu'Amazon, Walmart, e-Bay et Target, et de faibles barrières à l'entrée pour les nouveaux marchands, la quantité d'inventaire qui est téléchargée et vendue en ligne est stupéfiante. En tant qu'acheteur, il est parfois difficile de trouver le produit que l'on souhaite et de le comparer entre différents canaux, voire au sein d'un même canal.
Imaginez que vous cherchiez le rouge à lèvres rose parfait et que vous voyiez les résultats ci-dessous. S'agit-il des mêmes rouges à lèvres ? Si ce n'est pas le cas, en quoi sont-ils différents et quelle est la meilleure offre pour mes besoins ?
Mais les acheteurs ne sont pas les seuls à être désorientés. Prenons l'exemple des marques qui font appel à plusieurs distributeurs tiers et qui tentent de savoir comment leurs produits et leurs concurrents se comportent en ligne.
Extraire des informations sur le marché du commerce électronique à l'aide d'analyses avancées
Les géants du commerce électronique ne sont pas en mesure de résoudre ce problème, car il est dans leur intérêt d'attirer davantage de marchands et d'étendre leur portée. Tant que la barrière à l'entrée sera faible pour les nouveaux marchands qui apportent plus de stocks et créent plus de concurrence, les acheteurs continueront à acheter et, par conséquent, il restera difficile de suivre et de comprendre les taux de conversion pour les groupes de produits.
En réalité, créer une normalisation et obliger les vendeurs à se conformer aux conventions de dénomination, à fournir des identifiants universels tels que l'UPC et à classer les stocks dans la bonne catégorie n'est pas une proposition attrayante. C'est aux marques de se débrouiller par elles-mêmes. L'une des techniques les plus récentes à leur disposition est une technologie de traitement du langage naturel intégrée à la plateforme d'analyse avancée Skai , appelée clustering de produits.
La fonction de regroupement des produits permet de regrouper toutes les inscriptions d'un produit en une seule vue, à travers tous les marchands et canaux de distribution. Grâce à cette vue consolidée, il est possible d'avoir une compréhension unique de la performance d'un produit, par exemple, combien d'avis ont été générés et à partir de quels canaux, ce que les consommateurs disent du produit et quelle est sa note moyenne. En outre, il est possible d'évaluer un produit par rapport à l'ensemble du portefeuille et de le comparer à la concurrence.
Étant donné que toutes les marques ne définissent pas les groupes de produits de la même manière, il est également nécessaire que les plateformes d'analyse avancée permettent une certaine flexibilité dans la manière dont les groupes sont reconnus. Prenons l'exemple de deux saveurs différentes de votre marque de chips préférée. Elles sont vendues dans le même sac, au même format, et même côte à côte dans les rayons. Sont-ils uniques en soi ou doivent-ils être regroupés en une seule ligne de produits ? Et que se passe-t-il si le même parfum est vendu dans des sachets de tailles différentes ? Ou s'il est vendu à l'unité, par 3 ou par 6 ? La vérité est toujours dans l'œil de celui qui regarde.
La sauce secrète : Les percées de la PNL pour extraire des informations commerciales des sites de commerce électronique
L'application d'une solution de regroupement de produits de qualité à des centaines de milliers de produits provenant de multiples canaux de commerce électronique n'est pas une tâche triviale. Pour parvenir à un regroupement de produits d'une grande précision, la Skai emploie une combinaison unique de processus qui utilisent des technologies NLP brevetées, des capacités autoML hautement évolutives et des algorithmes d'apprentissage automatique pour le raffinement des marques.
Cela commence par la capacité d'extraire des connaissances approfondies sur un produit qui est ingéré dans la plateforme et de structurer ces connaissances dans des modèles de données propriétaires. Il s'agit notamment d'identifier le type de solution du produit et d'autres caractéristiques et avantages clés, ainsi que de nombreux autres attributs du produit, puis de normaliser et d'affiner toutes les valeurs de marque identifiées afin de garantir la cohérence de l'appellation au sein de l'ensemble des données.
Une fois les données organisées, elles sont segmentées. Cette étape détermine les critères qui appartiennent à un certain groupe. Par exemple, seuls les produits portant le même nom de marque feront partie d'un segment spécifique. Le segment peut être encore plus réduit si seuls les produits du même type de solution, de la même saveur, de la même couleur, de la même taille, etc. sont inclus.
Ensuite, des dictionnaires sont générés, conservés et appliqués aux données, ce qui permet de nettoyer efficacement les titres des mots-clés désordonnés et d'autres termes non pertinents. Ces deux étapes combinées sont réalisées par des analystes experts et avec des capacités autoML ; aucun travail de codage supplémentaire n'est nécessaire pour créer ces configurations uniques.
Enfin, une fois que les données ont été organisées, segmentées et nettoyées, un algorithme K-means analyse l'ensemble des données et détermine l'arrangement optimal de regroupement par segment. Cet algorithme est évalué manuellement et sa précision (homogénéité du regroupement) et son rappel (exhaustivité du regroupement) sont mesurés. Il a été démontré que cette approche permettait d'obtenir une précision supérieure à 95 %, ce qui est bien supérieur à la norme industrielle d'environ 78 %.
-------------
*Cetarticle de blog a été publié à l'origine sur Signals-Analytics.com. Kenshoo a acquis Signals-Analytics en décembre 2020. Lire le communiqué de presse.