Les décideurs des marques grand public réalisent enfin tout le potentiel de transformation des données externes, mais ils se rendent également compte à quel point il est difficile de les obtenir. Forrester rapporte que 87 % des décideurs en matière de données et d'analyse ont mis en œuvre ou planifient des initiatives visant à obtenir davantage de données externes.
Et ces initiatives se développent en dehors de l'équipe informatique ; 29% des personnes interrogées déclarent que l'informatique est le principal responsable de l'approvisionnement en données, en baisse par rapport à 37% en 2016. Pour soutenir ces projets, les organisations se tournent de plus en plus vers un nouveau spécialiste : le chasseur de données, qui identifie et vérifie les sources de données externes. La mise en place d'équipes axées sur les données externes représente un travail considérable, et de nombreux dirigeants se rendent compte que le choix des données externes est difficile à faire évoluer à mesure que la liste des sources s'allonge. C'est peut-être la raison pour laquelle 66 % des décideurs interrogés par Forrester déclarent qu'ils utilisent ou prévoient d'utiliser des fournisseurs de services externes pour les données, l'analyse et les informations.
Comment les marques peuvent-elles identifier les bonnes sources de données externes ?
Les fournisseurs externes comme la Skai font le travail à votre place, en prenant le temps de développer des méthodologies d'identification des données qui garantissent que les informations que vous obtenez sont représentatives du marché. L'identification et le choix des sources de données externes est une tâche qui prend du temps et qui paralyse les équipes de données internes de nombreuses organisations.
À la Skai, nous commençons ce processus en posant deux questions importantes : à quelles questions commerciales essayons-nous de répondre avec ces données, et que fera l'entreprise avec ces données ? Les réponses dictent les types de données et les sources que nous sélectionnons, qui doivent répondre à quatre critères principaux :
Couverture précise des parts de marché. Les sources de données externes choisies doivent être réellement représentatives d'un écosystème de marché donné, avec suffisamment de données textuelles pour produire une analyse utile. La collecte d'un trop grand nombre de données auprès de détaillants à marque unique ou d'autres canaux de niche peut introduire un biais dans les ensembles de données ; souvent, ces petites marques sont bien représentées dans des sources de données plus complètes telles qu'Amazon ou Walmart.
Mais assurer une couverture précise du marché est un processus personnalisé pour chaque écosystème de marché. Certains marchés, comme celui de la beauté, disposent de données pertinentes réparties sur de nombreux sites de commerce électronique ; d'autres marchés, comme celui de l'alimentation, sont plus centralisés sur un nombre restreint de sites de grande taille. Pour chaque nouvel écosystème, nous examinons la répartition des parts de marché sur les canaux de commerce électronique les plus courants (Amazon, Walmart et Target) avant de décider s'il convient d'intégrer des sources plus petites ou plus spécialisées.
Une présence en ligne solide. La plateforme de Skai est unique dans sa capacité à établir des liens précis et révélateurs entre un produit et ce que les consommateurs et les experts pensent de ce produit. Les évaluations de produits et les discussions en ligne sont essentielles pour établir ces liens, et nous avons des exigences élevées. Nous nous assurons d'obtenir des évaluations de produits avec des détails détaillés et des dates de publication afin de pouvoir suivre avec précision ce que les consommateurs disent et quand ils discutent de ces sujets, produisant ainsi une chronologie du sentiment des consommateurs.
Accès continu et stable aux données. Nous collectons des données externes par le biais d'intégrations d'API tierces et de sites accessibles au public en toute légalité. Chaque fois qu'un fournisseur modifie son back-end, nous devons modifier notre code et nos algorithmes en conséquence pour garantir un accès continu aux données. Maintenir l'accès à ces types de sources de données est une tâche d'ingénierie d'une complexité prohibitive pour la plupart des organisations, mais c'est une routine pour Skai.
Excellente qualité des données. Les données que nous collectons doivent comporter des descriptions textuelles complètes et de grande valeur afin que nos algorithmes exclusifs d'apprentissage automatique et de traitement du langage naturel puissent en extraire le contenu avec précision. Nous normalisons ensuite ce contenu, en veillant à ce que tous les ensembles de données parlent le même langage, ce qui nous permet de relier les ensembles de données et de fournir des analyses fiables et précises.
Une fois que nous avons identifié le meilleur assortiment de sources de données, nous confirmons nos choix avec des experts en la matière qui valident notre recherche et identifient les types de données ou les paramètres que nous avons pu manquer. L'identification des sources de données est une tâche complexe, longue et spécialisée, mais elle est assez simple comparée aux étapes suivantes : la connexion et la contextualisation de ces données.
Un vrai client de la Skai :
"Essayer de connecter autant de sources de données externes nouvelles et différentes à notre système existant nous aurait pris des années ! Skai a fait tout le travail difficile en collectant et en contextualisant toutes les données pertinentes pour [notre] écosystème, nous donnant une vue plus holistique de ce qui se passe dans notre catégorie"
-------------
*Cetarticle de blog a été publié à l'origine sur Signals-Analytics.com. Kenshoo a acquis Signals-Analytics en décembre 2020. Lire le communiqué de presse.