Les organisations modernes disposent de deux sources principales de données. Il s'agit de données internes, provenant par exemple de clients, d'employés internes, de partenaires ou de visiteurs de sites web, et de données externes, provenant par exemple d'avis d'influenceurs, de médias sociaux et de concurrents. Historiquement, les données étaient collectées et analysées par l'homme, mais en tirer des enseignements pratiques manuellement est une tâche ardue, voire impossible dans de nombreux cas. L'analyse avancée en tant que discipline est en train de mûrir, mais elle reste axée sur les sources structurées, qui sont également pour la plupart internes.
Il s'agit de l'examen automatisé de données ou de contenus à l'aide d'outils et de techniques de pointe. La veille stratégique traditionnelle se concentre sur les modèles historiques, tandis que l'analyse avancée utilise les données collectées pour découvrir et prédire les tendances futures.
Pour mieux comprendre ce qu'est l'analyse avancée, voyons comment elle fonctionne en pratique.
Les six étapes de l'analyse avancée : la valeur commerciale des données
L'analyse avancée est le moteur central d'un tissu de données, qui comprend de multiples éléments, notamment la collecte, la classification et l'accès aux données. L'analyse avancée suit une séquence précise :
Pipeline de données externes
L'analyse avancée vise à automatiser la collecte des données. Dans leur forme originale, les données sont encore généralement saisies par un être humain, par exemple un avis sur un produit ou un message sur les médias sociaux. Parmi les autres sources, on peut citer les résumés, les événements d'actualité, les registres d'annuaires, les archives publiques et les brevets.
Les données peuvent être collectées manuellement, mais cette méthode est inefficace et n'est pas évolutive. La collecte automatisée de données permet de recueillir en permanence des données grâce à l'utilisation d'API, de scraping et d'intégrations tierces. Cela permet d'intégrer un large éventail de données actualisées à grande échelle dans le pipeline d'analyse avancée, ce qui est indispensable pour réussir.
Préparation des données
Les données externes sont créées par des personnes dans leur vie quotidienne et ne sont donc pas toujours saisies sous une forme spécifique. Elles sont parfois rédigées dans des langues différentes, dans des structures différentes telles que des graphiques, parfois complètement non structurées, et proviennent de divers types de données tels que les produits sur le marché, les brevets et l'activité commerciale.
Certains types de données peuvent avoir plus de valeur que d'autres. Un message émanant d'un leader d'opinion, par exemple, aura beaucoup plus d'impact qu'un message émanant d'un membre du grand public. Au cours de cette deuxième étape, la machine prépare les données de manière à ce qu'elles puissent être analysées. Cette étape comprend également le nettoyage des données, qui consiste à identifier et à corriger (ou supprimer) les données incomplètes, inexactes ou non pertinentes, à normaliser les données et à identifier les éléments structurels clés dans les données non structurées.
Extraction de contenu et de sentiment
À cette étape, des algorithmes d'apprentissage automatique et de traitement du langage naturel (NLP) sont appliqués aux éléments de données clés afin d'en extraire le sens. Le sens, par exemple, peut être une valeur qui représente un avantage, une caractéristique ou un ingrédient spécifique auquel un élément de données fait référence, ainsi que le sentiment lié à cette valeur. Cette automatisation complexe imite le processus humain de compréhension du contenu et place la barre très haut pour la qualité des analyses avancées. La précision des analyses avancées dépend fortement de la précision de cette étape.
Fusion de données
Une fois que le sens des nombreuses sources est extrait, il est intégré dans un ensemble de données unifié. Ce processus est plus puissant que l'examen de chaque ensemble de données séparément. Pensez à la façon dont les humains combinent les données de leurs cinq sens pour améliorer leur perception du monde. De la même manière, les processus automatisés combinent les données pour découvrir des relations que les scientifiques n'auraient pas remarquées autrement.
Modélisation des données
C'est ici que tout se joue. Une fois que les données non structurées et impures sont nettoyées et transformées, les analystes peuvent entamer la partie fructueuse de leur travail : relier les choses entre elles et développer des modèles qui montrent l'impact, les dépendances, les tendances et les prédictions. Cela permet d'obtenir des informations exploitables et prédictives que les marques peuvent utiliser pour voir plus loin et préparer l'avenir de leur entreprise. Il est impossible de faire cela avec précision, à grande échelle, sans l'aide de techniques puissantes liées à l'IA et de données largement diversifiées.
Gestion des données
Une fois que les données sont utilisées pour construire un modèle, elles peuvent être stockées en vue de modèles affinés ultérieurs. Cela nécessite un système bien géré pour le traitement, le stockage et l'authentification des données. À ce stade, la séquence recommence, car les plateformes d'analyse collectent des données et répètent le processus.
Il est important de noter qu'il peut y avoir des points de contact humains dans chacune de ces étapes. Des personnes peuvent décider des données à collecter, puis les inspecter, les nettoyer, les structurer et en tirer des informations exploitables. Le défi que pose l'analyse avancée est le suivant : comment pouvons-nous automatiser ce processus afin de découvrir des informations précieuses que l'approche traditionnelle pourrait manquer ?
La valeur commerciale des données et de l'analyse avancée
Prenons un exemple pertinent de la pandémie de coronavirus. Les scientifiques des données pourraient, par exemple, examiner le nombre de fois où les gens mentionnent le système immunitaire, puis le nombre de produits qui parlent de renforcer le système immunitaire. S'ils découvrent que le système immunitaire est souvent mentionné, mais qu'il y a très peu de produits qui revendiquent cette caractéristique, cela indiquerait un besoin non satisfait sur le marché. Il y a beaucoup d'intérêt de la part du public, mais très peu d'entreprises qui en parlent.
Ce processus est en partie humain, puisque la réflexion sur le système immunitaire est manuelle.
Grâce à l'analyse avancée, nous allons au-delà de l'intelligence économique traditionnelle pour découvrir des liens que personne n'avait prévus. Supposons, par exemple, que nous suivions les ventes de produits, puis que nous dressions la liste des ingrédients de ces produits. Il se peut que nous découvrions une forte croissance des produits contenant de la vitamine C. Le système peut faire ressortir ce type d'information et peut-être la relier à des tendances telles que le coronavirus et l'intérêt pour le système immunitaire. Personne n'a besoin d'y penser à l'avance. L'ordinateur est capable de découvrir ce type de lien en décomposant les données relatives aux ventes et en les reliant aux ingrédients de chaque produit.
La véritable puissance vient de la combinaison du modèle humain et du modèle machine. Les scientifiques des données peuvent développer des modèles pour relier les choses entre elles et essayer de comprendre ce qui peut avoir un impact sur quoi. Ils peuvent utiliser leur connaissance du secteur pour comprendre quels attributs ou caractéristiques, comme les ingrédients ou les brevets, sont pertinents. Les analystes peuvent alors développer un modèle qui décompose les données entrantes pour aider à découvrir les connexions et la connectivité qu'ils n'auraient pas découvertes par eux-mêmes.
Cette connectivité supplémentaire est l'un des principaux moteurs de la valeur commerciale de l'analyse avancée. Le mélange de connaissances humaines et d'algorithmes puissants permet aux analystes de fouiller dans des montagnes de données et de trouver ce qui est pertinent. Ils peuvent ensuite étendre l'impact des données et des analyses à l'ensemble de l'entreprise. C'est l'un des plus grands défis, car les analyses sont souvent trop génériques pour être appliquées à des décisions spécifiques. De plus, lorsque cela est fait de manière automatisée, avec un flux en temps réel à partir de la constellation de sources de données externes, les marques peuvent découvrir des changements et des tendances en temps réel et y répondre.
Comment fonctionne l'analyse avancée dans la pratique
L'analyse avancée utilise une variété de techniques pour automatiser ce processus en six étapes.
Il s'agit notamment de l'exploration de données et de textes, de la recherche de modèles, de la prévision, de la visualisation, de l'analyse sémantique, de l'analyse des sentiments, de l'analyse de grappes, des statistiques multivariées, de l'analyse graphique, de la simulation, du traitement d'événements complexes et des réseaux neuronaux.
Deux des techniques les plus puissantes sont le traitement du langage naturel (NLP), l'apprentissage automatique et le traitement des images.
- La PNL décompose une phrase brute en ses composants taxonomiques. Cela permet aux analystes de transformer des données non structurées - telles que des messages sur les médias sociaux ou des critiques de produits - en une forme simplifiée et structurée qui peut être facilement analysée. Les algorithmes NLP brevetés de la Skaivont au-delà des méthodes NLP open source. Nous avons déconstruit le NLP standard et l'avons reconstruit pour extraire le contexte granulaire et le sentiment à travers de nombreuses sources et types de données différents.
- L'apprentissage automatique est une application de l'IA qui apprend aux ordinateurs à comprendre les données en fonction de ce qu'ils savent des ensembles de données précédents. Un avis est-il positif ou négatif ? Un algorithme d'apprentissage automatique peut utiliser ce qu'il sait des avis positifs ou négatifs précédents et classer un nouvel avis en fonction des avis antérieurs. En plus de comprendre le sens des phrases, l'apprentissage automatique peut également découvrir les tendances actuelles et prédire comment elles évolueront à l'avenir.
Dans l'ensemble, ces techniques appliquent les concepts les plus avancés en matière de mathématiques, d'informatique et de linguistique. Elles permettent aux employés d'une organisation de prendre des décisions fondées sur des preuves plutôt que sur des conjectures.
Points clés à prendre en compte lors de l'évaluation d'une plateforme d'analyse avancée
Les plateformes d'analyse avancée ont tendance à être très complexes. Leur construction et leur maintenance requièrent des compétences avancées. Cependant, elles servent également à démocratiser les données, en permettant aux décideurs de votre organisation d'utiliser les données pour prendre des décisions fondées sur des preuves.
Pour s'assurer qu'une plateforme d'analyse avancée est bien adaptée pour fournir les informations les plus percutantes possibles, posez des questions :
- L'internet fournit un flux constant de données sur les technologies, les leaders d'opinion, les événements, les produits, les consommateurs et les ventes.Pour exploiter ces données, les marques ont besoin d'un moyen de collecter ces données externes et de les structurer. Pour ce faire, il est nécessaire de puiser dans les sources externes, puis d'extraire les données dans leur contexte approprié afin de générer des informations exploitables. Les meilleures plateformes automatisent la collecte et la structuration des données afin de vous permettre d'obtenir des informations et des prévisions en temps réel. Signals Analytics est l'une de ces plateformes uniques - nous fournissons à la fois les données et les analyses dans un package unique et configurable.
- Pour exploiter le flux de données créé à chaque seconde, les plateformes d'analyse avancée ont besoin d'une méthode normalisée pour nettoyer et structurer ces données brutes sous une forme utilisable.Cela nécessite une expertise approfondie du secteur pour aider à comprendre le contexte des données, ainsi que des algorithmes de pointe en matière de NLP et d'apprentissage automatique. Ces algorithmes vont au-delà des techniques NLP open source et permettent aux marques d'obtenir des informations précises à grande échelle à partir des discussions des consommateurs ou d'autres sources de données.
- S'appuyer sur une plateforme d'analyse pour prendre des décisions suscite le scepticisme des parties prenantes. Pour avoir confiance en votre plateforme d'analyse avancée, assurez-vous qu'elle est transparente sur la manière dont elle collecte et analyse les données. Demandez-lui quelles sources elle utilise pour collecter les données, comment elle les nettoie, les structure et les analyse. Assurez-vous que vous pouvez compter sur la plateforme pour vous fournir des informations basées sur des données sur lesquelles vous pouvez agir.
- Est-elle configurable ?Pour tirer le meilleur parti d'une plateforme d'analyse, recherchez une plateforme qui prenne en charge des sources de données, des taxonomies, des modèles et des résultats personnalisés. Assurez-vous de pouvoir la configurer pour obtenir le type d'informations dont vous avez besoin pour prendre des décisions rapides et précises.
-------------
*Cetarticle de blog a été publié à l'origine sur Signals-Analytics.com. Kenshoo a acquis Signals-Analytics en décembre 2020. Lire le communiqué de presse.