
Der Online-Handel boomt. Schon vor der COVID-19-Pandemie waren die Einkaufszentren auf dem Rückzug, da sich immer mehr Verbraucher und Hersteller der digitalen Welt zuwandten. Aber die Analyse der Produktleistung ist online ganz anders als in der physischen Welt. Es gibt keinen universellen Produktcode (UPC), viele Produkte haben unterschiedliche Namen, und selbst Produkte mit demselben Namen können unterschiedlich sein. Jeder Einzelhändler hat seine eigenen Regeln, so dass die Hersteller nicht wissen, wie sie ihren "Anteil am Regal" bestimmen sollen, welche Produktrezensionen zu zählen sind, wie die tatsächliche Bewertung für ein bestimmtes Produkt aussieht, wie sie ihre Konkurrenz mit ihrer Leistung vergleichen können, wie sie ihr Produktangebot in einem bestimmten E-Commerce-Kanal optimieren können und vieles mehr. Kurz gesagt, es ist ein Dschungel da draußen.
Die Herausforderung, E-Commerce-Marktinformationen aus Websites zu extrahieren
E-Commerce-Websites verhalten sich ganz anders als der stationäre Handel. Da es so viele offene Marktplätze wie Amazon, Walmart, eBay und Target gibt und die Einstiegshürden für neue Händler niedrig sind, ist die Menge an Waren, die online hochgeladen und verkauft werden, atemberaubend. Für Käufer/innen kann es eine echte Herausforderung sein, das gewünschte Produkt zu finden und es über verschiedene Kanäle oder sogar innerhalb desselben Kanals zu vergleichen.
Stell dir vor, du suchst nach dem perfekten rosa Lippenstift und siehst die folgenden Ergebnisse. Sind das dieselben Lippenstifte? Wenn nicht - wie unterscheiden sie sich und was ist das beste Angebot für meine Bedürfnisse?
Aber es sind nicht nur die Käufer, die verwirrt sind. Denke an Marken, die mehrere Drittanbieter nutzen und versuchen zu verfolgen, wie ihre Produkte und die ihrer Konkurrenten online abschneiden.
Gewinnung von E-Commerce-Marktinformationen mit fortschrittlicher Analytik
Die E-Commerce-Giganten sind nicht in der Lage, dieses Problem zu lösen, da es in ihrem Interesse liegt, mehr Händler anzuziehen und ihre Reichweite zu vergrößern. Solange es eine niedrige Eintrittsbarriere für neue Händler/innen gibt, die mehr Waren einführen und mehr Wettbewerb schaffen, werden die Käufer/innen weiterhin einkaufen.
Die Realität sieht so aus, dass die Schaffung von Standards und die Verpflichtung der Verkäufer zur Einhaltung von Namenskonventionen, die Bereitstellung von universellen Identifikatoren wie UPC und die Zuordnung des Inventars zur richtigen Kategorie kein attraktives Angebot ist. Es liegt an den Marken, dies selbst herauszufinden. Eine der neuesten Techniken, die ihnen zur Verfügung steht, ist eine Technologie zur Verarbeitung natürlicher Sprache, die in die erweiterte Analyseplattform Skai integriert ist, das sogenannte Produktclustering.
Die Produktcluster-Funktion fasst alle verschiedenen Angebote für ein Produkt in einer Ansicht zusammen, und zwar über alle Händler und Vertriebskanäle hinweg. Mit dieser konsolidierten Ansicht ist es möglich, einen einzigartigen Überblick über die Leistung eines Produkts zu erhalten, z. B. wie viele Bewertungen es auf welchen Kanälen erhalten hat, was die Verbraucher über das Produkt sagen und wie seine durchschnittliche Bewertung lautet. Außerdem ist es möglich, ein Produkt mit dem gesamten Portfolio zu vergleichen und es mit der Konkurrenz abzugleichen.
Da nicht jede Marke die Produktgruppen auf die gleiche Weise definiert, müssen fortschrittliche Analyseplattformen auch flexibel sein, was die Erkennung der Gruppen angeht. Nimm zwei verschiedene Geschmacksrichtungen deiner Lieblingskartoffelchipsmarke. Sie kommen in derselben Tüte, haben dieselbe Größe und werden sogar nebeneinander im Regal verkauft. Sind sie für sich genommen einzigartig oder sollten sie zu einer Produktlinie zusammengefasst werden? Und was ist, wenn die gleiche Geschmacksrichtung in verschiedenen Tütengrößen angeboten wird? Oder einzeln, im 3er- oder 6er-Pack verkauft wird? Die Wahrheit liegt immer im Auge des Betrachters.
Die geheime Soße: NLP-Durchbrüche zur Gewinnung von Marktinformationen aus E-Commerce-Websites
Die Anwendung einer hochwertigen Produktcluster-Lösung auf Hunderttausende von Produkten aus verschiedenen E-Commerce-Kanälen ist keine triviale Aufgabe. Um ein Produktclustering mit hoher Genauigkeit zu erreichen, setzt Skai eine einzigartige Kombination von Verfahren ein, die patentierte NLP-Technologien, hoch skalierbare AutoML-Funktionen und Algorithmen für maschinelles Lernen zur Markenverfeinerung nutzen.
Es beginnt mit der Fähigkeit, tiefgreifendes Wissen über ein Produkt zu extrahieren, das in die Plattform eingespeist wird, und dieses Wissen in eigene Datenmodelle zu strukturieren. Dazu gehören die Identifizierung des Lösungstyps des Produkts und anderer wichtiger Merkmale und Vorteile sowie vieler anderer Produktattribute und die anschließende Normalisierung und Verfeinerung aller identifizierten Markenwerte, um die Konsistenz der Bezeichnungen innerhalb des gesamten Datensatzes sicherzustellen.
Nachdem die Daten organisiert sind, werden sie segmentiert. In diesem Schritt werden die Kriterien festgelegt, die zu einem bestimmten Cluster gehören. Zum Beispiel gehören nur Produkte mit demselben Markennamen zu einem bestimmten Segment. Das Segment kann noch weiter eingegrenzt werden, wenn nur Produkte der gleichen Lösungsart, des gleichen Geschmacks, der gleichen Farbe, der gleichen Größe usw. aufgenommen werden.
Als Nächstes werden Wörterbücher erstellt, kuratiert und auf die Daten angewendet, um die Titel effektiv von unordentlichem Keyword-Stuffing und anderen nicht relevanten Begriffen zu befreien. Diese beiden Schritte werden von erfahrenen Analysten und mit AutoML-Funktionen durchgeführt; es ist keine zusätzliche Programmierarbeit erforderlich, um diese einzigartigen Konfigurationen zu erstellen.
Nachdem die Daten organisiert, segmentiert und bereinigt wurden, scannt ein K-Mittel-Algorithmus den gesamten Datensatz und bestimmt die optimale Clusteranordnung pro Segment. Dieser Algorithmus wird manuell bewertet und auf Präzision (Homogenität des Clusters) und Recall (Vollständigkeit des Clusters) gemessen. Es hat sich gezeigt, dass dieser Ansatz eine Genauigkeit von über 95 % erreicht, was deutlich über dem Branchenstandard von etwa 78 % liegt.
-------------
*DieserBlogbeitrag erschien ursprünglich auf Signals-Analytics.com. Kenshoo hat Signals-Analytics im Dezember 2020 übernommen. Lies die Pressemitteilung.