
Das menschliche Gehirn ist darauf vorbereitet, Muster zu erkennen und Erfahrungen in Taxonomien zu ordnen. Tatsächlich basiert die menschliche Intelligenz auf unserer Fähigkeit, Erfahrungen in Kategorien und Konzepte einzuteilenWenn wir etwas Neues erleben, sind wir in der Lage, intelligent und angemessen zu reagieren, indem wir sofort erkennen, wie die neue Erfahrung in die Kategorien passt, die wir bereits gelernt haben.
Vielleicht weil unser Gehirn auf diese Weise funktioniert, ist es instinktiv, taxonomische Strukturen auch auf komplexe Konzepte in der Außenwelt anzuwenden, um sie besser verstehen zu können. Carolus LinnaeusCarolus Linnaeus, ein schwedischer Wissenschaftler aus dem 18. Jahrhundert, erfand das Linnaeus-Klassifizierungssystem für die Natur, das wir auch heute noch verwenden (wenn auch in aktualisierter Form).
Im Jahr 1869 wurde der russische Wissenschaftler Dmitri Mendelejew das Periodensystem erfunden, um Gespräche über die Bausteine unserer Existenz zu vereinfachen. Websites, Lebensmittelläden, Bibliotheken und viele andere gut organisierte digitale und reale Bereiche nutzen Taxonomiestrukturen, um Inhalte und Objekte logisch und leicht auffindbar anzuordnen.
Einen Lebensmittelladen zu organisieren ist eine Sache. Eine ständig wachsende Sammlung von Rohdaten zu organisieren, ist eine ganz andere Sache. Obwohl die Klassifizierung der Schlüssel zum Verständnis und zur Bearbeitung von Daten ist, sind nur wenige Datenanalyseunternehmen in der Lage, konsistente, nützliche Taxonomien so auf Big Data anzuwenden, dass sie zu neuen Erkenntnissen führen.
Warum brauchen wir Datentaxonomien?
Die digitale Datenerstellung wächst exponentiell. Jeden Tag stellen Facebook-Nutzer/innen mehr als 250 Millionen Fotos auf der Plattform ein. Jede Sekunde laden Instagram-Nutzer/innen 1.000 Fotos hoch. Etwa 10 % aller Verbraucher/innen schreiben online Produktbewertungen für die Produkte, die sie kaufen, und jedes Jahr werden mehr als 30.000 neue Konsumgüterprodukte auf den Markt gebracht.
Viele unserer Erfahrungen - sowohl als Menschen als auch als Unternehmen - haben sich ins Internet verlagert, und wir haben überall digitale Fußspuren hinterlassen. Marken, die in der Lage sind, die Bedeutung all dieser Daten zu nutzen, können wertvolle Einblicke in ihre Kunden, Wettbewerber und den gesamten Markt gewinnen. Diese Erkenntnisse ermöglichen Optimierungen im Marketing, im Messaging, in der Produktentwicklung und vielem mehr. Aber das ist nicht einfach, und zwar aus drei Gründen:
- 80-90% der Daten sind unstrukturiert. Da Daten in verschiedenen Formaten und an unterschiedlichen Orten erzeugt und gespeichert werden, gibt es keinen einzigen "Besitzer" und keine einfache Möglichkeit, sie zu durchsuchen oder zu formatieren. Das Problem wird immer schwieriger zu lösen, da die Datenmenge jeden Tag exponentiell wächst.
- Menschliche Kommunikation ist selten einfach. Wir sind clever in der Sprache. Übertreibungen, Witze, Sarkasmus und Doppeldeutigkeiten sind in einer Reihe von Datentypen üblich, vor allem in Beiträgen in sozialen Medien und in Produktbewertungen. Selbst wenn diese Datenquellen strukturiert und durchsuchbar sind, ist es schwierig, die Nuancen in unserer Sprache richtig herauszuarbeiten.
- Nur wenige unstrukturierte Datentypen sprechen die gleiche Sprache. Während strukturierte Datentypen oft eindeutige Bezeichner verwenden, um sie mit anderen Typen zu verbinden (z. B. eine SKU), haben unstrukturierte Datentypen keine solchen Gemeinsamkeiten. Auf einer grundlegenden Ebene kann es mehrere Namen (mit verschiedenen Schreibweisen) geben, die dieselbe Sache beschreiben; zum Beispiel können Verbraucher das Wort "Avocado" falsch schreiben oder es in Produktrezensionen als "avo" bezeichnen, während Wissenschaftler und Forscher vielleicht den wissenschaftlichen Namen "persea americana" bevorzugen. Noch komplizierter wird es, wenn Begriffe eine Doppelbedeutung haben, die es schwierig macht, den Kontext zu erkennen. Wenn eine Hautpflegemarke nach Verbraucherstimmen zu "Avocado-Gesichtsmasken" suchen würde, wie viele Ergebnisse würden sich dann auf Gesichtsmasken aus Stoff mit Avocado beziehen - ein völlig irrelevantes Produkt mit demselben Namen?
Der Schlüssel zu effektiven Taxonomien
Alle Datenanalyseunternehmen können externe Daten in Taxonomien strukturieren. Aber effektive Taxonomien - also solche, die spezifische, transformative Erkenntnisse liefern können - haben ein wesentliches Element: supergranulare, superrelevante Taxonomiewerte, die in allen allen Datenquellen und -punkte konsistent sind. Wenn jeder Datenpunkt mit denselben Parametern versehen werden kann, die für das Unternehmen wichtig sind, dann kann jeder Datenpunkt mit jedem anderen verbunden werden.
Die Klassifizierung von Daten in effektive Taxonomien ist ein entscheidender Faktor für Marken, die datengestützte Entscheidungen treffen wollen. Taxonomien verbinden und organisieren alle Daten in einem Unternehmen und ermöglichen es Datensoftwareplattformen, schnell und einfach nach Informationen zu suchen, Stimmungen zu extrahieren und aussagekräftige Grafiken zu erstellen. Am interessantesten ist, dass Taxonomien es Marken ermöglichen, sowohl das Marktgeschwätz als auch die Stimme der Verbraucher/innen mit ihren Produkten zu verbinden und so die Stärken, Lücken und Chancen einer Marke aufzudecken.
Wie effektive Taxonomien Daten organisieren
Stell dir die Datenpunkte als einzelne Bücher vor. Unstrukturierte Daten sind wie wahllose Bücherstapel überall und kein Zettelkatalog, der dich zu den gewünschten Informationen führt. Eine mäßige Taxonomie könnte den großen Bücherstapel in verschiedene Stapel nach Genres einteilen. Wenn du hoffst, deine Bücher nach dem Nachnamen des Autors oder dem Erscheinungsdatum zu sortieren, hast du Pech gehabt.
Eine effektive Taxonomie ist wie ein riesiges Bücherregal, in dem die Bücher in Regalen angeordnet und mit Tausenden von spezifischen Attributen wie Genre, Seitenzahl, Erscheinungsjahr, Autorenname und anderen für deine Buchhandlung wichtigen Kennzeichnungen versehen sind. Die Bücher können ganz einfach nach Bezeichnern neu sortiert werden, denn jedes Buch, vom Comic bis zur wissenschaftlichen Zeitschrift, verwendet dieselben Taxonomiewerte, die sogenannten Key Intelligence Parameters (KIPs).
Wenn du zwei oder mehr KIPs miteinander verbindest, kannst du Trendvorhersagen treffen. Wenn du zum Beispiel herausfinden willst, ob Liebesromane im Laufe der Zeit immer beliebter werden, kannst du die Verkaufszahlen für Bücher in der Kategorie "Liebesromane" aufzeichnen. Wenn deine Identifikatoren ausreichend spezifisch sind, kannst du sogar einige von ihnen in umfassendere Klassifizierungen aufrollen, um einen detaillierteren Blick auf eine Kategorie zu erhalten. Vielleicht weißt du, dass ein Teil deines Publikums sowohl Biografien als auch wissenschaftliche Texte mag. Wenn du beide in der Kategorie "Sachbücher" zusammenfasst, kannst du mehr Datensätze für genauere Analyseergebnisse einbeziehen.
Taxonomien brechen die Form
Eine Plattform, die möglichst effektive Taxonomien konfiguriert, nutzt drei Techniken:
- Die Verwendung von supergranularen KIPs. Jedes Merkmal, jeder Vorteil, jede Zutat, jeder Trend, jede SKU, jeder Wettbewerber und jedes Detail, das für eine Marke wichtig ist, wird in die KIPs aufgenommen. Sobald diese festgelegt sind, ist es einfach, mehrere KIPs unter größeren Themen zusammenzufassen, um verschiedene Blickwinkel auf einen Trend oder ein Merkmal zu untersuchen.
- Eine gemeinsame Sprache für alle Datentypen schaffen. Es ist üblich, dass Datenanalyseunternehmen alle unstrukturierten Datentypen, die sie analysieren, strukturieren. Aber viele bleiben dabei stehen, und Strukturierung allein ist nicht genug. Stattdessen sollten alle Daten sowohl strukturiert und normalisiert werden, bevor man Taxonomien erstellt. Dieser zweite Schritt ist selten, aber unerlässlich, um das Beste aus deinen Daten herauszuholen. Die Normalisierung aller Datentypen mit einer NLP-Engine (Natural Language Processing), die dieselben Taxonomiewerte verwendet, übersetzt sie alle in dieselbe Sprache und ermöglicht es, zu sehen, wie sich die einzelnen KIPs in der realen Welt gegenseitig beeinflussen oder miteinander interagieren.
- Einen flexiblen Ansatz wählen. Jede Datenquelle hat einen unterschiedlichen Grad an sprachlicher Spezifität. Patente und wissenschaftliche Forschungsarbeiten sind in ihrer Sprache oft am spezifischsten. Im Gegensatz dazu werden Verbraucherinnen und Verbraucher eine Diskussion in den sozialen Medien nur selten mit der SKU des besprochenen Produkts beginnen; stattdessen werden diese Unterhaltungen eher auf der Ebene des Produkttyps geführt. Die Skai verfügt über die nötige Flexibilität, um sicherzustellen, dass alle Anwendungsfälle in den Datenausgaben vertreten sind. Durch die Zusammenfassung mehrerer Taxonomiewerte unter einem einzigen Dach werden sowohl die spezifischsten Erwähnungen eines Begriffs als auch umfassendere Unterhaltungen über dieselbe Sache erfasst. So kann eine CPG-Marke, die Trends bei Bioprodukten verfolgen möchte, Begriffe wie "Bio", "100 % natürlich" und "ohne Konservierungsstoffe" unter demselben "Bio"-Begriff zusammenfassen, um alle Arten zu erfassen, in denen Verbraucher über Bio- und Bio-verwandte Produkte sprechen.
Es gibt noch eine andere Art von Flexibilität: die Möglichkeit, schnell, einfach und bei Bedarf neue Taxonomiewerte hinzuzufügen, um einen frühen Überblick über Trends und Ereignisse in der Welt zu erhalten. Neue Begriffe wie "biodivers" in der Welt der Bio-Lebensmittel und neue Entwicklungen in der Welt insgesamt - wie die COVID-19-Pandemie - können einfach zu den bestehenden Taxonomiewerten hinzugefügt werden, da alle unsere Daten normalisiert sind.
Wie Skai Datentaxonomien konfiguriert
Wenn wir Taxonomiewerte für eine Kategorie erstellen, die neu in Skai ist, gehen wir zwei verschiedene Wege, um eine vollständige Abdeckung zu gewährleisten. Der erste ist ein Top-down-Ansatz. In jeder vertikalen Kategorie sind bereits einige Taxonomiewerte gebräuchlich, z. B. Produktfilter, Attribute, die in Produktbeschreibungen vorkommen, sowie Kategorien und Unterkategorien in verschiedenen E-Commerce-Kanälen. Wir beginnen mit diesen bekannten Taxonomien. Dann fügen wir einen Bottom-up-Ansatz hinzu, bei dem wir riesige Datensätze durch eine NLP-Engine laufen lassen, um aussagekräftige Schlüsselwörter mit einer hohen Wiederholungsrate zu finden. Auf diese Weise können wir Schlüsselwörter identifizieren, die mit der Top-Down-Methode nur schwer zu erkennen sind.
Sobald die Taxonomiewerte festgelegt sind, kannst du individuelle Wertekombinationen erstellen, um Mega- und Mikrotrends widerzuspiegeln. Die Kombination von Werten auf diese Weise ermöglicht neue Einblicke in große Markttrends, die mehrere Kategorien betreffen, sowie in sehr spezifische Zusammenhänge, z. B. zwischen Produkteigenschaften und wahrgenommenen Vorteilen für eine bestimmte Produktlinie.
PepsiCo zum Beispiel nutzte die Skai , um Mega- und Mikrotrends in ihrem gesamten Produktportfolio zu verfolgen und so neue Produktentwicklungsmöglichkeiten zu entdecken, die sie vorher nicht kannten.
Marken wie PepsiCo wenden sich an Skai , weil niemand sonst einen so detaillierten Einblick bieten kann wie wir. Und das alles dank unserer Taxonomien! Lies die vollständige Fallstudie.
Um herauszufinden, wie Skai deiner Marke helfen kann, mehr aus Daten zu machen, kontaktiere uns für eine Demo.