JDKRUEGER&COAcademyAnmelden
Modul 1 von 8 · A/B-Testing Mastery

A/B-Testing für Nicht-Statistiker

15 Min · Erkennen, was einen echten A/B-Test auszeichnet — und warum paralleles Testen unter gleichen Bedingungen zuverlässigere Erkenntnisse liefert als ein Vorher-Nachher-Vergleich.
← A/B-Testing Mastery A/B-Testing für Nicht-Statistiker 1 / 22
Start

A/B-Testing für Nicht-Statistiker

Entscheidungen treffen, die der Wirklichkeit standhalten — nicht dem Bauchgefühl.

A/B-Testing als Wachstumshebel
Lernziel

Lernziel

Sie erkennen, was einen echten A/B-Test auszeichnet.

Sie verstehen, warum paralleles Testen unter gleichen Bedingungen zuverlässiger ist als Vorher-Nachher.

Sie formulieren eine eigene, überprüfbare Testhypothese.

1 Hypothese 2 Zufällige Aufteilung 3 Paralleler Vergleich 4 Entscheidung mit Daten
Konzept

Das Geschäftsproblem: siebzig Prozent Abbruch

Das Baymard Institute ermittelte aus über 100.000 Checkout-Prozessen eine durchschnittliche Warenkorbabbruchrate von 69,8 Prozent.

Jeder zweite Shop-Betreiber unterschätzt diesen Wert, weil er im Tagesgeschäft nicht sichtbar ist.

Die Folge: Tausende Besucher verlassen die Seite kurz vor dem Kauf.

70% — Abbruch 30% — Kauf
Durchschnittliche Warenkorbabbruchrate im E-Commerce
Konzept

Warum mehr Traffic kein Hebel ist

Bei einer Conversion Rate von drei Prozent und einem Abbruch von siebzig Prozent brauchen Sie dreißig Klicks für einen Kauf.

Mehr bezahlter Traffic bei gleicher Conversion-Rate frisst nur Marge und verschärft den Druck auf die Kosten.

Der echte Hebel liegt im bestehenden Traffic, nicht in neuem.

10.000 Besucher → 3.000 Warenkörbe → 900 Käufe
Konzept

Was ein echter A/B-Test tut

Der vorhandene Traffic wird nach dem Zufallsprinzip in zwei gleich große Gruppen aufgeteilt.

Gruppe A sieht die aktuelle Version, Gruppe B sieht die veränderte Version.

Beide Gruppen surfen zur gleichen Zeit unter denselben Bedingungen.

1 Zufällige Aufteilung 2 Variante A (Kontrolle) 3 Variante B (Änderung) 4 Gleichzeitige Messung
Konzept

Was ein A/B-Test nicht ist

Es ist kein Designwettbewerb, bei dem die schönere Variante gewinnt.

Es ist keine Plattform für Meinungen wie „bei mir klickt niemand auf Grün“.

Es ist auch keine Methode, um jede Woche eine neue Idee durchzuwirbeln.

VORHER NACHHER +
Daten vs. Meinung
Konzept

Anatomie eines Experiments: die Hypothese

Eine Hypothese sagt, welche Änderung Sie warum testen und welche Auswirkung Sie erwarten.

Schwach: „Wir testen einen neuen Button.“

Stark: „Wenn wir den CTA-Button im Warenkorb vergrößern, steigt die Conversion Rate um fünf Prozent, weil die Handlung deutlicher wird.“

1 Beobachtung 2 Annahme 3 Erwartete Veränderung 4 Messgröße
Konzept

Kontrolle, Variante und Randomisierung

Die Kontrolle ist die aktuelle Version — Ihr Status quo, gemessen unter den aktuellen Bedingungen.

Die Variante enthält genau eine gezielte Änderung.

Randomisierung sorgt dafür, dass Nutzer nicht selbst wählen, sondern zufällig zugeordnet werden.

VORHER NACHHER +
Kontrolle vs. Variante
Konzept

Metrik und Traffic-Split

Die Primärmetrik ist die eine Kennzahl, an der Sie Erfolg oder Misserfolg messen — meist Conversion Rate oder Umsatz pro Besucher.

Der Traffic-Split bestimmt, welcher Anteil der Besucher welche Variante sieht, typischerweise fünfzig zu fünfzig.

Eine ungleiche Aufteilung verlängert die Testlaufzeit oder schwächt die Aussagekraft.

50 Variante A 50 Variante B
Typischer 50/50 Traffic-Split
Beispiel

Warum Vorher-Nachher lügt: ein konkretes Szenario

Montag: Regen, dreitausend Besucher, Conversion Rate 2,1 Prozent.

Dienstag: Sonne, dreitausend Besucher, neuer Header live, Conversion Rate 2,4 Prozent.

Schlussfolgerung: Der Header bringt fünfzehn Prozent mehr Umsatz.

Wahrscheinlichkeit: Das Wetter und der Wochentag haben das Ergebnis verzerrt.

2.12.4MontagDienstag
Vorher-Nachher mit externem Störfaktor
Szenario

Kampagnen, Feiertage und Werbeaktionen

Am Black Friday steigt die Conversion Rate fast überall — unabhängig davon, was Sie am Shop ändern.

Eine Retargeting-Kampagne kann die Kontrollgruppe anders ansprechen als die Variante.

Wer Vorher-Nachher misst, blendet diese Störfaktoren aus statt sie zu kontrollieren.

VORHER NACHHER +
Störfaktoren wirken ungleich auf Zeitvergleiche
Konzept

Paralleles Testen eliminiert Störfaktoren

Bei einem A/B-Test laufen beide Varianten zur gleichen Zeit.

Wetter, Wochentag, Kampagnen und saisonale Effekte wirken sich auf beide Gruppen gleich aus.

Der einzige systematische Unterschied bleibt die getestete Änderung.

1 Gleicher Zeitraum 2 Gleiche Besucher 3 Gleiche externe Faktoren 4 Eine einzige Differenz
Konzept

Primärmetrik vs. Guardrail-Metriken

Die Primärmetrik entscheidet, ob die Variante gewinnt — zum Beispiel Umsatz pro Besucher.

Guardrail-Metriken schützen vor Nebenwirkungen: Rücklaufquote, Support-Anfragen, durchschnittlicher Bestellwert.

Eine Variante kann die Conversion steigern und gleichzeitig den Bestellwert senken.

VORHER NACHHER +
Primärmetrik und Guardrails im Blick
Beispiel

Geschäftsmetriken, die Sinn ergeben

Conversion Rate: Anteil der Besucher, die kaufen.

Umsatz pro Besucher: Kombiniert Conversion und Bestellwert.

Customer Lifetime Value: Zeigt langfristige Wirkung, besonders bei Abonnements.

3.2 Conversion Rate 4.8 Umsatz/Besucher 12.5 Lifetime Value
Beispielhafte Geschäftsmetriken
Konzept

Qualität einer Hypothese

Falsifizierbar: Das Gegenteil muss theoretisch möglich sein.

Eine Variable: Ändern Sie nur ein Element pro Variante.

Erwartete Wirkung: Nennen Sie Richtung und Größenordnung der erwarteten Veränderung.

1 Falsifizierbar 2 Eine Variable 3 Erwartete Wirkung 4 Messbare Metrik
Konzept

Häufige Fehler, die Tests ungültig machen

Peeking: Sie schauen täglich auf das Ergebnis und beenden den Test, sobald etwas Signifikantes blinkt.

Zu früh stoppen: Varianten schwanken zufällig, bis genügend Daten vorliegen.

Zu viele Varianten: Bei zehn Varianten gewinnt fast immer zufällig eine.

Peeking, Frühstoppen, Varianten-Inflation
Übung

Ihre Übung: eine falsifizierbare Hypothese

Wählen Sie eine Seite oder ein Element in Ihrem Shop.

Formulieren Sie: Wenn wir X ändern, dann steigt/sinkt Y um Z, gemessen an Metrik M.

Prüfen Sie: Ist nur eine Variable verändert? Ist das Gegenteil denkbar?

Hypothese für den eigenen Shop entwerfen
Zusammenfassung

Zusammenfassung: die wichtigsten Punkte

Siebzig Prozent aller Warenkörbe werden online nicht gekauft — mehr Traffic löst das Problem nicht.

Ein echter A/B-Test teilt Traffic zufällig auf und testet parallel unter gleichen Bedingungen.

Vorher-Nachher wird durch Wetter, Wochentag und Kampagnen verzerrt.

1 Problem erkennen 2 Hypothese formulieren 3 Parallel testen 4 Mit Daten entscheiden
Zusammenfassung

Was Sie mitnehmen

Definieren Sie vor dem Test eine klare Primärmetrik und passende Guardrails.

Formulieren Sie Hypothesen so, dass das Gegenteil möglich ist und nur eine Variable verändert wird.

Vermeiden Sie Peeking, Frühstoppen und zu viele Varianten.

VORHER NACHHER +
Von der Vermutung zur validen Entscheidung
Zwischenschritt

Das JDKRUEGER-Versprechen

Wir führen in DACH mehr A/B-Tests durch als klassische Agenturen verkaufen — und beweisen jede Empfehlung mit Daten.

Messbar. Skalierbar. Belegt.
Quiz

Quiz

Testen Sie Ihr Wissen.

Ein Shop hat eine Conversion Rate von 3 % und eine Warenkorbabbruchrate von etwa 70 %. Was ist die sinnvollste Schlussfolgerung für die Strategie?

Warum müssen Besucher in einem validen A/B-Test zufällig und parallel auf die Varianten verteilt werden?

Welche Hypothese ist für einen A/B-Test am besten geeignet?

Eine Variante steigert die Conversion Rate um 8 %, senkt aber den durchschnittlichen Bestellwert um 20 %. Was zeigt dies?

Welches Verhalten macht einen A/B-Test besonders anfällig für falsche Gewinner?

Transkript dieser Folie

A/B-Testing für Nicht-Statistiker