Die ehrliche Antwort: rund 4 %
Wenn ein Audio-Player auf einer Webseite erscheint, klicken im Durchschnitt etwa 4 von 100 Besuchern auf Play. Das zeigt eine Analyse von BeyondWords aus dem Jahr 2023, die über 17 Millionen Audio-Wiedergaben ausgewertet hat. Die gemessene Listen Rate lag bei 4,19 % – also jeder 25. Besucher.
Trinity Audio, ein weiterer Anbieter von Audio-Artikeln, kommt auf eine Click-Through-Rate von rund 2 %. Die Wahrheit liegt also irgendwo zwischen 2 und 5 %, abhängig von Platzierung, Thema und Zielgruppe.
Das klingt nach wenig. Ist es aber nicht.
Play-Rate
pro Session
als Durchschnitt
Warum 4 % mehr sind, als du denkst
Die durchschnittliche Verweildauer auf einer Webseite liegt bei etwa 2 Minuten und 17 Sekunden. Auf Blog-Artikeln oft noch weniger – viele Besucher sind nach 55 Sekunden wieder weg. Das ist die Realität: Die meisten Menschen scannen Überschriften, lesen den ersten Absatz und verschwinden.
Wer aber auf Play klickt, bleibt. Laut BeyondWords hören Nutzer im Schnitt 3 Minuten und 45 Sekunden pro Session – das ist rund 4-mal länger als die durchschnittliche Verweildauer. Trinity Audio bestätigt das mit einer Completion Rate von fast 49 %: Knapp die Hälfte aller Hörer bleibt bis zum Ende.
Was nach dem Klick passiert
Die eigentlich spannende Zahl ist nicht die Play-Rate – sondern die Listen-Through-Rate (LTR). Sie misst, wie viel vom Audio tatsächlich gehört wird. Und hier wird es interessant:
| Metrik | Wert | Quelle |
|---|---|---|
| Play-Rate (Listen Rate) | 4,19 % | BeyondWords, 2023 |
| Click-Through-Rate | 2,03 % | Trinity Audio, 2022 |
| Listen-Through-Rate | 59 – 69 % | BeyondWords / Trinity Audio |
| Completion Rate | 48,87 % | Trinity Audio, 2022 |
| LTR bei Langform (>5 Min.) | 70 % | Branchenanalyse, 2022 |
| Hördauer pro Session | 3 Min. 45 Sek. | BeyondWords, 2023 |
| Anteil Mobile | 71,1 % | Trinity Audio, 2022 |
Zwei Drittel des Audios werden gehört. Bei längeren Artikeln sogar 70 %. Das ist eine Engagement-Rate, von der jedes andere Format auf einer Webseite nur träumen kann.
Im Vergleich: Wie gut sind 4 %?
Um die Play-Rate einzuordnen, hilft ein Blick auf andere Klick-Raten im digitalen Marketing:
Quellen: BeyondWords 2023, Trinity Audio 2022, SmartInsights, Google Ads Benchmark 2023
Ein Audio-Player auf einem Artikel schlägt Display-Werbung um das 40-fache. Und im Gegensatz zu einer Anzeige bietet der Klick auf Play echten Mehrwert – kein Werbemittel, sondern den Inhalt der Seite in einem anderen Format.
Wann klicken mehr Menschen?
Die Play-Rate ist kein fixer Wert. Sie hängt von mehreren Faktoren ab, die Publisher beeinflussen können:
Platzierung. Ein Player, der direkt unter der Überschrift sitzt, wird häufiger geklickt als einer, der erst nach dem dritten Absatz erscheint. Sichtbarkeit ist alles.
Artikellänge. Längere Artikel haben höhere Play-Raten. Logisch: Wer einen 2.000-Wörter-Artikel sieht, überlegt eher, ob Zuhören nicht einfacher wäre. Studien zeigen, dass Langform-Content eine bis zu 3x höhere Click-Through-Rate erzielt als Kurzform.
Mobile Nutzung. 71 % aller Audio-Wiedergaben finden auf Mobilgeräten statt. Menschen unterwegs greifen eher zu Audio als Desktop-Nutzer. Wer viel mobilen Traffic hat, profitiert überproportional.
Tageszeit. Die meisten Klicks fallen zwischen 14 und 17 Uhr – die klassische Nachmittagslücke, wenn die Konzentration nachlässt. Ein zweiter Peak liegt zwischen 21 und 23 Uhr, wenn Menschen abschalten wollen.
dem Smartphone
Langform-Content
am Nachmittag
Was das für SEO bedeutet
Google misst Verweildauer. Eine Seite, auf der Besucher 55 Sekunden bleiben, sendet ein anderes Signal als eine, auf der sie 4 Minuten verbringen. Audio verlängert die Session-Dauer massiv – und das ohne, dass der Publisher einen einzigen zusätzlichen Satz schreiben muss.
Dazu kommt: Audio reduziert die Bounce-Rate. Die durchschnittliche Bounce-Rate für Blogs liegt bei 65–90 %. Wer einen Audio-Player anbietet, gibt Besuchern einen Grund, auf der Seite zu bleiben – selbst wenn sie nicht lesen wollen. Der Klick auf Play ist ein Engagement-Signal, das Google registriert.
Menschliche Stimme vs. KI: Macht das einen Unterschied?
Die genannten Studien basieren größtenteils auf KI-generierten Audio-Versionen. Was passiert, wenn statt einer Maschine ein echter Mensch spricht?
Direkte A/B-Studien zwischen KI und menschlichen Sprechern auf Webseiten sind noch selten. Aber aus der Werbewirkungsforschung wissen wir: Menschliche Stimmen erzielen eine 24 % höhere Markenerinnerung als synthetische Stimmen (Nielsen). Und Hörer bevorzugen Stimmen, die authentisch und nahbar klingen – genau das, was echte Sprecher liefern.
Die These: Wenn schon KI-Stimmen auf 4 % Play-Rate kommen, liegt das Potenzial für menschliche Stimmen noch höher. Mehr Vertrauen, mehr Nähe, mehr Engagement.
Was OKAYPLAY daraus macht
OKAYPLAY setzt auf genau diese 4 %. Jeder Klick auf Play bedeutet: Ein Mensch hört einem anderen Menschen zu. Nicht einer Maschine. Das Audio wird von echten Sprechern eingesprochen, die für ihre Arbeit fair bezahlt werden – finanziert durch kurze Audio-Werbespots.
Für Publisher bedeutet das: Mehr Verweildauer, bessere Engagement-Signale, barrierefreier Content – ohne einen Cent zu investieren. Denn OKAYPLAY ist für Webseitenbetreiber kostenlos.
4 von 100 klingen bescheiden. Aber es sind die 4, die wirklich zuhören.