Stille aus Audio entfernen: Pausen automatisch erkennen und trimmen

Schluss mit manuellem Durchscrubben langer Aufnahmen, um stille Lücken zu finden. DuneTools analysiert Dein Audio, findet jeden stillen Abschnitt und entfernt ihn mit einstellbarem Schwellwert und Mindestdauer. Perfekt für Podcasts, Vorlesungen, Sprachmemos und Bildschirmaufnahmen.

100% Privat

dB-Schwellwert

Visuelle Wellenform

Kein Wasserzeichen

Anleitung

So funktioniert automatische Stille-Entfernung

Drei Schritte, alles in Deinem Browser über die Web Audio API.

Audio hineinziehen

Ziehe eine MP3, WAV, OGG oder M4A per Drag-and-Drop. Das Tool dekodiert sie lokal mit der Web Audio API des Browsers, kein Upload nötig.

Erkennung einstellen

Setze den Stille-Schwellwert (Standard -30 dB, niedriger für verrauschte Aufnahmen, höher für saubere), Mindestdauer der Stille (Standard 0.5 s) und Padding (100 ms vor/nach behalten für natürliche Pausen). Vorschau der Wellenform live.

Bereinigtes Audio exportieren

Lade als WAV (verlustfrei) oder MP3 (kompakt) herunter. Sieh genau, wie viel Du gespart hast (Original 18:42 -> Bereinigt 14:21, 23% kürzer).

Konzipiert für gesprochenes Audio

Podcasts, Vorlesungen, Sprachmemos, Transkriptionsvorbereitung, Bildschirmaufnahme-Bereinigung.

Einstellbarer Schwellwert

Der Standard -30 dB funktioniert für die meisten sauberen Aufnahmen. Setze ihn niedriger (-40, -50 dB) für sehr leise Räume. Setze ihn höher (-20 dB) für laute Umgebungen, in denen 'Stille' noch Hintergrundbrummen hat.

Mindestdauer der Stille

Standard 0.5 Sekunden. Setze 0.2 s, um Mikropausen zu entfernen (aggressiv), oder 2 s, um nur lange ungeschickte Lücken zu killen (sanft). Natürliche Sprechpausen bleiben erhalten.

Padding-Sicherheit

Behalte 100 ms vor und nach jedem Schnitt, um abrupte Jump-Cuts zu vermeiden. Einstellbar 0-500 ms. Ohne Padding kann Audio abrupt klingen, wenn die Sprache wieder einsetzt.

Visuelle Wellenform-Vorschau

Canvas-Wellenform mit stillen Regionen in Rot hervorgehoben, beibehaltene Regionen in Grün. Sieh genau, was vor dem Export geschnitten wird.

100% lokale Verarbeitung

Die Web Audio API dekodiert und analysiert Deine Datei komplett im Browser. Audiodaten verlassen nie Dein Gerät, ideal für vertrauliche Interviews, medizinische Aufnahmen oder NDA-Inhalte.

MP3 + WAV Export

WAV für verlustfreie Qualität (direkt in Deine DAW ziehen). MP3 über ffmpeg.wasm für kompakte Dateien, bereit zum Veröffentlichen oder Teilen.

Stille-Erkennung: technische Hinweise

Verstehe den Algorithmus, damit Du ihn für Dein Audio feinjustieren kannst.

Was 'Stille' in dB wirklich bedeutet

Audio-Lautstärke wird in Dezibel relativ zur Vollausschlagsgrenze (dBFS) gemessen, wobei 0 dB die lauteste mögliche Aufnahme ohne Clipping ist, und -unendlich dB echte digitale Stille. Reale Aufnahmen haben einen Grundrauschpegel: ein ruhiges Büro liegt bei etwa -50 dB, ein akustisch behandeltes Studio bei etwa -70 dB. Sprache erreicht Spitzen bei -6 bis -12 dB. Wir nutzen RMS über 50-ms-Fenster, um zu entscheiden, ob ein Abschnitt Stille ist, RMS glättet kurze Pops, die eine Peak-Erkennung täuschen würden.

Wenn Dein Schwellwert -30 dB ist, aber Dein Raum bei -25 dB brummt, wird nichts als Stille erkannt. Schwellwert senken oder vorher entrauschen.

Warum die Mindestdauer der Stille zählt

Natürliche Sprache hat Mikropausen (50-300 ms zwischen Wörtern), die Du NICHT entfernen willst, so parsen Menschen Sätze. Eine Mindestdauer von 0.5 s bedeutet, dass nur Abschnitte von 500 ms oder länger geschnitten werden. Das erhält die Sprachkadenz und entfernt die tote Luft zwischen Absätzen, Folien oder Fehlstarts.

Podcast-Editoren nutzen typischerweise 0.4-0.8 s Mindestdauer. Aggressive Sport-Schnitte nutzen 0.2 s. Dokumentationsarbeit nutzt 1-2 s.

Padding: Jump-Cuts vermeiden

Ohne Padding bekommst Du abrupte Sprünge: Wort endet -> sofort neues Wort -> klingt unnatürlich. Padding behält einen Puffer von Audio auf jeder Seite des Schnitts (Standard 100 ms). Der Atem oder das ausklingende Zischen bleibt erhalten, der Schnitt verschmilzt natürlich. Setze höher (200-300 ms) für Musik oder sorgfältige Erzählung, niedriger (50 ms) für schnellgeschnittene Edits.

Hörer können typischerweise nicht erkennen, dass Stille entfernt wurde, wenn das Padding ≥80 ms ist. Darunter werden Fades oder Crossfades nötig.

Wenn dieses Tool NICHT ausreicht

Stille-Entfernung ist großartig für Inhalts-Trimmen, nicht für Rausch-Entfernung. Wenn Dein Audio kontinuierliches Hintergrundrauschen hat (Lüfter, Brummen, Verkehr), kann dieses Tool es nicht entfernen, Du brauchst einen Rauschunterdrücker oder Denoiser. Ebenso sind Atemgeräusche, Mundklicks und 'Ähms' keine Stille, sondern leises Rauschen über dem Schwellwert. Für diese Editierebene erledigt das eine DAW (Audacity kostenlos, oder Descript kostenpflichtig).

Nutze dieses Tool zuerst, um tote Luft zu entfernen, dann eine DAW für Rauschunterdrückung und Mundgeräusch-Bereinigung bei Bedarf.

Anwendungsfälle aus der Praxis

Podcast-Postproduktion

Schneide jede 'ähm, lass mich überlegen'-Pause über eine 90-minütige Folge in Sekunden. Spart 1-2 Stunden pro Folge gegenüber manuellem Scrub-and-Cut.

Online-Vorlesung bereinigen

Eine 2-stündige Vorlesung mit 20 Minuten 'lass mich die Folie finden'-Totluft aufgenommen. Strippe diese Lücken vor dem Teilen, Studierende bekommen ein knackigeres Wiedergabe-Erlebnis.

Sprachmemo-Bereinigung

iPhone-Sprachmemos mit langen Denkpausen, perfekt fürs Posten in einen Podcast-Feed oder Schicken an einen Transkribierer. Sauberes Audio = schnellere Transkription = niedrigere Kosten.

Bildschirmaufnahme-Audio

Tutorials und Demos haben oft 5-10 Sekunden Pausen, während Tools laden. Strippe diese vor der Veröffentlichung auf YouTube oder Deinem Help-Center, Zuschauer kommen direkt zum Inhalt.

Interview-Vorbereitung

Feldinterview mit ungeschickten Pausen, während die Quelle nachdenkt. Auto-Trim, damit Transkripte und Zitatauszüge natürlich fließen.

Hörbuch-Eigenaufnahme

Du sprichst ein Hörbuch selbst ein? Strippe die unbeabsichtigten 'Absatzpause'-Lücken vor dem Kapitel-Export. Hörer bekommen einen professionellen Fluss.

Stille entfernen, häufig gestellte Fragen

Schnelle Antworten zum Werkzeug

Was ist die beste Schwellwert-Einstellung?

Starte mit dem Standard -30 dB. Wenn zu viel echtes Audio geschnitten wird, hebe den Schwellwert Richtung -20 dB. Wenn nach der Verarbeitung stille Pausen bleiben, senke auf -40 oder -50 dB. Beachte die Wellenform-Vorschau, rote Regionen werden entfernt.

Werden Atemgeräusche zwischen Sätzen entfernt?

Wahrscheinlich nicht, Atemgeräusche liegen meist bei -20 bis -30 dB, was über dem Standard-Schwellwert ist. Wenn Du sie entfernen willst, senke den Schwellwert auf -15 dB UND setze die Mindestdauer auf 0.3 s. Teste zuerst an einem 30-Sekunden-Sample.

Kann ich das für Musikdateien nutzen?

Technisch ja, aber es ist für gesprochenes Audio konzipiert. Musik hat kontinuierliche Wellenformen mit sehr wenigen echten stillen Lücken (nur zwischen Tracks). Für Musik ist der einzige sinnvolle Durchgang das Entfernen zusätzlicher führender oder nachlaufender Stille bei einem einzelnen Track.

Ist das verlustfrei?

WAV-Export ist verlustfrei (das behaltene Audio ist bit-identisch zum Original-Input). MP3-Export ist verlustbehaftet (neu kodiert mit 128 kbps Standard). Wenn Qualität wichtig ist, exportiere WAV und konvertiere separat mit Deiner bevorzugten Bitrate per Audio-komprimieren-Tool zu MP3.

Wie lang darf meine Audiodatei sein?

Begrenzt durch den Browser-RAM. Ein moderner Laptop verkraftet 2-3 Stunden Sprachaudio (etwa 100-200 MB MP3 / 1-2 GB WAV) problemlos. Auf Mobilgeräten bleibe unter 1 Stunde für beste Leistung.

Funktioniert es bei verrauschten Aufnahmen?

Teilweise. Wenn das Hintergrundrauschen über Deinem Schwellwert liegt, wird nichts als Stille erkannt. Versuche, den Schwellwert Richtung -20 dB anzuheben. Bei wirklich verrauschtem Material lasse zuerst einen Denoiser laufen (Audacity hat Noise Reduction kostenlos), dann komme hierher zurück, um die stillen Lücken zu trimmen.

Kann ich vor dem Export sehen, was entfernt wird?

Ja. Die Wellenform-Vorschau zeigt die gesamte Audiodatei mit stillen Regionen in Rot und beibehaltenen in Grün. Du siehst genau, was der Algorithmus entschieden hat, passe Schwellwert/Mindestdauer an, bis die Markierung Deiner Absicht entspricht, dann exportiere.

Verändert sich das Timing meiner Sprache?

Ja, stille Lücken werden entfernt, also verschieben sich absolute Zeitstempel nach vorne. Wenn Du ein Transkript oder eine Untertiteldatei synchron zum Original hast, musst Du nach der Stille-Entfernung neu synchronisieren. Für Interviews ist das meist okay. Für Vorlesungen mit Folienwechseln zum Audio plane entsprechend.

Wird meine Audiodatei hochgeladen?

Nein. Alles läuft in Deinem Browser-Tab über die Web Audio API (Dekodierung) und ffmpeg.wasm (MP3-Export). Null ausgehende Anfragen während der Verarbeitung, in DevTools überprüfbar.

Was, wenn keine Stille erkannt wird?

Das Tool zeigt eine klare Meldung und lässt Dich die Originaldatei unverändert herunterladen. Üblicherweise heißt das, Dein Schwellwert ist zu niedrig (versuche -20 dB) oder Dein Audio hat wirklich keine stillen Lücken.