Usuń ciszę z audio: auto-detekcja i przycinanie pauz

Przestań ręcznie przewijać długie nagrania w poszukiwaniu cichych przerw. DuneTools analizuje Twoje audio, znajduje każdy cichy fragment i usuwa go z regulowanym progiem i minimalną długością. Idealne do podcastów, wykładów, notatek głosowych i nagrań ekranu.

100% prywatnie

Próg dB

Wizualny przebieg

Bez znaku wodnego

Kroki

Jak działa auto-usuwanie ciszy

Trzy kroki, wszystko w przeglądarce dzięki Web Audio API.

Wrzuć swoje audio

Przeciągnij MP3, WAV, OGG lub M4A. Narzędzie dekoduje plik lokalnie przez Web Audio API przeglądarki, bez żadnej wysyłki.

Dostrój ustawienia detekcji

Ustaw próg ciszy (domyślnie -30 dB, niżej dla głośnych nagrań, wyżej dla czystych), minimalną długość ciszy (domyślnie 0.5 s) i padding (zachowaj 100 ms przed i po dla naturalnych pauz). Podglądaj przebieg na żywo.

Eksportuj wyczyszczone audio

Pobierz jako WAV (bezstratny) lub MP3 (kompaktowy). Zobacz dokładnie, ile zyskałeś (Oryginał 18:42 -> Po czyszczeniu 14:21, krótsze o 23%).

Zaprojektowane dla audio z mową

Podcasty, wykłady, notatki głosowe, przygotowanie do transkrypcji, czyszczenie nagrań ekranu.

Regulowany próg

Domyślne -30 dB działa dla większości czystych nagrań. Zejdź niżej (-40, -50 dB) dla bardzo cichych pomieszczeń. Podnieś wyżej (-20 dB) dla głośnych otoczeń, gdzie „cisza” wciąż ma szum tła.

Min. długość ciszy

Domyślnie 0.5 sekundy. Ustaw 0.2 s, aby usunąć mikropauzy (agresywnie), albo 2 s, aby usuwać tylko długie, niezręczne przerwy (delikatnie). Naturalne pauzy w mowie są zachowane.

Bezpieczny padding

Zachowaj 100 ms przed i po każdym cięciu, by uniknąć szarpniętych jump-cutów. Regulacja 0-500 ms. Bez paddingu audio może brzmieć nagle, gdy mowa wraca.

Podgląd wizualnego przebiegu

Canvas z przebiegiem, ciche obszary podświetlone na czerwono, zachowane na zielono. Zobacz dokładnie, co zostanie wycięte przed eksportem.

100% lokalne przetwarzanie

Web Audio API dekoduje i analizuje Twój plik w całości w przeglądarce. Dane audio nigdy nie opuszczają urządzenia, idealne do poufnych wywiadów, nagrań medycznych lub treści NDA.

Eksport MP3 i WAV

WAV dla bezstratnej jakości (od razu do Twojego DAW). MP3 przez ffmpeg.wasm dla kompaktowych plików gotowych do publikacji lub udostępniania.

Detekcja ciszy: notatki techniczne

Zrozum algorytm, by móc go dostroić do swojego audio.

Co tak naprawdę oznacza „cisza” w dB

Głośność audio mierzy się w decybelach względem pełnej skali (dBFS), gdzie 0 dB to najgłośniej, jak plik może być bez clippingu, a minus nieskończoność dB to prawdziwa cyfrowa cisza. Prawdziwe nagrania mają podłogę szumu: cichy biuro to około -50 dB, akustycznie przygotowane studio około -70 dB. Mowa szczytuje przy -6 do -12 dB. Używamy RMS w oknach po 50 ms, by zdecydować, czy fragment to cisza, RMS wygładza krótkie trzaski, które oszukałyby detekcję szczytową.

Jeśli Twój próg to -30 dB, a Twój pokój buczy na -25 dB, nic nie zostanie wykryte jako cisza. Obniż próg albo najpierw odszum.

Dlaczego min. długość ciszy ma znaczenie

Naturalna mowa ma mikropauzy (50-300 ms między słowami), których NIE chcesz usuwać, to dzięki nim ludzie parsują zdania. Ustawienie minimum 0.5 s oznacza, że tylko fragmenty 500 ms lub dłuższe zostaną wycięte. To zachowuje kadencję, usuwając martwy czas między akapitami, slajdami lub falstartami.

Edytorzy podcastów zwykle używają 0.4-0.8 s min. długości. Agresywne montaże sportowe używają 0.2 s. Praca dokumentalna używa 1-2 s.

Padding: unikanie jump-cutów

Bez paddingu masz szarpnięte przeskoki: koniec słowa -> natychmiast nowe słowo -> brzmi nienaturalnie. Padding zachowuje bufor audio po każdej stronie cięcia (domyślnie 100 ms). Oddech lub końcowa sybilanta są zachowane, cięcie zlewa się naturalnie. Ustaw więcej (200-300 ms) dla muzyki lub starannej narracji, mniej (50 ms) dla szybkich montaży.

Słuchacze zwykle nie poznają, że cisza została usunięta, gdy padding wynosi ≥80 ms. Poniżej zaczynają być potrzebne fade'y lub crossfade'y.

Kiedy to narzędzie NIE wystarcza

Usuwanie ciszy świetnie nadaje się do przycinania treści, nie do usuwania szumu. Jeśli Twoje audio ma ciągły szum tła (wentylator, buczenie, ruch uliczny), to narzędzie nie usunie go, potrzebujesz reduktora szumu lub denoisera. Podobnie odgłosy oddechu, mlaski i „yyy” to nie cisza, to cichy szum żyjący powyżej progu. Do takiej edycji DAW (darmowa Audacity albo płatny Descript) radzi sobie najlepiej.

Użyj najpierw tego narzędzia, by usunąć martwą ciszę, potem DAW do redukcji szumu i czyszczenia odgłosów ust, jeśli trzeba.

Praktyczne zastosowania

Postprodukcja podcastu

Wytnij każdą pauzę „yyy, daj chwilę pomyśleć” w 90-minutowym odcinku w sekundach. Oszczędza 1-2 godziny na odcinek w porównaniu z ręcznym przewijaniem i cięciem.

Czyszczenie wykładów online

Nagrałeś 2-godzinne zajęcia z 20 minutami „daj mi znaleźć ten slajd” martwej ciszy. Wytnij te przerwy przed udostępnieniem, studenci dostają zwartą wersję.

Czyszczenie notatek głosowych

Notatki głosowe z iPhone’a z długimi pauzami na myślenie, idealne do publikacji w feedzie podcastu lub wysłania do transkrybera. Czystsze audio = szybsza transkrypcja = niższy koszt.

Audio z nagrań ekranu

Tutoriale i dema często mają 5-10 sekundowe pauzy podczas ładowania narzędzi. Wytnij je przed publikacją na YouTube lub w swoim centrum pomocy, widzowie od razu dostają treść.

Przygotowanie wywiadu

Wywiad w terenie z niezręcznymi przerwami, gdy rozmówca myśli. Auto-przycinanie, by transkrypcje i cytaty płynęły naturalnie.

Samodzielne nagrywanie audiobooka

Sam czytasz audiobook? Wytnij niezamierzone przerwy „końca akapitu” przed eksportem rozdziału. Słuchacze dostają profesjonalny flow.

Usuwanie ciszy, najczęściej zadawane pytania

Szybkie odpowiedzi o narzędziu

Jakie jest najlepsze ustawienie progu?

Zacznij od domyślnego -30 dB. Jeśli zbyt dużo prawdziwego audio jest wycinane, podnieś próg w kierunku -20 dB. Jeśli ciche pauzy utrzymują się po przetworzeniu, obniż do -40 lub -50 dB. Obserwuj podgląd przebiegu, czerwone obszary to to, co zostanie usunięte.

Czy to usuwa oddechy między zdaniami?

Pewnie nie, oddechy zwykle leżą przy -20 do -30 dB, czyli powyżej domyślnego progu. Jeśli chcesz je usunąć, obniż próg do -15 dB ORAZ ustaw minimalną długość ciszy na 0.3 s. Najpierw przetestuj na próbce 30 sekund.

Czy mogę użyć tego do plików muzycznych?

Technicznie tak, ale narzędzie jest zaprojektowane dla mowy. Muzyka ma ciągłe przebiegi z bardzo nielicznymi prawdziwymi cichymi przerwami (tylko między utworami). Dla muzyki jedynym sensownym zastosowaniem jest usunięcie nadmiarowej ciszy na początku lub końcu pojedynczego utworu.

Czy to jest bezstratne?

Eksport WAV jest bezstratny (zachowane audio jest bit-identyczne z oryginałem). Eksport MP3 jest stratny (ponowne kodowanie domyślnie przy 128 kbps). Jeśli zależy Ci na jakości, eksportuj WAV i osobno skonwertuj na MP3 w preferowanym bitrate za pomocą narzędzia Kompresuj audio.

Jak długi może być mój plik audio?

Ograniczone przez RAM przeglądarki. Nowoczesny laptop wygodnie obsługuje 2-3 godziny mowy (około 100-200 MB MP3 lub 1-2 GB WAV). Na mobile pozostań poniżej 1 godziny dla najlepszej wydajności.

Czy działa na głośnych nagraniach?

Częściowo. Jeśli szum tła jest powyżej Twojego progu, nic nie zostanie wykryte jako cisza. Spróbuj podnieść próg w kierunku -20 dB. Dla naprawdę głośnych materiałów uruchom najpierw denoiser (Audacity ma darmową Redukcję szumu), potem wróć tutaj, by przyciąć ciche przerwy.

Czy mogę zobaczyć, co zostanie usunięte przed eksportem?

Tak. Podgląd przebiegu pokazuje cały plik audio z cichymi obszarami podświetlonymi na czerwono i zachowanymi na zielono. Widzisz dokładnie, co algorytm zdecydował, dostrajaj próg i min. długość, aż oznaczenie pasuje do Twojej intencji, potem eksportuj.

Czy timing mojej mowy się zmieni?

Tak, ciche przerwy są usuwane, więc bezwzględne znaczniki czasu przesuwają się wcześniej. Jeśli masz transkrypcję lub plik napisów zsynchronizowany z oryginałem, musisz je ponownie zsynchronizować po usunięciu ciszy. Dla wywiadów to zwykle nie problem. Dla wykładów z przejściami slajdów zsynchronizowanymi z audio, zaplanuj odpowiednio.

Czy mój plik audio jest wysyłany?

Nie. Wszystko działa w karcie przeglądarki przez Web Audio API (dekodowanie) i ffmpeg.wasm (eksport MP3). Zero żądań wychodzących podczas przetwarzania, weryfikowalne w DevTools.

Co jeśli żadna cisza nie zostanie wykryta?

Narzędzie pokazuje jasny komunikat i pozwala pobrać oryginalny plik bez zmian. Zwykle oznacza to, że próg jest za niski (spróbuj -20 dB) albo Twoje audio naprawdę nie ma cichych przerw.