Kompresuj audio online: mniejsze pliki, ta sama jakość odsłuchu

Zmniejsz rozmiar plików MP3, WAV, OGG lub M4A o 50-90% z pełną kontrolą nad bitrate, częstotliwością próbkowania i kanałami. ffmpeg.wasm działa w całości w Twojej przeglądarce, audio nigdy nie opuszcza urządzenia, a każdy zaoszczędzony kilobajt zostaje przy Tobie.

100% prywatnie

Własny bitrate

Podgląd rozmiaru

Bez znaku wodnego

Kroki

Jak kompresować pliki audio

Trzy kroki, wszystko po stronie klienta przez ffmpeg.wasm.

Wrzuć swoje audio

Przeciągnij jeden lub wiele plików MP3, WAV, OGG, M4A, FLAC. Narzędzie czyta je lokalnie, bez wysyłki na serwer, bez czekania na przepustowość.

Wybierz preset lub dostrój

Wybierz Podcast (96 kbps mono), Standard (128 kbps stereo), High (192 kbps stereo) lub Custom (ustaw bitrate 32-320 kbps, częstotliwość próbkowania 8/16/22/44.1/48 kHz, mono/stereo).

Kompresuj i pobierz

Wciśnij kompresuj, ffmpeg.wasm chrupie audio w Twojej przeglądarce. Zobacz dokładną zmianę rozmiaru (Przed 12.4 MB → Po 2.8 MB, mniejsze o 77%). Pobierz jeden plik lub partię jako ZIP.

Kompresja bez chmury

Każda opcja, którą daje koder desktopowy, bez konieczności wysyłki.

Kontrola bitrate 32-320 kbps

Wybierz dokładny docelowy bitrate. 32-64 kbps dla notatek głosowych (zrozumiałe, ale skompresowane). 96-128 kbps dla podcastów (przezroczyste dla głosu). 192-320 kbps dla muzyki (poziom audiofilski).

Konwersja mono / stereo

Podcasty i wykłady rzadko potrzebują stereo, przełączenie na mono tnie rozmiar pliku o 50% bez utraty jakości dla głosu. Muzyka zachowuje stereo dla separacji przestrzennej.

Downsampling częstotliwości próbkowania

Domyślne 44.1 kHz to przesada dla głosu. Zejdź do 22.05 kHz dla notatek (mniejsze o 50%), 16 kHz dla mowy w jakości telefonicznej (mniejsze o 75%). Muzyka zostaje przy 44.1 lub 48 kHz.

Podgląd rozmiaru na żywo

Przed wciśnięciem kompresuj narzędzie szacuje rozmiar pliku wyjściowego na podstawie czasu trwania × bitrate × kanałów. Pokręć ustawieniami, zobacz nowe oszacowanie, znajdź właściwy balans bez metody prób i błędów.

Przetwarzanie wsadowe

Wrzuć 50 odcinków podcastu naraz. Każdy dostaje te same ustawienia, wynik to pojedynczy ZIP ze wszystkimi skompresowanymi plikami w środku. Świetne do archiwizowania starego katalogu.

100% lokalnie przez ffmpeg.wasm

Branżowy standard ffmpeg skompilowany do WebAssembly działa w karcie Twojej przeglądarki. Dane audio, oryginalne czy skompresowane, nigdy nie dotykają naszych serwerów. Potwierdź w zakładce Network w DevTools.

Kompresja audio: teoria

Bitrate, kodeki i co „stratny” naprawdę oznacza dla Twoich uszu.

Bitrate to najważniejsze pokrętło

Bitrate (kbps = kilobity na sekundę) bezpośrednio kontroluje jakość vs rozmiar pliku. Połów bitrate, połów rozmiaru pliku, bardziej agresywne artefakty kompresji. Dla treści głosowych 64-96 kbps mono jest przezroczyste dla większości słuchaczy. Dla muzyki 192-256 kbps stereo to złoty środek, 320 kbps to przesada i tylko audiofile słyszą różnicę w testach ślepych. Schodzenie poniżej 64 kbps dla muzyki produkuje słyszalne artefakty „podwodne”.

Podcasterzy: 96 kbps mono oszczędza 70% przestrzeni dyskowej w porównaniu z 192 kbps stereo, bez słyszalnej straty dla głosu.

Częstotliwość próbkowania: dlaczego 44.1 kHz nie zawsze jest potrzebne

Częstotliwość próbkowania ogranicza najwyższą częstotliwość audio, jaką można reprezentować (połowa częstotliwości próbkowania, zgodnie z Nyquistem). 44.1 kHz łapie do 22.05 kHz, czyli granicy słuchu ludzkiego, idealne dla muzyki. 22.05 kHz łapie do 11 kHz, mnóstwo jak na głos (który żyje głównie w paśmie 100 Hz do 8 kHz). 16 kHz to jakość telefoniczna. Cięcie częstotliwości próbkowania połowi rozmiar pliku, zachowując jakość treści głosowej.

Notatka głosowa przy 16 kHz / 64 kbps mono = około 0.5 MB/min. Ta sama treść przy 44.1 kHz / 192 kbps stereo = około 1.4 MB/min, 3x większy plik bez zysku w odczuwalnej jakości.

Mono vs stereo, kiedy stereo jest zmarnowane

Stereo podwaja rozmiar pliku, przechowując dwa niezależne kanały. Stereo ma znaczenie dla muzyki, ambisonicznych nagrań terenowych i nagrań binauralnych. Stereo jest zmarnowane dla solowego głosu (podcasty, wykłady, notatki głosowe), nagrań z jednym mikrofonem i starej treści mono (audycji radiowych sprzed 1965). Konwersja zmarnowanego stereo do mono tnie rozmiar pliku o połowę z zerową słyszalną różnicą, kanały były już identyczne.

Sprawdź „czy kanał L różni się od R?” Jeśli nie, jest już mono w opakowaniu stereo. Skonwertuj na prawdziwe mono i odzyskaj 50% dysku.

Bezstratne vs stratne, kiedy każde ma sens

Bezstratne formaty (WAV, FLAC, ALAC) przechowują dane audio bit w bit, duże pliki, idealne do edycji i archiwizacji. Stratne formaty (MP3, AAC, OPUS, OGG Vorbis) odrzucają psychoakustycznie niesłyszalne dane, mniejsze pliki, idealne do dystrybucji. AAC przy 128 kbps zwykle brzmi lepiej niż MP3 przy 128 kbps. OPUS to nowoczesny mistrz dla głosu (najlepsza jakość przy najniższym bitrate). Domyślnie używamy MP3 ze względu na uniwersalne wsparcie urządzeń, przełącz na OPUS lub AAC, jeśli Twoja publiczność ma nowoczesny sprzęt.

Archiwizuj w WAV/FLAC. Dystrybuuj w MP3 lub AAC. Nigdy nie kompresuj ponownie stratnego pliku ze stratnego źródła, zawsze wracaj do bezstratnego mastera, jeśli to możliwe.

Praktyczne zastosowania

Przygotowanie podcastu do dystrybucji

Master przy 256 kbps stereo, kompresuj wersję dystrybucyjną do 96 kbps mono. Przepustowość RSS feedu spada o 70%, jakość odcinka niezmieniona dla słuchaczy.

Audio do e-maila

Dostawcy poczty ograniczają załączniki do 20-25 MB. 30-minutowa notatka głosowa w WAV to około 300 MB, skompresowana do MP3 96 kbps to 22 MB. Zmieści się w Gmailu, Outlooku, ProtonMailu.

Archiwum notatek głosowych

Lata notatek głosowych w pełnej jakości zjadają gigabajty. Wsadowa kompresja do 64 kbps mono, archiwum kurczy się 10x bez odczuwalnej straty dla starych notatek.

Optymalizacja odtwarzania w sieci

Osadzone audio na Twoim blogu albo stronie kursu? Ciężkie MP3 spowalniają ładowanie strony. Kompresuj do 96-128 kbps, słuchacze dostają to samo, Twój rachunek za CDN spada.

Audiobook na podróż

Audiobooki MP3 często mają 192 kbps stereo, około 100 MB na godzinę. Przekompresuj do 64 kbps mono na podróż (bez słyszalnej straty dla narracji), a 20-godzinna książka mieści się na karcie SD 1.5 GB.

Klip głosowy na Discord / Slack

Discord ogranicza uploady do 8 MB (darmowy plan). Klip głosowy ponad limit? Skompresuj do 64-96 kbps i się zmieści, jakość audio jest świetna do swobodnego czatu.

Kompresja audio, najczęściej zadawane pytania

Szybkie odpowiedzi o narzędziu

O ile mniejsze może być moje audio?

Zależy od źródła i celu. Stereo MP3 320 kbps skompresowane do mono 96 kbps maleje o 85%. WAV nagrany przy 44.1 kHz / 16-bit skonwertowany na MP3 128 kbps maleje o 90%. Już skompresowane MP3 (128 kbps) ponownie zakodowane przy tym samym bitrate kurczą się o 0-5% i tracą jakość. Zawsze kompresuj z najwyższej jakości źródła, jakim dysponujesz.

Czy audio będzie brzmieć gorzej?

Tylko jeśli przesadzisz z kompresją. Przy rozsądnym bitrate (96+ kbps głos, 192+ kbps muzyka) różnica jest niesłyszalna w testach ślepych. Zejdź za nisko (32-48 kbps dla muzyki) i usłyszysz artefakty „podwodne” lub „metaliczne”.

Jaki format wyeksportować?

MP3 dla maksymalnej kompatybilności (każde urządzenie na Ziemi gra MP3). OPUS dla najlepszej jakości przy niskim bitrate (nowoczesne przeglądarki, aplikacje podcastowe). AAC dla ekosystemu Apple i jako najlepsza alternatywa dla MP3. OGG Vorbis dla projektów open source. W razie wątpliwości wybierz MP3.

Czy mogę kompresować wiele plików wsadowo?

Tak, wrzuć 10 lub 100 plików naraz, narzędzie zastosuje te same ustawienia do każdego i da Ci pojedynczy ZIP ze wszystkimi skompresowanymi wynikami. Przydatne dla podcasterów kompresujących stary katalog albo archiwistów zmniejszających nagrania terenowe.

Czy plik jest wysyłany, by go skompresować?

Nie. ffmpeg.wasm to wersja branżowego standardu ffmpeg w WebAssembly, działająca wewnątrz karty Twojej przeglądarki. Twoje audio nigdy nie trafia na nasze serwery, potwierdź w zakładce Network DevTools przeglądarki podczas kompresji.

Ile trwa kompresja?

Mniej więcej 0.5-3x czasu rzeczywistego na nowoczesnym laptopie, 30-minutowy podcast kompresuje się w 15-90 sekund. Urządzenia mobilne są wolniejsze, spodziewaj się 2-5x czasu rzeczywistego na telefonie. Zadania wsadowe stają w kolejce sekwencyjnie, by nie zabrakło RAM-u.

Jaka jest różnica między CBR a VBR?

CBR (Constant Bitrate) utrzymuje ten sam kbps przez cały plik, przewidywalny rozmiar, trochę gorsza jakość przy danym bitrate. VBR (Variable Bitrate) używa więcej bitów na złożone fragmenty, mniej na ciszę, około 10-20% mniejsze przy tej samej odczuwalnej jakości. Domyślnie używamy VBR, przełącz na CBR, jeśli Twoja docelowa platforma tego wymaga (niektóre starsze hosty podcastów).

Czy mogę zachować tagi ID3 (tytuł, artysta, album)?

Tak, domyślnie kopiujemy metadane ID3 ze źródła do skompresowanego wyniku. Tytuł, artysta, album, rok, gatunek i okładka przenoszą się. Jeśli chcesz najpierw edytować tagi, użyj naszego narzędzia Edytor tagów MP3, a potem kompresuj.

Co jeśli moje audio jest zniekształcone po kompresji?

Dwie typowe przyczyny: (1) bitrate zbyt niski dla treści, podnieś do 128 kbps lub wyżej. (2) Źródło było już skompresowane wielokrotnie (utrata generacyjna), znajdź bezstratny oryginał. Nigdy nie kompresuj już skompresowanego pliku przy tym samym bitrate.

Czy działa na iPhonie?

Tak, na iOS Safari 16+. ffmpeg.wasm działa na mobile, ale jest znacznie wolniejszy niż na desktopie. Kompresuj małe pliki (poniżej 50 MB) na mobile, zadania wsadowe lepiej robić na laptopie.