Supprimer les silences audio : détection automatique des pauses

Arrête de scrubber manuellement de longs enregistrements pour trouver les blancs. DuneTools analyse ton audio, repère chaque silence, et les retire avec seuil et longueur minimale réglables. Parfait pour podcasts, cours, mémos vocaux et captures d'écran.

100% Privé

Seuil dB

Forme d'onde visuelle

Sans filigrane

Étapes

Comment fonctionne la suppression automatique des silences

Trois étapes, le tout dans ton navigateur via Web Audio API.

Dépose ton audio

Glisse-dépose un MP3, WAV, OGG ou M4A. L'outil le décode localement avec le Web Audio API du navigateur, aucun upload.

Règle les paramètres de détection

Définis le seuil de silence (par défaut -30 dB, plus bas pour les enregistrements bruyants, plus haut pour les propres), la longueur minimale de silence (par défaut 0.5 s) et le padding (garde 100 ms avant/après pour des pauses naturelles). Aperçu de la forme d'onde en direct.

Exporte l'audio nettoyé

Télécharge en WAV (sans perte) ou MP3 (compact). Vois exactement combien tu as gagné (Original 18:42 -> Nettoyé 14:21, 23% plus court).

Conçu pour l'audio parlé

Podcasts, cours, mémos vocaux, préparation de transcription, nettoyage de capture d'écran.

Seuil réglable

Le défaut -30 dB marche pour la plupart des enregistrements propres. Descends plus bas (-40, -50 dB) pour des pièces très calmes. Monte plus haut (-20 dB) pour des environnements bruyants où le 'silence' a encore un bourdonnement de fond.

Longueur min de silence

Par défaut 0.5 seconde. Mets 0.2 s pour retirer les micro-pauses (agressif), ou 2 s pour ne tuer que les longs blancs gênants (doux). Les pauses naturelles de la parole sont préservées.

Sécurité du padding

Garde 100 ms avant et après chaque coupe pour éviter des jump-cuts brutaux. Réglable 0-500 ms. Sans padding, l'audio peut sembler abrupt quand la parole reprend.

Aperçu visuel de la forme d'onde

Forme d'onde sur canvas avec les zones silencieuses surlignées en rouge, les zones conservées en vert. Vois exactement ce qui sera coupé avant d'exporter.

Traitement 100% local

Le Web Audio API décode et analyse ton fichier entièrement dans le navigateur. Les données audio ne quittent jamais ton appareil, idéal pour interviews confidentielles, enregistrements médicaux ou contenu sous NDA.

Export MP3 et WAV

WAV pour la qualité sans perte (à glisser directement dans ta DAW). MP3 via ffmpeg.wasm pour des fichiers compacts prêts à publier ou partager.

Détection de silence : notes techniques

Comprendre l'algorithme pour le régler selon ton audio.

Ce que 'silence' signifie vraiment en dB

La sonie audio se mesure en décibels relatifs au full scale (dBFS), où 0 dB est le maximum sans clipping, et -infini dB est le vrai silence numérique. Les vrais enregistrements ont un noise floor : un bureau silencieux est autour de -50 dB, un studio traité autour de -70 dB. La parole pique à -6 à -12 dB. Nous utilisons le RMS sur des fenêtres de 50 ms pour décider si un segment est du silence, le RMS lisse les brefs pops qui tromperaient la détection de crête.

Si ton seuil est à -30 dB mais ta pièce bourdonne à -25 dB, rien n'est détecté comme silence. Baisse le seuil ou débruite d'abord.

Pourquoi la longueur minimale compte

La parole naturelle a des micro-pauses (50-300 ms entre les mots) que tu ne veux PAS retirer, c'est ainsi que les humains parsent les phrases. Définir un minimum de 0.5 s signifie que seules les zones de 500 ms ou plus sont coupées. Cela préserve la cadence tout en retirant le silence entre paragraphes, slides ou faux départs.

Les monteurs podcast utilisent typiquement 0.4-0.8 s de longueur min. Les montages sport agressifs utilisent 0.2 s. Le travail documentaire utilise 1-2 s.

Padding : éviter les jump cuts

Sans padding, tu obtiens des sauts brutaux : fin de mot, nouveau mot instantané, ça sonne artificiel. Le padding garde un buffer d'audio de chaque côté de la coupe (par défaut 100 ms). La respiration ou la sifflante de fin sont préservées, la coupe se fond naturellement. Mets plus haut (200-300 ms) pour de la musique ou de la narration soignée, plus bas (50 ms) pour des montages rapides.

Les auditeurs ne peuvent typiquement pas dire que du silence a été retiré quand le padding est ≥80 ms. En dessous, des fondus ou crossfades deviennent nécessaires.

Quand cet outil n'est PAS suffisant

La suppression de silence est super pour couper du contenu, pas pour retirer du bruit. Si ton audio a un souffle de fond continu (ventilateur, bourdonnement, trafic), cet outil ne peut pas le retirer, tu as besoin d'un réducteur ou débruiteur. De même, les respirations, clics de bouche et 'euh' ne sont pas du silence, c'est du bruit léger qui vit au-dessus du seuil. Pour ce niveau d'édition, une DAW (Audacity gratuit, ou Descript payant) s'en charge.

Utilise cet outil d'abord pour retirer les blancs, puis une DAW pour réduire le bruit et nettoyer les bruits de bouche si besoin.

Cas d'usage réels

Post-production de podcast

Coupe chaque 'euh, laisse-moi réfléchir' sur un épisode de 90 minutes en quelques secondes. Économise 1-2 heures par épisode versus le scrub-and-cut manuel.

Nettoyage de cours en ligne

Cours de 2 heures enregistré avec 20 minutes de 'laisse-moi retrouver cette slide' de blancs. Vire ces moments avant de partager, les étudiants ont une lecture plus serrée.

Nettoyage de mémo vocal

Mémos vocaux iPhone avec de longues pauses de réflexion, parfait pour poster sur un flux podcast ou envoyer à un transcripteur. Audio propre = transcription plus rapide = coût plus bas.

Audio de capture d'écran

Tutoriels et démos ont souvent des pauses de 5-10 secondes pendant le chargement des outils. Vire-les avant de publier sur YouTube ou ton centre d'aide, les spectateurs vont droit au contenu.

Préparation d'interview

Interview de terrain avec des blancs gênants pendant que la source réfléchit. Coupe automatique pour que transcriptions et extraits de citations s'écoulent naturellement.

Auto-enregistrement d'audiobook

Tu narres ton propre audiobook ? Vire les blancs involontaires de 'pause de paragraphe' avant l'export par chapitre. Les auditeurs ont un flow professionnel.

Suppresseur de silences, questions fréquentes

Réponses rapides sur l'outil

Quel est le meilleur réglage de seuil ?

Commence avec le défaut -30 dB. Si trop de vraie parole est coupée, monte le seuil vers -20 dB. Si des pauses silencieuses persistent après traitement, baisse à -40 ou -50 dB. Surveille l'aperçu de la forme d'onde, les zones rouges sont ce qui sera retiré.

Cela va-t-il retirer les respirations entre les phrases ?

Probablement pas, les respirations se situent généralement à -20 à -30 dB ce qui est au-dessus du seuil par défaut. Si tu veux les retirer, baisse le seuil à -15 dB ET définis une longueur min de silence de 0.3 s. Teste sur un échantillon de 30 secondes d'abord.

Puis-je utiliser ceci pour des fichiers musicaux ?

Techniquement oui, mais c'est conçu pour l'audio parlé. La musique a des formes d'onde continues avec très peu de vrais silences (seulement entre les pistes). Pour la musique, la seule passe utile est de retirer du silence en début ou fin sur une seule piste.

Est-ce sans perte ?

L'export WAV est sans perte (l'audio conservé est bit-identique à l'original). L'export MP3 est avec perte (réencodé à 128 kbps par défaut). Si la qualité compte, exporte en WAV et convertis en MP3 séparément avec le bitrate préféré via l'outil Compresser audio.

Quelle peut être la durée de mon fichier audio ?

Limitée par la RAM du navigateur. Un laptop moderne gère confortablement 2-3 heures d'audio parlé (environ 100-200 Mo de MP3 / 1-2 Go de WAV). Sur mobile, reste sous 1 heure pour les meilleures performances.

Marche-t-il sur des enregistrements bruyants ?

Partiellement. Si le bruit de fond est au-dessus de ton seuil, rien n'est détecté comme silencieux. Essaie de monter le seuil vers -20 dB. Pour du matériel vraiment bruyant, lance un débruiteur d'abord (Audacity a Noise Reduction gratuit) puis reviens ici couper les blancs.

Puis-je voir ce qui sera retiré avant d'exporter ?

Oui. L'aperçu de la forme d'onde montre tout le fichier audio avec les zones silencieuses surlignées en rouge et les zones gardées en vert. Tu vois exactement ce que l'algorithme a décidé, ajuste seuil/longueur min jusqu'à ce que le marquage corresponde à ton intention, puis exporte.

Le timing de ma parole va-t-il changer ?

Oui, les blancs sont retirés, donc les timestamps absolus se décalent plus tôt. Si tu as une transcription ou un fichier de sous-titres synchronisé à l'original, tu devras resynchroniser après suppression. Pour des interviews, ça va généralement. Pour des cours avec changements de slide synchronisés à l'audio, planifie en conséquence.

Mon fichier audio est-il uploadé ?

Non. Tout tourne dans ton onglet de navigateur via Web Audio API (décodage) et ffmpeg.wasm (export MP3). Zéro requête sortante pendant le traitement, vérifiable dans DevTools.

Que se passe-t-il si aucun silence n'est détecté ?

L'outil affiche un avis clair et te laisse télécharger le fichier original inchangé. Cela signifie généralement que ton seuil est trop bas (essaie -20 dB) ou que ton audio n'a vraiment pas de blancs.