FFMPEG: audio stream normalizálása

Írta:

– Kategóriák:

Az ffmpeg tartalmaz egy loudnorm nevű filtert, amely kiegyensúlyozza a hangerőt az EBU R128 szabvány szerint. Egy másik lehetőség a dynaudnorm (Dynamic Audio Normalizer), amely valós időben végzi a hangerőkiegyenlítést.

Az alábbi parancs egy Icecast streamet fogad forrásként, normalizálja a hangerőt, majd továbbítja egy másik Icecast szerverre:

ffmpeg -i http://forras-stream-url/orosfm.mp3 \
-filter_complex "dynaudnorm=f=150:g=5" \
-c:a libmp3lame -b:a 128k -content_type audio/mpeg \
-f mp3 icecast://user:password@cel-szerver:8000/stream.mp3

Table of Contents

Magyarázat a parancshoz

-i http://forras-stream-url/orosfm.mp3 → Forrásstream megadása.
-filter_complex "dynaudnorm=f=150:g=5" → Dynamic Audio Normalizer:
- f=150: Frekvenciatartomány (minél magasabb, annál simább).
- g=5: Maximális hangerő növekedés (dB-ben).
-c:a libmp3lame -b:a 128k → MP3 kódolás, 128 kbps bitráta.
-content_type audio/mpeg → Megfelelő MIME-típus beállítása Icecast számára.
-f mp3 → MP3 formátum beállítása.
icecast://user:password@cel-szerver:8000/stream.mp3 → Cél Icecast szerver címe, felhasználónévvel és jelszóval.

Alternatíva: loudnorm használata (precízebb, de késleltethet)

Ha pontosabb normalizálást akarsz az EBU R128 szabvány szerint, használhatod a loudnorm filtert:

ffmpeg -i http://forras-stream-url/orosfm.mp3 \ -filter_complex "loudnorm=I=-16:TP=-1:LRA=11" \ -c:a libmp3lame -b:a 128k -content_type audio/mpeg \ -f mp3 icecast://user:password@cel-szerver:8000/stream.mp3

Paraméterek magyarázata:

I=-16 → Integrated loudness (integrált hangerő) -16 LUFS

Ez az átlagos hangerősség a teljes audio időtartama alatt.

Ajánlott értékek:

Streaming (Spotify, YouTube, Apple Music, stb.): általában -14 vagy -16 LUFS.
TV és rádióadások (EBU R128 szabvány): általában -23 LUFS.

TP=-1 → True Peak (csúcshangerő) -1 dBFS

A digitális hangban a maximális csúcshangszint (Peak Level) korlátozása.

Ajánlott értékek:

CD-mastering: -0.3 dBFS
Streaming szolgáltatások: -1 dBFS (biztonsági tartaléknak)

LRA=11 → Loudness Range (hangerő dinamika tartomány) 11 LU

A halk és hangos részek közötti dinamikai különbség. Minél kisebb az érték, annál kiegyenlítettebb a hangerő.

Ajánlott értékek:

Podcastok, beszédhangok: 3-6 LU (kevés dinamika)
Film, zene, rádió: 8-15 LU (nagyobb dinamika)

Melyiket válaszd?

dynaudnorm: Javasolt valós idejű stream esetén, mert gyors és dinamikusan alkalmazkodik.
loudnorm: Ha pontosabb és szabványosított normalizálást szeretnél, de kicsit késleltethet.

A `measure` és `apply` módok használata

Ha további finomhangolásra van szükséged, akkor az FFmpeg ezt a szűrőt képes kétlépcsős normalizálásra is használni (measure és apply módokkal).

Az FFmpeg loudnorm szűrőjét kétlépcsős módban is használhatod, ami precízebb hangerő-normalizálást biztosít. Ez különösen hasznos lehet, ha az audioanyagok nagyon eltérő hangerőszintekkel rendelkeznek.

🔹 1. lépés: Elemzés (`measure` mód)

Elsőként lefuttatjuk az FFmpeg-et úgy, hogy csak analizálja a hangerőt, de nem módosítja az audiot.

ffmpeg -i input.mp3 -af loudnorm=I=-16:TP=-1:LRA=11:print_format=json -f null -

Mit csinál ez?

Nem módosítja az audiot, csak elemzi.
A parancs végén JSON formátumban kiírja a szükséges hangerőértékeket, például:

{
"input_i": "-20.3",
"input_tp": "-2.5",
"input_lra": "6.2",
"input_thresh": "-30.0",
"output_i": "-16.0",
"output_tp": "-1.0",
"output_lra": "11.0",
"output_thresh": "-26.0",
"target_offset": "0.0"
}

Ezek az értékek kellenek majd a következő lépésben. Jegyezd fel őket!

🔹 2. lépés: Alkalmazás (`apply` mód)

Most használjuk a kapott értékeket, hogy normalizáljuk az audiot.

ffmpeg -i input.mp3 -af loudnorm=I=-16:TP=-1:LRA=11:measured_I=-20.3:measured_TP=-2.5:measured_LRA=6.2:measured_thresh=-30.0:offset=0.0 -c:a libmp3lame -b:a 192k output.mp3

Mit csinál ez?

Az elemzett értékeket használja fel a hangerő precíz beállításához.
Megőrzi a dinamikát, de minden egyes részlet a kívánt -16 LUFS hangerőszinten lesz.
Megakadályozza a torzítást, mivel a csúcshangerő (-1 dBFS) limitálva van.

Összegzés

Elemzés (measure) → Megkapod a hangerőadatokat.
Alkalmazás (apply) → A kapott adatokkal normalizálod az audiot.

Ez a kétlépcsős megoldás sokkal pontosabb, mint az egyetlen loudnorm futtatása, mert az FFmpeg így nem csak találomra állítja be a hangerőt, hanem konkrét mérési adatok alapján dolgozik.

Tipp: Ha Icecast streamre alkalmaznád ezt, akkor a második lépésben output.mp3 helyett közvetlenül streamelheted az eredményt:

ffmpeg -i http://forras-stream-url/orosfm.mp3 -af loudnorm=I=-16:TP=-1:LRA=11:measured_I=-20.3:measured_TP=-2.5:measured_LRA=6.2:measured_thresh=-30.0:offset=0.0 -c:a libmp3lame -b:a 128k -f mp3 icecast://user:password@cel-szerver:8000/stream.mp3

FFMPEG normalizálás stream

Maxwell Tunes Media – Dokumentáció

FFMPEG: audio stream normalizálása

Magyarázat a parancshoz

Paraméterek magyarázata:

Melyiket válaszd?

A `measure` és `apply` módok használata

🔹 1. lépés: Elemzés (`measure` mód)

Mit csinál ez?

🔹 2. lépés: Alkalmazás (`apply` mód)

Mit csinál ez?

Összegzés

More posts

FFMPEG – IceCast2 környezet elindítása

🎧 Audio Playback API – FastAPI + Socket alapú vezérlés

SuperCollider: Supernova multi threading, több szerveres megoldás

Broadcast Core manuális indítása és tesztelése

FFMPEG: audio stream normalizálása

Magyarázat a parancshoz

Paraméterek magyarázata:

Melyiket válaszd?

A measure és apply módok használata

🔹 1. lépés: Elemzés (measure mód)

Mit csinál ez?

🔹 2. lépés: Alkalmazás (apply mód)

Mit csinál ez?

Összegzés

More posts

FFMPEG – IceCast2 környezet elindítása

🎧 Audio Playback API – FastAPI + Socket alapú vezérlés

SuperCollider: Supernova multi threading, több szerveres megoldás

Broadcast Core manuális indítása és tesztelése

A `measure` és `apply` módok használata

🔹 1. lépés: Elemzés (`measure` mód)

🔹 2. lépés: Alkalmazás (`apply` mód)