Professor emeritus Asbjørn Krokstad.

Romakustiske kriterier.

Sammendrag til NAS-Nytt av materiale foreberedt og delvis presentert til NAS høstmøte 2001, Forum Romakustikk. En fyldigere presentasjon vil foreligge som en rapport fra Inst for teleteknikk.

Vi bygger på lineære overføringfunksjoner fra kilde til mottaker. Det er likegyldig om disse er representert i tidsplan, for enkelhets skyld kaller vi de da impulsresponser, eller i frekvens; og det er likegyldig hvordan de måles; pulser, støy, diskret kvasistøy (MLS) eller sinus.

Praksis er at de måles med omnidirektiv kilde (monopol)(NB! Det er et betydelig problem at praktiske kilder ikke er "omni""nok). Rundstrålende kilde representerer stemmen, treblåsere, og strykeinstrumenter rimelig bra, men ikke messinginstrumenter. Supplement med en dipolrespons ville være interessant.

Binaural hørsel tas hensyn til ved enten å måle på kunsthode, å supplere trykkresponser med trykkgradientresponser, eller å måle komplette lydfeltdata med fire trykkmikrofoner (sound field).

Anbefaling:

Romakustiske impulsresponser måles med monopol og dipol kilde.

Det måles med kunsthode og med lydfeltsmikrofon (fire trykkmikrofoner; i avstander 8 cm opp til oktaven 1 kHz, i avstander 1.8 cm for oktavene 2-8 kH. Jeg har beregnet en korrekt gradientkorreksjon).

( NB! Vi kan direkte sammenligne impulsresponser med responser fra erfaringsmessig gode saler,

og på den måten gå utenom kriterieproblemene).

Vi trenger minimum to impulsoverføringsresponser mellom alle kildeposisjoner til alle mottakerposisjoner. For å dekke det viktige frekvensområde til 11 kHz, må det brukes 22050 sampel/s,

så vi ender opp med ca 50 000 data pr respons i rom av konsertsalkvalitet.

Responsene kan beregnes ved speilkildemetoden, eller også ved strålegang hvis fasen syntetiseres.

(Beregnede impulsresponser kan danne utgangspunkt for romakustisk simulering, med hodetelefoner eller to krysskansellerte høyttalere.

Vi kan komme utenom bruk av kriterier ved å bedømme romakustikken på prosjekteringsstadiet).

Problemet er å redusere datamengden i impulsresponser til i størrelsesorden 3-4 tall som beskriver de romakustiske kvaliteter til hver overføringsvei, og helst et tilsvarende antall globale tall som beskriver hele rommets kvaliteter.

Parameteraksene bør være ortogonale, det bør ikke være stor innbyrdes korrelasjon mellom parametrene.

Parametriseringen kan være ren datareduksjon (fjerning av redundans i datamengden), den kan bringe inn hørselens begrensninger, eller den kan gå helt frem til å ta hensyn til rommets bruk; som auditorium, konsertsal, kirke, opera etc.

Det første brukte trinn i datareduksjon er fjerning av endel faseinformasjon gjennom kvadrering av sampelverdier( "Dot"-kvadrering).

Energidimensjonen betegnes gjerne som ekkogram. Kvadrering kan begrunnes i hørselen.

Kuttruff har vist at det bare er store faseforskjeller som er hørbare.

Kvadrering betoner sterke refleksjoner.

W.C. Sabines elegante bidrag var innføring av etterklangstiden. Hvis en antar eksponentiell energi-utsving (altså at energitapene er proposjonale med lagret energi i rommet), kan både inn-sving og ut-sving av feltet karakteriseres med èn parameter, etterklangstiden (eller en tidskonstant). Denne må gis som funksjon av frekvens. Parameteren er rent fysisk begrunnet; og forutsetningene for den er i overraskende stor grad oppfylt i større rom, når vi ser bort fra de første diskrete refleksjoner. Vi har erfaringsdata for gunstige verdier for ulike formål.

De fleste parametre som er innført som supplementer til etterklangstiden, er bygget opp som forhold mellom integrert tidlig og sen del av kvadrert impulsrespons. "Tidlig" regnes som integrasjon til 50 ms ved tale, til 80 ms ved musikk. "Sen" er resten av impulsresponsen. (noen parametre normaliserer til

integralet av hele ekkogrammet).

Lateralfaktoren(Barron, Marshall) integrerer "tidlig" innfallende lyd veiet med retningsfaktoren cos q (podium i 90° ), men ser bort fra direktelyd. En "sen" lateralfaktor er innført i senere år, og synes å beskrive "omhyllingseffekten" (envelopment) bra (Evjen, Bradley).

Faktorene kan normaliseres på ulike måter, mot; hele impulsenergien, den "sene" energi, eller energi målt i en referanseposisjon.

Interaural krysskorrelasjon skiller seg prinsippielt fra de øvrige ved ikke å ta utgangspunkt i impulsresponsen.

Tyndepunktstiden er normalisert 1.ordens moment av kvadrert impulsrespons, og har ingen grense mellom tidlig og sen. Lochner & Burger bruker kontinuerlige vindusfunksjoner for å definere "tidlig", som de betegner som "signal", og "sen", som de betegner som reverberant støy, og som adderes sammen med bakgrunnsstøy.

Tove Marit Holmefjord målte parametre i Olavshallen og konstaterte at parametre med abrupte tidsgrenser fluktuerer betydelig fra sete til sete uten tilsvarende variasjoner i subjektive opplevelser. Etterklangstiden er i rimelig grad en "global" parameter. Tygdepunktstiden viser forklarbare systematiske variasjoner.

Det er vist at det er stor innbyrdes korrelasjon mellom alle de parametre som bygger på forholdet tidlig/sen lyd, og paramtrene kan i stor grad predikteres ut fra etterklangstidene (Gade).

Som podieparametre brukes Gades "Support I og II" som er forholdet "halvtidlig"/tidlig respons ved tilhører.

Modulasjonsoverføringsfunksjonen (Modulation Transfer Function, MTF) er Fourier-transformasjonen av den kvadrerte impulrespons og har dermed samme informasjon som ekkogrammet, men i frekvensplanet.

Etterklangstiden kan predikteres ut fra øvre grensefrekvens til MTF.

MTF inneholder mer informasjon enn etterklangstiden, og fremstår som en sterk konkurrent til denne. Høyt nivå av direktelyd og tidlig lyd gir høy grensefrekvens til MTF, og gir en form av korreksjon til etterklangstiden. Speech Transmission Index (STI) kan også brukes ved musikk.

Status for romakustiske parametre er:

- etterklangstiden er utmerket fysisk begrunnet, og vil bestå. MTF er et godt alternativ.

som ikke kommer til uttrykk subjektivt..

Anbefaling: Beregn og mål alle de kjente, men sørg for også å lagre impulsresponser.

Hvor går vi videre?

Tor Halmrast har festet oppmerksomhet ved at finstrukturen i impulsresponsen inneholder informasjon som forsvinner ved integrasjon. Han har påvist at "boks"-lignende effekter i et rom sannsynligvis har sammenheng med mikrostrukturen i impulsresponsen, og at det synes å kunne forklares ut fra hørselens frekvensanalyse i frekvensgrupper.

Dette følger opp tidligere analyser omkring begrepet farving (coloration), som er en kamfiltereffekt grunnet fåtall nære og sterke refleksjoner. Det bør helst være flere et nullpunkt i overføringsfunksjonen innen hver frekvensgruppe.

Ove Halseth har i en hovedoppgave studert effekten av å glatte ekkogrammet før parametrisering.

Schroeder glatter ved baklengs integrasjon.

For å unngå energimessig forskyvning av ekkogrammet, glatter Halseth begge veier.

Glatting med lavpassfilter 10 Hz innebærer at ekkogrammet kan resamples med frekvens 20 Hz, som tilsvarer 50 ms oppløsning, og ca 50 tall pr respons.

Halseth viser at parametrene fluktuerer noe mindre etter en slik glatting.

Korreksjon av impulsresponsen med presedenseffekten (Haas-effekten) er en tenkbar måte å gjøre en første hørselrelatert tilbasning på. En korreksjonskurve gir i instituttrapporten.

Presedenseffekten er sannsynligvis en kombinasjon av monaural og binaural effekt.

Det er derfor interessant å utvikle en tids- og retnings-funksjon som impulsresponsen bør foldes med for

å ta hensyn til primære hørselsegenskaper. Som kjent vektes direktelyden høyt.

De viktigste subjektive attributter som brukes for å beskrive akustiske forhold i rom er:

I tillegg kommer begrep knyttet til klangfarve-effekter: Varme, brillians m.flere.

En effekt som ikke helt dekkes av disse attributter er: "Luftighet" .

Det kan være det inverse av "boks"-effekten til Halmrast, men kanskje noe mere.

Det kreves rom av en viss størrelse; og sannsynligvis diffust lydfelt, for å få høy luftighet.

"Inter-kilde-korrelasjon" er et annet begrep jeg vil foreslå innført.

Kildelokalisering må knyttes til direkte eller diffraktert første bølgefront. I konsertlokaler er

denne svak, og det kan være vanskelig å følge de enkelte instrumenter i et orkester.

Det antas at dette er lettere når interkildekorrelasjonen er liten. I form tilsvarer denne interaural korrelasjon, men med større mulige forsinkelser. Den må da måles ved resiprositet, med støy fra et punkt i salen til to mikrofoner på podiet, og så finne korrelasjonsfunksjonen.

Lav interkildekorrelasjon innebærer at vi hører forskjeller mellom instrumenter også grunnet forskjeller i overført refleksjonslyd, ikke bare direktelyd.

Det er også påvist at romakustiske forhold kan påvirke mulighetene til tonehøydediskriminering.

Det vil bli spennende å konstruere en parameter som tar hensyn til dette.

Konklusjoner:

forbedret innsikt.

- Vis forsiktighet ved rom som avviker sterkt fra de vi har erfaringer med.