Algoritmer for høreapparat
FOREDRAG PÅ NAS HØSTMØTE 27 OKTOBER 2001
Sverre Stensby, SINTEF. Asbjørn Krokstad og Wim van Dommelen, NTNU
Innledning
I dette foredraget presenteres prosjektet "Algoritmer for høreapparat".
Funksjonen til tradisjonelle høreapparat er å forsterke lyd slik at talespektret kommer over høreterskelen til den hørselshemmede. Det er vel kjent at dette alene ikke gir så god oppfattbarhet av tale som ønsket. Spesielt er problemet stort hos personer med nevrogene hørselstap.
Den store prosesseringskapasiteten i dagens og fremtidens digitale høreapparat gir mulighet for avansert signalprosessering. Dette åpner for forbedret individuell tilpassing av talesignalet til den hørselsrest som disse personene har. Detaljene i aktuelle algoritmer er imidlertid ikke tilstrekkelig kjent.
Prosjektformål
Hensikten med prosjektet er å bidra til utviklingen av det faglige grunnlaget for konstruksjon av effektive algoritmer for bedret taleforståelighet i digitale høreapparater.
Prosjektet bearbeides langs to linjer, lytteprøver og utvikling av algoritmer. Hensikten med lytteprøvene er å diagnostisere hvilke fonetiske trekk i tale som er vanskeligst å oppfatte. Ut fra denne diagnosen kan det så utvikles algoritmer som modifiserer talesignalet slik at det vil bli lettere å forstå for hørselshemmede. I denne presentasjonen legges hovedvekten på lytteprøvene.
Et sekundært mål med prosjektet er at erfaringene skal komme til nytte i taleopplæring av helsepersonell, nyhetsopplesere, foredragsholdere og andre.
Lytteprøver
Hensikten med lytteprøvene er å diagnostisere hvilke fonetiske trekk i tale som er vanskeligst å oppfatte i dagligdagse situasjoner. Med "dagligdagse situasjoner" menes lytting til radio og TV, samtale, foredrag mm. Metodisk er det vanskelig å kombinere "dagligdagse" situasjoner med et systematisk opplegg som kan gi kvantitative resultater. For å ivareta disse til dels motstridende hensyn ble det utviklet et opplegg med spesielt oppbygde setninger som ble presentert via høyttaler.
Setningsmateriale
Setninger har den fordelen at de er mer "naturlige" enn ord sagt isolert. Men vanlige setninger har den ulempen at de inneholder redundans slik at enkelte av ordene kan gjettes ut fra sammenhengen. Det er derfor utviklet et sett med setninger med en semantikk som gjør det vanskelig å gjette hvilke ord som forekommer, men der den syntaktiske strukturen er korrekt. Alle ordene er vanlige norske ord. Setningen "Flisen påstår at pillene kunne kyle." fra materialet illustrerer prinsippet. Metoden benyttes ofte i lytteprøver og benevnes "Semantically Unpredictable Sentences" (SUS).
Språklyder kan grupperes i minimale par. I setningene er det også lagt vekt på å avdekke feil i slike tilfelle. Det er derfor valgt ord fra grupper av minimale par. I setningene
"Raske paver triller ofte.", "Rare maver griller nå.", "Gode gaver traver gjerne." og "Kalde haver graver mest." kan det testes på opposisjonen mellom /p/, /m/, /g/ og /h/ i "paver", "maver", "gaver" og "haver".Det ble utviklet 150 setninger. Disse ble lest av fire menn og fire kvinner med østnorsk, vestnorsk, trøndersk, eller nordnorsk dialektbakgrunn.
Typer av lytteprøver
Lytteprøver har best diskriminerende effekt når andelen av riktig og galt er i nærheten av 50-50. Et av virkemidlene for å oppnå ønsket andel av feil var å benytte tre ulike typer av lytteprøver dynamisk gjennom testen. Prøvetypene ble benevnt setningstest, ordtest og rimordtest.
Rimordtesten var den letteste testformen. Her fikk lytteren presentert det meste av setningen
skriftlig. Et av ordene manglet, og det ble gitt fire svaralternativer for dette ordet. Et eksempel erBilen vet at barna ville ____ . /hale/helle/holde/hyle/
Her skulle _____ erstattes med det svaralternativet som passet best med det som ble hørt.
Ordtesten var mer krevende. Også her fikk lytteren presentert det meste av setningen skriftlig og ett av ordene manglet. Men det ble ikke gitt svaralternativ.
Setningstesten var den mest krevende. Her skulle hele setningen oppfattes når den ble presentert. Det ble ikke gitt noen skriftlig støtte.
Lyttere
Det har deltatt 48 lyttere i testen. Den største gruppen brukte høreapparat, men det deltok også normalthørende og personer som hadde hørselstap, men som ikke nyttet høreapparat. Lokallag av Hørselshemmedes Landsforbund i Sør-Trøndelag har vært behjelpelig med å sette oss i kontakt med aktuelle lyttere.
Lytteprøver
Lytteprøvene ble foretatt i et konferanserom med dimensjonene 6x6x3 m. Det ble systematisk benyttet to avstander til høyttaleren som presenterte setningsmaterialet, henholdsvis 1.3 og 4.1 m.
Kontrollert støy ble presentert over andre høyttalere for å maskere talen. Som støy ble det benyttet såkalt "talekor" med tre ulike nivåer. Dette gir til sammen 6 ulike betingelser for virkningen av støy og rom. Disse betingelsene ble variert i løpet av testen sammen med testtype for å oppnå ønsket andel av feil for hver lytter.
Lytter satt sammen med forsøksleder. Foran seg hadde de en dataskjerm. Detaljene i presentasjonen ble styrt av en PC. Hver presentasjon hadde følgende faser:
Lyden fra hele sesjonen tas opp på bånd via kunsthode for senere analyse.
Resultat av lytteprøven
Testmetoden og setningsmaterialet var utviklet spesielt for dette prosjektet. Et resultat er derfor at dette fungerte etter forutsetningene.
Mønstret i typer av feil var de samme hos normalthørende og hos de med hørselstap uavhengig om de i den siste gruppen brukte høreapparat eller ikke. Mange av problemtypene ser derfor ut til å være universelle, men de skaper størst problem hos de med hørselstap.
Innleserne med østnorsk dialekt ble forstått best. Dette var uavhengig av lytternes egen dialektbakgrunn. Vi har foreløpig ikke funnet noen endelig forklaring på dette. En mulighet er at de som leste østnorsk naturlig lå tettest opp mot skriftbildet og benyttet mest distinkt uttale.
Grensen mellom ordene ble stort sett oppfattet. Dette var et av resultatene fra setningstesten.
Konsonantlydene hadde større andel feil enn vokallydene, men det var også betydelig andel feil i vokallydene. Algoritmene bør derfor gi positive bidrag til oppfattelsen av alle kategorier av talelyder. Nasaler hadde størst andel av feil etterfulgt av plosiver, frikativer og likvider.
Algoritmer
Ulike algoritmer har vært undersøkt i studentoppgaver. Algoritmer som tar utgangspunkt i henholdsvis tidsfunksjon, transformasjoner og binaural hørsel har vært behandlet. Algoritmene er lovende for videre utvikling.
Taleopplæring
Resultatene fra prosjektet støtter opp om mange av de anerkjente anvisningene vedrørende det å tale til hørselshemmede, og de gir grunnlag for noen nye. Det viktigste er å bruke naturlig stemme og snakke litt sterkt, litt langsomt, og med øyekontakt rett til samtalepartneren. Lyder og ord som lett forveksles bør tillegges litt ekstra tydelighet.
Bidragsytere
Prosjektet "Algoritmer for høreapparat" er finansiert med Extra-midler fra Helse og Rehabilitering.
Helse og Rehabilitering er en norsk stiftelse bestående av 21 landsomfattende helse- og rehabiliteringsorganisasjoner, som har konsesjon til å drive det landsomfattende TV-spillet EXTRA. Overskuddet fra spillet skal bidra til å øke de frivillige humanitære organisasjonenes innsats innenfor forebygging, rehabilitering og forskning i Norge. Alle frivillige humanitære/samfunnsnyttige organisasjoner og funksjonshemmedes interesseorganisasjoner i Norge kan søke om midler uavhengig av medlemskap i stiftelsen.
Søkerorganisasjon er Hørselshemmedes Landsforbund. Spesielt har lokallaget i Bergen engasjert seg i problematikken og vært pådriver for å få i gang dette prosjektet.
Prosjektet utføres ved Institutt for Teleteknikk, Fakultet for elektronikk og telekommunikasjon, NTNU. Arbeidet gjøres i nært samarbeid med Lingvistisk institutt ved NTNU og SINTEF Tele og data. En rekke studenter har gjort en stor innsats i prosjektet. Takk rettes også de som har lest inn setningsmaterialet, de som har deltatt som lyttere og til prosjektets rådgivende ekspertgruppe.
Kontakt
Foredragsholderene har følgende elektroniske postadresser:
Asbjorn.Krokstad@tele.ntnu.no, Wim.van.Dommelen@hf.ntnu.no og Sverre.Stensby@informatics.sintef.no