Trefwoorden |
Vissen
in de ruis (Eerder gepubliceerd in Electron #7-2007) Inleiding Al vele jaren proberen radio-zendamateurs om verbindingen te maken onder omstandigheden die dat 'eigenlijk' niet meer toelaten. Het is de echte amateur een eer en een genoegen om juist als het moeilijk wordt alles uit de kast te halen om toch dat zwakke station te 'kunnen werken' en met weinig vermogen te slagen waar de grotere jongens het allang hebben opgegeven. De beperkingen op het maximale zendvermogen in onze omgeving is dan geen belemmering maar juist een uitdaging om hiermee minstens evenveel te kunnen doen als amateurs uit landen waar men het niet zo nauw neemt met een watje meer of minder. Het 'gevecht' wordt meestal op meerdere fronten gevoerd, waarbij een goed antenne-systeem steeds op de eerste plaats komt, voor het zenden zowel als voor het ontvangen. Over de verliezen in antenne-voedingssystemen en hoe die te voorkomen schreef ik al eerder in Electron, zie 'Waar blijft de PEP'. Naast een efficiënt antenne-systeem komt de kunst van (en de kunstgrepen bij) het luisteren zeker niet op de laatste plaats en daarover wilde ik het ditmaal eens hebben. Vanaf het begin van het radio-tijdperk werden de 'luisteraars' al geconfronteerd met allerlei ongewenste, natuurlijke radiosignalen die de ontvangst bemoeilijkten. Het duurde daarom niet lang of de (amateur) ontvangers werden voorzien van schakelingen die b.v. de grote klappen van onweer storingen konden beperken in de vorm van 'noise limitters'. In die eerste tijd waren het voornamelijk morse signalen die de communicatie verzorgden. Met teruggekoppelde ontvangers was het mogelijk om erg smalbandig te luisteren maar de frequentie-(in-)stabiliteit van deze inrichtingen maakte dit soort ontvangst tot een 'arbeidsintensieve' aangelegenheid. Met de komst van de (super-) heterodyne ontvanger werd ook de stabiliteit verbeterd en werden filters in het audio gebied toegepast om de gewenste, smalbandige signalen uit de storing te kunnen halen. Het bleek echter al snel dat werkelijk goede audio filters moeilijk te maken waren omdat de maximaal haalbare flanksteilheid van deze analoge filters beperkt was. Goede filterkwaliteit was gemakkelijker te bereiken in het midden-frequent gebied en hier kwam men al snel op de mechanische technieken met kristal filters of andere middelen en in heel luxe ontvangers kon je ook de beroemde Collins mechanische filters terug vinden. Op het filtergebied is het daarna heel lang stil geweest, omdat men al betrekkelijk snel tegen de grens van de (analoge) techniek aan liep, die fundamenteel van aard was en daarom geen echte doorbraak toeliet. Dat werd allemaal anders met de komst van de microprocessor, die digitale signaal bewerkingen (Digital Signal Processing) toeliet met ongekende nieuwe mogelijkheden. Na omzetting van de analoge signalen in digitale vorm m.b.v. een A/D omzetter is de informatie beschikbaar in de vorm van een reeks binaire getallen, die verder naar behoefte kunnen worden gemanipuleerd: opgeteld, vermenigvuldigd en ook korte of langere tijd worden bewaard (vertraagd). Het enige kwaliteitsverlies dat door dit soort manipulaties optrad had te maken met het beperkte oplossende vermogen van de A/D omzetter en de beperkte resolutie van de interne registers. In de begintijd werkten de microprocessoren maar met acht bits en een beperkte verwerkingssnelheid. Omdat het signaal uit een groot aantal monsters moet bestaan voor een goede reproduceerbaarheid (monstername twee maal zo snel als de hoogste weer te geven frequentie) waren deze eerste microprocessors eigenlijk te traag voor directe signaalverwerking. Tegen het einde van de jaren '80 ontstonden daarom de eerste microprocessoren die speciaal voor dit soort digitale signaalbewerkingen waren gemaakt, met 24 en 32 bits brede registers, speciale (hardware) vermenigvuldigers en ingebouwde A/D en D/A omzetters. De TMS 310 (later 320) van Texas Instruments is daarvan een goed voorbeeld, die in een moderne versie nog steeds volop wordt toegepast. Voor wat meer achtergrond over dit soort signaalbewerkingen kan ik de artikelenserie van PA3GTN in Electron 8 t/m 11, 2003 aanbevelen en ook de verdere mogelijkheden met deze technieken van PA0SIM in Electron 5 en 6 van 2006. Ook het programma WSJT, zoals beschreven door PEIAHX in Electron 6 van 2005 maakt intensief gebruik van digitale signaal bewerkingen. In de meeste tegenwoordige middenklasse ontvangers is een of andere vorm van DSP ingebouwd al zijn er ook veel aanbieders van losse DSP 'set-top-boxjes' voor signaal na-bewerkingen die hier goede zaken doen (zie ook de kastjes van BHI, beschreven door in Electron 5, 2005). Verder is er op de ARRL-site veel over dit onderwerp te vinden. De meeste van de hiervoor beschreven DSP processors beperken zich tot hoogstandjes die in het verlengde liggen de oude analoge filters, maar dan met superieure specificaties. Zo kunnen er nu fantastische flank steilheden worden bereikt (2,5 kHz -3dB tot -60 dB bij 2,8 kHz.), kan de filter-breedte en -positie in het audio-gebied vrij worden gekozen en kunnen inkeep filters (notches) automatisch de storende fluittoontjes onderdrukken. Al deze zaken liggen echter nog steeds 'in het frequentie domein'. Digitale signaalbewerking kan echter net zo gemakkelijk in het tijdsdomein werken als in het frequentiedomein en desnoods in allebei te gelijk. Daarom is er nu een nieuwe generatie signaal processor systemen op de markt verschenen, die meer en andere bewerkingen op het (spraak-)signaal kan 'loslaten' dan vroeger mogelijk was met uitsluitend analoge middelen. Een goed voorbeeld hiervan is de 'SprachEkstraktor' van Günther Michels, DJ7UP die hiermee een module DX-11 of een compleet kastje DX-21 uitbrengt, zie ook zijn web-site Deze processor maakt gebruik van de typische kenmerken die horen bij gesproken informatie: het beperkte frequentiegebied, de tijdeenheden waarin spraakklanken worden voortgebracht en daarmee de spraak omhullende. Door juist op deze kenmerken te focusseren slaagt dit systeem er in om vooral spraaksignalen te onderscheiden van andere 'informatie' en storingen. Dit laatste is nu juist waar ook het menselijk brein goed in is.
Kort geleden was ik op bezoek bij een bevriende radio-amateur, die mij zo'n 'SprachEkstraktor' kastje liet zien. Het klonk mij goed in de oren, vooral het verwijderen van ruis van een (toch al verstaanbaar) spraaksignaal was opvallend. Mijn ervaring met vele 'spraakverbeteraars' is dat deze het luisteren naar gestoorde signalen kunnen veraangenamen waardoor minder snel een of andere vorm van 'luistermoeheid' zal optreden. Meestal is zo'n systeem echter niet in staat om de verstaanbaarheid wezenlijk te verbeteren, dus heb ik tot nu toe voor mijzelf afgezien van toepassing hiervan. De nieuwe vorm van signaalbewerking van DJ7UP leek mij echter juist op dit gebied een doorbraak te hebben bereikt en ik vroeg mij af, of dit systeem werkelijk in staat was om beter met de spraaksignalen om te gaan dan een getrainde luisteraar, zoals ik mijzelf graag vlei. Ik heb daarom zo'n systeempje opgevraagd om hier zelf metingen aan te doen, vooral met het oog op verbetering van de verstaanbaarheid van spraak. De DX-11 'kit' die mij werd toegestuurd bestond uit een keurig, multi-layer printje met (natuurlijk) SMD- componenten, waarop onmiddellijk de TMS320 opviel als centrale DSP processor. Verder een paar kleine losse onderdeeltjes en een handleiding hoe deze tot een geheel te maken en te gebruiken, zie figuur 1.
Figuur 1: De DX-11 kit In figuur 1 valt op hoe klein het printje is in relatie tot de onderdelen er omheen; het systeempje kan daarom gemakkelijk worden weggebouwd in transceivers of (computer)luidsprekers. Voor een objectieve en kwantificeerbare meting ben ik uitgegaan van de opstelling als in figuur 2.
In figuur 2 herkennen we de volgende componenten: 1: Radio ontvanger afgestemd op de lokale FM nieuwszender (perfect spraaksignaal). Als alternatief en voor een constante stem werd het signaal van de zender afgewisseld met dat van een 'gesproken boek'. Dat laatste maakt de meetresultaten beter onderling vergelijkbaar. De sterkte van het spraaksignaal is vrij instelbaar. 2: Amateur ontvanger, af te stemmen op diverse soorten ruis en storing. De set staat ingesteld op enkel zijband ontvangst, met een intern filter: 2,4 kHz - 3dB en 4,4 kHz - 60 dB. Afgestemd werd op verschillende amateur banden en een verscheidenheid aan soorten van storing. Ook hier was de sterkte vrij instelbaar. 3: Audio-filter om het perfecte spraaksignaal te beperken tot dezelfde bandbreedte als de ontvangen ruis. De signalen uit 1 en 2 worden bij elkaar opgeteld en aangesloten op 5. 4: De signalen op de ingang van de DX-11 worden op een oscilloscoop gezet om de maximale ingangsspanning (pieken in de ruis en de spraak) te beperken tot minder dan 900 mVtt, de grens voor deze schakeling. Hier is ook een RMS millivolt meter aangesloten om de ingestelde waarden tot een enkel getal te kunnen herleiden. Het (analoge) aanwijsinstrument hiervan werd extra gedempt om een eenduidige aanwijzing te krijgen van de variaties in de ruis als wel in de spraak. 5: DX-11, SprachEkstraktor, in te stellen op maximale verstaanbaarheid onder diverse luister en signaal-stoor condities. Tenslotte vinden we een schakelaar waarmee de signalen kunnen worden beluisterd, vóór en na het DSP-systeem, en na versterking op een luidspreker of een hoofdtelefoon. De sterkte van dit signaal werd steeds ingesteld voor een optimale luistercondities.
Allereerst heb ik gezorgd dat onder diverse ruis en spraakomstandigheden het top-top niveau op de ingang van de DX-11 onder de maximaal toegestane waarde van 900 mV. bleef. De effectieve spanningswaarde (van de ruis) die hierbij hoorde werd vervolgens vastgesteld en dit ruisniveau werd de referentie voor de rest van de metingen, zodat de DX-11 steeds bij dezelfde instelling (van de A/D convertor, en dus van het aantal rekenbits in de processor) kon worden getest. Vervolgens werd op diverse soorten ruis afgestemd met de amateur ontvanger, omdat de ruis in mijn omgeving op de tachtig meter band heel anders (korreliger) klinkt dan op de tien meter band. Daarna werd het spraak signaal in sterkte omhoog gedraaid, tot het juist (maar 100 %) verstaanbaar was. Hierbij werd steeds gezocht naar de meest optimale instelling van de DX-11, die met een aparte potentiometer is te optimaliseren voor specifieke situaties. Nadat dit verstaanbaarheidniveau op het gehoor was vastgesteld, werd de ruis weggedraaid en werd op de millivoltmeter de effectieve waarde gemeten van het spraaksignaal. Met deze meting kon op reproduceerbare wijze de signaal / ruisverhouding worden vastgesteld voor juist 100 % verstaanbaarheid van de signalen uit de DX-11. Vervolgens werd de meting herhaald, maar nu zonder de processor. Opnieuw kan nu reproduceerbaar worden vastgesteld hoe goed een 'ongewapend' menselijk gehoor de spraaksignalen uit de ruis 'vist'. Door de getallen uit beide metingen te vergelijken kan worden vastgesteld in hoeverre de processor werkelijk iets kan verbeteren aan een 'moeilijke' verbinding. Bovenstaande metingen werden herhaald met diverse soorten storingen, waaronder die door ratel van (harmonischen van de lijnfrequentie van) TV ontvangers, 'jammers' (stoorzenders), zijband 'lispel' van naastliggende stations etc. Ook voor het spraaksignaal werden diverse soorten stemmen gebruikt, zowel van het lokale nieuwsstation als van verschillende 'gesproken boeken'. Uit alle metingen rijst nu het volgende plaatje op. - Ruis uit 'schoon' deel van Met processor: S/N: -9,3 dB. Zonder: S/N: -6,3 dB. De DX-11 maakt het dus mogelijk om een spraaksignaal eerder in de ruis te herkennen, en wel met 3dB winst. Bij deze meting bleek dat het type stem de spraakherkenning enigszins beïnvloede; een vrouwenstem was eerder verstaanbaar dan een mannenstem en ook tussen verschillende mannenstemmen bleek nog wat onderscheid. De meting werd daarom herhaald met een beter verstaanbare stem. Met processor: S/N: -10,9 dB. Zonder: S/N: -6,3 dB. De winst was hier dus al 4,6 dB. Gemiddeld was vast te stellen
dat de DX-11 een winst van ca 4 dB in
verstaanbaarheid opleverde bij deze 'atmosferische' ruis op de - Ruis op Met processor: S/N: -15,3 dB. Zonder: S/N: -9,3 dB. Het opmerkelijke is dat het menselijk gehoor ondanks (of dankzij?) deze storing toch 'dieper' in de ruis kon luisteren. In vergelijking met de vorige meting vond ik een verbetering met ca 3 dB. Het is grappige dat deze toegenomen verstaanbaarheid ook gold voor de DX-11; hier was de verbetering zelfs 4,4 dB. Alles bijeen was de winst door de processor dus maar liefst 6 dB.; een opmerkelijke verbetering. Omdat niet elke 'TV-ratel
hetzelfde is, werd op dezelfde Met processor: S/N: -8,6 dB. Zonder: S/N: -2,3 dB. Deze sterke ratel verslechterde dus de signaal/ruisverhouding voor goede verstaanbaarheid, maar de DX-11 had hier minder last van dan het directe gehoor. Ook hier kon een winst van ca 6 dB. worden vastgesteld. - Tenslotte werd nog een
kunstmatige storing aangebracht op de ruis uit een 'schoon' stuk van de Met processor: S/N: -6,8 dB. Zonder: S/N: -4,0 dB. Zowel de processor als de menselijke spraakherkenning hadden duidelijk last van deze storing; toch was de winst door de processor ook hier ca 3 dB. - Ruis uit 'schoon' deel van Met processor: S/N: -6,3 dB. Zonder: S/N: -4,0 dB. De ruis was hier veel gelijkmatiger van karakter (niet 'korrelig'). Toch kon ook hier een zekere winst door toepassing van de processor worden vastgesteld, en wel met ruim 2 dB.
- Tenslotte werd nog een proef gedaan met 'zijband lispel', de hinderlijke spraakdoorbraak met hoge tonen van een station dat op minder dan 3 kHz. afstand wordt ontvangen. Zoals te verwachten was gaf de processor hier geen verbetering omdat zowel het gewenste als het ongewenste signaal de typische kenmerken van de menselijke spraak vertoonde. Dat geldt natuurlijk ook voor een 'pile-up'. Uit alle metingen konden een paar interessante conclusies worden getrokken. - Het (getrainde!) menselijke gehoor is in staat om spraaksignalen tot ca S/N: - 6dB 'uit de ruis' te halen; dit kan zelfs oplopen tot -9 dB bij bepaalde type storing. - Bij 'breedbandige' ruis geeft de DX-11 een verbetering van S/N met 2,5 - 4,5 dB, afhankelijk van de 'kleuring' van de ruis en het type stem. - Bij gecompliceerde storingen (TV-ratel) kan een S/N verbetering optreden tot ca 6 dB. - Bij ratelstoringen met een herhalingsfrequentie in het spraak gebied ( 5 - 10 Hz) wordt de winst van de SprachEkstractor wat lager (ca 2,5 dB). - Bij storingen met een spraak karakter (zijband lispel), is er geen verbetering vast te stellen. - Bij signalen die al goed verstaanbaar zijn, wordt de verstaanbaarheid verder verbeterd door (sterke) afname van de ruis. Dit vermindert de 'luister moeheid'. Wellicht geeft dit ook toepassingen in andere 'ruisomstandigheden' zoals b.v. communicatie op een motorfiets. - Grappige bijkomstigheid is dat de DX-11 ook de vocalist sterker naar voren laat komen uit begeleidende muziek; kennelijk beschouwt het systeem 'muziek' ook als 'ruis'. - Het systeem is niet ontworpen voor de verbetering van morse signalen en werkt hier dan ook niet voor.
De algemene conclusie is gerechtvaardigd, dat de DX-11 een wezenlijke verbetering geeft voor spraaksignalen onder vrijwel alle soorten van (andere dan spraak) storingen. Deze verbetering ligt in de orde van 3 - 6 dB signaal-stoorafstand t.o.v. het ongewapend oor. Bij toch al goed verstaanbare spraaksignalen wordt de signaal/ruis afstand sterk verbeterd waardoor een aangenamer luisterklimaat ontstaat. Om een vergelijkbare verbetering te krijgen, zou de ontvangstantenne minstens twee maal zo effectief (zo groot) moeten zijn; een uitdaging die gemakkelijk in het voordeel van de DX-11 uitvalt. Bob J. van Donselaar, on9cvd@veron.nl |
|