Le STI (Speech Transmission Index) et son application dans des environnements très bruyants The STI (Speech Transmission Index) and its application to very noisy environments Karl Buck*, T. Wessling** * Institut Franco-Allemand de Recherche – Saint Louis ** Wehrtechnische Dienststelle 91 – Meppen Résumé En évaluant l’exposition au bruit des équipages de char, nous avons pu constater que le niveau acoustique du signal de communication est tel qu’une lésion de l’organe de l’audition ne peut être exclue. Une estimation du niveau acoustique du signal de communication pour obtenir une intelligibilité suffisante (bonne-excellente) à l’aide de la méthode du STI proposée par STEENEKEN, a été faite. Cette estimation a montré que le niveau théorique est de 20 dB inférieur aux niveaux mesurés in situ. Ceci peut être expliqué par le fait que la méthode de calcul du STI ne prend en compte que le rapport signal sur bruit physique entre le bruit extérieur et la parole. Dans les environnements peu bruyants, l’erreur faite est négligeable. Par contre dans le cas des bruits intenses (char, hélicoptère, avion à hélice …) les non-linéarités de l’effet de masque (ZWICKER) ne peuvent plus être négligées. Pour remédier à ce problème, la méthode de calcul pour le STI à été modifiée à l’ISL (WESSLING). L’estimation du niveau acoustique de la parole utilisant cette méthode modifiée est en accord avec les niveaux mesurés sur site. L’exposé montre le principe de base de la méthode de calcul pour le STI et ses problèmes à l’application pour des niveaux élevés. Il décrit également les principes de l’extension pour les niveaux forts. Abstract During an evaluation of the noise exposure of tank crews, it has been established that the noise levels due to the speech communication underneath the hearing protection may be hazardous to hearing. The levels, needed for an acceptable speech intelligibility (good-excellent) in the given noisy environment, have been estimated using the STI method proposed by STEENEKEN. This estimation has shown that the theoretical speech levels are 20 dB below the levels measured in a real situation. This may be explained by the fact, that the STI calculation is based on the physical signal to noise ratio between the speech and the external noise. In low noise areas the error due to this approach is negligible. However, in high noise environments (tank, helicopter, propeller air plane…) the non-linear behavior of the upward spread of masking (ZWICKER) has to be taken into account. An extension to the standard algorithm of the STI has been developed at the ISL (WESSLING). The estimated speech levels when using this adapted procedure have been in good agreement with the measured data. The lecture shows the basics of the method of calculation of the STI and its problems when applied to high level noise. It also describes the principles of the extension to high very noisy environments.
1.
INTRODUCTION
Figure 1 : Niveaux d’exposition au bruit du commandant d’un char pour différentes configurations Pour protéger l’audition contre des bruits intenses il existe des limites d’exposition basées sur le niveau acoustique équivalent pondéré A. La législation en Allemagne et en France prévoit qu’aucune personne ne doit être exposée à une dose de bruit excédant un niveau acoustique de 85 dBA pendant 8 heures. Dans le cas de port d’un protecteur auditif, la perte d’insertion (IL, Insertion Loss) est prise en compte pour la détermination du niveau d’exposition. Astelab 2003
27 - 1
Le STI (Speech Transmission Index) et son application dans des environnements très bruyants Pour certaines professions (p.ex. équipages d’hélicoptères, d’avions à hélice ou de tanks) où les personnels doivent être protégés contre les bruits intenses, ils ont aussi besoin de communiquer par un système de communication. Ce système est normalement intégré dans le casque de protection acoustique. Pour ces configurations nous avons pu constater que le niveau acoustique sous le casque de protection pendant la durée de communication peut excéder le bruit mesuré à l’oreille nue. La figure 1 montre que pour le chef du char, le niveau acoustique sous le casque de protection est de 110 dBA pendant la communication. Après, ce niveau tombe de 6 dB à 104 dBA. Ces mesures nous ont montré qu’il est important de pouvoir prédire les niveaux de communication sous un équipement de protection auditif. Pour réaliser cela, la méthode STI (Speech Transmission Index) proposée par STEENEKEN [1] nous semblait appropriée.
2. LE STI (SPEECH TRANSMISSION INDEX) 2.1.
Le principe du STI
Le calcul de cet index, décrit dans un rapport de TNO (STEENEKEN [2]), est basé (fig. 2) sur la détermination du
Figure 2 : Principe de base pour la détermination du STI rapport signal sur bruit entre le signal de communication (parole) et le bruit de fond dans sept bandes d’octave entre 125 Hz et 8 kHz. Le STI représente la somme de ces sept rapports pondérés avec des facteurs appropriés (αn ). La corrélation entre ce test et les résultats du test CVC (Consonne-Voyelle-Consonne) est représenté dans le tableau 1. Qualité Subjective
très mauvais
Type de test
STI
80
Relations entre les mesures STI et les résultats des tests CVC
Les problèmes du STI
Pour la détermination du STI selon STEENEKEN, seul le rapport signal sur bruit physique est utilisé, alors que ni l’excitation psycho-acoustique du bruit ni celle de la parole ne sont prises en compte. Cela signifie que la variabilité des bandes critiques, décrites par ZWICKER [3], et l’effet de masque psycho-acoustique ne sont pas considérés lors du calcul. Cette approche montre de bons résultats tant que le bruit de fond est de niveau modéré et que son spectre est plus ou moins plat. Ce qui est vrai dans les cas pour lesquels le STI à été développé. Dans les conditions de bruit comme celle montrée dans la figure 1, la procédure de calcul standard du STI ne semble pas adéquate. Utilisant l’évaluation standard du STI pour le cas de l’audition protégée (fig. 1, trait pointillé) un niveau acoustique de la parole de 90 dB devrait déjà aboutir à une intelligibilité (CVC) d’environ 80 %, ce qui représente une qualité subjective « excellente » (Tableau 1). Par contre le niveau de parole choisi par le chef du char est de 20 dB
Astelab 2003
27 - 2
Le STI (Speech Transmission Index) et son application dans des environnements très bruyants supérieur. Nous pensons, que cela signifie que la qualité « excellente » de l’intelligibilité de la parole, telle que prédite par le STI standard, n’est pas obtenue.
3. MODIFICATIONS DU CALCUL DU STI Nous pensons, que les problèmes décrits plus haut sont dus à l’effet de masque. En effet, le calcul standard du STI (implémentation RASTI) ne prend en compte qu’une pente de masquage de 35 dB/oct indépendant du niveau du bruit
Figure 3 : Principe de masquage utilisé pour le calcul standard du STI (traits continus) comparé aux courbes de masquage d’après Zwicker et Feldtkeller [3] (traits discontinus) masquant. Cette hypothèse peut, pour des bruit de fort niveau, mener à une sous-estimation de l’effet de masque pour des bruits de fort niveau. La figure 4 montre les différences entre les deux façons de prise en compte de l’effet de masque pour un bruit de bande fine à une fréquence centrale de 250 Hz et pour différents niveaux acoustiques. On peut constater que, à partir d’un niveau de 80 dB et pour des fréquences supérieure à 800 Hz, le masquage utilisé par le RASTI sous-estime l’effet de masque de plus de 10 dB.
Figure 4 : Différences de calcul du STI entre la méthode standard et la méthode adaptée
Comme les calculs du STI sont basés sur le rapport signal sur bruit dans 8 bandes d’octaves (fig. 2) et comme ce rapport est indépendant du niveau absolu, il est possible d’utiliser les niveaux d’excitation psycho-acoustique à la place des niveaux acoustiques. Cette deuxième procédure nous semble appropriée comme elle prend en compte la dépendance du niveau acoustique de l’effet de masque ainsi que la dépendance de la fréquence de la largeur bande d’intégration (bande critique).
Astelab 2003
27 - 3
Le STI (Speech Transmission Index) et son application dans des environnements très bruyants La figure 4 montre l’estimation du STI pour un niveau de parole de 60 dB perturbé par un bruit de bande fine (fc = 125 Hz) de 70 dB (figure de gauche) ou de 110 dB (figure de droite). Dans le cas d’une perturbation modérée (70 dB), le masquage ne joue qu’un rôle mineur et les estimations pour chaque mode de calcul sont très peu différentes. Par contre, pour le bruit de 110 dB, les différences dues au mode de calcul sont considérables. Le mode de calcul standard prédit une intelligibilité quasi parfaite (STI = 91%) alors que le calcul adapté, dû au masquage presque complet de la parole, ne prédit aucune intelligibilité (STI = 9 %). Comme déjà décrit plus haut (fig. 3), cet effet est dû à la progression non linéaire du masquage telle qu’elle a été décrite par Zwicker et Feldkeller [3]. Cet exemple montre que l’utilisation des niveaux d’excitation à la place de niveaux de pression acoustique pour le calcul du STI donne des résultats plus adéquats dans des situations d’exposition aux bruits extrêmes. La formulation exacte des algorithmes adaptés a été publiée par Wessling [4].
4. APPLICATION AU BRUIT DE CHAR Pour les courbes de la figure 5 nous appliquons au bruit auquel est exposé le commandant d’un char le calcul du STI modifié (fig. 1). La ligne continue épaisse représente les niveaux acoustiques en bandes de tiers d’octaves sous le protecteur auditif, qui sont pris en compte pour le calcul standard du STI. Le trait discontinu épais représente le niveau d’excitation psycho-acoustique prise en compte pour le calcul modifié. Les courbes en gris représentent les spectres à long terme de la parole tels qu’ils ont été utilisés pour les calculs (trait discontinu : 110 dB ; trait continu : 100 dB ; trait pointillé : 90 dB). Dans les zones spectrales essentielles pour l’intelligibilité de la parole nous pouvons constater que le rapport signal sur bruit effectif (psycho-acoustique) est, à cause de l’effet de masque, 10 dB moins bon que le rapport signal sur bruit physique.
Figure 5 :Application du STI modifié à l’exposition au bruit du chef de char. La table montre les calculs du STI et du CVC pour ces conditions Pour un niveau de parole de 100 dB, le score du CVC calculé avec la méthode standard s’élève à 86 % (excellente intelligibilité) mais n’affiche que 71,5 % (limite inférieure pour une bonne intelligibilité) pour le calcul modifié. Dans le cas d’un niveau de parole de 110 dB, ce score augmente de 3,6 % à 89,6 pour le calcul standard, et de 11,8 % à 83,3 % (excellente intelligibilité) pour le calcul modifié. On peut supposer qu’un commandant de véhicule blindé, qui exige une bonne communication, augmentera le niveau de la parole jusqu’au point où il juge l’intelligibilité entre bonne et excellente. Ce niveau d’intelligibilité est obtenu à un niveau de parole de 90 dB dans le cas du calcul standard (figure 5). Le calcul modifié prédit un niveau situé entre 100 dB et 110 dB. Le niveau de parole choisi par le commandant du char (ligne noire fine dans figure 5) montre clairement que cette prédiction est très proche de la réalité .
Astelab 2003
27 - 4
Le STI (Speech Transmission Index) et son application dans des environnements très bruyants
5. CONCLUSION Nous avons pu voir que l’évaluation des systèmes combinés de protection et de communication, qui sont utilisés dans des environnements très bruyants avec une prédominance basse fréquence (véhicules blindés, hélicoptères, avions à hélice…), ne devrait pas être faite avec des méthodes utilisant uniquement le rapport signal sur bruit physique (p. ex. STIDAS). Ces méthodes sous-estiment le « bruit psycho-acoustique » dû au masquage des moyennes fréquences par les basses fréquences. Comme dans la gamme des fréquences moyennes (2 à 8 kHz) les protections sont le plus performantes, cet effet mène à une sous-estimation du niveau de parole nécessaire à une communication acceptable. Par contre, une adaptation des méthodes de calcul (au moins pour le STI) pour l’évaluation de l’intelligibilité semble possible, si l’on utilise à la place des niveaux physiques (niveau acoustique) les niveaux psycho-acoustiques (niveaux d’excitation) comme base pour les calculs.
6. BIBLIOGRAPHIE [1] Steeneken HJM, (1992). On measuring and predicting speech intelligibility. Thèse de Doctorat, Université d’Utrecht, Pays Bas, 1992 [2] Steeneken HJM, Verhave JA, Houtgast T, Description of the STI measuring method. TNO-Report TNO-TM 1994 I-2, TNO Soesterberg, Pays Bas, 1994 [3] Zwicker E, Feldtkeller R. Das Ohr als Nachrichtenempfänger. Hirtzel Verlag Stuttgart,1967 Traduction : L’oreille récepteur d’information, Collection technique et scientifique des télécommunications, CNET-ENST, MASSON, 1981 [4] Wessling T, Erweiterung der Methode nach Houtgast und Steeneken zur Prognose der Sprachverständlichkeit (sog. STI) fúr Fälle tieffrequenten Lärms hohen Pegels. Diplomarbeit, Ruhruniversität Bochum, 1997 Littérature additionnelle : Kryter KD, The effects of noise on man. Academic Press, 1970 Houtgast T, Steeneken HJM, A multi-lingual evaluation of the RASTI-method for estimating speech intelligibility in auditoria. Acoustica, 54, 185-199, 1984
Astelab 2003
27 - 5