Search Images Maps Play YouTube Gmail Drive Calendar More »
Sign in
Screen reader users: click this link for accessible mode. Accessible mode has the same essential features but works better with your reader.

Patents

  1. Advanced Patent Search
Publication numberWO2009090281 A1
Publication typeApplication
Application numberPCT/ES2008/070246
Publication date23 Jul 2009
Filing date30 Dec 2008
Priority date17 Jan 2008
Publication numberPCT/2008/70246, PCT/ES/2008/070246, PCT/ES/2008/70246, PCT/ES/8/070246, PCT/ES/8/70246, PCT/ES2008/070246, PCT/ES2008/70246, PCT/ES2008070246, PCT/ES200870246, PCT/ES8/070246, PCT/ES8/70246, PCT/ES8070246, PCT/ES870246, WO 2009/090281 A1, WO 2009090281 A1, WO 2009090281A1, WO-A1-2009090281, WO2009/090281A1, WO2009090281 A1, WO2009090281A1
InventorsArrondo Ivan Portas
ApplicantAuralia Emotive Media Systems, S,L.
Export CitationBiBTeX, EndNote, RefMan
External Links: Patentscope, Espacenet
Method of converting 5.1 sound format to hybrid binaural format
WO 2009090281 A1
Abstract
Method of converting 5.1 sound format to hybrid binaural format, comprising obtaining the signals from the FL, FR, C, SL, SR and LFE channels in 5.1 format which it is desired to convert into hybrid binaural format; auralizing the FL, FR, SL and SR channels in the following positions: FL: elevation from 0° to 30°, azimuth from -10° to -30°; FR: elevation from 0° to 30°, azimuth from +10° to +30°; SL: elevation from 175° to 195°, azimuth from -30° to -60°; SR: elevation from 175° to 195°, azimuth from +30° to +60°, thus obtaining the signals FL1, FR1, SL1 and SR1; modelling the response from the enclosure on the basis of the signals, introducing a reverberation effect; and mixing the signals FL2, FR2, SL2 and SR2 obtained in the previous step with the original LFE and C signals to obtain the two left and right output signals.
Claims  translated from Spanish  (OCR text may contain errors)
REIVINDICACIONES What is claimed
1. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones 1. Procedure format conversion sound binaural 5.1 hybrid, comprising the following operations
obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido; obtain the signals of the channels FL, FR, C, SL, SR and LFE of 5.1 format to be converted into binaural format hybrid;
auralizar los canales FL, FR, SL y SR en las siguientes posiciones: auralizar the FL, FR, SL and SR channels in the following positions:
FL: elevación de 0 o a 30°; FL: elevation of 0 or 30 °; azimut de -10 o a -30°. Azimuth -10 or -30 °.
FR: elevación de 0 o a 30°; FR: elevation of 0 or 30 °; azimut de +10 a +30°. Azimuth +10 to + 30 °.
SL: elevación de 175° a 195°; SL: elevation of 175 ° to 195 °; azimut de -30° a -60°. Azimuth -30 ° to -60 °.
SR: elevación de 175° a 195°; SR: elevation of 175 ° to 195 °; azimut de +30° a +60°, Azimuth + 30 ° to + 60 °,
obteniéndose como resultado las señales FLi, FRi, SLi y SRi; obtaining as result the FLi, FRi, SLi and SRi signals;
procesar independientemente las señales del plano frontal (FLi y FRi) y las del plano trasero (SLi y SRi), utilizando para ello, las respuestas a impulso de dos recintos virtuales diferentes, optimizados cada uno de ellos para dichos planos, obteniéndose como resultado las señales FL 2 , FR 2 , SL 2 y SR 2 ; independently process the signals from the front plane (FLi and FRi) and backplane (SLi and SRi), using the impulse responses of two different virtual enclosures, optimized each to said planes, resulting in the FL 2 signals, FR 2, SL 2 and SR 2;
mezclar las señales FL 2 , FR 2 , SL 2 y SR 2 obtenidas en Ia operación anterior junto con las señales originales LFE y C para obtener las dos señales de salida izquierda y derecha. mix 2 FL, FR 2, SL 2 and SR 2 signals obtained in the previous operation with the original signals LFE and C to obtain the two signals left and right output.
2. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque las respuestas a impulso de los recintos virtuales utilizados para el procesado del plano frontal y trasero, comprenden tiempos de reverberación de entre 0,5 sy 1 s para el primero, y de entre 1 sy 3,5 s para el segundo. 2. Procedure format conversion sound binaural 5.1 to hybrid according to the preceding claim, characterized in that the impulse responses of the virtual enclosures used for processing the front plane and rear comprise reverberation time of between 0.5 s 1 s for the first and between 1 s and 3.5 s for the second.
3. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque comprende, previamente a Ia operación final de mezcla, una compresión del canal LFE. 3. Procedure format conversion sound binaural 5.1 to hybrid according to any of the preceding claims, characterized in that prior to Ia final operation comprising mixing a compression of the LFE channel.
4. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque antes de Ia operación de auralización comprende las operaciones de: 4. Procedure format conversion sound binaural 5.1 hybrid according to any of the preceding claims, characterized in that before the operation auralization comprising the steps of:
separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen: música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R; separate the signals of the channels FL, FR, C, SL, SR in the sources that comprise: L music, music R, voice and frontal impact, rear impact and rear impact R L;
remezclar las fuentes estimadas en proporciones optimizadas para procesos posteriores, reconstruyendo los canales FL, FR, C, SL y SR. remixing the estimated proportions optimized for further processing sources, reconstructing the channels FL, FR, C, SL and SR.
5. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque Ia operación de remezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R se realiza de acuerdo con los siguientes rangos porcentuales: 5. Procedure sound format conversion 5.1 binaural hybrid according to the preceding claim, characterized in that the operation of remixing of music sources L, R music, voice and frontal impact, rear impact and rear impact L R is made according with the following percentage ranges:
FL .:: 70-90% música L, 30-10% voz y efectos frontales FL. :: music L 70-90%, 30-10% and frontal effects voice
FR *: 70-90% música R, 30-10% voz y efectos frontales FR *: 70-90% R music, voice and 30-10% frontal impact
C: 70-90% voz y efectos frontales, 30-10% música L y R C: 70-90% voice and frontal effects, 30-10% music L and R
SL: 70-90% efectos traseros L, 30-10% música L SL: 70-90% rear effects L, 30-10% music L
SR: 7700--9900%% efectos traseros R, 30-10% música R SR: 7700--9900 rear effects %% R, 30-10% music R
6. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque es llevado a cabo por uno dispositivo de entre los de Ia siguiente lista: un ASIC, una FPGA, un DSP, un microprocesador y un microcontrolador. 6. The method of converting audio format 5.1 hybrid binaural according to the preceding claim, characterized in that it is carried out by one device among of Ia following list: an ASIC, an FPGA, a DSP, a microprocessor and a microcontroller .
7. Programa de ordenador que comprende instrucciones de programa que provocan que un ordenador lleve a cabo las operaciones del método de acuerdo con cualquiera de las reivindicaciones anteriores. 7. Computer program comprising program instructions that cause a computer to perform the method steps according to any of the preceding claims.
8. Programa de ordenador de acuerdo con Ia reivindicación 7, caracterizado porque está almacenado en unos medios de almacenamiento. 8. Computer program according to claim 7, characterized in that it is stored in a storage means.
9. Programa de ordenador de acuerdo con Ia reivindicación 7, caracterizado porque se transmite a través de una señal portadora. 9. Computer program according to claim 7, characterized in that is transmitted through a carrier signal.
Description  translated from Spanish  (OCR text may contain errors)

PROCEDIMIENTO DE CONVERSIÓN DE FORMATO SONORO 5.1 A FORMAT CONVERSION PROCEDURE 5.1 SONORO

BINAURAL HÍBRIDO Binaural HYBRID

DESCRIPCI Ó N DESCRIPTION N

OBJETO DE LA INVENCIÓN OBJECT OF THE INVENTION

El objeto principal de Ia presente invención es un procedimiento para convertir sonido en formato sonoro 5.1 , habitualmente utilizado para registro y reproducción sonora digital de contenido cinematográfico, en formato binaural híbrido. The main object of the present invention is a process for converting sound into sound 5.1 format, commonly used for recording and reproducing digital sound movie content, in binaural format hybrid.

ANTECEDENTES DE LA INVENCIÓN BACKGROUND OF THE INVENTION

Actualmente, el formato 5.1 representa el estándar para Ia reproducción sonora doméstica de cine. Currently, the 5.1 format is the standard for the reproduction of sound domestic cinema. Un sistema sonoro en formato 5.1 está compuesto por seis canales de audio donde se mezclan en distintas proporciones las señales de música, voz, efectos sonoros, etc. A sound system in the 5.1 format is composed of six audio channels where signals of music, voice, sound effects mixed in different proportions, etc. Cada uno de los canales corresponde a un altavoz, ya su vez cada uno de los altavoces debe estar situado en una ubicación concreta con relación al usuario para conseguir una sensación sonora óptima. Each of the channels corresponds to a speaker, and in turn each of the speakers should be placed at a particular location relative to the user for optimal sound sensation.

Los altavoces principales (FL y FR en Ia Figura 1 ) forman idealmente un triángulo equilátero con Ia posición del usuario (O). The main speakers (FL and FR in Figure 1) form an equilateral triangle ideally with the position of the user (O). Además, las rectas formadas por los altavoces envolventes (SL y SR) y el usuario (O) forman un ángulo de aproximadamente 110° con respecto al eje vertical (recta que une O y C). In addition, the straight lines formed by the surround speakers (SL and SR) and the user (O) form an angle of approximately 110 ° about the vertical axis (line connecting O and C). El altavoz LFE (Low Frequency Enhancement, en sus siglas en inglés), tiene por objeto realzar los sonidos graves para producir un efecto impactante en Ia reproducción. Speaker LFE (Low Frequency Enhancement, its acronym in English), aims to enhance bass sounds to produce a striking effect on the reproduction. Su ubicación no es determinante, ya que Ia información que transmite tiene un espectro de frecuencias generalmente menor de 100 Hz, que tiene una naturaleza omnidireccional. Its location is not decisive, since the information transmitted has a spectrum of frequencies generally lower than 100 Hz, which has an omnidirectional nature. Es decir, no se puede determinar de donde proviene el sonido. That is, you can not determine where the sound is coming.

Un inconveniente de los sistemas de audio basados en el formato 5.1 es que la sensación sonora del usuario se deteriora rápidamente cuando éste no está situado en Ia ubicación óptima con respecto de los altavoces. A drawback of audio systems based on 5.1 sound format is that the user feel deteriorates rapidly when it is not located in the optimum location with respect to the speakers. La utilización de auriculares permite, sin embargo, una colocación óptima del usuario en todo momento, ya que los sistemas de reproducción sonora, al estar adheridos a Ia cabeza del usuario, no modifican su posición relativa respecto a su cabeza. Using headphones allows, however, optimal placement of the user at all times, since sound reproduction systems, being attached to the head of the user, do not change their position relative to your head.

Sin embargo, el ser humano es un receptor sonoro volumétrico, es decir, procesa el sonido que llega a él a través de, por ejemplo, reflexiones creadas por los hombros y el torso, o difracciones creadas por el sonido al rodear Ia cabeza. However, the human is a volumetric sound receiver, ie processes sound that reaches it through, for example, reflections created by the shoulders and torso, or diffractions created by the sound to surround the head. La audición humana es por naturaleza binaural, donde Ia resultante de todo el proceso de recepción sonora termina en dos únicos canales: oído derecho y oído izquierdo. Human hearing is binaural nature, wherein the result of the whole process of sound reception ends in only two channels: the right ear and left ear. El término "binaural" hace referencia a Ia naturaleza de Ia audición humana, debido a que las personas somos capaces de captar toda Ia información espacial sonora a través de un único par de oídos. The term "binaural" refers to the nature of human hearing Ia because people are able to capture all the spatial sound information through a single pair of ears.

Cuando no se tiene en cuenta esta fenomenología se suele producir el denominado "sonido intracraneal", como por ejemplo al escuchar sonido estéreo tradicional a través de auriculares. When no one considers this phenomenology is usually produced the so-called "intracranial sound", such as traditional stereo sound when listening through headphones. El sonido intracraneal consiste en Ia sensación de que las fuentes sonoras se encuentran en el interior del cráneo del usuario, en un punto situado entre los dos auriculares, por Io que el sonido estéreo tradicional no es un formato aconsejable cuando se tratan de representar de forma realista espacios sonoros tridimensionales. Intracranial sound consists of the feeling that the sound sources are inside the skull of the user, at a point between the two headphones, for which reason the traditional stereo sound is not a recommended format when you try to represent so realistic three-dimensional sound spaces.

Existen fundamentalmente dos formas de lograr reproducciones binaurales: There are essentially two ways to achieve binaural reproduction:

La primera de ellas consiste en sustituir el par de receptores puntuales que se utiliza habitualmente por receptores volumétricos, como maniquíes, logrando de ese modo que el sonido que llega a ellos se procese de forma natural. The first is to replace the pair of specific receptors that is typically used for volumetric receivers, as dummies, thereby achieving the sound that reaches them is processed naturally. De este modo se logra una grabación estéreo binaural, donde queda ya introducida toda Ia fenomenología descrita anteriormente. Thus a binaural stereo recording, where all phenomenology Ia described above is achieved is already entered.

La segunda se basa en realizar un procedimiento de auralización. The second is based on performing a procedure auralization. Para ello, se suele medir o modelar Ia respuesta de un determinado receptor (un maniquí o un ser humano, por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente un ruido de banda ancha emitido desde un determinado punto alrededor del usuario). For this, usually measured or model the response of a given receptor (a dummy or a human, for example) to a pulse signal from a given point in space (typically a broadband noise emitted from a point around user). La patente US 2007213990 describe un método para transformar una señal estéreo bacanal tradicional en una señal binaural, centrándose en el tratamiento que debe sufrir Ia señal de entrada de cara a su preparación para ser transformada en sonido tridimensional. US 2007213990 discloses a method for transforming a traditional stereo signal into a binaural signal bacanal, focusing on the treatment must suffer the input signal ahead of their preparation to be transformed into three-dimensional sound. Específicamente, se describe cómo dividir Ia señal de entrada según distintas bandas de frecuencia para, una vez dividida Ia señal de entrada, auralizar cada sub-banda y finalmente unirlas para formar los dos canales de salida en formato binaural. Specifically, it describes how to divide the input signal according to different frequency bands, once the input signal divided auralizar each subband and finally joining them to form the two output channels in binaural format.

DESCRIPCIÓN DE LA INVENCIÓN DESCRIPTION OF THE INVENTION

La presente invención describe un nuevo procedimiento para Ia auralización en tiempo real de audio en formato 5.1. The present invention describes a new process for the auralization real-time audio in 5.1 format. Para lograr un resultado óptimo, cada canal es tratado y auralizado independientemente, de modo que es posible asignar parámetros acústicos específicos a cada uno de ellos con el objetivo de hacer más realista y espectacular Ia reproducción. For optimal results, each channel is treated and auralizado independently, so that you can assign specific acoustic parameters to each order to make more realistic and spectacular the reproduction.

Las ventajas más importantes del procedimiento de Ia invención se pueden resumir en las siguientes: The most important advantages of the method of the invention can be summarized as follows:

Se consigue una reproducción óptima en todos los casos, ya que, al estar los auriculares adheridos al usuario, Ia posición relativa entre el sistema de reproducción y el usuario no varía. optimal reproduction in all cases, since, being attached to the user headphones, the relative position between the reproduction system and the user does not vary is achieved.

El modelo híbrido que se describe, que combina Ia auralización de los canales FL, FR, SL y SR con los canales monofónicos originales C y LFE permite una mayor inteligibilidad de los diálogos, al no existir interferencias entre los canales frontales y el canal C, así como una inmersión superior debido a Ia constante referenciación inconsciente que realiza el cerebro entre el canal C monofónico y los canales auralizados. The hybrid model described, which combines the auralization of FL, FR, SL and SR channels with the original monophonic channels C and LFE allows greater intelligibility of the dialogue, the absence of interference between the front channels and the channel C, and an immersion superior because unconscious Ia constant referencing the brain makes between the monaural channel C and auralizados channels.

El reajuste de las proporciones de los diferentes tipos de información, mediante Ia separación de fuentes y posterior remezclado, permite optimizar desde el inicio el contenido de los distintos canales para lograr un resultado óptimo. Readjusting the proportions of the different types of information, through the separation of sources and later remixed, from the beginning to optimize the content of the different channels to achieve optimal results.

La colocación virtual específica de los canales FL y FR, así como el modelado del recinto específico, permiten un perfecto equilibrio con el canal de diálogos C, no interfiriendo con su inteligibilidad y dotando de Ia profundidad justa al plano frontal. The specific virtual placement of FL and FR channel and modeling the specific compound, allow a perfect balance with the dialogue channel C, not interfering with their intelligibility and infusing Ia depth just the frontal plane.

La colocación virtual específica de los canales SL y SR, así como el modelado de un recinto específico diferente para los canales de los planos delantero y trasero, aportan una sensación de profundidad trasera impactante, dotando al sistema de planos diferenciados de reproducción sonora, creando de este modo una experiencia altamente inmersiva. The specific virtual placement of the SL and SR channels and modeling a different specific grounds for the channels of the front and rear planes, bring a sense of striking back depth, providing the system with differentiated levels of sound reproduction, creating thus a highly immersive experience.

El refuerzo del canal LFE permite recrear las sensaciones producidas por las componentes graves en las salas de cine, equilibrando el sistema de reproducción. Strengthening the LFE channel recreates the sensations produced by the major components in cinemas, balancing the playback system.

En el presente documento, el término "auralizar" hace referencia al procesado de los diferentes canales para conseguir que el usuario tenga Ia impresión de que provienen de lugares del espacio concretos, consiguiéndose así una espectacularidad e inteligibilidad optimizadas. Herein, the term "auralizar" refers to the processing of different channels for the user having the printing of which come from parts of concrete space and achieving an optimized spectacularity and intelligibility.

Del mismo modo, el término "canal" hace referencia a Ia señal de cada uno de los altavoces que componen el formato de sonido 5.1 o el formato de sonido binaural híbrido. Similarly, the term "channel" refers to the signal of each of the speakers that make the sound format 5.1 or hybrid format binaural sound. Así, hablaremos de los canales FL, FR, C, SL, SR o LFE, que son los canales de entrada en formato 5.1 y de los canales L y R, que son los canales de salida en formato binaural. So, we will discuss the channels FL, FR, C, SL, SR or LFE, which are input channels in the 5.1 format and the L and R channels are output channels in binaural format. Se utilizarán las letras "L" y "R" para distinguir entre las posiciones de los canales situadas a Ia izquierda (left, en inglés) y derecha (right, en inglés) del usuario. the letters "L" will be used and "R" to distinguish between the channel positions situated Ia left (left,) and right (right in English) of the user. También se utilizarán los términos "plano frontal" y "plano trasero" para hacer referencia a Ia posición de los canales frente al usuario o detrás del usuario, así como "plano lateral derecho" o "plano lateral izquierdo" para hacer referencia a Ia posición de los canales a los lados del usuario. the terms "front plane" and will also be used "flat back" to refer to the position of the channel towards the user or behind the user and "right side up" or "left lateral plane" to refer to the position channels on the sides of the user.

Por otro lado, el término "fuente" se refiere a una señal que contiene sonidos de un solo proceso físico, es decir, las fuentes serán, en general, música, voz y efectos. Furthermore, the term "source" refers to a signal containing only sounds of a physical process, that is, the sources will in general music, voice and effects.

Se define también el término "binaural híbrido" como un formato sonoro que mezcla canales auralizados con canales no auralizados o monofónicos. the term "binaural hybrid" is also defined as an audio format that mixes auralizados channels with no auralizados or monophonic channels. Concretamente, Ia presente invención mezcla los canales auralizados FL, FR, SL y SR con los canales no auralizados C y LFE. Specifically, the present invention mixes auralizados channels FL, FR, SL and SR with non auralizados C and LFE channels.

De acuerdo con un aspecto de Ia presente invención, se describe un procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones: According to one aspect of the present invention, a method of converting sound 5.1 format described hybrid binaural, characterized in that it comprises the following operations:

1 ) Obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido. 1) Obtain the channel signals FL, FR, C, SL, SR and LFE of 5.1 format to be converted into binaural format hybrid. La información que contienen estas señales es normalmente una mezcla de varias fuentes, donde: The information contained in these signals is usually a mixture of several sources, where:

FL: contiene principalmente música, y en menor medida voz y efectos. FL: contains primarily music, and less voice and effects.

FR: contiene principalmente música, y en menor medida voz y efectos. FR: it contains primarily music, and less voice and effects. C: contiene principalmente voz, y en menor medida música y efectos. C contains mainly voice, and to a lesser extent music and effects. SL: contiene principalmente efectos, y en menor medida música. SL: it contains mainly effects, and less music. SR: contiene principalmente efectos, y en menor medida música. SR: it contains mainly effects, and less music. LFE: contiene únicamente graves. LFE: contains only serious.

2) Auralizar los canales FL, FR, SL y SR en las siguientes posiciones: FL: elevación de 0 o a 30°; 2) Auralizar channels FL, FR, SL and SR in the following positions: FL: elevation of 0 or 30 °; azimut de -10 o a -30°. Azimuth -10 or -30 °.

FR: elevación de 0 o a 30°; FR: elevation of 0 or 30 °; azimut de +10 a +30°. Azimuth +10 to + 30 °.

SL: elevación de 175° a 195°; SL: elevation of 175 ° to 195 °; azimut de -30° a -60°. Azimuth -30 ° to -60 °. SR: elevación de 175° a 195°; SR: elevation of 175 ° to 195 °; azimut de +30° a +60°. Azimuth + 30 ° to + 60 °.

obteniéndose como resultado las señales FLi, FRi, SLi y SRi. obtaining as result the FLi, FRi, SLi and SRi signals.

Diremos que "auralizar" un canal en una posición determinada significa ubicar virtualmente ese canal de forma que Ia reproducción de las señales resultantes, una para el canal derecho y otra para el canal izquierdo, a través de unos auriculares producen Ia sensación en el usuario de que los sonidos de ese canal provienen de esa posición determinada del espacio. Say that "auralizar" a channel at a given position means virtually locate the channel so that the reproduction of the resulting signals, one for the right channel and one for the left channel via headphones produce Ia feeling in the user the sounds of that channel come from that particular position in space.

Dicho de otro modo, auralizar es un proceso mediante el cual un canal carente de información espacial habitualmente monofónico, como en este caso, es decir, anecoico o seco, es procesado mediante un procedimiento llamado convolución, con Ia respuesta al impulso (respuesta en tiempo y frecuencia a un determinado estímulo acústico proveniente de un determinado punto del espacio) de un determinado oyente. In other words, auralizar is a process by which a channel lacking usually monophonic spatial information, as in this case, ie anechoic or dry, is processed by a procedure called convolution with Ia impulse response (response time and frequency to a given acoustic stimulus from a given point in space) of a particular listener.

Sin embargo, debido a las diferencias físicas entre los diferentes usuarios (tamaño, distancia entre los oídos, etc.), no todos ellos responden de igual modo ante los nuevos canales FLi, FRi, SLi y SRi. However, due to the physical differences between different users (size, distance between the ears, etc.), not all of them respond equally to new FLI fri, SLi and SRi channels.

Para conocer Ia respuesta de cada tipo de usuario, se modela o se mide Ia respuesta de un determinado receptor (un maniquí o un ser humano por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente ruido de banda ancha emitido desde un determinado punto alrededor del usuario). For the response of each type of user, it is modeled or measured the response of a given receptor (a dummy or a human being for example) to a pulse signal from a given point in space (usually broadband noise emitted from a point around the user). Ésta respuesta al impulso del usuario se utiliza más tarde para procesar una fuente monofónica (sin información espacial) mediante un proceso de convolución, logrando así el efecto de escuchar dicha fuente situada en el punto donde ha sido emitido el impulso. This impulse response of the user is later used to process a monophonic source (without spatial information) through a convolution process, thus achieving the effect of listening to that source located at the point where the momentum has been issued.

Los inventores han descubierto que situar virtualmente los canales FL, FR, SL y SR dentro de los rangos angulares descritos anteriormente proporciona a todos los usuarios una sensación de espectacularidad óptima. The inventors have discovered that virtually placing the channels FL, FR, SL and SR within the angular ranges described above provides all users enhanced sensitivity spectacularity.

El motivo de que los rangos angulares de los altavoces frontales (FL y FR) no sean muy grandes es evitar Ia pérdida de inteligibilidad del canal de diálogos (C) debido a una imagen estéreo excesiva de Ia música, es decir, que Ia energía del canal FL vaya casi completamente a L y Ia energía de FR vaya casi completamente a R, y evitar Ia llegada de una gran cantidad de energía a los planos laterales, cerca de los oídos que interfiera en Ia localización de los canales del plano trasero (SL y SR). The reason that the angular ranges of the front speakers (FL and FR) are not too large is to avoid the loss of intelligibility channel dialogues (C) because of an image over stereo Ia music, ie that the energy of FL channel go almost entirely to L and the energy of FR go almost entirely to R, and avoid Ia arrival of a lot of energy to the side planes, near the ears which interfere with the localization of the channels backplane (SL and SR).

El canal de diálogos (C) no se procesa en Ia operación de procesado de las señales de los canales FL, FR, SL y SR, ya que mantenerlo como fuente aporta dos grandes ventajas a Ia salida final del procedimiento. The dialogue channel (C) is not processed in the operation for processing the signals of the channels FL, FR, SL and SR as keep source provides two major advantages to the outlet end of the procedure.

La primera de ellas es ganar en inteligibilidad respecto al formato de entrada, ya que al mantener este canal intacto y auralizar los de los planos frontal (FL y FR) y trasero (SL y SR), los diálogos (C) quedan destacados en Ia posición central, reduciendo Ia fatiga auditiva para su seguimiento. The first one is to win in intelligibility regarding the input format, and that by keeping this intact and auralizar those of the front and rear (SL and SR) planes (FL and FR) channel dialogues (C) are featured in Ia central position, reducing ear fatigue Ia for follow up.

La segunda ventaja reside en el hecho de constituir un punto de referencia auditivo para el cerebro, ya que mantener su naturaleza intracraneal hace ideal su combinación con los canales auralizados. The second advantage lies in the fact constitute a point of reference for the auditory brain as they keep their intracranial nature makes it ideal combination with auralizados channels. De este modo, el cerebro compara constantemente Ia posición de este canal con los auralizados, haciendo Ia experiencia auditiva del usuario mucho más espectacular. Thus, the brain constantly compares the position of this channel with auralizados, Ia making the listening experience much more spectacular user.

El canal LFE tampoco se procesa en esta operación del procedimiento debido a Ia naturaleza no direccional de las frecuencias que contiene, es decir, da Ia sensación de ser escuchado en todas las posiciones. The LFE channel is not processed in this step of the process because no directional nature Ia frequencies containing, ie Ia gives feeling of being heard in all positions. Esta característica hace que los altavoces destinados a Ia reproducción de este canal puedan ser situados prácticamente en cualquier lugar del recinto. This feature makes the speakers intended for the reproduction of this channel can be located virtually anywhere in the room.

3) Modelar respuestas de recinto independientes para los planos frontal y trasero. 3) Modeling responses independent enclosure for the front and rear planes.

Se procesan los canales del plano frontal (FLi, FRi) y trasero (SU , SRi) independientemente utilizando dos respuestas a impulso de recintos optimizados diferentes. and channels the frontal plane (FLI, FRI) back (SU, SRi) independently impulse responses using two different optimized enclosures are processed. El procesado por separado de los canales frontales y traseros aporta Ia ventaja de utilizar dos recintos virtuales diferentes, dotando de mayor profundidad únicamente a los canales traseros, que son los que poseen efectos más espectaculares. The processed separately from the front and rear channels provides the advantage of using two different virtual campuses, providing greater depth only to the rear channels, which are those with more spectacular effects. Una profundidad excesiva en los canales delanteros, sin embargo, dificultaría Ia inteligibilidad de los diálogos. Excessive depth in the front channels, however, difficult Ia intelligibility of the dialogues.

De acuerdo con realizaciones preferidas de Ia presente invención, Ia reverberación introducida en los canales Fl_i y FRi está dentro del rango de 0,5 segundos a 1 segundo, y Ia reverberación introducida en los canales SU y SRi está dentro del rango de 1 segundo a 3,5 segundos. According to preferred embodiments of the present invention, the reverberation introduced in Fl_i and FRi channels is within the range of 0.5 seconds to 1 second, and Ia reverberation introduced in the SU and SRi channels is within the range of 1 second to 3.5 seconds.

Así, después de Ia operación de modelar Ia respuesta del recinto se obtienen como salida las señales del plano frontal FL 2 y FR 2 , y las señales del plano trasero SL 2 y SR 2 Thus, after the operation for modeling the response of the enclosure are obtained as output signals frontal plane FL 2 and FR 2, and SL signals backplane 2 and SR 2

4) Mezclar las señales obtenidas en Ia operación anterior junto con las señales LFE y C originales para obtener las señales de salida del canal izquierdo y el canal derecho (L y R). 4) Mix the signals obtained in the previous operation with the original C and LFE signals for the output signals of the left channel and the right channel (L and R).

De acuerdo con una realización preferida de Ia presente invención, el procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, comprende, previamente a Ia operación final de mezcla, comprimir Ia señal del canal LFE, obteniéndose una señal LFE'. According to a preferred embodiment of the present invention, the method of converting audio format hybrid binaural 5.1, comprises, before final operation Ia mixing, compressing the signal of the LFE channel LFE signal to obtain a '.

Otra realización preferida de Ia invención comprende, previamente a Ia operación de auralización, las operaciones de: Another preferred embodiment of the invention, prior to the operation comprises auralization, the steps of:

a) Separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R. La separación se realiza utilizando un algoritmo de análisis de componentes independientes. a) separating the channel signals FL, FR, C, SL, SR in the sources that compose music L, R music, voice and frontal impact, rear impact and rear impact L R. The separation is performed using an algorithm independent component analysis. Este análisis realiza una comparación de las distintas entradas (canales) que contienen información redundante en diferentes proporciones. This analysis makes a comparison of the various inputs (channels) containing redundant information in different proportions. Partiendo de Ia teoría de que varias señales se pueden considerar independientes si proceden de procesos físicos distintos, se logra aislar las distintas componentes, que en este caso son voz, música y efectos. From Ia theory that multiple signals can be considered independent if they come from different physical processes, it is achieved by isolating the various components, which in this case are voice, music and effects.

b) Mezclar las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R para obtener las señales que constituirán Ia entrada a Ia operación subsiguiente de auralización de los canales. b) Mix music sources L, R music, voice and frontal impact, rear impact and rear impact L R for signals constitute the input to subsequent operation Ia auralization channels. Esta operación de mezcla reconstruye las señales FL, FR, C, SL y SR con las proporciones óptimas de las fuentes que se separaron en Ia operación anterior. This mixing operation reconstructs the FL, FR, C, SL and SR signals with the optimum proportions of the sources that were separated in the previous operation.

De acuerdo con una realización preferida de Ia presente invención, Ia mezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R para obtener los canales se realiza según los siguientes rangos porcentuales: According to a preferred embodiment of the present invention, the mixture of music sources L, R music, voice and frontal impact, rear impact and rear impact L R for the channels is performed according to the following percentage ranges:

FL .:: 70-90% música L, 30-10% voz y efectos frontales FL. :: music L 70-90%, 30-10% and frontal effects voice

FR *: 70-90% música R, 30-10% voz y efectos frontales FR *: 70-90% R music, voice and 30-10% frontal impact

C: 70-90% voz y efectos frontales, 30-10% música L y R C: 70-90% voice and frontal effects, 30-10% music L and R

SL: 70-90% efectos traseros L, 30-10% música L SL: 70-90% rear effects L, 30-10% music L

SR: 7700--9900%% efectos traseros R, 30-10% música R SR: 7700--9900 rear effects %% R, 30-10% music R

El objetivo de estas dos operaciones opcionales es garantizar que cada canal en el proceso de auralización contenga Ia proporción adecuada de las distintas componentes, ya que Ia mezcla original en 5.1 estaba optimizada para su reproducción a través de 6 altavoces físicos, esquema completamente distinto a un par de auriculares. The aim of these optional operations is to ensure that each channel in the process auralization containing the appropriate proportion of the various components as Ia original mixture in 5.1 was optimized for playback through six physical speakers, completely different scheme to a pair of headphones. A Ia hora de reproducir en auriculares, Ia información redundante característica de sistemas cuadrafónicos como el 5.1 obstaculiza Ia percepción de realismo espacial, y por eso es necesario este reajuste. After one hour of play in headphones, Ia feature redundant information systems like quadraphonic 5.1 Ia hinders perception of spatial realism, so this adjustment is necessary.

El canal de frecuencias graves LFE ya es en sí mismo una componente independiente, y por tanto su información no es redundante en los demás canales. The LFE channel bass frequencies is already in itself an independent component, and therefore information is not redundant in other channels. Por este motivo no se incluye en las operaciones iniciales opcionales de separación y mezcla. For this reason it is not included in the initial optional separation operations and mixing.

De acuerdo con otro aspecto de Ia invención, ésta se extiende también a programas de ordenador, en particular programas de ordenador en contenidos en una portadora, adaptados para llevar a cabo las operaciones del procedimiento descrito. According to another aspect of the invention, the invention also extends to computer programs, particularly computer programs contained in a carrier, adapted to perform operations described procedure. El programa puede estar en forma de código fuente, código objeto o un código intermedio entre el código fuente y el código objeto, como una forma parcialmente compilada, o de cualquier otra forma adecuada para implementar las operaciones de Ia invención. The program may be in source code, object code or an intermediate code between source code and object code such as partially compiled form one, or any other suitable form to implement operations of the invention.

La portadora puede ser cualquier dispositivo o entidad capaz de transportar el programa. The carrier can be any device or entity capable of carrying the program. Por ejemplo, Ia portadora puede comprender un medio de almacenamiento, como una ROM, un CD ROM o cualquier otro medio de almacenamiento magnético, por ejemplo un disquete o un disco duro. For example, the carrier may comprise a storage medium such as a ROM, a CD ROM or any other magnetic storage medium, eg a floppy disk or a hard disk. Además, Ia portadora puede ser una portadora de transmisión, como una señal eléctrica u óptica que se pueda comunicar a través de cable eléctrico, óptico, por radio o de cualquier otro modo. Furthermore, the carrier may be a carrier transmission, as an electrical or optical signal that can communicate through electrical cable, optical, radio or otherwise.

Alternativamente, Ia portadora puede ser un circuito integrado en el que está almacenado el programa, estando el circuito adaptado para efectuar las operaciones del procedimiento. Alternatively, Ia carrier may be an integrated circuit in which the program is stored, being adapted to perform the operations of the process circuit. En particular, podría ser un ASIC, una FPGA, un DSP, un microprocesador o un microcontrolador. In particular, it could be an ASIC, an FPGA, a DSP, a microprocessor or microcontroller.

DESCRIPCIÓN DE LOS DIBUJOS Para complementar Ia descripción que se está realizando y con objeto de ayudar a una mejor comprensión de las características de Ia invención, de acuerdo con un ejemplo preferente de realización práctica de Ia misma, se acompaña como parte integrante de dicha descripción, un juego de dibujos en donde con carácter ilustrativo y no limitativo, se ha representado Io siguiente: DESCRIPTION OF THE DRAWINGS To complement the description being made and in order to aid a better understanding of the characteristics of the invention, according to a preferred practical embodiment thereof, accompanying as an integral part of said description, a set of drawings where in an illustrative and not limitative character the following is shown:

Figura 1.- Muestra una vista de Ia ubicación de los altavoces físicos de un cine en un formato sonoro 5.1. Figure 1 shows a view of the physical location of a cinema speakers in a sound format 5.1.

Figura 2.- Muestra un esquema explicativo de Ia posición de los ángulos de elevación (α) y de azimut (β). 2 shows an explanatory diagram of the position of the elevation angles (α) and azimuth (β).

Figura 3.- Muestra un esquema general de las operaciones del procedimiento de acuerdo con Ia presente invención. Figure 3 shows a general outline of the operations of the method according to the present invention.

REALIZACIÓN PREFERENTE DE LA INVENCIÓN PREFERRED EMBODIMENT OF THE INVENTION

Se parte del sonido original de una película en formato 5.1 que se desea convertir en binaural híbrido, que en este caso está grabado en un disco de tipo It was part of the original sound of a movie in 5.1 format to be converted into hybrid binaural, which in this case is recorded on a disc type

DVD. DVD. La Figura 1 muestra Ia posición de los altavoces de los canales en una sala de cine con relación a Ia posición en Ia que debe estar situado el usuario para una experiencia sonora óptima. Figure 1 shows the position of the speaker channels in a movie theater: relative to the position in which the user must be located for optimal sound experience.

En este ejemplo, el procedimiento Io efectúa un ordenador que, en primer lugar, como se muestra en Ia Figura 3, obtiene a partir del DVD las señales de los canales originales en formato 5.1 (FL, FR, C, SL, SR, LFE). In this example, the Io procedure makes a computer, first, as shown in Figure 3, obtained from the DVD signals of the original channels in the 5.1 format (FL, FR, C, SL, SR, LFE ). El canal LFE es separado para ser procesado en paralelo de modo independiente, sufriendo únicamente una compresión que da como resultado Ia señal LFE'. The LFE channel is separated for parallel processing independently, suffering only compression resulting the signal LFE.

En este ejemplo, se proporciona un selector (S) que permite que el usuario seleccione o no las operaciones opcionales de extraer las fuentes de los canales originales y remezclarlas de acuerdo con unas proporciones nuevas para realzar Ia espectacularidad de Ia película. In this example, a selector (S) which allows the user to select or not the optional steps of removing the sources of the original channels and remixing according to a new proportions to enhance spectacularity Ia of the film is provided. Para ello, se separan Ia fuentes (música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R), por ejemplo utilizando el algoritmo de separación de fuentes por análisis de componentes independientes 'FastICA', desarrollado por el HUT (Helsinki University of Technology), para volver a mezclarlos de acuerdo con unas proporciones nuevas optimizadas. To that end, the sources (music L, music R, voice and frontal impact, rear impact L and rear effects R) are separated, for example using the algorithm source separation by independent component analysis' FastICA, developed by the HUT (Helsinki University of Technology), to re-mix according to a new optimized proportions. En este ejemplo supondremos que Ia película es de acción, Io cual implica Ia existencia de una serie de características sonoras, como explosiones, tiros, ruido de motores, etc. In this example we will assume that Ia film is action, which involves Io the existence of a series of sound characteristics, such as explosions, shots, engine noise, etc. Para conseguir Ia mayor espectacularidad posible en este tipo de películas, se han determinado las siguientes proporciones óptimas de mezcla: To get more spectacular Ia possible in these films, they have determined the following optimal mixing ratios:

FL': 80% música L + 20% voz y efectos frontales FR': 80% música R + 20% voz y efectos frontales FL '80% 20% L music + voice and frontal effects FR': R 80% + 20% music and voice frontal effects

C: 80% voz y efectos frontales + 20% música L y R C: 80% and frontal effects voice + music 20% L and R

SL': 80% efectos traseros L + 20% música L SL ': 80% rear effects music L + 20% L

SR': 80% efectos traseros R + 20% música R SR ': 80% back + 20% R effects music R

Una vez mezcladas las fuentes en los canales de este modo optimizado, se separa el canal de diálogos (C) del resto, los canales FL', FR', SL' y SR' son auralizados cada uno de ellos en una situación geométrica óptima para realzar Ia espectacularidad de Ia experiencia sonora del usuario. Once mixed sources in the channels of this optimal way channel dialogues (C) of the rest is separated, the FL ', FR', SL 'and SR are auralizados each in an optimal geometric situation Ia Ia enhance sound spectacular user experience. En este caso, se ha considerado que el oyente tiene las características de un usuario estándar basado en las respuestas al impulso de un maniquí Kemar. In this case, it was considered that the listener has the characteristics of a standard user based on the impulse responses of a Kemar mannequin.

A continuación se presentan las posiciones óptimas de los canales, descritas a través del ángulo de elevación (α) y del ángulo de azimut (β) que forman con el oyente: Then the optimal positions of the channels, described through the elevation angle (α) and azimuth angle (β) that form with the listener are presented:

FL': elevación 15°; FL ': elevation 15 °; azimut -20° -20 ° Azimuth

FR': elevación 15°; FR ': elevation 15 °; azimut 20° SL': elevación 180°; 20 ° azimuth SL ': 180 ° elevation; azimut -40° SR': elevación 180°; Azimuth -40 ° SR ': 180 ° elevation; azimut 40° 40 ° Azimuth

La Figura 2 muestra Ia referencia de Ia ubicación de los ángulos de elevación y azimut, respectivamente α y β. Figure 2 shows the location of reference angles Ia elevation and azimuth, respectively α and β. Después de Ia operación de auralización, se obtienen las señales FL'i, FR'i , SL'i y SRV A continuación, se procesan las señales FL'i y FR'i con Ia respuesta al impulso de un recinto similar a una sala de cine, con un tiempo de reverberación (T r ) de 0,5 segundos aproximadamente; After the operation auralization, the FL'i, FR'i, SRV SL'i and then signals are obtained, and the FL'i FR'i the response signals are processed impulse similar to a room enclosure film, with a reverberation time (T r) of about 0.5 seconds; y las señales SL'i y SR'i con Ia respuesta al impulso de otro recinto similar a una sala de cine diferente, con un tiempo de reverberación de 2 segundos aproximadamente. and SL'i SR'i signals Ia and impulse response similar to a cinema hall different grounds, a reverberation time of approximately 2 seconds.

Finalmente, se mezclan los canales obtenidos en Ia operación anterior, FL'2, FR'2, SL'2 y SR'2 con los canales LFE' y C para obtener únicamente dos señales en formato binaural híbrido correspondientes a los canales L y R de unos auriculares. Finally, the channel obtained in the previous operation, FL'2, FR'2, SL'2 and SR'2 with LFE channels C and for only two hybrid binaural format signals corresponding to the L and R are mixed headphones.

Patent Citations
Cited PatentFiling datePublication dateApplicantTitle
WO2007123788A2 *3 Apr 20071 Nov 2007Srs Labs, Inc.Audio signal processing
EP1816890A1 *30 Jan 20078 Aug 2007Sony CorporationAudio reproducing system and method thereof
US5742689 *4 Jan 199621 Apr 1998Virtual Listening Systems, Inc.Method and device for processing a multichannel signal for use with a headphone
US6002775 *14 Aug 199814 Dec 1999Sony CorporationMethod and apparatus for electronically embedding directional cues in two channels of sound
Non-Patent Citations
Reference
1 *"Neural Networks, 2005. Proceedings. 2005 IEEE International Joint Conference on Montreal", vol. 2, QUE., CANADA., article CIARAMEL THE A.: "BSS toolbox for delayed and convolved mixtures", pages: 1245 - 1250
2 *TECHNOLOGIES FOR PRESENTATION OF SORROUND-SOUND IN HEADPHONES., 17 December 2007 (2007-12-17), Retrieved from the Internet <URL:http://www. headwize.com/tech/sshd_ tech.htm> [retrieved on 20090323]
Classifications
International ClassificationH04S3/00
Cooperative ClassificationH04S3/008, H04S2400/01
European ClassificationH04S3/00D
Legal Events
DateCodeEventDescription
16 Sep 2009121Ep: the epo has been informed by wipo that ep was designated in this application
Ref document number: 08870792
Country of ref document: EP
Kind code of ref document: A1
20 Jul 2010NENPNon-entry into the national phase in:
Ref country code: DE
16 Feb 2011122Ep: pct application non-entry in european phase
Ref document number: 08870792
Country of ref document: EP
Kind code of ref document: A1