Search Images Play YouTube Gmail Drive Calendar Translate More »
Sign in
Screen reader users: click this link for accessible mode. Accessible mode has the same essential features but works better with your reader.

Patents

  1. Advanced Patent Search
Publication numberWO2009090281 A1
Publication typeApplication
Application numberPCT/ES2008/070246
Publication date23 Jul 2009
Filing date30 Dec 2008
Priority date17 Jan 2008
Publication numberPCT/2008/70246, PCT/ES/2008/070246, PCT/ES/2008/70246, PCT/ES/8/070246, PCT/ES/8/70246, PCT/ES2008/070246, PCT/ES2008/70246, PCT/ES2008070246, PCT/ES200870246, PCT/ES8/070246, PCT/ES8/70246, PCT/ES8070246, PCT/ES870246, WO 2009/090281 A1, WO 2009090281 A1, WO 2009090281A1, WO-A1-2009090281, WO2009/090281A1, WO2009090281 A1, WO2009090281A1
InventorsArrondo Ivan Portas
ApplicantAuralia Emotive Media Systems, Arrondo Ivan Portas
Export CitationBiBTeX, EndNote, RefMan
External Links: Patentscope, Espacenet
Method of converting 5.1 sound format to hybrid binaural format
WO 2009090281 A1
Abstract
Method of converting 5.1 sound format to hybrid binaural format, comprising obtaining the signals from the FL, FR, C, SL, SR and LFE channels in 5.1 format which it is desired to convert into hybrid binaural format; auralizing the FL, FR, SL and SR channels in the following positions: FL: elevation from 0° to 30°, azimuth from -10° to -30°; FR: elevation from 0° to 30°, azimuth from +10° to +30°; SL: elevation from 175° to 195°, azimuth from -30° to -60°; SR: elevation from 175° to 195°, azimuth from +30° to +60°, thus obtaining the signals FL1, FR1, SL1 and SR1; modelling the response from the enclosure on the basis of the signals, introducing a reverberation effect; and mixing the signals FL2, FR2, SL2 and SR2 obtained in the previous step with the original LFE and C signals to obtain the two left and right output signals.
Claims  translated from Spanish  (OCR text may contain errors)
REIVINDICACIONES Claims
1. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones 1. A method of converting a hybrid sound binaural 5.1 format, comprising the following operations
obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido; get the signals of the channels FL, FR, C, SL, SR and LFE 5.1 format to be converted in binaural hybrid format;
auralizar los canales FL, FR, SL y SR en las siguientes posiciones: auralizar the FL, FR, SL and SR channels in the following positions:
FL: elevación de 0 o a 30°; FL: elevation of 0 or 30 °; azimut de -10 o a -30°. azimuth of -10 or -30 °.
FR: elevación de 0 o a 30°; FR: elevation of 0 or 30 °; azimut de +10 a +30°. azimuth of +10 to + 30 °.
SL: elevación de 175° a 195°; SL: elevation of 175 ° to 195 °; azimut de -30° a -60°. azimuth of -30 ° to -60 °.
SR: elevación de 175° a 195°; SR: elevation of 175 ° to 195 °; azimut de +30° a +60°, azimuth of + 30 ° to + 60 °,
obteniéndose como resultado las señales FLi, FRi, SLi y SRi; obtaining as a result the FLi, Fri, SLi and SRi signals;
procesar independientemente las señales del plano frontal (FLi y FRi) y las del plano trasero (SLi y SRi), utilizando para ello, las respuestas a impulso de dos recintos virtuales diferentes, optimizados cada uno de ellos para dichos planos, obteniéndose como resultado las señales FL 2 , FR 2 , SL 2 y SR 2 ; independently process the signals from the frontal plane (FLi and Fri) and backplane (SLi and SRi), using the impulse responses of two different virtual campuses, each optimized for these planes, resulting in the 2 signals FL, FR 2, SL 2 and SR 2;
mezclar las señales FL 2 , FR 2 , SL 2 y SR 2 obtenidas en Ia operación anterior junto con las señales originales LFE y C para obtener las dos señales de salida izquierda y derecha. FL mix 2 FR 2, SL 2 and SR 2 signals obtained in the previous operation along with the original LFE signals and C signals for both left and right output.
2. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque las respuestas a impulso de los recintos virtuales utilizados para el procesado del plano frontal y trasero, comprenden tiempos de reverberación de entre 0,5 sy 1 s para el primero, y de entre 1 sy 3,5 s para el segundo. 2. Conversion Procedure 5.1 hybrid sound binaural format according to the preceding claim, characterized in that the impulse responses of the virtual enclosures used for processing the front plane and rear comprise reverberation time of 0.5 s to 1 s for the first, and from 1 s to 3.5 s for the second.
3. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque comprende, previamente a Ia operación final de mezcla, una compresión del canal LFE. 3. Procedure sound format conversion binaural 5.1 hybrid according to any of the preceding claims, characterized in that, prior to Ia final operation comprising mixing a compression LFE channel.
4. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque antes de Ia operación de auralización comprende las operaciones de: Procedure 4. Conversion 5.1 hybrid sound binaural format according to any of the preceding claims, characterized in that before the operation for auralization comprising the steps of:
separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen: música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R; separate the signals of the channels FL, FR, C, SL, SR in the sources that make up: L music, R music, voice and frontal impact, rear impact and rear impact R L;
remezclar las fuentes estimadas en proporciones optimizadas para procesos posteriores, reconstruyendo los canales FL, FR, C, SL y SR. remixing the estimated proportions optimized for further processing sources, reconstructing channels FL, FR, C, SL and SR.
5. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque Ia operación de remezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R se realiza de acuerdo con los siguientes rangos porcentuales: 5. Procedure 5.1 format conversion to hybrid sound binaural according to the previous claim, wherein the operation remix of the music sources L, R music, voice and frontal impact, rear impact and rear impact R L is made according the following percentage ranges:
FL .:: 70-90% música L, 30-10% voz y efectos frontales FL. :: Music L 70-90%, 30-10% and frontal effects voice
FR *: 70-90% música R, 30-10% voz y efectos frontales FR *: 70-90% R music, voice and 30-10% frontal impact
C: 70-90% voz y efectos frontales, 30-10% música L y R C: 70-90% and front voice effects, music 30-10% L and R
SL: 70-90% efectos traseros L, 30-10% música L SL: rear effects L 70-90%, 30-10% music L
SR: 7700--9900%% efectos traseros R, 30-10% música R SR: %% rear effects 7700--9900 R, R music 30-10%
6. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque es llevado a cabo por uno dispositivo de entre los de Ia siguiente lista: un ASIC, una FPGA, un DSP, un microprocesador y un microcontrolador. 6. The method of converting a hybrid sound 5.1 binaural format according to the preceding claim, characterized in that it is carried out by one device from the following list of Ia: an ASIC, an FPGA, a DSP, a microprocessor and a microcontroller .
7. Programa de ordenador que comprende instrucciones de programa que provocan que un ordenador lleve a cabo las operaciones del método de acuerdo con cualquiera de las reivindicaciones anteriores. 7. Computer program comprising program instructions that cause a computer to perform the method steps according to any of the preceding claims.
8. Programa de ordenador de acuerdo con Ia reivindicación 7, caracterizado porque está almacenado en unos medios de almacenamiento. 8. Computer program according to claim 7, wherein it is stored in a storage means.
9. Programa de ordenador de acuerdo con Ia reivindicación 7, caracterizado porque se transmite a través de una señal portadora. 9. Computer program according to claim 7, characterized in that is transmitted through a carrier signal.
Description  translated from Spanish  (OCR text may contain errors)

PROCEDIMIENTO DE CONVERSIÓN DE FORMATO SONORO 5.1 A FORMAT CONVERSION PROCEDURE 5.1 SOUND

BINAURAL HÍBRIDO BINAURAL HYBRID

DESCRIPCI Ó N DESCRIPTION

OBJETO DE LA INVENCIÓN OBJECT OF THE INVENTION

El objeto principal de Ia presente invención es un procedimiento para convertir sonido en formato sonoro 5.1 , habitualmente utilizado para registro y reproducción sonora digital de contenido cinematográfico, en formato binaural híbrido. The main object of the present invention is a process for converting sound into 5.1 sound format, commonly used for sound recording and reproducing digital cinema content in binaural hybrid format.

ANTECEDENTES DE LA INVENCIÓN BACKGROUND OF THE INVENTION

Actualmente, el formato 5.1 representa el estándar para Ia reproducción sonora doméstica de cine. Currently, the 5.1 is the standard format for playback Ia home theater sound. Un sistema sonoro en formato 5.1 está compuesto por seis canales de audio donde se mezclan en distintas proporciones las señales de música, voz, efectos sonoros, etc. A sound system in 5.1 format consists of six channels of audio where the music signals, voice, sound effects are mixed in different proportions, etc. Cada uno de los canales corresponde a un altavoz, ya su vez cada uno de los altavoces debe estar situado en una ubicación concreta con relación al usuario para conseguir una sensación sonora óptima. Each channel corresponds to a speaker, and in turn each of the speakers must be placed in a specific location relative to the user for optimum sound sensation.

Los altavoces principales (FL y FR en Ia Figura 1 ) forman idealmente un triángulo equilátero con Ia posición del usuario (O). The main speakers (FL and FR in Figure 1) ideally form an equilateral triangle with the position of the user (O). Además, las rectas formadas por los altavoces envolventes (SL y SR) y el usuario (O) forman un ángulo de aproximadamente 110° con respecto al eje vertical (recta que une O y C). Furthermore, the straight lines formed by the surround speakers (SL and SR) and the user (O) form an angle of approximately 110 ° with respect to the vertical axis (line connecting O and C). El altavoz LFE (Low Frequency Enhancement, en sus siglas en inglés), tiene por objeto realzar los sonidos graves para producir un efecto impactante en Ia reproducción. The speaker LFE (Low Frequency Enhancement, its acronym in English), aims to enhance the bass sound to produce a striking effect on reproduction Ia. Su ubicación no es determinante, ya que Ia información que transmite tiene un espectro de frecuencias generalmente menor de 100 Hz, que tiene una naturaleza omnidireccional. Its location is not decisive, since the information transmitted usually has a spectrum of frequencies lower than 100 Hz, which has an omnidirectional nature. Es decir, no se puede determinar de donde proviene el sonido. That is, you can not determine where the sound is coming.

Un inconveniente de los sistemas de audio basados en el formato 5.1 es que la sensación sonora del usuario se deteriora rápidamente cuando éste no está situado en Ia ubicación óptima con respecto de los altavoces. A drawback of audio systems based on 5.1 sound format is that the user feel deteriorates rapidly when it is not located in the optimum location with respect to the speakers. La utilización de auriculares permite, sin embargo, una colocación óptima del usuario en todo momento, ya que los sistemas de reproducción sonora, al estar adheridos a Ia cabeza del usuario, no modifican su posición relativa respecto a su cabeza. Using headphones allows, however, optimum positioning of the user at all times, since sound reproduction systems, to be attached to the head of the user, do not change your position relative to your head.

Sin embargo, el ser humano es un receptor sonoro volumétrico, es decir, procesa el sonido que llega a él a través de, por ejemplo, reflexiones creadas por los hombros y el torso, o difracciones creadas por el sonido al rodear Ia cabeza. However, the human being is a volumetric sound receiver, ie processes the sound reaching him through, for example, reflections created by the shoulders and torso, or diffractions created by the sound to surround the head. La audición humana es por naturaleza binaural, donde Ia resultante de todo el proceso de recepción sonora termina en dos únicos canales: oído derecho y oído izquierdo. Human hearing is binaural nature, wherein the resultant around the sound reception process ends in only two channels: right ear and left ear. El término "binaural" hace referencia a Ia naturaleza de Ia audición humana, debido a que las personas somos capaces de captar toda Ia información espacial sonora a través de un único par de oídos. The term "binaural" refers to the nature of human hearing Ia because people are able to capture all the spatial sound information through a single pair of ears.

Cuando no se tiene en cuenta esta fenomenología se suele producir el denominado "sonido intracraneal", como por ejemplo al escuchar sonido estéreo tradicional a través de auriculares. When no one considers this phenomenology is usually produced called "intracranial sound" such as traditional stereo sound when listening through headphones. El sonido intracraneal consiste en Ia sensación de que las fuentes sonoras se encuentran en el interior del cráneo del usuario, en un punto situado entre los dos auriculares, por Io que el sonido estéreo tradicional no es un formato aconsejable cuando se tratan de representar de forma realista espacios sonoros tridimensionales. Intracranial sound consists of the feeling that the sound sources are inside the skull of the user, at a point between the two headphones, due to which the traditional stereo format is not advisable when trying to represent so realistic three-dimensional sound spaces.

Existen fundamentalmente dos formas de lograr reproducciones binaurales: There are essentially two ways to achieve binaural reproduction:

La primera de ellas consiste en sustituir el par de receptores puntuales que se utiliza habitualmente por receptores volumétricos, como maniquíes, logrando de ese modo que el sonido que llega a ellos se procese de forma natural. The first is to replace the pair of specific receptors that are commonly used by volumetric receivers, like mannequins, thereby achieving the sound that reaches them is processed naturally. De este modo se logra una grabación estéreo binaural, donde queda ya introducida toda Ia fenomenología descrita anteriormente. Thereby recording a binaural stereo, where all Ia phenomenology as described above is introduced is achieved.

La segunda se basa en realizar un procedimiento de auralización. The second is based on performing a procedure auralization. Para ello, se suele medir o modelar Ia respuesta de un determinado receptor (un maniquí o un ser humano, por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente un ruido de banda ancha emitido desde un determinado punto alrededor del usuario). For this, usually measured or model the response of a given receptor (a dummy or a human, for example) to a pulse signal from a given point in space (typically a broadband noise emitted from a point around User). La patente US 2007213990 describe un método para transformar una señal estéreo bacanal tradicional en una señal binaural, centrándose en el tratamiento que debe sufrir Ia señal de entrada de cara a su preparación para ser transformada en sonido tridimensional. US 2007213990 discloses a method for transforming a traditional stereo signal into a binaural signal bacchanal, focusing on the treatment to be suffering the input signal ahead of their preparation to be transformed into three-dimensional sound. Específicamente, se describe cómo dividir Ia señal de entrada según distintas bandas de frecuencia para, una vez dividida Ia señal de entrada, auralizar cada sub-banda y finalmente unirlas para formar los dos canales de salida en formato binaural. Specifically, it describes how to divide the input signal according to different frequency bands, once the input signal divided auralizar each sub-band and finally unite to form the two output channels in binaural format.

DESCRIPCIÓN DE LA INVENCIÓN DESCRIPTION OF THE INVENTION

La presente invención describe un nuevo procedimiento para Ia auralización en tiempo real de audio en formato 5.1. The present invention describes a new process for real-time auralization 5.1 audio format. Para lograr un resultado óptimo, cada canal es tratado y auralizado independientemente, de modo que es posible asignar parámetros acústicos específicos a cada uno de ellos con el objetivo de hacer más realista y espectacular Ia reproducción. For optimum result, each channel is treated and auralizado independently so that you can assign specific acoustic parameters to each order to make more realistic and spectacular Ia reproduction.

Las ventajas más importantes del procedimiento de Ia invención se pueden resumir en las siguientes: The most important advantages of the process of the invention can be summarized as follows:

Se consigue una reproducción óptima en todos los casos, ya que, al estar los auriculares adheridos al usuario, Ia posición relativa entre el sistema de reproducción y el usuario no varía. Optimum playback in every case, since, being attached to the user's headphones, the relative position between the reproduction system and the user does not change is achieved.

El modelo híbrido que se describe, que combina Ia auralización de los canales FL, FR, SL y SR con los canales monofónicos originales C y LFE permite una mayor inteligibilidad de los diálogos, al no existir interferencias entre los canales frontales y el canal C, así como una inmersión superior debido a Ia constante referenciación inconsciente que realiza el cerebro entre el canal C monofónico y los canales auralizados. The hybrid model described, combining Ia auralization of FL, FR, SL and SR with the original mono channels C and LFE channels allows greater intelligibility of the dialogue, in the absence of interference between the front channels and the channel C, as well as a dive superior because Ia constant referencing unconscious brain makes between mono channel C and auralizados channels.

El reajuste de las proporciones de los diferentes tipos de información, mediante Ia separación de fuentes y posterior remezclado, permite optimizar desde el inicio el contenido de los distintos canales para lograr un resultado óptimo. The adjustment of the proportions of the different types of information, through the separation of sources and later remixed, from the beginning to optimize the content of the different channels for optimal results.

La colocación virtual específica de los canales FL y FR, así como el modelado del recinto específico, permiten un perfecto equilibrio con el canal de diálogos C, no interfiriendo con su inteligibilidad y dotando de Ia profundidad justa al plano frontal. The specific virtual placement of FL and FR channel and specific modeling compound, allowing a perfect balance with the dialogue channel C, not interfering with the intelligibility of Ia and providing just the front plane depth.

La colocación virtual específica de los canales SL y SR, así como el modelado de un recinto específico diferente para los canales de los planos delantero y trasero, aportan una sensación de profundidad trasera impactante, dotando al sistema de planos diferenciados de reproducción sonora, creando de este modo una experiencia altamente inmersiva. The specific virtual placement SL and SR channels, as well as modeling of a specific compound for different channels of the front and rear planes, provide a feeling of striking back depth, providing the system with differentiated levels of sound reproduction, creating Thus a highly immersive experience.

El refuerzo del canal LFE permite recrear las sensaciones producidas por las componentes graves en las salas de cine, equilibrando el sistema de reproducción. Strengthening the LFE channel recreates the sensations produced by the serious components in theaters, balancing the playback system.

En el presente documento, el término "auralizar" hace referencia al procesado de los diferentes canales para conseguir que el usuario tenga Ia impresión de que provienen de lugares del espacio concretos, consiguiéndose así una espectacularidad e inteligibilidad optimizadas. Herein, the term "auralizar" refers to the processing of the different channels for the user to have the printing that come from specific parts of space and achieving a spectacular and optimized intelligibility.

Del mismo modo, el término "canal" hace referencia a Ia señal de cada uno de los altavoces que componen el formato de sonido 5.1 o el formato de sonido binaural híbrido. Similarly, the term "channel" refers to the signal of each of the speakers that make the sound format 5.1 or hybrid format binaural sound. Así, hablaremos de los canales FL, FR, C, SL, SR o LFE, que son los canales de entrada en formato 5.1 y de los canales L y R, que son los canales de salida en formato binaural. So, we talk about the channels FL, FR, C, SL, SR and LFE, which are the input channels in 5.1 format and the L and R channels are output channels in binaural format. Se utilizarán las letras "L" y "R" para distinguir entre las posiciones de los canales situadas a Ia izquierda (left, en inglés) y derecha (right, en inglés) del usuario. The letters "L" is used, and "R" to distinguish between the positions of the channels located at Ia left (left,) and right (right, in English) of the user. También se utilizarán los términos "plano frontal" y "plano trasero" para hacer referencia a Ia posición de los canales frente al usuario o detrás del usuario, así como "plano lateral derecho" o "plano lateral izquierdo" para hacer referencia a Ia posición de los canales a los lados del usuario. The terms "front plane" and will also be used "back-up" to refer to the position of the channel to the user or behind the user and "right side up" or "left-back plan" to refer to the position channels on the sides of the user.

Por otro lado, el término "fuente" se refiere a una señal que contiene sonidos de un solo proceso físico, es decir, las fuentes serán, en general, música, voz y efectos. Furthermore, the term "source" refers to a sound signal containing a single physical process, that is, the sources will, in general, music, voice and effects.

Se define también el término "binaural híbrido" como un formato sonoro que mezcla canales auralizados con canales no auralizados o monofónicos. The term "hybrid binaural" is also defined as an audio format that blends no auralizados auralizados channels or mono channels. Concretamente, Ia presente invención mezcla los canales auralizados FL, FR, SL y SR con los canales no auralizados C y LFE. Specifically, the present invention mixes the auralizados channels FL, FR, SL and SR with non auralizados C and LFE channels.

De acuerdo con un aspecto de Ia presente invención, se describe un procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones: According to one aspect of the present invention, a sound conversion process 5.1 format described binaural hybrid, characterized by comprising the following operations:

1 ) Obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido. 1) Obtain the channel signals FL, FR, C, SL, SR and LFE 5.1 format to be converted in binaural hybrid format. La información que contienen estas señales es normalmente una mezcla de varias fuentes, donde: The information contained in these signals is usually a mixture of several sources, where:

FL: contiene principalmente música, y en menor medida voz y efectos. FL, contains mainly music, and less voice and effects.

FR: contiene principalmente música, y en menor medida voz y efectos. FR, it contains mainly music, and less voice and effects. C: contiene principalmente voz, y en menor medida música y efectos. C contains mainly voice and less music and effects. SL: contiene principalmente efectos, y en menor medida música. SL, it contains mainly effects, and less music. SR: contiene principalmente efectos, y en menor medida música. SR, it contains mainly effects, and less music. LFE: contiene únicamente graves. LFE: contains only bass.

2) Auralizar los canales FL, FR, SL y SR en las siguientes posiciones: FL: elevación de 0 o a 30°; 2) Auralizar channels FL, FR, SL and SR in the following positions: FL: elevation of 0 or 30 °; azimut de -10 o a -30°. azimuth of -10 or -30 °.

FR: elevación de 0 o a 30°; FR: elevation of 0 or 30 °; azimut de +10 a +30°. azimuth of +10 to + 30 °.

SL: elevación de 175° a 195°; SL: elevation of 175 ° to 195 °; azimut de -30° a -60°. azimuth of -30 ° to -60 °. SR: elevación de 175° a 195°; SR: elevation of 175 ° to 195 °; azimut de +30° a +60°. azimuth of + 30 ° to + 60 °.

obteniéndose como resultado las señales FLi, FRi, SLi y SRi. obtaining as a result the FLi, Fri, SLi and SRi signals.

Diremos que "auralizar" un canal en una posición determinada significa ubicar virtualmente ese canal de forma que Ia reproducción de las señales resultantes, una para el canal derecho y otra para el canal izquierdo, a través de unos auriculares producen Ia sensación en el usuario de que los sonidos de ese canal provienen de esa posición determinada del espacio. We say that "auralizar" a channel at a given position means that channel virtually locate a way that the reproduction of the resulting signals, one for the right channel and one for the left channel, through headphones produce Ia in the user feeling sounds that come from that particular channel position in space.

Dicho de otro modo, auralizar es un proceso mediante el cual un canal carente de información espacial habitualmente monofónico, como en este caso, es decir, anecoico o seco, es procesado mediante un procedimiento llamado convolución, con Ia respuesta al impulso (respuesta en tiempo y frecuencia a un determinado estímulo acústico proveniente de un determinado punto del espacio) de un determinado oyente. In other words, auralizar is a process by which a channel lacking usually monaural spatial information, as in this case, ie anechoic or dry, is processed through a procedure called convolution with Ia impulse response (response time and often a given acoustic stimulus from a given point in space) of a particular listener.

Sin embargo, debido a las diferencias físicas entre los diferentes usuarios (tamaño, distancia entre los oídos, etc.), no todos ellos responden de igual modo ante los nuevos canales FLi, FRi, SLi y SRi. However, due to the physical differences between the different users (size, distance between the ears, etc.), not all respond the same way to new FLi, Fri, SLi and SRi channels.

Para conocer Ia respuesta de cada tipo de usuario, se modela o se mide Ia respuesta de un determinado receptor (un maniquí o un ser humano por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente ruido de banda ancha emitido desde un determinado punto alrededor del usuario). To know the response of each type of user, is modeled or measured the response of a specific receptor (a dummy or a human being for example) to a pulse signal from a given point in space (usually broadband noise emitted from a point around the user). Ésta respuesta al impulso del usuario se utiliza más tarde para procesar una fuente monofónica (sin información espacial) mediante un proceso de convolución, logrando así el efecto de escuchar dicha fuente situada en el punto donde ha sido emitido el impulso. This user impulse response is later used for processing a mono source (without spatial information) by a convolution process, thus achieving the effect of listening to that source located at the point where the momentum has been issued.

Los inventores han descubierto que situar virtualmente los canales FL, FR, SL y SR dentro de los rangos angulares descritos anteriormente proporciona a todos los usuarios una sensación de espectacularidad óptima. The inventors have discovered that virtually placing the channels FL, FR, SL and SR within the angular ranges described above provides all users a sense of optimum spectacle.

El motivo de que los rangos angulares de los altavoces frontales (FL y FR) no sean muy grandes es evitar Ia pérdida de inteligibilidad del canal de diálogos (C) debido a una imagen estéreo excesiva de Ia música, es decir, que Ia energía del canal FL vaya casi completamente a L y Ia energía de FR vaya casi completamente a R, y evitar Ia llegada de una gran cantidad de energía a los planos laterales, cerca de los oídos que interfiera en Ia localización de los canales del plano trasero (SL y SR). The reason that the angular ranges of the front speakers (FL and FR) are not very large is to prevent the loss of intelligibility channel dialogues (C) because an image excessive stereo Ia music, namely, that the energy of FL channel go almost entirely to the energy of L and go almost completely FR R, Ia and prevent arrival of a lot of energy to the lateral planes, near the ears which interfere with the localization of the backplane channels (SL and SR).

El canal de diálogos (C) no se procesa en Ia operación de procesado de las señales de los canales FL, FR, SL y SR, ya que mantenerlo como fuente aporta dos grandes ventajas a Ia salida final del procedimiento. The channel dialogues (C) is not processed in the operation of signal processing channels FL, FR, SL and SR, and I keep as a source brings two big advantages to the outlet end of the procedure.

La primera de ellas es ganar en inteligibilidad respecto al formato de entrada, ya que al mantener este canal intacto y auralizar los de los planos frontal (FL y FR) y trasero (SL y SR), los diálogos (C) quedan destacados en Ia posición central, reduciendo Ia fatiga auditiva para su seguimiento. The first one is to win in intelligibility for the format input as to keep intact and auralizar those of the front and rear (SL and SR) planes (FL and FR) channel dialogues (C) are featured in Ia center position, thereby reducing the auditory fatigue for monitoring.

La segunda ventaja reside en el hecho de constituir un punto de referencia auditivo para el cerebro, ya que mantener su naturaleza intracraneal hace ideal su combinación con los canales auralizados. The second advantage lies in the fact that it is a point of reference for the auditory brain as they keep their intracranial nature makes it ideal combination with auralizados channels. De este modo, el cerebro compara constantemente Ia posición de este canal con los auralizados, haciendo Ia experiencia auditiva del usuario mucho más espectacular. Thus, the brain constantly compares the position of this channel with auralizados, Ia listening experience of doing much more spectacular user.

El canal LFE tampoco se procesa en esta operación del procedimiento debido a Ia naturaleza no direccional de las frecuencias que contiene, es decir, da Ia sensación de ser escuchado en todas las posiciones. The LFE channel is not processed in this step of the process because Ia non-directional nature of the frequencies it contains, ie Ia gives feeling to be heard in all positions. Esta característica hace que los altavoces destinados a Ia reproducción de este canal puedan ser situados prácticamente en cualquier lugar del recinto. This feature makes the speakers aimed at Ia reproduction of this channel can be located virtually anywhere in the room.

3) Modelar respuestas de recinto independientes para los planos frontal y trasero. 3) Modeling response of independent grounds for the front and rear planes.

Se procesan los canales del plano frontal (FLi, FRi) y trasero (SU , SRi) independientemente utilizando dos respuestas a impulso de recintos optimizados diferentes. The channels and the front plane (FLI Fri) back (SU SRI) independently using two different impulse responses are processed enclosures optimized. El procesado por separado de los canales frontales y traseros aporta Ia ventaja de utilizar dos recintos virtuales diferentes, dotando de mayor profundidad únicamente a los canales traseros, que son los que poseen efectos más espectaculares. The processed separately from the front and rear channels provides the advantage of using two different virtual campuses, providing deeper only to the rear channels, which are those with more spectacular effects. Una profundidad excesiva en los canales delanteros, sin embargo, dificultaría Ia inteligibilidad de los diálogos. Too deeply into the front channels, however, Ia difficult intelligibility of the dialogues.

De acuerdo con realizaciones preferidas de Ia presente invención, Ia reverberación introducida en los canales Fl_i y FRi está dentro del rango de 0,5 segundos a 1 segundo, y Ia reverberación introducida en los canales SU y SRi está dentro del rango de 1 segundo a 3,5 segundos. According to preferred embodiments of the present invention, the input to the reverberation and FRi Fl_i channels is within the range 0.5 seconds to 1 second, and introduced into the reverberation Ia SU and SRi channels is within the range of 1 second to 3.5 seconds.

Así, después de Ia operación de modelar Ia respuesta del recinto se obtienen como salida las señales del plano frontal FL 2 y FR 2 , y las señales del plano trasero SL 2 y SR 2 Thus, after the operation to model the response of the enclosure are obtained as output signals from the frontal plane FL 2 and FR 2 and backplane signals SL 2 and SR 2

4) Mezclar las señales obtenidas en Ia operación anterior junto con las señales LFE y C originales para obtener las señales de salida del canal izquierdo y el canal derecho (L y R). 4) Mix the signals obtained in the previous operation with the LFE and original C signals for the output signals of the left channel and the right channel (L and R).

De acuerdo con una realización preferida de Ia presente invención, el procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, comprende, previamente a Ia operación final de mezcla, comprimir Ia señal del canal LFE, obteniéndose una señal LFE'. According to a preferred embodiment of the present invention, the process of converting a hybrid sound binaural 5.1 format, comprising, prior to mixing Ia final operation, compress the signal of the LFE channel, obtaining a LFE signal '.

Otra realización preferida de Ia invención comprende, previamente a Ia operación de auralización, las operaciones de: Another preferred embodiment of the invention, prior to the operation comprises auralization, the steps of:

a) Separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R. La separación se realiza utilizando un algoritmo de análisis de componentes independientes. a) Separate channel signals FL, FR, C, SL, SR in the sources that compose music L, R music, voice and frontal impact, rear impact and rear impact L R. The separation is performed using an algorithm Independent component analysis. Este análisis realiza una comparación de las distintas entradas (canales) que contienen información redundante en diferentes proporciones. This analysis makes a comparison of the different inputs (channels) that contain redundant information in different proportions. Partiendo de Ia teoría de que varias señales se pueden considerar independientes si proceden de procesos físicos distintos, se logra aislar las distintas componentes, que en este caso son voz, música y efectos. From Ia theory that various signals can be considered independent if they come from different physical processes, it is achieved isolate the various components, which in this case are speech, music and effects.

b) Mezclar las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R para obtener las señales que constituirán Ia entrada a Ia operación subsiguiente de auralización de los canales. b) Mix music sources L, R music, voice and frontal impact, rear impact and rear impact L R for the signals form the input to subsequent operation auralization Ia channels. Esta operación de mezcla reconstruye las señales FL, FR, C, SL y SR con las proporciones óptimas de las fuentes que se separaron en Ia operación anterior. This mixing operation rebuilds FL, FR, C, SL and SR signals with the optimum proportions of the sources separated in the previous operation.

De acuerdo con una realización preferida de Ia presente invención, Ia mezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R para obtener los canales se realiza según los siguientes rangos porcentuales: According to a preferred embodiment of the present invention, the mixture of music sources L, R music, voice and frontal impact, rear impact and rear impact L R for the channels is performed according to the following percentage ranges:

FL .:: 70-90% música L, 30-10% voz y efectos frontales FL. :: Music L 70-90%, 30-10% and frontal effects voice

FR *: 70-90% música R, 30-10% voz y efectos frontales FR *: 70-90% R music, voice and 30-10% frontal impact

C: 70-90% voz y efectos frontales, 30-10% música L y R C: 70-90% and front voice effects, music 30-10% L and R

SL: 70-90% efectos traseros L, 30-10% música L SL: rear effects L 70-90%, 30-10% music L

SR: 7700--9900%% efectos traseros R, 30-10% música R SR: %% rear effects 7700--9900 R, R music 30-10%

El objetivo de estas dos operaciones opcionales es garantizar que cada canal en el proceso de auralización contenga Ia proporción adecuada de las distintas componentes, ya que Ia mezcla original en 5.1 estaba optimizada para su reproducción a través de 6 altavoces físicos, esquema completamente distinto a un par de auriculares. The aim of these optional operations is to ensure that each channel in the process of auralization containing the appropriate proportion of different components as original mixture Ia 5.1 was optimized for playback through 6 physical speakers, a completely different scheme headphones. A Ia hora de reproducir en auriculares, Ia información redundante característica de sistemas cuadrafónicos como el 5.1 obstaculiza Ia percepción de realismo espacial, y por eso es necesario este reajuste. A one hour of play on headphones, Ia feature quadraphonic redundant information systems as hindering 5.1 Ia spatial perception realism, so this adjustment is necessary.

El canal de frecuencias graves LFE ya es en sí mismo una componente independiente, y por tanto su información no es redundante en los demás canales. The low frequency channel LFE is already in itself an independent component, and therefore the information is not redundant in the other channels. Por este motivo no se incluye en las operaciones iniciales opcionales de separación y mezcla. Therefore it is not included in the initial optional separation operations and mixing.

De acuerdo con otro aspecto de Ia invención, ésta se extiende también a programas de ordenador, en particular programas de ordenador en contenidos en una portadora, adaptados para llevar a cabo las operaciones del procedimiento descrito. According to another aspect of the invention, the invention also extends to computer programs, particularly computer programs contained in a carrier, adapted to perform the process steps described. El programa puede estar en forma de código fuente, código objeto o un código intermedio entre el código fuente y el código objeto, como una forma parcialmente compilada, o de cualquier otra forma adecuada para implementar las operaciones de Ia invención. The program may be in source code, object code or an intermediate code between source code and object code, such as a partially compiled form, or any other suitable way to implement the operations of the invention.

La portadora puede ser cualquier dispositivo o entidad capaz de transportar el programa. The carrier may be any entity or device capable of carrying the program. Por ejemplo, Ia portadora puede comprender un medio de almacenamiento, como una ROM, un CD ROM o cualquier otro medio de almacenamiento magnético, por ejemplo un disquete o un disco duro. For example, the carrier may comprise a storage medium such as a ROM, a CD ROM or any other magnetic storage medium, eg a floppy disk or a hard disk. Además, Ia portadora puede ser una portadora de transmisión, como una señal eléctrica u óptica que se pueda comunicar a través de cable eléctrico, óptico, por radio o de cualquier otro modo. Furthermore, the carrier may be a transmission carrier such as an electrical or optical signal that can communicate through electrical cable, optical, radio or otherwise.

Alternativamente, Ia portadora puede ser un circuito integrado en el que está almacenado el programa, estando el circuito adaptado para efectuar las operaciones del procedimiento. Alternatively, Ia carrier may be an integrated circuit in which the program is stored, being adapted to perform the operations of the process circuit. En particular, podría ser un ASIC, una FPGA, un DSP, un microprocesador o un microcontrolador. In particular, it could be an ASIC, an FPGA, a DSP, a microprocessor or microcontroller.

DESCRIPCIÓN DE LOS DIBUJOS Para complementar Ia descripción que se está realizando y con objeto de ayudar a una mejor comprensión de las características de Ia invención, de acuerdo con un ejemplo preferente de realización práctica de Ia misma, se acompaña como parte integrante de dicha descripción, un juego de dibujos en donde con carácter ilustrativo y no limitativo, se ha representado Io siguiente: DESCRIPTION OF THE DRAWINGS To complement the description being made and in order to aid a better understanding of the features of the invention according to a preferred practical embodiment thereof, is attached as an integral part of said description, a set of drawings that are illustrative and not limiting, the following has been represented:

Figura 1.- Muestra una vista de Ia ubicación de los altavoces físicos de un cine en un formato sonoro 5.1. Figure 1 shows a view of the physical location of the speakers of a film on a 5.1 sound format.

Figura 2.- Muestra un esquema explicativo de Ia posición de los ángulos de elevación (α) y de azimut (β). 2 shows an explanatory diagram of the position of the elevation angles (α) and azimuth (β).

Figura 3.- Muestra un esquema general de las operaciones del procedimiento de acuerdo con Ia presente invención. Figure 3 shows an overview of the operations of the method according to the present invention.

REALIZACIÓN PREFERENTE DE LA INVENCIÓN PREFERRED EMBODIMENT OF THE INVENTION

Se parte del sonido original de una película en formato 5.1 que se desea convertir en binaural híbrido, que en este caso está grabado en un disco de tipo It is part of the original sound of a movie in 5.1 format to be converted into hybrid binaural, which in this case is engraved on a disc type

DVD. DVD. La Figura 1 muestra Ia posición de los altavoces de los canales en una sala de cine con relación a Ia posición en Ia que debe estar situado el usuario para una experiencia sonora óptima. Figure 1 shows the position of the speaker channels in a movie theater regarding Ia position in which the user should be located for optimal sound experience.

En este ejemplo, el procedimiento Io efectúa un ordenador que, en primer lugar, como se muestra en Ia Figura 3, obtiene a partir del DVD las señales de los canales originales en formato 5.1 (FL, FR, C, SL, SR, LFE). In this example, the Io makes a computer process, first, as shown in Figure 3 DVD obtained from the signals of the original channels in 5.1 format (FL, FR, C, SL, SR, LFE ). El canal LFE es separado para ser procesado en paralelo de modo independiente, sufriendo únicamente una compresión que da como resultado Ia señal LFE'. The LFE channel is separated for parallel processing independently, suffering only compression that results in the signal LFE.

En este ejemplo, se proporciona un selector (S) que permite que el usuario seleccione o no las operaciones opcionales de extraer las fuentes de los canales originales y remezclarlas de acuerdo con unas proporciones nuevas para realzar Ia espectacularidad de Ia película. In this example, a selector (S) which allows the user to select or remove optional operations sources and remixing the original channels according to a new proportions to enhance spectacle Ia of the film is provided. Para ello, se separan Ia fuentes (música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R), por ejemplo utilizando el algoritmo de separación de fuentes por análisis de componentes independientes 'FastICA', desarrollado por el HUT (Helsinki University of Technology), para volver a mezclarlos de acuerdo con unas proporciones nuevas optimizadas. To that end, the sources (music L, R music, voice and frontal impact, rear impact and rear impact R L) are separated, for example using the source separation algorithm for independent component analysis 'FastICA', developed by the HUT (Helsinki University of Technology), to re-mix them according to a new optimized proportions. En este ejemplo supondremos que Ia película es de acción, Io cual implica Ia existencia de una serie de características sonoras, como explosiones, tiros, ruido de motores, etc. In this example we assume that action Ia film is, Io which implies the existence of a series of sound characteristics, such as explosions, shots, engine noise, etc. Para conseguir Ia mayor espectacularidad posible en este tipo de películas, se han determinado las siguientes proporciones óptimas de mezcla: To get more spectacular Ia possible in these films, they were determined the following optimal mixing ratios:

FL': 80% música L + 20% voz y efectos frontales FR': 80% música R + 20% voz y efectos frontales FL ': 80% + 20% L music voice and frontal impact FR': 80% + 20% R music voice and frontal impact

C: 80% voz y efectos frontales + 20% música L y R C: 80% front voice and music effects + 20% L and R

SL': 80% efectos traseros L + 20% música L SL ': 80% rear effects + 20% L Music L

SR': 80% efectos traseros R + 20% música R SR ': 80% rear effects music R + 20% R

Una vez mezcladas las fuentes en los canales de este modo optimizado, se separa el canal de diálogos (C) del resto, los canales FL', FR', SL' y SR' son auralizados cada uno de ellos en una situación geométrica óptima para realzar Ia espectacularidad de Ia experiencia sonora del usuario. Once mixed fonts channels of this optimized mode, channel dialogues (C) the rest is removed, the FL 'FR', SL 'and SR are auralizados each in an optimal geometric situation Ia Ia enhance sound spectacular user experience. En este caso, se ha considerado que el oyente tiene las características de un usuario estándar basado en las respuestas al impulso de un maniquí Kemar. In this case, it was considered that the listener has the characteristics of a standard user based on the impulse responses of a Kemar mannequin.

A continuación se presentan las posiciones óptimas de los canales, descritas a través del ángulo de elevación (α) y del ángulo de azimut (β) que forman con el oyente: Then optimal channel positions, described through the elevation angle (α) and azimuth angle (β) that form with the listener are presented:

FL': elevación 15°; FL ': elevation 15 °; azimut -20° -20 ° Azimuth

FR': elevación 15°; FR ': elevation 15 °; azimut 20° SL': elevación 180°; azimuth 20 ° SL ': lifting 180 °; azimut -40° SR': elevación 180°; Azimuth -40 ° SR ": elevated 180 °; azimut 40° azimuth 40 °

La Figura 2 muestra Ia referencia de Ia ubicación de los ángulos de elevación y azimut, respectivamente α y β. Figure 2 shows the location of Ia reference elevation angles and azimuth, respectively α and β. Después de Ia operación de auralización, se obtienen las señales FL'i, FR'i , SL'i y SRV A continuación, se procesan las señales FL'i y FR'i con Ia respuesta al impulso de un recinto similar a una sala de cine, con un tiempo de reverberación (T r ) de 0,5 segundos aproximadamente; After the operation of auralization, the FL'i, FR'i, SRV SL'i and then signals are obtained, the FL'i and FR'i signals are processed with the response to the impulse of a similar enclosure to a room cinema, with a reverberation time (T r) of about 0.5 seconds; y las señales SL'i y SR'i con Ia respuesta al impulso de otro recinto similar a una sala de cine diferente, con un tiempo de reverberación de 2 segundos aproximadamente. and SL'i and SR'i signals Ia impulse response similar to a cinema hall different grounds, a reverberation time of about 2 seconds.

Finalmente, se mezclan los canales obtenidos en Ia operación anterior, FL'2, FR'2, SL'2 y SR'2 con los canales LFE' y C para obtener únicamente dos señales en formato binaural híbrido correspondientes a los canales L y R de unos auriculares. Finally, channels obtained in the above operation, FL'2, FR'2, SL'2 and SR'2 with LFE and C channels for only two binaural hybrid format signals corresponding to the L and R channels are mixed headphones.

Patent Citations
Cited PatentFiling datePublication dateApplicantTitle
WO2007123788A2 *3 Apr 20071 Nov 2007Srs Labs IncAudio signal processing
EP1816890A1 *30 Jan 20078 Aug 2007Sony CorporationAudio reproducing system and method thereof
US5742689 *4 Jan 199621 Apr 1998Virtual Listening Systems, Inc.Method and device for processing a multichannel signal for use with a headphone
US6002775 *14 Aug 199814 Dec 1999Sony CorporationMethod and apparatus for electronically embedding directional cues in two channels of sound
Non-Patent Citations
Reference
1 *'Neural Networks, 2005. Proceedings. 2005 IEEE International Joint Conference on Montreal', vol. 2, QUE., CANADA. article CIARAMEL THE A.: 'BSS toolbox for delayed and convolved mixtures', pages 1245 - 1250
2 *TECHNOLOGIES FOR PRESENTATION OF SORROUND-SOUND IN HEADPHONES., [Online] 17 December 2007, Retrieved from the Internet: <URL:http://www. headwize.com/tech/sshd_ tech.htm> [retrieved on 2009-03-23]
Classifications
International ClassificationH04S3/00
Cooperative ClassificationH04S2400/01, H04S3/008
European ClassificationH04S3/00D
Legal Events
DateCodeEventDescription
16 Feb 2011122Ep: pct app. not ent. europ. phase
Ref document number: 08870792
Country of ref document: EP
Kind code of ref document: A1
20 Jul 2010NENPNon-entry into the national phase in:
Ref country code: DE
16 Sep 2009121Ep: the epo has been informed by wipo that ep was designated in this application
Ref document number: 08870792
Country of ref document: EP
Kind code of ref document: A1