Search Images Play YouTube Gmail Drive Calendar Translate More »
Sign in
Screen reader users: click this link for accessible mode. Accessible mode has the same essential features but works better with your reader.

Patents

  1. Advanced Patent Search
Publication numberWO2009090281 A1
Publication typeApplication
Application numberPCT/ES2008/070246
Publication date23 Jul 2009
Filing date30 Dec 2008
Priority date17 Jan 2008
Publication numberPCT/2008/70246, PCT/ES/2008/070246, PCT/ES/2008/70246, PCT/ES/8/070246, PCT/ES/8/70246, PCT/ES2008/070246, PCT/ES2008/70246, PCT/ES2008070246, PCT/ES200870246, PCT/ES8/070246, PCT/ES8/70246, PCT/ES8070246, PCT/ES870246, WO 2009/090281 A1, WO 2009090281 A1, WO 2009090281A1, WO-A1-2009090281, WO2009/090281A1, WO2009090281 A1, WO2009090281A1
InventorsArrondo Ivan Portas
ApplicantAuralia Emotive Media Systems, Arrondo Ivan Portas
Export CitationBiBTeX, EndNote, RefMan
External Links: Patentscope, Espacenet
Method of converting 5.1 sound format to hybrid binaural format
WO 2009090281 A1
Abstract
Method of converting 5.1 sound format to hybrid binaural format, comprising obtaining the signals from the FL, FR, C, SL, SR and LFE channels in 5.1 format which it is desired to convert into hybrid binaural format; auralizing the FL, FR, SL and SR channels in the following positions: FL: elevation from 0° to 30°, azimuth from -10° to -30°; FR: elevation from 0° to 30°, azimuth from +10° to +30°; SL: elevation from 175° to 195°, azimuth from -30° to -60°; SR: elevation from 175° to 195°, azimuth from +30° to +60°, thus obtaining the signals FL1, FR1, SL1 and SR1; modelling the response from the enclosure on the basis of the signals, introducing a reverberation effect; and mixing the signals FL2, FR2, SL2 and SR2 obtained in the previous step with the original LFE and C signals to obtain the two left and right output signals.
Claims  translated from Spanish  (OCR text may contain errors)

REIVINDICACIONES CLAIMS

1. 1. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones Format Conversion Procedure 5.1 to binaural sound hybrid, comprising the following operations

obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido; signals to obtain the FL, FR, C, SL, SR and LFE 5.1 format you want to convert binaural hybrid format;

auralizar los canales FL, FR, SL y SR en las siguientes posiciones: auralizar the FL, FR, SL and SR in the following positions:

FL: elevación de 0 o a 30°; azimut de -10 o a -30°. FL: elevation of 0 or 30 °, azimuth of -10 or -30 °.

FR: elevación de 0 o a 30°; azimut de +10 a +30°. FR: elevation of 0 or 30 °, azimuth of +10 to +30 °.

SL: elevación de 175° a 195°; azimut de -30° a -60°. SL: elevation of 175 ° to 195 °; azimuth of -30 ° to -60 °.

SR: elevación de 175° a 195°; azimut de +30° a +60°, SR: elevation of 175 ° to 195 °, azimuth +30 ° to +60 °,

obteniéndose como resultado las señales FLi, FRi, SLi y SRi; signals yielding results FLi, FRi, SLi and SRi;

procesar independientemente las señales del plano frontal (FLi y FRi) y las del plano trasero (SLi y SRi), utilizando para ello, las respuestas a impulso de dos recintos virtuales diferentes, optimizados cada uno de ellos para dichos planos, obteniéndose como resultado las señales FL 2 , FR 2 , SL 2 y SR 2 ; independently process signals from the frontal plane (FLi and FRi) and backplane (SLi and SRi), using the answers to boost two different virtual campuses, each optimized for these plans, obtaining as a result the signals FL 2 FR 2, SL 2 and SR 2;

mezclar las señales FL 2 , FR 2 , SL 2 y SR 2 obtenidas en Ia operación anterior junto con las señales originales LFE y C para obtener las dos señales de salida izquierda y derecha. blending two signals FL, FR 2, SL 2 and SR 2 obtained above in the operation together with the original signals C and LFE to obtain two output signals left and right.

2. Two. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque las respuestas a impulso de los recintos virtuales utilizados para el procesado del plano frontal y trasero, comprenden tiempos de reverberación de entre 0,5 sy 1 s para el primero, y de entre 1 sy 3,5 s para el segundo. Format conversion process 5.1 to binaural sound hybrid according to the previous claim, wherein the impulse responses of the enclosures used for processing virtual plane front and rear comprise reverberation time of 0.5 s and 1 s for the first, and between 1 s and 3.5 s for the second.

3. Three. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque comprende, previamente a Ia operación final de mezcla, una compresión del canal LFE. Format conversion process 5.1 to binaural sound hybrid according to any preceding claim, comprising prior to the operation end of mixing, compression of the LFE channel.

4. April. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque antes de Ia operación de auralización comprende las operaciones de: Format conversion process 5.1 to binaural sound hybrid according to any of the preceding claims, wherein before the operation of auralisation comprising the steps of:

separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen: música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R; separate the signals of the FL, FR, C, SL, SR in the sources that comprise: Music L, R music, voice and frontal impact, rear impact and effects L rear R;

remezclar las fuentes estimadas en proporciones optimizadas para procesos posteriores, reconstruyendo los canales FL, FR, C, SL y SR. remix proportions estimated sources optimized for subsequent processes, rebuilding the FL, FR, C, SL and SR.

5. May. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque Ia operación de remezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R se realiza de acuerdo con los siguientes rangos porcentuales: Format conversion process 5.1 to binaural sound hybrid according to the previous claim, wherein the operation remix music sources L, R music, voice and frontal impact, rear effects and effects rear L R is performed according to the following percentage ranges:

FL .:: 70-90% música L, 30-10% voz y efectos frontales FL. :: Music L 70-90%, 30-10% and voice frontal impact

FR *: 70-90% música R, 30-10% voz y efectos frontales FR *: 70-90% R music, voice, and effects 30 to 10% frontal

C: 70-90% voz y efectos frontales, 30-10% música L y R C: 70-90% frontal impact voice, music 30-10% L and R

SL: 70-90% efectos traseros L, 30-10% música L SL: 70-90% rear effects L, 30-10% Music L

SR: 7700--9900%% efectos traseros R, 30-10% música R SR: 7700 - 9900%% R rear effects, music R 30-10%

6. June. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque es llevado a cabo por uno dispositivo de entre los de Ia siguiente lista: un ASIC, una FPGA, un DSP, un microprocesador y un microcontrolador. Format conversion process 5.1 to binaural sound hybrid according to the previous claim, characterized in that it is carried out by one device from the following list of Ia: an ASIC, an FPGA, a DSP, a microprocessor and a microcontroller.

7. July. Programa de ordenador que comprende instrucciones de programa que provocan que un ordenador lleve a cabo las operaciones del método de acuerdo con cualquiera de las reivindicaciones anteriores. Computer program comprising program instructions that cause a computer to perform the method steps according to any preceding claim.

8. August. Programa de ordenador de acuerdo con Ia reivindicación 7, caracterizado porque está almacenado en unos medios de almacenamiento. Computer program according to claim 7, wherein is stored in a storage means.

9. 9. Programa de ordenador de acuerdo con Ia reivindicación 7, caracterizado porque se transmite a través de una señal portadora. Computer program according to claim 7, characterized by transmitting via a carrier signal.

Description  translated from Spanish  (OCR text may contain errors)

PROCEDIMIENTO DE CONVERSIÓN DE FORMATO SONORO 5.1 A FORMAT CONVERSION PROCEDURE 5.1 SOUND

BINAURAL HÍBRIDO HYBRID BINAURAL

DESCRIPCI Ó N Narrative

OBJETO DE LA INVENCIÓN OBJECT OF THE INVENTION

El objeto principal de Ia presente invención es un procedimiento para convertir sonido en formato sonoro 5.1 , habitualmente utilizado para registro y reproducción sonora digital de contenido cinematográfico, en formato binaural híbrido. The main object of the present invention is a process for converting sound into 5.1 sound format, commonly used for sound recording and reproducing digital cinema content, binaural hybrid format.

ANTECEDENTES DE LA INVENCIÓN BACKGROUND OF THE INVENTION

Actualmente, el formato 5.1 representa el estándar para Ia reproducción sonora doméstica de cine. Currently, the 5.1 format standard Ia represents domestic film sound reproduction. Un sistema sonoro en formato 5.1 está compuesto por seis canales de audio donde se mezclan en distintas proporciones las señales de música, voz, efectos sonoros, etc. A 5.1 sound system format consists of six audio channels which are mixed in different proportions signals from music, voice, sound effects, etc.. Cada uno de los canales corresponde a un altavoz, ya su vez cada uno de los altavoces debe estar situado en una ubicación concreta con relación al usuario para conseguir una sensación sonora óptima. Each channel corresponds to a speaker, and in turn each of the speakers must be placed in a specific location relative to the user to achieve optimum sound sensation.

Los altavoces principales (FL y FR en Ia Figura 1 ) forman idealmente un triángulo equilátero con Ia posición del usuario (O). The main speakers (FL and FR in Figure 1) are ideally an equilateral triangle with the position of the user (O). Además, las rectas formadas por los altavoces envolventes (SL y SR) y el usuario (O) forman un ángulo de aproximadamente 110° con respecto al eje vertical (recta que une O y C). Furthermore, the lines formed by the surround speakers (SL and SR) and the user (O) forming an angle of approximately 110 ° relative to the vertical axis (line connecting O and C). El altavoz LFE (Low Frequency Enhancement, en sus siglas en inglés), tiene por objeto realzar los sonidos graves para producir un efecto impactante en Ia reproducción. The speaker LFE (Low Frequency Enhancement, its acronym in English), is to enhance the bass sound to produce a striking effect on reproduction Ia. Su ubicación no es determinante, ya que Ia información que transmite tiene un espectro de frecuencias generalmente menor de 100 Hz, que tiene una naturaleza omnidireccional. Its location is not conclusive as the information transmitted Ia has a spectrum of frequencies generally below 100 Hz, which has an omnidirectional nature. Es decir, no se puede determinar de donde proviene el sonido. I mean, you can not determine where the sound comes.

Un inconveniente de los sistemas de audio basados en el formato 5.1 es que la sensación sonora del usuario se deteriora rápidamente cuando éste no está situado en Ia ubicación óptima con respecto de los altavoces. A drawback of systems based audio 5.1 format is that the user audible sensation quickly deteriorates when it is not located in Ia optimum location with respect to the speakers. La utilización de auriculares permite, sin embargo, una colocación óptima del usuario en todo momento, ya que los sistemas de reproducción sonora, al estar adheridos a Ia cabeza del usuario, no modifican su posición relativa respecto a su cabeza. Using headphones can, however, optimal placement of the user at all times, since the playback systems, being attached to the head of the user, do not change their position relative to the head.

Sin embargo, el ser humano es un receptor sonoro volumétrico, es decir, procesa el sonido que llega a él a través de, por ejemplo, reflexiones creadas por los hombros y el torso, o difracciones creadas por el sonido al rodear Ia cabeza. However, the human being is a volumetric sound receiver, ie processes sound that reaches him through, for example, reflections created by the shoulders and torso, or diffractions created by the surround sound to the head. La audición humana es por naturaleza binaural, donde Ia resultante de todo el proceso de recepción sonora termina en dos únicos canales: oído derecho y oído izquierdo. Human hearing is binaural nature, wherein the resultant of the entire sound receiving process ends in only two channels: right ear and left ear. El término "binaural" hace referencia a Ia naturaleza de Ia audición humana, debido a que las personas somos capaces de captar toda Ia información espacial sonora a través de un único par de oídos. The term "binaural" refers to the nature of human hearing Ia because people are able to capture all of the information space sound through a single pair of ears.

Cuando no se tiene en cuenta esta fenomenología se suele producir el denominado "sonido intracraneal", como por ejemplo al escuchar sonido estéreo tradicional a través de auriculares. When you consider this phenomenology is usually produced called "intracranial sound", such as traditional stereo sound when listening through headphones. El sonido intracraneal consiste en Ia sensación de que las fuentes sonoras se encuentran en el interior del cráneo del usuario, en un punto situado entre los dos auriculares, por Io que el sonido estéreo tradicional no es un formato aconsejable cuando se tratan de representar de forma realista espacios sonoros tridimensionales. Intracranial sound consists of the feeling that the sound sources are located within the skull of the user, at a point located between the two earphones, for which reason the traditional stereo format is not desirable when trying to represent such realistic three-dimensional sound spaces.

Existen fundamentalmente dos formas de lograr reproducciones binaurales: There are essentially two ways to achieve binaural reproductions:

La primera de ellas consiste en sustituir el par de receptores puntuales que se utiliza habitualmente por receptores volumétricos, como maniquíes, logrando de ese modo que el sonido que llega a ellos se procese de forma natural. The first one is to replace the point-receiver pair that is typically used for volumetric receivers like mannequins, thereby achieving the sound that reaches them is processed naturally. De este modo se logra una grabación estéreo binaural, donde queda ya introducida toda Ia fenomenología descrita anteriormente. Thus achieves a binaural stereo recording, where it is introduced as described above all phenomenology Ia.

La segunda se basa en realizar un procedimiento de auralización. The second is based on performing a procedure of auralisation. Para ello, se suele medir o modelar Ia respuesta de un determinado receptor (un maniquí o un ser humano, por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente un ruido de banda ancha emitido desde un determinado punto alrededor del usuario). For this purpose, usually measured or model the response of a given receptor (a dummy or a human, for example) to a pulse signal from a specific point in space (usually broadband noise emitted from a certain point about the user). La patente US 2007213990 describe un método para transformar una señal estéreo bacanal tradicional en una señal binaural, centrándose en el tratamiento que debe sufrir Ia señal de entrada de cara a su preparación para ser transformada en sonido tridimensional. Patent U.S. 2007213990 describes a method for transforming a traditional stereo signal bacchanal a binaural signal, focusing on the treatment to be suffering the input signal in the face of their preparation to be transformed into three-dimensional sound. Específicamente, se describe cómo dividir Ia señal de entrada según distintas bandas de frecuencia para, una vez dividida Ia señal de entrada, auralizar cada sub-banda y finalmente unirlas para formar los dos canales de salida en formato binaural. Specifically, it describes how to divide the input signal according to different frequency bands, once divided the input signal, auralizar each sub-band and finally unite to form the two output channels binaural format.

DESCRIPCIÓN DE LA INVENCIÓN DESCRIPTION OF THE INVENTION

La presente invención describe un nuevo procedimiento para Ia auralización en tiempo real de audio en formato 5.1. The present invention describes a new method for the real-time auralization in 5.1 audio. Para lograr un resultado óptimo, cada canal es tratado y auralizado independientemente, de modo que es posible asignar parámetros acústicos específicos a cada uno de ellos con el objetivo de hacer más realista y espectacular Ia reproducción. To achieve optimum results, each channel is treated and auralizado independently so that you can assign specific acoustic parameters to each of them in order to make more realistic and spectacular playback Ia.

Las ventajas más importantes del procedimiento de Ia invención se pueden resumir en las siguientes: The most important advantages of the method of the invention can be summarized as follows:

Se consigue una reproducción óptima en todos los casos, ya que, al estar los auriculares adheridos al usuario, Ia posición relativa entre el sistema de reproducción y el usuario no varía. Optimal reproduction is achieved in all cases, since, by being attached to the headset user, the relative position between the reproduction system and the user does not change.

El modelo híbrido que se describe, que combina Ia auralización de los canales FL, FR, SL y SR con los canales monofónicos originales C y LFE permite una mayor inteligibilidad de los diálogos, al no existir interferencias entre los canales frontales y el canal C, así como una inmersión superior debido a Ia constante referenciación inconsciente que realiza el cerebro entre el canal C monofónico y los canales auralizados. The hybrid model is described, which combines the auralization of the FL, FR, SL and SR with the original mono channels C and LFE allows greater intelligibility of dialogues, in the absence of interference between the front channels and the channel C, and higher immersion due to the constant referencing unconscious brain makes between the channel and the channel C auralizados monophonic.

El reajuste de las proporciones de los diferentes tipos de información, mediante Ia separación de fuentes y posterior remezclado, permite optimizar desde el inicio el contenido de los distintos canales para lograr un resultado óptimo. The readjustment of the proportions of different types of information, through the separation of sources and later remixed, from the beginning to optimize the content of the different channels to achieve optimal results.

La colocación virtual específica de los canales FL y FR, así como el modelado del recinto específico, permiten un perfecto equilibrio con el canal de diálogos C, no interfiriendo con su inteligibilidad y dotando de Ia profundidad justa al plano frontal. Placing specific virtual channels FL and FR, and specific modeling compound, allowing a perfect equilibrium with the dialogue channel C, not interfering with the intelligibility of the depth and providing just the frontal plane.

La colocación virtual específica de los canales SL y SR, así como el modelado de un recinto específico diferente para los canales de los planos delantero y trasero, aportan una sensación de profundidad trasera impactante, dotando al sistema de planos diferenciados de reproducción sonora, creando de este modo una experiencia altamente inmersiva. Specific virtual placement SL and SR channels, as well as modeling a specific site different channels for front and rear planes, provide a striking sense of depth back, providing the system with different levels of sound reproduction, creating Thus highly immersive experience.

El refuerzo del canal LFE permite recrear las sensaciones producidas por las componentes graves en las salas de cine, equilibrando el sistema de reproducción. The LFE channel reinforcement to recreate the sensations produced by the serious components theaters, balancing the reproductive system.

En el presente documento, el término "auralizar" hace referencia al procesado de los diferentes canales para conseguir que el usuario tenga Ia impresión de que provienen de lugares del espacio concretos, consiguiéndose así una espectacularidad e inteligibilidad optimizadas. Herein, the term "auralizar" refers to the processing of the different channels for the user having the printing of which come from parts of the specific space, thus achieving optimized spectacular and intelligibility.

Del mismo modo, el término "canal" hace referencia a Ia señal de cada uno de los altavoces que componen el formato de sonido 5.1 o el formato de sonido binaural híbrido. Similarly, the term "channel" refers to the signal from each of the speakers that make up the 5.1 sound format or hybrid binaural sound format. Así, hablaremos de los canales FL, FR, C, SL, SR o LFE, que son los canales de entrada en formato 5.1 y de los canales L y R, que son los canales de salida en formato binaural. So, talk about the FL, FR, C, SL, SR and LFE, which are the input channels in 5.1 and the L and R, which are the output channels binaural format. Se utilizarán las letras "L" y "R" para distinguir entre las posiciones de los canales situadas a Ia izquierda (left, en inglés) y derecha (right, en inglés) del usuario. He used the letters "L" and "R" to distinguish between channel positions located left Ia (left,) and right (right, in English) of the user. También se utilizarán los términos "plano frontal" y "plano trasero" para hacer referencia a Ia posición de los canales frente al usuario o detrás del usuario, así como "plano lateral derecho" o "plano lateral izquierdo" para hacer referencia a Ia posición de los canales a los lados del usuario. Also use the terms "frontal plane" and "backplane" to refer to the position of the channels before users or behind the user, as well as "right side up" or "left lateral plane" to refer to the position the channels on the sides of the wearer.

Por otro lado, el término "fuente" se refiere a una señal que contiene sonidos de un solo proceso físico, es decir, las fuentes serán, en general, música, voz y efectos. Furthermore, the term "source" refers to a sound signal containing a single physical process, ie the sources will, in general, music, voice and effects.

Se define también el término "binaural híbrido" como un formato sonoro que mezcla canales auralizados con canales no auralizados o monofónicos. It also defines the term "hybrid binaural" sound as a format that mixes auralizados channels with auralizados or monophonic channels. Concretamente, Ia presente invención mezcla los canales auralizados FL, FR, SL y SR con los canales no auralizados C y LFE. Specifically, the present invention mixture auralizados channels FL, FR, SL and SR with C auralizados channels and LFE.

De acuerdo con un aspecto de Ia presente invención, se describe un procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones: According to one aspect of the present invention describes a method of converting 5.1 to binaural sound format hybrid, comprising the following operations:

1 ) Obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido. 1) Get the signs of the FL, FR, C, SL, SR and LFE 5.1 format to be converted on hybrid binaural format. La información que contienen estas señales es normalmente una mezcla de varias fuentes, donde: The information contained in these signals is usually a mixture of various sources, wherein:

FL: contiene principalmente música, y en menor medida voz y efectos. FL: contains mostly music, and less voice and effects.

FR: contiene principalmente música, y en menor medida voz y efectos. FR: primarily contains music, and less voice and effects. C: contiene principalmente voz, y en menor medida música y efectos. C contains mainly voice and less music and effects. SL: contiene principalmente efectos, y en menor medida música. SL contains mainly effects, and less music. SR: contiene principalmente efectos, y en menor medida música. SR contains mainly effects, and less music. LFE: contiene únicamente graves. LFE: contains only serious.

2) Auralizar los canales FL, FR, SL y SR en las siguientes posiciones: FL: elevación de 0 o a 30°; azimut de -10 o a -30°. 2) Auralizar the FL, FR, SL and SR in the following positions: FL: elevation of 0 or 30 °, azimuth of -10 or -30 °.

FR: elevación de 0 o a 30°; azimut de +10 a +30°. FR: elevation of 0 or 30 °, azimuth of +10 to +30 °.

SL: elevación de 175° a 195°; azimut de -30° a -60°. SL: elevation of 175 ° to 195 °; azimuth of -30 ° to -60 °. SR: elevación de 175° a 195°; azimut de +30° a +60°. SR: elevation of 175 ° to 195 °, azimuth +30 ° to +60 °.

obteniéndose como resultado las señales FLi, FRi, SLi y SRi. signals yielding results FLi, FRi, SLi and SRi.

Diremos que "auralizar" un canal en una posición determinada significa ubicar virtualmente ese canal de forma que Ia reproducción de las señales resultantes, una para el canal derecho y otra para el canal izquierdo, a través de unos auriculares producen Ia sensación en el usuario de que los sonidos de ese canal provienen de esa posición determinada del espacio. Say that "auralizar" a channel at a certain position means that virtually locate a way that the channel reproduction resulting signals, one for the right channel and one for the left channel, through headphones produce Ia in the user feeling sounds from that channel comes from that particular position in space.

Dicho de otro modo, auralizar es un proceso mediante el cual un canal carente de información espacial habitualmente monofónico, como en este caso, es decir, anecoico o seco, es procesado mediante un procedimiento llamado convolución, con Ia respuesta al impulso (respuesta en tiempo y frecuencia a un determinado estímulo acústico proveniente de un determinado punto del espacio) de un determinado oyente. Put another way, auralizar is a process whereby a spatial information channel typically devoid monophonic, as in this case, ie anechoic or dry, is processed by a procedure called convolution with Ia impulse response (response time and a specific frequency acoustic stimulus from a given point in space) of a particular listener.

Sin embargo, debido a las diferencias físicas entre los diferentes usuarios (tamaño, distancia entre los oídos, etc.), no todos ellos responden de igual modo ante los nuevos canales FLi, FRi, SLi y SRi. However, due to the physical differences between the different users (size, distance between the ears, etc..), Not all respond the same way to new channels FLi, FRi, SLi and SRi.

Para conocer Ia respuesta de cada tipo de usuario, se modela o se mide Ia respuesta de un determinado receptor (un maniquí o un ser humano por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente ruido de banda ancha emitido desde un determinado punto alrededor del usuario). The response for each user type, is modeled or measured the response of a given receptor (a dummy or a human, for example) to a pulse signal from a given point in space (usually broadband noise emitted from a certain point around the user). Ésta respuesta al impulso del usuario se utiliza más tarde para procesar una fuente monofónica (sin información espacial) mediante un proceso de convolución, logrando así el efecto de escuchar dicha fuente situada en el punto donde ha sido emitido el impulso. This user impulse response is later used to process a mono source (no spatial information) through a convolution process, thus achieving the effect of listening to such source located at the point where the momentum has been issued.

Los inventores han descubierto que situar virtualmente los canales FL, FR, SL y SR dentro de los rangos angulares descritos anteriormente proporciona a todos los usuarios una sensación de espectacularidad óptima. The inventors have discovered that virtually placing the channels FL, FR, SL and SR within the angular ranges described above provides all users an optimum spectacle feeling.

El motivo de que los rangos angulares de los altavoces frontales (FL y FR) no sean muy grandes es evitar Ia pérdida de inteligibilidad del canal de diálogos (C) debido a una imagen estéreo excesiva de Ia música, es decir, que Ia energía del canal FL vaya casi completamente a L y Ia energía de FR vaya casi completamente a R, y evitar Ia llegada de una gran cantidad de energía a los planos laterales, cerca de los oídos que interfiera en Ia localización de los canales del plano trasero (SL y SR). The reason that the angular ranges of the front speakers (FL and FR) are not too large is to avoid the loss of intelligibility dialogue channel (C) due to excessive stereo image Ia music, ie the energy of the FL channel go almost completely the energy of L and go almost completely FR R, Ia and prevent arrival of a large amount of energy to the lateral planes, close to the ears to interfere with the localization of backplane channels (SL and SR).

El canal de diálogos (C) no se procesa en Ia operación de procesado de las señales de los canales FL, FR, SL y SR, ya que mantenerlo como fuente aporta dos grandes ventajas a Ia salida final del procedimiento. The dialogue channel (C) not processed in the operation for signal processing of the FL, FR, SL and SR, and to keep it as source provides two major advantages to the outlet end of the procedure.

La primera de ellas es ganar en inteligibilidad respecto al formato de entrada, ya que al mantener este canal intacto y auralizar los de los planos frontal (FL y FR) y trasero (SL y SR), los diálogos (C) quedan destacados en Ia posición central, reduciendo Ia fatiga auditiva para su seguimiento. The first one is to win in intelligibility compared to input format, since this channel to keep intact and the planes auralizar the front (FL and FR) and rear (SL and SR), dialogues (C) are highlighted in Ia central position, thereby reducing the auditory fatigue monitoring.

La segunda ventaja reside en el hecho de constituir un punto de referencia auditivo para el cerebro, ya que mantener su naturaleza intracraneal hace ideal su combinación con los canales auralizados. The second advantage lies in the fact that it is a reference point for the brain auditory, since maintaining intracranial nature makes it ideal combination with auralizados channels. De este modo, el cerebro compara constantemente Ia posición de este canal con los auralizados, haciendo Ia experiencia auditiva del usuario mucho más espectacular. Thus, the brain constantly compares the position of this channel with auralizados making Ia user listening experience more spectacular.

El canal LFE tampoco se procesa en esta operación del procedimiento debido a Ia naturaleza no direccional de las frecuencias que contiene, es decir, da Ia sensación de ser escuchado en todas las posiciones. The LFE channel is not processed in this step of the process due to the directional nature containing frequencies, ie Ia gives feeling to be heard in all positions. Esta característica hace que los altavoces destinados a Ia reproducción de este canal puedan ser situados prácticamente en cualquier lugar del recinto. This feature makes the speakers designed to reproduce this channel Ia can be located virtually anywhere in the enclosure.

3) Modelar respuestas de recinto independientes para los planos frontal y trasero. 3) Modeling complex responses independent front and rear planes.

Se procesan los canales del plano frontal (FLi, FRi) y trasero (SU , SRi) independientemente utilizando dos respuestas a impulso de recintos optimizados diferentes. Channels are processed frontal plane (FLi, FRi) and rear (SU, SRi) independently using two impulse responses of different optimized enclosures. El procesado por separado de los canales frontales y traseros aporta Ia ventaja de utilizar dos recintos virtuales diferentes, dotando de mayor profundidad únicamente a los canales traseros, que son los que poseen efectos más espectaculares. Separate processing of the front and rear channels provides the advantage of using two different virtual venues, providing greater depth only by the rear channels, which are those with more spectacular effects. Una profundidad excesiva en los canales delanteros, sin embargo, dificultaría Ia inteligibilidad de los diálogos. Excessive depth in the front channels, however, difficult dialogues Ia intelligibility.

De acuerdo con realizaciones preferidas de Ia presente invención, Ia reverberación introducida en los canales Fl_i y FRi está dentro del rango de 0,5 segundos a 1 segundo, y Ia reverberación introducida en los canales SU y SRi está dentro del rango de 1 segundo a 3,5 segundos. According to preferred embodiments of the present invention, the reverberation introduced into the channels and FRi Fl_i is within the range from 0.5 seconds to 1 second, Ia reverberation SU introduced into the channels and SRi is within the range from 1 second to 3.5 seconds.

Así, después de Ia operación de modelar Ia respuesta del recinto se obtienen como salida las señales del plano frontal FL 2 y FR 2 , y las señales del plano trasero SL 2 y SR 2 Thus, after the operation to shape the response of the compound are obtained as output signals from the front plane 2 and FR FL 2 and backplane signals SL 2 and SR 2

4) Mezclar las señales obtenidas en Ia operación anterior junto con las señales LFE y C originales para obtener las señales de salida del canal izquierdo y el canal derecho (L y R). 4) Mix the signals obtained in the operation above along with original C LFE signals and signals for the left channel output and the right channel (L and R).

De acuerdo con una realización preferida de Ia presente invención, el procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, comprende, previamente a Ia operación final de mezcla, comprimir Ia señal del canal LFE, obteniéndose una señal LFE'. According to a preferred embodiment of the present invention, the format conversion process 5.1 to binaural sound hybrid, comprising, prior to the operation end of the mixing, compressing the signal of the LFE channel, obtaining a signal LFE.

Otra realización preferida de Ia invención comprende, previamente a Ia operación de auralización, las operaciones de: Another preferred embodiment of the invention comprises, prior to the operation of auralization, the steps of:

a) Separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R. a) Separate signals the FL, FR, C, SL, SR in the sources that compose music L, R music, voice and frontal impact, rear impact effects rear L and R. La separación se realiza utilizando un algoritmo de análisis de componentes independientes. The separation is performed using an algorithm for independent component analysis. Este análisis realiza una comparación de las distintas entradas (canales) que contienen información redundante en diferentes proporciones. This analysis makes a comparison of the various inputs (channels) contain redundant information in different proportions. Partiendo de Ia teoría de que varias señales se pueden considerar independientes si proceden de procesos físicos distintos, se logra aislar las distintas componentes, que en este caso son voz, música y efectos. Ia based on theory that multiple signals can be considered independent if they come from different physical processes are unable to isolate the various components, which in this case are speech, music and effects.

b) Mezclar las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R para obtener las señales que constituirán Ia entrada a Ia operación subsiguiente de auralización de los canales. b) Mix music sources L, R music, voice and frontal impact, rear effects rear L and R to obtain effects signals constitute the input to the operation subsequent channel auralisation. Esta operación de mezcla reconstruye las señales FL, FR, C, SL y SR con las proporciones óptimas de las fuentes que se separaron en Ia operación anterior. This mixing operation reconstructs the signals FL, FR, C, SL and SR with the optimum proportions of the sources separated in the operation above.

De acuerdo con una realización preferida de Ia presente invención, Ia mezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R para obtener los canales se realiza según los siguientes rangos porcentuales: According to a preferred embodiment of the present invention, the mixture of music sources L, R music, voice and frontal impact, rear effects rear L and R to obtain effects channel is performed according to the following percentage ranges:

FL .:: 70-90% música L, 30-10% voz y efectos frontales FL. :: Music L 70-90%, 30-10% and voice frontal impact

FR *: 70-90% música R, 30-10% voz y efectos frontales FR *: 70-90% R music, voice, and effects 30 to 10% frontal

C: 70-90% voz y efectos frontales, 30-10% música L y R C: 70-90% frontal impact voice, music 30-10% L and R

SL: 70-90% efectos traseros L, 30-10% música L SL: 70-90% rear effects L, 30-10% Music L

SR: 7700--9900%% efectos traseros R, 30-10% música R SR: 7700 - 9900%% R rear effects, music R 30-10%

El objetivo de estas dos operaciones opcionales es garantizar que cada canal en el proceso de auralización contenga Ia proporción adecuada de las distintas componentes, ya que Ia mezcla original en 5.1 estaba optimizada para su reproducción a través de 6 altavoces físicos, esquema completamente distinto a un par de auriculares. The aim of these two optional operations is to ensure that each channel auralization process contains the appropriate proportion of the various components, since the mixture was original 5.1 optimized for playback through 6 speakers physical scheme entirely a headphones. A Ia hora de reproducir en auriculares, Ia información redundante característica de sistemas cuadrafónicos como el 5.1 obstaculiza Ia percepción de realismo espacial, y por eso es necesario este reajuste. A one hour of play in headphones, Ia redundant information as quadraphonic systems feature 5.1 realism hinders Ia spatial perception, and therefore need this adjustment.

El canal de frecuencias graves LFE ya es en sí mismo una componente independiente, y por tanto su información no es redundante en los demás canales. The LFE channel bass and is in itself a separate component, and therefore their information is not redundant in the other channels. Por este motivo no se incluye en las operaciones iniciales opcionales de separación y mezcla. For this reason not included in the initial operations optional separation and mixing.

De acuerdo con otro aspecto de Ia invención, ésta se extiende también a programas de ordenador, en particular programas de ordenador en contenidos en una portadora, adaptados para llevar a cabo las operaciones del procedimiento descrito. According to another aspect of the invention, this also extends to computer programs, particularly computer programs contained in a carrier adapted to carry out the operations of the procedure. El programa puede estar en forma de código fuente, código objeto o un código intermedio entre el código fuente y el código objeto, como una forma parcialmente compilada, o de cualquier otra forma adecuada para implementar las operaciones de Ia invención. The program may be in the form of source code, object code or an intermediate code between source code and object code as a partially compiled form, or any other form suitable to implement the operations of the invention.

La portadora puede ser cualquier dispositivo o entidad capaz de transportar el programa. The carrier can be any entity or device capable of carrying the program. Por ejemplo, Ia portadora puede comprender un medio de almacenamiento, como una ROM, un CD ROM o cualquier otro medio de almacenamiento magnético, por ejemplo un disquete o un disco duro. For example, the carrier may comprise a storage medium such as a ROM, a CD ROM or any other magnetic storage medium, such as a diskette or hard disk. Además, Ia portadora puede ser una portadora de transmisión, como una señal eléctrica u óptica que se pueda comunicar a través de cable eléctrico, óptico, por radio o de cualquier otro modo. Additionally, Ia can be a carrier-carrier transmission, such as electrical or optical signal that can communicate via wired electrical, optical, radio or otherwise.

Alternativamente, Ia portadora puede ser un circuito integrado en el que está almacenado el programa, estando el circuito adaptado para efectuar las operaciones del procedimiento. Alternatively, Ia carrier may be an integrated circuit in which is stored the program circuit being adapted to perform the steps of the process. En particular, podría ser un ASIC, una FPGA, un DSP, un microprocesador o un microcontrolador. In particular, it could be an ASIC, an FPGA, a DSP, a microprocessor or microcontroller.

DESCRIPCIÓN DE LOS DIBUJOS Para complementar Ia descripción que se está realizando y con objeto de ayudar a una mejor comprensión de las características de Ia invención, de acuerdo con un ejemplo preferente de realización práctica de Ia misma, se acompaña como parte integrante de dicha descripción, un juego de dibujos en donde con carácter ilustrativo y no limitativo, se ha representado Io siguiente: DESCRIPTION OF THE DRAWINGS To complement the description being made and in order to help better understand the features of the invention, according to a preferred practical embodiment thereof has been included as part of the description, a set of drawings where in an illustrative and not limiting, the following has been represented:

Figura 1.- Muestra una vista de Ia ubicación de los altavoces físicos de un cine en un formato sonoro 5.1. Figure 1. - Shows a view of the physical speaker locations of a cinema in a 5.1 sound format.

Figura 2.- Muestra un esquema explicativo de Ia posición de los ángulos de elevación (α) y de azimut (β). Figure 2. - Shows a diagram explaining the position of the elevation angles (α) and azimuth (β).

Figura 3.- Muestra un esquema general de las operaciones del procedimiento de acuerdo con Ia presente invención. Figure 3. - Displays an overview of the operations of the process according to the present invention.

REALIZACIÓN PREFERENTE DE LA INVENCIÓN PREFERRED EMBODIMENT OF THE INVENTION

Se parte del sonido original de una película en formato 5.1 que se desea convertir en binaural híbrido, que en este caso está grabado en un disco de tipo The original sound of the film in 5.1 format to be converted into binaural hybrid, which in this case is recorded on a disk type

DVD. DVD. La Figura 1 muestra Ia posición de los altavoces de los canales en una sala de cine con relación a Ia posición en Ia que debe estar situado el usuario para una experiencia sonora óptima. Figure 1 shows the position of the speaker of the channels in a movie theater Ia relative to position in which the user should be positioned for optimal sound experience.

En este ejemplo, el procedimiento Io efectúa un ordenador que, en primer lugar, como se muestra en Ia Figura 3, obtiene a partir del DVD las señales de los canales originales en formato 5.1 (FL, FR, C, SL, SR, LFE). In this example, the method performs a computer Io, first, as shown in Figure 3, obtained from the DVD the original channel signals in the 5.1 format (FL, FR, C, SL, SR, LFE ). El canal LFE es separado para ser procesado en paralelo de modo independiente, sufriendo únicamente una compresión que da como resultado Ia señal LFE'. The LFE channel is separated to be processed independently in parallel, suffering only compression resulting in the signal LFE.

En este ejemplo, se proporciona un selector (S) que permite que el usuario seleccione o no las operaciones opcionales de extraer las fuentes de los canales originales y remezclarlas de acuerdo con unas proporciones nuevas para realzar Ia espectacularidad de Ia película. In this example, there is provided a selector (S) which allows the user to select or optional operations of drawing the sources of the original channels and remixed under new proportions to enhance Ia Ia spectacular film. Para ello, se separan Ia fuentes (música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R), por ejemplo utilizando el algoritmo de separación de fuentes por análisis de componentes independientes 'FastICA', desarrollado por el HUT (Helsinki University of Technology), para volver a mezclarlos de acuerdo con unas proporciones nuevas optimizadas. For this, separate sources Ia (music L, R music, voice and frontal impact, rear effects and effects rear L R), for example using the source separation algorithm for independent component analysis 'FastICA' developed by HUT (Helsinki University of Technology), to re-mix under new proportions optimized. En este ejemplo supondremos que Ia película es de acción, Io cual implica Ia existencia de una serie de características sonoras, como explosiones, tiros, ruido de motores, etc. In this example we will assume that action film is Ia, Io which implies the existence of a number of sound features, such as explosions, shots, engine noise, etc.. Para conseguir Ia mayor espectacularidad posible en este tipo de películas, se han determinado las siguientes proporciones óptimas de mezcla: To get more spectacular Ia possible in these films have been determined the following optimal proportions of mixture:

FL': 80% música L + 20% voz y efectos frontales FR': 80% música R + 20% voz y efectos frontales FL ': 80% L + 20% music and effects voice front FR': music R + 80% voice and 20% frontal impact

C: 80% voz y efectos frontales + 20% música L y R C: 80% effect voice and music frontal + 20% L and R

SL': 80% efectos traseros L + 20% música L SL ': 80% rear impacts + 20% L Music L

SR': 80% efectos traseros R + 20% música R SR ': 80% rear effects music R + 20% R

Una vez mezcladas las fuentes en los canales de este modo optimizado, se separa el canal de diálogos (C) del resto, los canales FL', FR', SL' y SR' son auralizados cada uno de ellos en una situación geométrica óptima para realzar Ia espectacularidad de Ia experiencia sonora del usuario. Once mixed in the channels sources thus optimized, separates the dialogue channel (C) the remainder, the FL ', FR', SL 'and SR' are each auralizados an optimal geometric situation Ia Ia enhance spectacular sound experience of the user. En este caso, se ha considerado que el oyente tiene las características de un usuario estándar basado en las respuestas al impulso de un maniquí Kemar. In this case, it was considered that the listener has the features of a standard user based on the impulse responses of a Kemar mannequin.

A continuación se presentan las posiciones óptimas de los canales, descritas a través del ángulo de elevación (α) y del ángulo de azimut (β) que forman con el oyente: Below are the optimal positions of the channels, described through the elevation angle (α) and azimuth (β) which form with the listener:

FL': elevación 15°; azimut -20° FL ': 15 ° elevation, azimuth -20 °

FR': elevación 15°; azimut 20° SL': elevación 180°; azimut -40° SR': elevación 180°; azimut 40° FR ': elevation 15 °, azimuth 20 ° SL': elevation 180 ° azimuth 40 ° SR ': elevation 180 ° azimuth 40 °

La Figura 2 muestra Ia referencia de Ia ubicación de los ángulos de elevación y azimut, respectivamente α y β. Figure 2 shows the location reference Ia of elevation and azimuth angles, α and β respectively. Después de Ia operación de auralización, se obtienen las señales FL'i, FR'i , SL'i y SRV A continuación, se procesan las señales FL'i y FR'i con Ia respuesta al impulso de un recinto similar a una sala de cine, con un tiempo de reverberación (T r ) de 0,5 segundos aproximadamente; y las señales SL'i y SR'i con Ia respuesta al impulso de otro recinto similar a una sala de cine diferente, con un tiempo de reverberación de 2 segundos aproximadamente. After the operation of auralization, FL'i signals are obtained, FR'i, SRV SL'i and then the signals are processed with Ia FR'i FL'i and impulse response of a room-like enclosure film, with a reverberation time (T r) of approximately 0.5 seconds, and SL'i and SR'i signals with the response to the impulse of another similar enclosure to a different theater, with a reverberation time about 2 seconds.

Finalmente, se mezclan los canales obtenidos en Ia operación anterior, FL'2, FR'2, SL'2 y SR'2 con los canales LFE' y C para obtener únicamente dos señales en formato binaural híbrido correspondientes a los canales L y R de unos auriculares. Finally, mix the channels obtained in the previous operation, FL'2, FR'2, SR'2 with SL'2 and LFE channels' and C only two signals for binaural hybrid format corresponding to channels L and R headphones.

Patent Citations
Cited PatentFiling datePublication dateApplicantTitle
WO2007123788A2 *3 Apr 20071 Nov 2007Srs Labs IncAudio signal processing
EP1816890A1 *30 Jan 20078 Aug 2007Sony CorporationAudio reproducing system and method thereof
US5742689 *4 Jan 199621 Apr 1998Virtual Listening Systems, Inc.Method and device for processing a multichannel signal for use with a headphone
US6002775 *14 Aug 199814 Dec 1999Sony CorporationMethod and apparatus for electronically embedding directional cues in two channels of sound
Non-Patent Citations
Reference
1 *'Neural Networks, 2005. Proceedings. 2005 IEEE International Joint Conference on Montreal', vol. 2, QUE., CANADA. article CIARAMEL THE A.: 'BSS toolbox for delayed and convolved mixtures', pages 1245 - 1250
2 *TECHNOLOGIES FOR PRESENTATION OF SORROUND-SOUND IN HEADPHONES., [Online] 17 December 2007, Retrieved from the Internet: <URL:http://www. headwize.com/tech/sshd_ tech.htm> [retrieved on 2009-03-23]
Classifications
International ClassificationH04S3/00
Cooperative ClassificationH04S2400/01, H04S3/008
European ClassificationH04S3/00D
Legal Events
DateCodeEventDescription
16 Feb 2011122
Country of ref document: EP
Kind code of ref document: A1
Ref document number: 08870792
20 Jul 2010NENP
Ref country code: DE
16 Sep 2009121
Ref document number: 08870792
Country of ref document: EP
Kind code of ref document: A1