Search Images Maps Play YouTube Gmail Drive Calendar More »
Sign in
Screen reader users: click this link for accessible mode. Accessible mode has the same essential features but works better with your reader.

Patents

  1. Advanced Patent Search
Publication numberWO2009090281 A1
Publication typeApplication
Application numberPCT/ES2008/070246
Publication date23 Jul 2009
Filing date30 Dec 2008
Priority date17 Jan 2008
Publication numberPCT/2008/70246, PCT/ES/2008/070246, PCT/ES/2008/70246, PCT/ES/8/070246, PCT/ES/8/70246, PCT/ES2008/070246, PCT/ES2008/70246, PCT/ES2008070246, PCT/ES200870246, PCT/ES8/070246, PCT/ES8/70246, PCT/ES8070246, PCT/ES870246, WO 2009/090281 A1, WO 2009090281 A1, WO 2009090281A1, WO-A1-2009090281, WO2009/090281A1, WO2009090281 A1, WO2009090281A1
InventorsArrondo Ivan Portas
ApplicantAuralia Emotive Media Systems, S,L.
Export CitationBiBTeX, EndNote, RefMan
External Links: Patentscope, Espacenet
Method of converting 5.1 sound format to hybrid binaural format
WO 2009090281 A1
Abstract
Method of converting 5.1 sound format to hybrid binaural format, comprising obtaining the signals from the FL, FR, C, SL, SR and LFE channels in 5.1 format which it is desired to convert into hybrid binaural format; auralizing the FL, FR, SL and SR channels in the following positions: FL: elevation from 0° to 30°, azimuth from -10° to -30°; FR: elevation from 0° to 30°, azimuth from +10° to +30°; SL: elevation from 175° to 195°, azimuth from -30° to -60°; SR: elevation from 175° to 195°, azimuth from +30° to +60°, thus obtaining the signals FL1, FR1, SL1 and SR1; modelling the response from the enclosure on the basis of the signals, introducing a reverberation effect; and mixing the signals FL2, FR2, SL2 and SR2 obtained in the previous step with the original LFE and C signals to obtain the two left and right output signals.
Claims(9)  translated from Spanish
REIVINDICACIONES CLAIMS
1. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones 1. Procedure sound format conversion binaural 5.1 hybrid, comprising the following operations
obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido; get the signals of the channels FL, FR, C, SL, SR and LFE 5.1 format to be converted into binaural hybrid format;
auralizar los canales FL, FR, SL y SR en las siguientes posiciones: auralizar the FL, FR, SL and SR channels in the following positions:
FL: elevación de 0 o a 30°; FL: elevation of 0 or 30 °; azimut de -10 o a -30°. Azimuth -10 or -30 °.
FR: elevación de 0 o a 30°; FR: elevation of 0 or 30 °; azimut de +10 a +30°. azimuth +10 to + 30 °.
SL: elevación de 175° a 195°; SL: elevation of 175 ° to 195 °; azimut de -30° a -60°. azimuth -30 ° to -60 °.
SR: elevación de 175° a 195°; SR: elevation of 175 ° to 195 °; azimut de +30° a +60°, Azimuth + 30 ° to + 60 °,
obteniéndose como resultado las señales FLi, FRi, SLi y SRi; obtaining as a result the FLI fri, SLi and SRi signals;
procesar independientemente las señales del plano frontal (FLi y FRi) y las del plano trasero (SLi y SRi), utilizando para ello, las respuestas a impulso de dos recintos virtuales diferentes, optimizados cada uno de ellos para dichos planos, obteniéndose como resultado las señales FL 2 , FR 2 , SL 2 y SR 2 ; independently process the signals from the frontal plane (FLI and FRI) and backplane (SLi and SRi), using the impulse responses of two different virtual campuses, optimized each for these planes, resulting in the signals FL 2 FR 2, SL 2 and SR 2;
mezclar las señales FL 2 , FR 2 , SL 2 y SR 2 obtenidas en Ia operación anterior junto con las señales originales LFE y C para obtener las dos señales de salida izquierda y derecha. FL mix 2 FR 2, SL 2 and SR 2 signals obtained in the previous operation along with the original LFE signals and C for the two signals left and right output.
2. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque las respuestas a impulso de los recintos virtuales utilizados para el procesado del plano frontal y trasero, comprenden tiempos de reverberación de entre 0,5 sy 1 s para el primero, y de entre 1 sy 3,5 s para el segundo. 2. Procedure sound format conversion binaural 5.1 to hybrid according to the preceding claim, characterized in that the impulse responses of the virtual enclosures used for processing the front plane and rear comprise reverberation times between 0.5 s and 1 s for the first, and between 1 s and 3.5 s for the second.
3. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque comprende, previamente a Ia operación final de mezcla, una compresión del canal LFE. 3. Procedure sound format conversion binaural 5.1 to hybrid according to any of the preceding claims, characterized in that, prior to Ia final operation comprising mixing a compression of the LFE channel.
4. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque antes de Ia operación de auralización comprende las operaciones de: 4. Procedure sound format conversion binaural 5.1 to hybrid according to any of the preceding claims, characterized in that before the operation auralization comprising the steps of:
separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen: música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R; separate channel signals FL, FR, C, SL, SR in the sources that comprise: L music, music R, voice and frontal impact, rear impact and rear impact R L;
remezclar las fuentes estimadas en proporciones optimizadas para procesos posteriores, reconstruyendo los canales FL, FR, C, SL y SR. remixing the estimated proportions optimized for further processing sources, reconstructing the channels FL, FR, C, SL and SR.
5. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque Ia operación de remezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R se realiza de acuerdo con los siguientes rangos porcentuales: 5. Procedure 5.1 format conversion to hybrid sound binaural according to the previous claim, characterized in that the operation of remixing of music sources L, R music, voice and frontal impact, rear impact and rear impact R L is performed according with the following percentage ranges:
FL .:: 70-90% música L, 30-10% voz y efectos frontales FL. :: Music L 70-90%, 30-10% and frontal effects voice
FR *: 70-90% música R, 30-10% voz y efectos frontales FR *: 70-90% R music, voice and 30-10% frontal impact
C: 70-90% voz y efectos frontales, 30-10% música L y R C: 70-90% voice and frontal effects, music 30-10% L and R
SL: 70-90% efectos traseros L, 30-10% música L SL: rear effects L 70-90%, 30-10% music L
SR: 7700--9900%% efectos traseros R, 30-10% música R SR: %% rear impact 7700--9900 R, R music 30.10%
6. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque es llevado a cabo por uno dispositivo de entre los de Ia siguiente lista: un ASIC, una FPGA, un DSP, un microprocesador y un microcontrolador. 6. The method of converting audio format 5.1 hybrid binaural according to the preceding claim, characterized in that it is carried out by one device among of Ia following list: an ASIC, an FPGA, a DSP, a microprocessor and a microcontroller .
7. Programa de ordenador que comprende instrucciones de programa que provocan que un ordenador lleve a cabo las operaciones del método de acuerdo con cualquiera de las reivindicaciones anteriores. 7. Computer program comprising program instructions that cause a computer to perform the method steps according to any of the preceding claims.
8. Programa de ordenador de acuerdo con Ia reivindicación 7, caracterizado porque está almacenado en unos medios de almacenamiento. 8. Computer program according to claim 7, characterized in that it is stored in a storage means.
9. Programa de ordenador de acuerdo con Ia reivindicación 7, caracterizado porque se transmite a través de una señal portadora. 9. Computer program according to claim 7, characterized in that is transmitted through a carrier signal.
Description  translated from Spanish

PROCEDIMIENTO DE CONVERSIÓN DE FORMATO SONORO 5.1 A FORMAT CONVERSION PROCEDURE 5.1 SONORO

BINAURAL HÍBRIDO Binaural HYBRID

DESCRIPCI Ó N DESCRIPTION

OBJETO DE LA INVENCIÓN OBJECT OF THE INVENTION

El objeto principal de Ia presente invención es un procedimiento para convertir sonido en formato sonoro 5.1 , habitualmente utilizado para registro y reproducción sonora digital de contenido cinematográfico, en formato binaural híbrido. The main object of the present invention is a process for converting sound into 5.1 sound format, commonly used for digital sound recording and playback of film content in binaural hybrid format.

ANTECEDENTES DE LA INVENCIÓN BACKGROUND OF THE INVENTION

Actualmente, el formato 5.1 representa el estándar para Ia reproducción sonora doméstica de cine. Currently, the 5.1 is the standard format for playback Ia home cinema sound. Un sistema sonoro en formato 5.1 está compuesto por seis canales de audio donde se mezclan en distintas proporciones las señales de música, voz, efectos sonoros, etc. A sound system in 5.1 format consists of six audio channels where signals of music, voice, sound effects are mixed in different proportions, etc. Cada uno de los canales corresponde a un altavoz, ya su vez cada uno de los altavoces debe estar situado en una ubicación concreta con relación al usuario para conseguir una sensación sonora óptima. Each channel corresponds to a speaker, and in turn each of the speakers must be placed in a specific location relative to the user for optimum sound sensation.

Los altavoces principales (FL y FR en Ia Figura 1 ) forman idealmente un triángulo equilátero con Ia posición del usuario (O). The main speakers (FL and FR in Figure 1) ideally form an equilateral triangle with the position of the user (O). Además, las rectas formadas por los altavoces envolventes (SL y SR) y el usuario (O) forman un ángulo de aproximadamente 110° con respecto al eje vertical (recta que une O y C). In addition, the straight formed by the surround speakers (SL and SR) and the user (O) form an angle of approximately 110 ° to the vertical axis (line connecting O and C). El altavoz LFE (Low Frequency Enhancement, en sus siglas en inglés), tiene por objeto realzar los sonidos graves para producir un efecto impactante en Ia reproducción. The speaker LFE (Low Frequency Enhancement, its acronym in English), aims to enhance the bass sound to produce a striking effect on reproduction Ia. Su ubicación no es determinante, ya que Ia información que transmite tiene un espectro de frecuencias generalmente menor de 100 Hz, que tiene una naturaleza omnidireccional. Its location is not decisive, since the information transmitted has a spectrum of frequencies generally less than 100 Hz, which has an omnidirectional nature. Es decir, no se puede determinar de donde proviene el sonido. That is, you can not determine where the sound is coming.

Un inconveniente de los sistemas de audio basados en el formato 5.1 es que la sensación sonora del usuario se deteriora rápidamente cuando éste no está situado en Ia ubicación óptima con respecto de los altavoces. A drawback of audio systems based on 5.1 sound format is that the user feel deteriorates rapidly when it is not located in the optimum location with respect to the speakers. La utilización de auriculares permite, sin embargo, una colocación óptima del usuario en todo momento, ya que los sistemas de reproducción sonora, al estar adheridos a Ia cabeza del usuario, no modifican su posición relativa respecto a su cabeza. Using headphones allows, however, optimal placement of the user at all times, since sound reproduction systems, being attached to the head of the user, do not change their position relative to your head.

Sin embargo, el ser humano es un receptor sonoro volumétrico, es decir, procesa el sonido que llega a él a través de, por ejemplo, reflexiones creadas por los hombros y el torso, o difracciones creadas por el sonido al rodear Ia cabeza. However, the human being is a volumetric sound receiver, ie processes sound that reaches him through, for example, reflections created by the shoulders and torso, or diffractions created by the sound to surround the head. La audición humana es por naturaleza binaural, donde Ia resultante de todo el proceso de recepción sonora termina en dos únicos canales: oído derecho y oído izquierdo. Human hearing is binaural nature, wherein the resultant of all the sound reception process ends at two unique channels: right ear and left ear. El término "binaural" hace referencia a Ia naturaleza de Ia audición humana, debido a que las personas somos capaces de captar toda Ia información espacial sonora a través de un único par de oídos. The term "binaural" refers to the nature of human hearing Ia because people are able to capture all the spatial sound information through a single pair of ears.

Cuando no se tiene en cuenta esta fenomenología se suele producir el denominado "sonido intracraneal", como por ejemplo al escuchar sonido estéreo tradicional a través de auriculares. When no one considers this phenomenology is usually produced the so-called "intracranial sound", such as traditional stereo sound when listening through headphones. El sonido intracraneal consiste en Ia sensación de que las fuentes sonoras se encuentran en el interior del cráneo del usuario, en un punto situado entre los dos auriculares, por Io que el sonido estéreo tradicional no es un formato aconsejable cuando se tratan de representar de forma realista espacios sonoros tridimensionales. Intracranial sound consists of the feeling that the sound sources are inside the skull of the user, at a point between the two headphones, for which reason the traditional stereo sound is not a recommended format when trying to represent so realistic three-dimensional sound spaces.

Existen fundamentalmente dos formas de lograr reproducciones binaurales: There are essentially two ways to achieve binaural reproduction:

La primera de ellas consiste en sustituir el par de receptores puntuales que se utiliza habitualmente por receptores volumétricos, como maniquíes, logrando de ese modo que el sonido que llega a ellos se procese de forma natural. The first is to replace the pair of specific receptors which is commonly used for volumetric receivers, like mannequins, thereby achieving the sound that reaches them is processed naturally. De este modo se logra una grabación estéreo binaural, donde queda ya introducida toda Ia fenomenología descrita anteriormente. Thus a binaural stereo recording, where all phenomenology Ia and described above is introduced is achieved.

La segunda se basa en realizar un procedimiento de auralización. The second is based on performing a procedure auralisation. Para ello, se suele medir o modelar Ia respuesta de un determinado receptor (un maniquí o un ser humano, por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente un ruido de banda ancha emitido desde un determinado punto alrededor del usuario). To do this, is usually measured or model the response of a given receptor (a dummy or a human, for example) to a pulse signal from a given point in space (typically a broadband noise emitted from a point around user). La patente US 2007213990 describe un método para transformar una señal estéreo bacanal tradicional en una señal binaural, centrándose en el tratamiento que debe sufrir Ia señal de entrada de cara a su preparación para ser transformada en sonido tridimensional. US 2007213990 discloses a method for transforming a traditional stereo signal into a binaural signal bacchanal, focusing on the treatment that should suffer the input signal ahead of their preparation to be transformed into three-dimensional sound. Específicamente, se describe cómo dividir Ia señal de entrada según distintas bandas de frecuencia para, una vez dividida Ia señal de entrada, auralizar cada sub-banda y finalmente unirlas para formar los dos canales de salida en formato binaural. Specifically, it describes how to divide the input signal according to different frequency bands, once the input signal divided auralizar each sub-band and finally put them together to form the two output channels in binaural format.

DESCRIPCIÓN DE LA INVENCIÓN DESCRIPTION OF THE INVENTION

La presente invención describe un nuevo procedimiento para Ia auralización en tiempo real de audio en formato 5.1. The present invention describes a new process for auralisation real-time audio in 5.1 format. Para lograr un resultado óptimo, cada canal es tratado y auralizado independientemente, de modo que es posible asignar parámetros acústicos específicos a cada uno de ellos con el objetivo de hacer más realista y espectacular Ia reproducción. For optimal results, each channel is treated and auralizado independently, so it is possible to assign specific acoustic parameters to each order to make more realistic and spectacular Ia reproduction.

Las ventajas más importantes del procedimiento de Ia invención se pueden resumir en las siguientes: The most important advantages of the process of the invention can be summarized as follows:

Se consigue una reproducción óptima en todos los casos, ya que, al estar los auriculares adheridos al usuario, Ia posición relativa entre el sistema de reproducción y el usuario no varía. optimum playback in every case, since, being attached to the headset user, the relative position between the reproduction system and the user does not change is achieved.

El modelo híbrido que se describe, que combina Ia auralización de los canales FL, FR, SL y SR con los canales monofónicos originales C y LFE permite una mayor inteligibilidad de los diálogos, al no existir interferencias entre los canales frontales y el canal C, así como una inmersión superior debido a Ia constante referenciación inconsciente que realiza el cerebro entre el canal C monofónico y los canales auralizados. The hybrid model described, combining Ia auralization of FL, FR, SL and SR channels with the original monophonic channels C and LFE allows greater intelligibility of the dialogue, the absence of interference between the front channels and the channel C, as well as a dip Ia higher due to constant referencing unconscious brain makes between monophonic channel C and auralizados channels.

El reajuste de las proporciones de los diferentes tipos de información, mediante Ia separación de fuentes y posterior remezclado, permite optimizar desde el inicio el contenido de los distintos canales para lograr un resultado óptimo. The readjustment of the proportions of the different types of information, through the separation of sources and later remixed, from the beginning to optimize the content of the different channels to achieve optimum results.

La colocación virtual específica de los canales FL y FR, así como el modelado del recinto específico, permiten un perfecto equilibrio con el canal de diálogos C, no interfiriendo con su inteligibilidad y dotando de Ia profundidad justa al plano frontal. The specific virtual placement of the FL and FR channels as well as modeling specific enclosure, allow a perfect balance with the dialogue channel C, not interfering with their intelligibility and infusing the frontal plane just Ia depth.

La colocación virtual específica de los canales SL y SR, así como el modelado de un recinto específico diferente para los canales de los planos delantero y trasero, aportan una sensación de profundidad trasera impactante, dotando al sistema de planos diferenciados de reproducción sonora, creando de este modo una experiencia altamente inmersiva. The specific virtual placement of the SL and SR channels and modeling a different specific grounds for the channels of the front and rear planes, bring a sense of striking back depth, providing the system with differentiated levels of sound reproduction, creating thus a highly immersive experience.

El refuerzo del canal LFE permite recrear las sensaciones producidas por las componentes graves en las salas de cine, equilibrando el sistema de reproducción. Strengthening the LFE channel recreates the sensations produced by the major components in cinemas, balancing the playback system.

En el presente documento, el término "auralizar" hace referencia al procesado de los diferentes canales para conseguir que el usuario tenga Ia impresión de que provienen de lugares del espacio concretos, consiguiéndose así una espectacularidad e inteligibilidad optimizadas. Herein, the term "auralizar" refers to the processing of different channels to get the user to have the printing that come from parts of the concrete space and achieving a spectacular and optimized intelligibility.

Del mismo modo, el término "canal" hace referencia a Ia señal de cada uno de los altavoces que componen el formato de sonido 5.1 o el formato de sonido binaural híbrido. Similarly, the term "channel" refers to the signal of each of the speakers that make the sound format 5.1 or hybrid format binaural sound. Así, hablaremos de los canales FL, FR, C, SL, SR o LFE, que son los canales de entrada en formato 5.1 y de los canales L y R, que son los canales de salida en formato binaural. So, we'll talk channels FL, FR, C, SL, SR and LFE, which are input channels in 5.1 format and the L and R channels, which are the output channels in binaural format. Se utilizarán las letras "L" y "R" para distinguir entre las posiciones de los canales situadas a Ia izquierda (left, en inglés) y derecha (right, en inglés) del usuario. the letters "L" will be used and "R" to distinguish between the positions of the channels located at Ia left (left,) and right (right, in English) user. También se utilizarán los términos "plano frontal" y "plano trasero" para hacer referencia a Ia posición de los canales frente al usuario o detrás del usuario, así como "plano lateral derecho" o "plano lateral izquierdo" para hacer referencia a Ia posición de los canales a los lados del usuario. the terms "front plane" and will also be used "flat back" to refer to the position of the channel towards the user or behind the user, as well as "right side up" or "left lateral plane" to refer to the position channels on the sides of the user.

Por otro lado, el término "fuente" se refiere a una señal que contiene sonidos de un solo proceso físico, es decir, las fuentes serán, en general, música, voz y efectos. Furthermore, the term "source" refers to a signal containing only sounds of a physical process, that is, the sources will in general music, voice and effects.

Se define también el término "binaural híbrido" como un formato sonoro que mezcla canales auralizados con canales no auralizados o monofónicos. the term "hybrid binaural" is also defined as an audio format that mixes auralizados channels with no auralizados or monophonic channels. Concretamente, Ia presente invención mezcla los canales auralizados FL, FR, SL y SR con los canales no auralizados C y LFE. Specifically, the present invention mixes the auralizados channels FL, FR, SL and SR with non auralizados C and LFE channels.

De acuerdo con un aspecto de Ia presente invención, se describe un procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones: According to one aspect of the present invention, a sound conversion process 5.1 format described binaural hybrid, characterized in that it comprises the following operations:

1 ) Obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido. 1) Obtain the channel signals FL, FR, C, SL, SR and LFE 5.1 format to be converted into binaural hybrid format. La información que contienen estas señales es normalmente una mezcla de varias fuentes, donde: The information contained in these signals is usually a mix of several sources, where:

FL: contiene principalmente música, y en menor medida voz y efectos. FL, contains mainly music, and to a lesser extent and effects voice.

FR: contiene principalmente música, y en menor medida voz y efectos. FR contains mainly music, and to a lesser extent and effects voice. C: contiene principalmente voz, y en menor medida música y efectos. C contains mainly voice, and to a lesser extent music and effects. SL: contiene principalmente efectos, y en menor medida música. SL: it contains mainly effects, and less music. SR: contiene principalmente efectos, y en menor medida música. SR, it contains mainly effects, and less music. LFE: contiene únicamente graves. LFE: contains only serious.

2) Auralizar los canales FL, FR, SL y SR en las siguientes posiciones: FL: elevación de 0 o a 30°; 2) Auralizar channels FL, FR, SL and SR in the following positions: FL: elevation of 0 or 30 °; azimut de -10 o a -30°. Azimuth -10 or -30 °.

FR: elevación de 0 o a 30°; FR: elevation of 0 or 30 °; azimut de +10 a +30°. azimuth +10 to + 30 °.

SL: elevación de 175° a 195°; SL: elevation of 175 ° to 195 °; azimut de -30° a -60°. azimuth -30 ° to -60 °. SR: elevación de 175° a 195°; SR: elevation of 175 ° to 195 °; azimut de +30° a +60°. Azimuth + 30 ° to + 60 °.

obteniéndose como resultado las señales FLi, FRi, SLi y SRi. obtaining as a result the FLI fri, SLi and SRi signals.

Diremos que "auralizar" un canal en una posición determinada significa ubicar virtualmente ese canal de forma que Ia reproducción de las señales resultantes, una para el canal derecho y otra para el canal izquierdo, a través de unos auriculares producen Ia sensación en el usuario de que los sonidos de ese canal provienen de esa posición determinada del espacio. We will say that "auralizar" a channel in a given position means virtually locate the channel way that the reproduction of the resulting signals, one for the right channel and one for the left channel, through headphones produce Ia feeling in the user sounds that come from that particular channel position in space.

Dicho de otro modo, auralizar es un proceso mediante el cual un canal carente de información espacial habitualmente monofónico, como en este caso, es decir, anecoico o seco, es procesado mediante un procedimiento llamado convolución, con Ia respuesta al impulso (respuesta en tiempo y frecuencia a un determinado estímulo acústico proveniente de un determinado punto del espacio) de un determinado oyente. In other words, auralizar is a process by which a channel lacking usually monophonic spatial information, as in this case, ie anechoic or dry, is processed by a procedure called convolution with Ia impulse response (response time and frequency to a given acoustic stimulus from a given point in space) of a particular listener.

Sin embargo, debido a las diferencias físicas entre los diferentes usuarios (tamaño, distancia entre los oídos, etc.), no todos ellos responden de igual modo ante los nuevos canales FLi, FRi, SLi y SRi. However, due to the physical differences between different users (size, distance between the ears, etc.), not all respond the same way to new FLI fri, SLi and SRi channels.

Para conocer Ia respuesta de cada tipo de usuario, se modela o se mide Ia respuesta de un determinado receptor (un maniquí o un ser humano por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente ruido de banda ancha emitido desde un determinado punto alrededor del usuario). To know the response of each type of user, is modeled or measured the response of a particular receptor (a dummy or a human being for example) to a pulse signal from a given point in space (usually broadband noise emitted from a certain point around the user). Ésta respuesta al impulso del usuario se utiliza más tarde para procesar una fuente monofónica (sin información espacial) mediante un proceso de convolución, logrando así el efecto de escuchar dicha fuente situada en el punto donde ha sido emitido el impulso. This impulse response user is later used to process a monophonic source (no spatial information) by a convolution process, thus achieving the effect of listening to that source located at the point where the momentum has been issued.

Los inventores han descubierto que situar virtualmente los canales FL, FR, SL y SR dentro de los rangos angulares descritos anteriormente proporciona a todos los usuarios una sensación de espectacularidad óptima. The inventors have discovered that virtually placing the channels FL, FR, SL and SR within the ranges described above provides angular all users a sense of optimum spectacularity.

El motivo de que los rangos angulares de los altavoces frontales (FL y FR) no sean muy grandes es evitar Ia pérdida de inteligibilidad del canal de diálogos (C) debido a una imagen estéreo excesiva de Ia música, es decir, que Ia energía del canal FL vaya casi completamente a L y Ia energía de FR vaya casi completamente a R, y evitar Ia llegada de una gran cantidad de energía a los planos laterales, cerca de los oídos que interfiera en Ia localización de los canales del plano trasero (SL y SR). The reason that the angular ranges of the front speakers (FL and FR) are not too large is to prevent the loss of intelligibility channel dialogues (C) because an image excessive stereo Ia music, namely, that the energy of channel FL go almost entirely to L and the energy of FR go almost entirely to R, and avoid Ia arrival of a lot of energy to the lateral planes, near the ears which interfere with the localization of the channels backplane (SL and SR).

El canal de diálogos (C) no se procesa en Ia operación de procesado de las señales de los canales FL, FR, SL y SR, ya que mantenerlo como fuente aporta dos grandes ventajas a Ia salida final del procedimiento. The channel dialogues (C) is not processed in the operation of processing the signals of the channels FL, FR, SL and SR, as I keep as a source provides two major advantages to the outlet end of the procedure.

La primera de ellas es ganar en inteligibilidad respecto al formato de entrada, ya que al mantener este canal intacto y auralizar los de los planos frontal (FL y FR) y trasero (SL y SR), los diálogos (C) quedan destacados en Ia posición central, reduciendo Ia fatiga auditiva para su seguimiento. The first one is to win in intelligibility regarding the input format, and that by keeping this intact and auralizar those of the front and rear (SL and SR) planes (FL and FR) channel dialogues (C) are featured in Ia center position, thereby reducing the auditory fatigue for follow up.

La segunda ventaja reside en el hecho de constituir un punto de referencia auditivo para el cerebro, ya que mantener su naturaleza intracraneal hace ideal su combinación con los canales auralizados. The second advantage lies in the fact constitute a point of reference for the auditory brain as they keep their intracranial nature makes it ideal combination with auralizados channels. De este modo, el cerebro compara constantemente Ia posición de este canal con los auralizados, haciendo Ia experiencia auditiva del usuario mucho más espectacular. Thus, the brain constantly compares the position of this channel with auralizados making Ia auditory experience much more spectacular user.

El canal LFE tampoco se procesa en esta operación del procedimiento debido a Ia naturaleza no direccional de las frecuencias que contiene, es decir, da Ia sensación de ser escuchado en todas las posiciones. The LFE channel is not processed in this step of the process because Ia non-directional nature of the frequencies contained therein, that is, gives Ia feeling of being heard in all positions. Esta característica hace que los altavoces destinados a Ia reproducción de este canal puedan ser situados prácticamente en cualquier lugar del recinto. This feature makes the speakers intended Ia reproduction of this channel can be located virtually anywhere in the room.

3) Modelar respuestas de recinto independientes para los planos frontal y trasero. 3) Modeling independent responses enclosure for the front and rear planes.

Se procesan los canales del plano frontal (FLi, FRi) y trasero (SU , SRi) independientemente utilizando dos respuestas a impulso de recintos optimizados diferentes. and channels the frontal plane (FLI, FRI) back (SU, SRi) independently using two different impulse responses optimized enclosures are processed. El procesado por separado de los canales frontales y traseros aporta Ia ventaja de utilizar dos recintos virtuales diferentes, dotando de mayor profundidad únicamente a los canales traseros, que son los que poseen efectos más espectaculares. The processed separately from the front and rear channels brings the advantage of using two different virtual campuses, providing greater depth only to the rear channels, which are those with more spectacular effects. Una profundidad excesiva en los canales delanteros, sin embargo, dificultaría Ia inteligibilidad de los diálogos. Excessive depth in the front channels, however, difficult Ia intelligibility of the dialogues.

De acuerdo con realizaciones preferidas de Ia presente invención, Ia reverberación introducida en los canales Fl_i y FRi está dentro del rango de 0,5 segundos a 1 segundo, y Ia reverberación introducida en los canales SU y SRi está dentro del rango de 1 segundo a 3,5 segundos. According to preferred embodiments of the present invention, the reverberation introduced in the Fl_i and FRi channels is within the range of 0.5 seconds to 1 second, Ia reverberation introduced in the SU and SRi channels is within the range of 1 second 3.5 seconds.

Así, después de Ia operación de modelar Ia respuesta del recinto se obtienen como salida las señales del plano frontal FL 2 y FR 2 , y las señales del plano trasero SL 2 y SR 2 Thus, after the operation to model the response of the enclosure are obtained as output signals from the frontal plane FL 2 and FR 2, and backplane signals SL 2 and SR 2

4) Mezclar las señales obtenidas en Ia operación anterior junto con las señales LFE y C originales para obtener las señales de salida del canal izquierdo y el canal derecho (L y R). 4) Mix the signals obtained in the previous operation together with the original C LFE signals to obtain the output signals of the left channel and the right channel (L and R).

De acuerdo con una realización preferida de Ia presente invención, el procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, comprende, previamente a Ia operación final de mezcla, comprimir Ia señal del canal LFE, obteniéndose una señal LFE'. According to a preferred embodiment of the present invention, the process of converting sound binaural hybrid format 5.1, comprising, prior to mixing Ia final operation, compress the signal of the LFE channel, resulting in an LFE signal '.

Otra realización preferida de Ia invención comprende, previamente a Ia operación de auralización, las operaciones de: Another preferred embodiment of the invention comprises previously auralisation the operation of the operations:

a) Separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R. La separación se realiza utilizando un algoritmo de análisis de componentes independientes. a) Separate the channel signals FL, FR, C, SL, SR in the sources that compose music L, R music, voice and frontal impact, rear impact and rear impact L R. The separation is performed using an algorithm independent component analysis. Este análisis realiza una comparación de las distintas entradas (canales) que contienen información redundante en diferentes proporciones. This analysis makes a comparison of the different inputs (channels) containing redundant information in different proportions. Partiendo de Ia teoría de que varias señales se pueden considerar independientes si proceden de procesos físicos distintos, se logra aislar las distintas componentes, que en este caso son voz, música y efectos. From Ia theory that various signals can be considered independent if they come from different physical processes, it is achieved isolate the various components, which in this case are speech, music and effects.

b) Mezclar las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R para obtener las señales que constituirán Ia entrada a Ia operación subsiguiente de auralización de los canales. b) Mix music sources L, R music, voice and frontal impact, rear impact and rear impact L R for the signals that form the input to subsequent operation auralization Ia channels. Esta operación de mezcla reconstruye las señales FL, FR, C, SL y SR con las proporciones óptimas de las fuentes que se separaron en Ia operación anterior. This mixing operation rebuilds FL, FR, C, SL and SR signals with the optimum proportions of the sources separated in the previous operation.

De acuerdo con una realización preferida de Ia presente invención, Ia mezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R para obtener los canales se realiza según los siguientes rangos porcentuales: According to a preferred embodiment of the present invention, the mixture of music sources L, R music, voice and frontal impact, rear impact and rear impact L R for the channels is performed according to the following percentage ranges:

FL .:: 70-90% música L, 30-10% voz y efectos frontales FL. :: Music L 70-90%, 30-10% and frontal effects voice

FR *: 70-90% música R, 30-10% voz y efectos frontales FR *: 70-90% R music, voice and 30-10% frontal impact

C: 70-90% voz y efectos frontales, 30-10% música L y R C: 70-90% voice and frontal effects, music 30-10% L and R

SL: 70-90% efectos traseros L, 30-10% música L SL: rear effects L 70-90%, 30-10% music L

SR: 7700--9900%% efectos traseros R, 30-10% música R SR: %% rear impact 7700--9900 R, R music 30.10%

El objetivo de estas dos operaciones opcionales es garantizar que cada canal en el proceso de auralización contenga Ia proporción adecuada de las distintas componentes, ya que Ia mezcla original en 5.1 estaba optimizada para su reproducción a través de 6 altavoces físicos, esquema completamente distinto a un par de auriculares. The objective of these two optional operations is to ensure that each channel in the process of auralisation contains the appropriate proportion of the various components, as Ia original mixture in 5.1 was optimized for playback through 6 physical speakers, completely different scheme to a pair of headphones. A Ia hora de reproducir en auriculares, Ia información redundante característica de sistemas cuadrafónicos como el 5.1 obstaculiza Ia percepción de realismo espacial, y por eso es necesario este reajuste. A Ia when playing in headphones, Ia feature redundant information systems like quadraphonic 5.1 spatial perception hinders Ia realism, so this adjustment is necessary.

El canal de frecuencias graves LFE ya es en sí mismo una componente independiente, y por tanto su información no es redundante en los demás canales. The LFE channel bass frequencies is already in itself an independent component, and therefore their information is not redundant in the other channels. Por este motivo no se incluye en las operaciones iniciales opcionales de separación y mezcla. For this reason it is not included in the initial optional separation and mixing operations.

De acuerdo con otro aspecto de Ia invención, ésta se extiende también a programas de ordenador, en particular programas de ordenador en contenidos en una portadora, adaptados para llevar a cabo las operaciones del procedimiento descrito. According to another aspect of the invention, it also extends to computer programs, particularly computer programs contained in a carrier, adapted to carry out the operations of the procedure. El programa puede estar en forma de código fuente, código objeto o un código intermedio entre el código fuente y el código objeto, como una forma parcialmente compilada, o de cualquier otra forma adecuada para implementar las operaciones de Ia invención. The program may be in source code, object code or an intermediate code between source code and object code such as a partially compiled form, or any other suitable way to implement the operations of the invention.

La portadora puede ser cualquier dispositivo o entidad capaz de transportar el programa. The carrier may be any entity or device capable of carrying the program. Por ejemplo, Ia portadora puede comprender un medio de almacenamiento, como una ROM, un CD ROM o cualquier otro medio de almacenamiento magnético, por ejemplo un disquete o un disco duro. For example, the carrier may comprise a storage medium such as a ROM, a CD ROM or any other magnetic storage medium, eg a floppy disk or a hard disk. Además, Ia portadora puede ser una portadora de transmisión, como una señal eléctrica u óptica que se pueda comunicar a través de cable eléctrico, óptico, por radio o de cualquier otro modo. Furthermore, the carrier may be a carrier transmission, as electrical or optical signal that can communicate through electrical cable, optical, radio or otherwise.

Alternativamente, Ia portadora puede ser un circuito integrado en el que está almacenado el programa, estando el circuito adaptado para efectuar las operaciones del procedimiento. Alternatively, Ia carrier may be an integrated circuit in which the program is stored, being adapted to perform the operations of the process circuit. En particular, podría ser un ASIC, una FPGA, un DSP, un microprocesador o un microcontrolador. In particular, it could be an ASIC, an FPGA, a DSP, a microprocessor or microcontroller.

DESCRIPCIÓN DE LOS DIBUJOS Para complementar Ia descripción que se está realizando y con objeto de ayudar a una mejor comprensión de las características de Ia invención, de acuerdo con un ejemplo preferente de realización práctica de Ia misma, se acompaña como parte integrante de dicha descripción, un juego de dibujos en donde con carácter ilustrativo y no limitativo, se ha representado Io siguiente: DESCRIPTION OF THE DRAWINGS To complement the description being made and in order to aid a better understanding of the characteristics of the invention, according to a preferred practical embodiment thereof, attached as an integral part of said description, a set of drawings where in an illustrative and non-limiting character is represented:

Figura 1.- Muestra una vista de Ia ubicación de los altavoces físicos de un cine en un formato sonoro 5.1. Figure 1 shows a view of the physical location of a cinema speakers in a 5.1 sound format.

Figura 2.- Muestra un esquema explicativo de Ia posición de los ángulos de elevación (α) y de azimut (β). 2 shows an explanatory diagram of the position of the elevation angles (α) and azimuth (β).

Figura 3.- Muestra un esquema general de las operaciones del procedimiento de acuerdo con Ia presente invención. Figure 3 shows an overview of the operations of the method according to the present invention.

REALIZACIÓN PREFERENTE DE LA INVENCIÓN PREFERRED EMBODIMENT OF THE INVENTION

Se parte del sonido original de una película en formato 5.1 que se desea convertir en binaural híbrido, que en este caso está grabado en un disco de tipo It is part of the original sound of a movie in 5.1 format to be converted into hybrid binaural, which in this case is recorded on a disc type

DVD. DVD. La Figura 1 muestra Ia posición de los altavoces de los canales en una sala de cine con relación a Ia posición en Ia que debe estar situado el usuario para una experiencia sonora óptima. Figure 1 shows the position of the speaker channels in a movie theater regarding Ia position in which the user must be located for optimal sound experience.

En este ejemplo, el procedimiento Io efectúa un ordenador que, en primer lugar, como se muestra en Ia Figura 3, obtiene a partir del DVD las señales de los canales originales en formato 5.1 (FL, FR, C, SL, SR, LFE). In this example, the Io procedure carried out a computer first, as shown in Figure 3 obtained from the DVD signals of the original channels in 5.1 format (FL, FR, C, SL, SR, LFE ). El canal LFE es separado para ser procesado en paralelo de modo independiente, sufriendo únicamente una compresión que da como resultado Ia señal LFE'. The LFE channel is separated for parallel processing independently, suffering only compression resulting the signal LFE.

En este ejemplo, se proporciona un selector (S) que permite que el usuario seleccione o no las operaciones opcionales de extraer las fuentes de los canales originales y remezclarlas de acuerdo con unas proporciones nuevas para realzar Ia espectacularidad de Ia película. In this example, a selector (S) which allows the user to select or not the optional operations of extracting the sources of the original channels and remixing according to a new proportions to enhance spectacularity Ia of the film is provided. Para ello, se separan Ia fuentes (música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R), por ejemplo utilizando el algoritmo de separación de fuentes por análisis de componentes independientes 'FastICA', desarrollado por el HUT (Helsinki University of Technology), para volver a mezclarlos de acuerdo con unas proporciones nuevas optimizadas. To that end, the sources (music L, music R, voice and frontal impact, rear impact L and rear effects R) are separated, for example using the algorithm source separation by independent component analysis 'FastICA', developed by HUT (Helsinki University of Technology), to re-mix according with new optimized proportions. En este ejemplo supondremos que Ia película es de acción, Io cual implica Ia existencia de una serie de características sonoras, como explosiones, tiros, ruido de motores, etc. In this example we will assume that Ia is an action film, Io which implies the existence of a series of sound characteristics, such as explosions, shots, engine noise, etc. Para conseguir Ia mayor espectacularidad posible en este tipo de películas, se han determinado las siguientes proporciones óptimas de mezcla: To get more spectacular Ia possible in these films, they have determined the following optimal mixing ratios:

FL': 80% música L + 20% voz y efectos frontales FR': 80% música R + 20% voz y efectos frontales FL ': 80% + 20% L music and voice effects frontal FR': 80% + 20% R music voice and frontal effects

C: 80% voz y efectos frontales + 20% música L y R C: 80% front voice and music effects + 20% L and R

SL': 80% efectos traseros L + 20% música L SL ': 80% rear effects music L + 20% L

SR': 80% efectos traseros R + 20% música R SR ': 80% rear effects R + 20% music R

Una vez mezcladas las fuentes en los canales de este modo optimizado, se separa el canal de diálogos (C) del resto, los canales FL', FR', SL' y SR' son auralizados cada uno de ellos en una situación geométrica óptima para realzar Ia espectacularidad de Ia experiencia sonora del usuario. Once mixed sources in the channels of this optimized mode, the channel dialogues (C) the rest is separated, the FL ', FR', SL 'and SR are auralizados each in an optimal geometric situation Ia Ia enhance sound spectacular user experience. En este caso, se ha considerado que el oyente tiene las características de un usuario estándar basado en las respuestas al impulso de un maniquí Kemar. In this case, it was considered that the listener has the characteristics of a standard user based on the impulse responses of a Kemar mannequin.

A continuación se presentan las posiciones óptimas de los canales, descritas a través del ángulo de elevación (α) y del ángulo de azimut (β) que forman con el oyente: Then optimal channel positions, described through the elevation angle (α) and azimuth angle (β) that form with the listener are presented:

FL': elevación 15°; FL ': elevation 15 °; azimut -20° -20 ° Azimuth

FR': elevación 15°; FR ': elevation 15 °; azimut 20° SL': elevación 180°; Azimuth 20 ° SL ': lifting 180 °; azimut -40° SR': elevación 180°; Azimuth -40 ° SR ': lifting 180 °; azimut 40° 40 ° Azimuth

La Figura 2 muestra Ia referencia de Ia ubicación de los ángulos de elevación y azimut, respectivamente α y β. Figure 2 shows the location of Ia reference elevation angles and azimuth, respectively α and β. Después de Ia operación de auralización, se obtienen las señales FL'i, FR'i , SL'i y SRV A continuación, se procesan las señales FL'i y FR'i con Ia respuesta al impulso de un recinto similar a una sala de cine, con un tiempo de reverberación (T r ) de 0,5 segundos aproximadamente; After the operation of auralisation, the FL'i, FR'i, SRV SL'i and then signals are obtained, the FL'i and FR'i signals are processed with the response to the impulse of a similar enclosure to a room film, with a reverberation time (T r) of about 0.5 seconds; y las señales SL'i y SR'i con Ia respuesta al impulso de otro recinto similar a una sala de cine diferente, con un tiempo de reverberación de 2 segundos aproximadamente. and SL'i and SR'i signals Ia impulse response similar to a cinema hall different grounds, a reverberation time of approximately 2 seconds.

Finalmente, se mezclan los canales obtenidos en Ia operación anterior, FL'2, FR'2, SL'2 y SR'2 con los canales LFE' y C para obtener únicamente dos señales en formato binaural híbrido correspondientes a los canales L y R de unos auriculares. Finally, the channels obtained in the previous operation, FL'2, FR'2, SL'2 and SR'2 with LFE and C channels for just two binaural hybrid format signals corresponding to the L and R channels are mixed headphones.

Patent Citations
Cited PatentFiling datePublication dateApplicantTitle
WO2007123788A2 *3 Apr 20071 Nov 2007Srs Labs, Inc.Audio signal processing
EP1816890A1 *30 Jan 20078 Aug 2007Sony CorporationAudio reproducing system and method thereof
US5742689 *4 Jan 199621 Apr 1998Virtual Listening Systems, Inc.Method and device for processing a multichannel signal for use with a headphone
US6002775 *14 Aug 199814 Dec 1999Sony CorporationMethod and apparatus for electronically embedding directional cues in two channels of sound
Non-Patent Citations
Reference
1 *'Neural Networks, 2005. Proceedings. 2005 IEEE International Joint Conference on Montreal', vol. 2, QUE., CANADA. article CIARAMEL THE A.: 'BSS toolbox for delayed and convolved mixtures', pages 1245 - 1250
2 *TECHNOLOGIES FOR PRESENTATION OF SORROUND-SOUND IN HEADPHONES., [Online] 17 December 2007, Retrieved from the Internet: <URL:http://www. headwize.com/tech/sshd_ tech.htm> [retrieved on 2009-03-23]
Classifications
International ClassificationH04S3/00
Cooperative ClassificationH04S2400/01, H04S3/008
European ClassificationH04S3/00D
Legal Events
DateCodeEventDescription
16 Sep 2009121Ep: the epo has been informed by wipo that ep was designated in this application
Ref document number: 08870792
Country of ref document: EP
Kind code of ref document: A1
20 Jul 2010NENPNon-entry into the national phase in:
Ref country code: DE
16 Feb 2011122Ep: pct app. not ent. europ. phase
Ref document number: 08870792
Country of ref document: EP
Kind code of ref document: A1