Search Images Play YouTube Gmail Drive Calendar Translate More »
Sign in
Screen reader users: click this link for accessible mode. Accessible mode has the same essential features but works better with your reader.

Patents

  1. Advanced Patent Search
Publication numberWO2009090281 A1
Publication typeApplication
Application numberPCT/ES2008/070246
Publication date23 Jul 2009
Filing date30 Dec 2008
Priority date17 Jan 2008
Publication numberPCT/2008/70246, PCT/ES/2008/070246, PCT/ES/2008/70246, PCT/ES/8/070246, PCT/ES/8/70246, PCT/ES2008/070246, PCT/ES2008/70246, PCT/ES2008070246, PCT/ES200870246, PCT/ES8/070246, PCT/ES8/70246, PCT/ES8070246, PCT/ES870246, WO 2009/090281 A1, WO 2009090281 A1, WO 2009090281A1, WO-A1-2009090281, WO2009/090281A1, WO2009090281 A1, WO2009090281A1
InventorsArrondo Ivan Portas
ApplicantAuralia Emotive Media Systems, Arrondo Ivan Portas
Export CitationBiBTeX, EndNote, RefMan
External Links: Patentscope, Espacenet
Method of converting 5.1 sound format to hybrid binaural format
WO 2009090281 A1
Abstract
Method of converting 5.1 sound format to hybrid binaural format, comprising obtaining the signals from the FL, FR, C, SL, SR and LFE channels in 5.1 format which it is desired to convert into hybrid binaural format; auralizing the FL, FR, SL and SR channels in the following positions: FL: elevation from 0° to 30°, azimuth from -10° to -30°; FR: elevation from 0° to 30°, azimuth from +10° to +30°; SL: elevation from 175° to 195°, azimuth from -30° to -60°; SR: elevation from 175° to 195°, azimuth from +30° to +60°, thus obtaining the signals FL1, FR1, SL1 and SR1; modelling the response from the enclosure on the basis of the signals, introducing a reverberation effect; and mixing the signals FL2, FR2, SL2 and SR2 obtained in the previous step with the original LFE and C signals to obtain the two left and right output signals.
Claims  translated from Spanish  (OCR text may contain errors)
REIVINDICACIONES Claims
1. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones 1. A method of converting a hybrid sound binaural 5.1 format, comprising the following operations
obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido; get the signals of the channels FL, FR, C, SL, SR and LFE 5.1 format you want to convert into binaural format hybrid;
auralizar los canales FL, FR, SL y SR en las siguientes posiciones: auralizar the FL, FR, SL and SR channels in the following positions:
FL: elevación de 0 o a 30°; FL: elevation of 0 or 30 °; azimut de -10 o a -30°. azimuth of -10 or -30 °.
FR: elevación de 0 o a 30°; FR: elevation of 0 or 30 °; azimut de +10 a +30°. azimuth of +10 to + 30 °.
SL: elevación de 175° a 195°; SL: elevation of 175 ° to 195 °; azimut de -30° a -60°. azimuth of -30 ° to -60 °.
SR: elevación de 175° a 195°; SR: elevation of 175 ° to 195 °; azimut de +30° a +60°, azimuth of + 30 ° to + 60 °,
obteniéndose como resultado las señales FLi, FRi, SLi y SRi; obtained as a result of LiF, FRi, SLi and SRi signals;
procesar independientemente las señales del plano frontal (FLi y FRi) y las del plano trasero (SLi y SRi), utilizando para ello, las respuestas a impulso de dos recintos virtuales diferentes, optimizados cada uno de ellos para dichos planos, obteniéndose como resultado las señales FL 2 , FR 2 , SL 2 y SR 2 ; independently process signals from the frontal plane (LiF and FRi) and backplane (SLi and SRi), using the impulse responses of two different virtual campuses, each optimized for these planes, resulting in the two signals FL, FR 2, SL 2 and SR 2;
mezclar las señales FL 2 , FR 2 , SL 2 y SR 2 obtenidas en Ia operación anterior junto con las señales originales LFE y C para obtener las dos señales de salida izquierda y derecha. mix FL 2 FR 2, SL 2 and SR 2 signals obtained in the previous operation together with the original LFE signals and C signals for both left and right output.
2. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque las respuestas a impulso de los recintos virtuales utilizados para el procesado del plano frontal y trasero, comprenden tiempos de reverberación de entre 0,5 sy 1 s para el primero, y de entre 1 sy 3,5 s para el segundo. 2. Conversion Procedure 5.1 hybrid sound binaural format according to the preceding claim, characterized in that the impulse responses of the virtual enclosures used for processing the front plane and rear comprise reverberation time of 0.5 s and 1 s for the first, and between 1 s and 3.5 s for the second.
3. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque comprende, previamente a Ia operación final de mezcla, una compresión del canal LFE. 3. Conversion Procedure 5.1 hybrid sound binaural format according to any of the preceding claims, characterized in that, prior to Ia final operation comprising mixing a compression of the LFE channel.
4. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con cualquiera de las reivindicaciones anteriores, caracterizado porque antes de Ia operación de auralización comprende las operaciones de: Procedure 4. Conversion 5.1 hybrid sound binaural format according to any of the preceding claims, characterized in that before the operation for auralization comprising the steps of:
separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen: música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R; separate channel signals FL, FR, C, SL, SR in the sources that make up: L music, music R, voice and frontal impact, rear impact and rear impact R L;
remezclar las fuentes estimadas en proporciones optimizadas para procesos posteriores, reconstruyendo los canales FL, FR, C, SL y SR. remixing the estimated proportions for subsequent processes optimized sources, reconstructing the channels FL, FR, C, SL and SR.
5. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque Ia operación de remezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R se realiza de acuerdo con los siguientes rangos porcentuales: 5. The process of converting a hybrid sound 5.1 binaural format according to the preceding claim, wherein the operation of the remix music sources L, R music, voice and frontal impact, rear impact and rear impact L R is made according the following percentage ranges:
FL .:: 70-90% música L, 30-10% voz y efectos frontales FL. :: L music 70-90%, 30-10% and frontal voice effects
FR *: 70-90% música R, 30-10% voz y efectos frontales FR *: R music 70-90%, 30-10% and frontal voice effects
C: 70-90% voz y efectos frontales, 30-10% música L y R C: 70-90% voice and frontal effects, music 30-10% L and R
SL: 70-90% efectos traseros L, 30-10% música L SL: 70-90% rear effects L, L 30-10% music
SR: 7700--9900%% efectos traseros R, 30-10% música R SR: 7700--9900 rear effects %% R, R Music 30-10%
6. Procedimiento de conversión de formato sonoro 5.1 a binaural híbrido de acuerdo con Ia reivindicación anterior, caracterizado porque es llevado a cabo por uno dispositivo de entre los de Ia siguiente lista: un ASIC, una FPGA, un DSP, un microprocesador y un microcontrolador. 6. The process of converting a hybrid sound 5.1 binaural format according to the preceding claim, characterized in that it is carried out by one device from the following list of Ia: an ASIC, an FPGA, a DSP, a microprocessor and a microcontroller .
7. Programa de ordenador que comprende instrucciones de programa que provocan que un ordenador lleve a cabo las operaciones del método de acuerdo con cualquiera de las reivindicaciones anteriores. 7. Computer program comprising program instructions that cause a computer to perform the method steps according to any of the preceding claims.
8. Programa de ordenador de acuerdo con Ia reivindicación 7, caracterizado porque está almacenado en unos medios de almacenamiento. 8. A computer program according to claim 7, characterized in that it is stored in a storage means.
9. Programa de ordenador de acuerdo con Ia reivindicación 7, caracterizado porque se transmite a través de una señal portadora. 9. A computer program according to claim 7, wherein is transmitted through a carrier signal.
Description  translated from Spanish  (OCR text may contain errors)

PROCEDIMIENTO DE CONVERSIÓN DE FORMATO SONORO 5.1 A FORMAT CONVERSION PROCEDURE 5.1 SOUND

BINAURAL HÍBRIDO BINAURAL HYBRID

DESCRIPCI Ó N DESCRIPTION

OBJETO DE LA INVENCIÓN OBJECT OF THE INVENTION

El objeto principal de Ia presente invención es un procedimiento para convertir sonido en formato sonoro 5.1 , habitualmente utilizado para registro y reproducción sonora digital de contenido cinematográfico, en formato binaural híbrido. The main object of the present invention is a process for converting sound into 5.1 sound format typically used for digital sound recording and reproduction of film content in binaural hybrid format.

ANTECEDENTES DE LA INVENCIÓN BACKGROUND OF THE INVENTION

Actualmente, el formato 5.1 representa el estándar para Ia reproducción sonora doméstica de cine. Currently, the 5.1 format is the standard for playback Ia home theater sound. Un sistema sonoro en formato 5.1 está compuesto por seis canales de audio donde se mezclan en distintas proporciones las señales de música, voz, efectos sonoros, etc. A sound system 5.1 format consists of six audio channels where signals from music, voice, sound effects are mixed in different proportions, etc. Cada uno de los canales corresponde a un altavoz, ya su vez cada uno de los altavoces debe estar situado en una ubicación concreta con relación al usuario para conseguir una sensación sonora óptima. Each channel corresponds to a speaker, and in turn each of the speakers must be placed in a specific location relative to the user for optimum sound sensation.

Los altavoces principales (FL y FR en Ia Figura 1 ) forman idealmente un triángulo equilátero con Ia posición del usuario (O). The main speakers (FL and FR in Figure 1) ideally form an equilateral triangle with the position of the user (O). Además, las rectas formadas por los altavoces envolventes (SL y SR) y el usuario (O) forman un ángulo de aproximadamente 110° con respecto al eje vertical (recta que une O y C). Furthermore, the straight lines formed by the surround speakers (SL and SR) and the user (O) form an angle of approximately 110 ° to the vertical axis (line connecting O and C). El altavoz LFE (Low Frequency Enhancement, en sus siglas en inglés), tiene por objeto realzar los sonidos graves para producir un efecto impactante en Ia reproducción. The speaker LFE (Low Frequency Enhancement, its acronym in English), aims to boost the bass sounds to produce a striking effect on reproduction Ia. Su ubicación no es determinante, ya que Ia información que transmite tiene un espectro de frecuencias generalmente menor de 100 Hz, que tiene una naturaleza omnidireccional. Its location is not decisive, since Ia information transmitted has a spectrum of generally lower frequencies of 100 Hz, which has an omnidirectional nature. Es decir, no se puede determinar de donde proviene el sonido. That is, you can not determine where the sound is coming.

Un inconveniente de los sistemas de audio basados en el formato 5.1 es que la sensación sonora del usuario se deteriora rápidamente cuando éste no está situado en Ia ubicación óptima con respecto de los altavoces. A drawback of audio systems based on 5.1 sound format is that user feel deteriorates rapidly when it is not located in the optimum location relative to the speakers. La utilización de auriculares permite, sin embargo, una colocación óptima del usuario en todo momento, ya que los sistemas de reproducción sonora, al estar adheridos a Ia cabeza del usuario, no modifican su posición relativa respecto a su cabeza. Using headphones allows, however, optimal positioning of the user at all times, as playback systems, being attached to the head of the user, not change its position relative to his head.

Sin embargo, el ser humano es un receptor sonoro volumétrico, es decir, procesa el sonido que llega a él a través de, por ejemplo, reflexiones creadas por los hombros y el torso, o difracciones creadas por el sonido al rodear Ia cabeza. However, the human being is a volumetric sound receiver, ie processes sound that reaches him through, for example, reflections created by the shoulders and torso, or diffractions created by sound to surround the head. La audición humana es por naturaleza binaural, donde Ia resultante de todo el proceso de recepción sonora termina en dos únicos canales: oído derecho y oído izquierdo. Human binaural hearing is by nature, wherein the resultant of all the sound reception process ends in only two channels: left ear and right ear. El término "binaural" hace referencia a Ia naturaleza de Ia audición humana, debido a que las personas somos capaces de captar toda Ia información espacial sonora a través de un único par de oídos. The term "binaural" refers to Ia Ia nature of human hearing, because people are able to capture all sound the spatial information through a single pair of ears.

Cuando no se tiene en cuenta esta fenomenología se suele producir el denominado "sonido intracraneal", como por ejemplo al escuchar sonido estéreo tradicional a través de auriculares. When not follow this phenomenology is usually produced called "intracranial sound" such as traditional stereo sound when listening through headphones. El sonido intracraneal consiste en Ia sensación de que las fuentes sonoras se encuentran en el interior del cráneo del usuario, en un punto situado entre los dos auriculares, por Io que el sonido estéreo tradicional no es un formato aconsejable cuando se tratan de representar de forma realista espacios sonoros tridimensionales. Intracranial sound consists of the feeling that the sound sources are inside the skull of the user, at a point between the two headphones, due to which the traditional stereo format is not advisable when trying to represent such realistic three-dimensional sound spaces.

Existen fundamentalmente dos formas de lograr reproducciones binaurales: There are essentially two ways to achieve binaural reproduction:

La primera de ellas consiste en sustituir el par de receptores puntuales que se utiliza habitualmente por receptores volumétricos, como maniquíes, logrando de ese modo que el sonido que llega a ellos se procese de forma natural. The first is to replace the pair of specific receptors that are commonly used for volumetric receivers, like mannequins, thereby achieving the sound that reaches them is processed naturally. De este modo se logra una grabación estéreo binaural, donde queda ya introducida toda Ia fenomenología descrita anteriormente. Thereby recording a binaural stereo, where all phenomenology Ia and described above is introduced is achieved.

La segunda se basa en realizar un procedimiento de auralización. The second is based on performing a procedure auralization. Para ello, se suele medir o modelar Ia respuesta de un determinado receptor (un maniquí o un ser humano, por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente un ruido de banda ancha emitido desde un determinado punto alrededor del usuario). To do this, is usually measured or model the response of a given receptor (a dummy or a human, for example) to a pulse signal from a given point in space (typically a broadband noise emitted from a point around user). La patente US 2007213990 describe un método para transformar una señal estéreo bacanal tradicional en una señal binaural, centrándose en el tratamiento que debe sufrir Ia señal de entrada de cara a su preparación para ser transformada en sonido tridimensional. The US 2007213990 discloses a method for transforming a traditional stereo signal bacchanal in a binaural signal, focusing on the treatment they must suffer the input signal ahead of their preparation to be transformed into three-dimensional sound. Específicamente, se describe cómo dividir Ia señal de entrada según distintas bandas de frecuencia para, una vez dividida Ia señal de entrada, auralizar cada sub-banda y finalmente unirlas para formar los dos canales de salida en formato binaural. Specifically, it describes how to divide the input signal according to different frequency bands, once the input signal divided auralizar each sub-band and finally unite to form the two output channels in binaural format.

DESCRIPCIÓN DE LA INVENCIÓN DESCRIPTION OF THE INVENTION

La presente invención describe un nuevo procedimiento para Ia auralización en tiempo real de audio en formato 5.1. The present invention describes a new method for the real-time auralization 5.1 audio format. Para lograr un resultado óptimo, cada canal es tratado y auralizado independientemente, de modo que es posible asignar parámetros acústicos específicos a cada uno de ellos con el objetivo de hacer más realista y espectacular Ia reproducción. For optimal results, each channel is treated and auralizado independently so that you can assign specific acoustic parameters to each order to make more realistic and spectacular Ia playback.

Las ventajas más importantes del procedimiento de Ia invención se pueden resumir en las siguientes: The most important advantages of the method of the invention can be summarized as follows:

Se consigue una reproducción óptima en todos los casos, ya que, al estar los auriculares adheridos al usuario, Ia posición relativa entre el sistema de reproducción y el usuario no varía. Optimum playback in all cases, since, being attached to the user's headphones, the relative position between the reproduction system and the user does not change is achieved.

El modelo híbrido que se describe, que combina Ia auralización de los canales FL, FR, SL y SR con los canales monofónicos originales C y LFE permite una mayor inteligibilidad de los diálogos, al no existir interferencias entre los canales frontales y el canal C, así como una inmersión superior debido a Ia constante referenciación inconsciente que realiza el cerebro entre el canal C monofónico y los canales auralizados. The hybrid model described, which combines the auralization Ia FL, FR, SL and SR with the original mono channels C and LFE channels allows greater intelligibility of the dialogue, in the absence interference between the front channels and the channel C, and a dive superior because Ia constant referencing unconscious brain makes between mono channel C and auralizados channels.

El reajuste de las proporciones de los diferentes tipos de información, mediante Ia separación de fuentes y posterior remezclado, permite optimizar desde el inicio el contenido de los distintos canales para lograr un resultado óptimo. The adjustment of the proportions of different types of information, through the separation of sources and later remixed, from the beginning optimizes the content of the different channels for optimal results.

La colocación virtual específica de los canales FL y FR, así como el modelado del recinto específico, permiten un perfecto equilibrio con el canal de diálogos C, no interfiriendo con su inteligibilidad y dotando de Ia profundidad justa al plano frontal. The specific virtual placement of the FL and FR channels as well as modeling the specific compound, allow a perfect balance with the channel dialogues C, not interfering with their intelligibility and infusing the frontal plane Ia fair depth.

La colocación virtual específica de los canales SL y SR, así como el modelado de un recinto específico diferente para los canales de los planos delantero y trasero, aportan una sensación de profundidad trasera impactante, dotando al sistema de planos diferenciados de reproducción sonora, creando de este modo una experiencia altamente inmersiva. The specific placement of virtual SL and SR channels, as well as modeling of a different specific channels enclosure for the front and rear planes, provide a feeling of striking back depth, providing the system with different levels of sound reproduction, creating Thus a highly immersive experience.

El refuerzo del canal LFE permite recrear las sensaciones producidas por las componentes graves en las salas de cine, equilibrando el sistema de reproducción. Strengthening the LFE channel recreates the sensations produced by the serious components in cinemas, balancing the playback system.

En el presente documento, el término "auralizar" hace referencia al procesado de los diferentes canales para conseguir que el usuario tenga Ia impresión de que provienen de lugares del espacio concretos, consiguiéndose así una espectacularidad e inteligibilidad optimizadas. In this document, the term "auralizar" refers to the processing of different channels to get the user to have the printing that come from places of concrete space, thereby achieving a spectacular and optimized intelligibility.

Del mismo modo, el término "canal" hace referencia a Ia señal de cada uno de los altavoces que componen el formato de sonido 5.1 o el formato de sonido binaural híbrido. Similarly, the term "channel" refers to the signal of each of the speakers that make the sound format 5.1 or hybrid format binaural sound. Así, hablaremos de los canales FL, FR, C, SL, SR o LFE, que son los canales de entrada en formato 5.1 y de los canales L y R, que son los canales de salida en formato binaural. So, talk channels FL, FR, C, SL, SR and LFE, which are the input channels in 5.1 format and the L and R channels are output channels in binaural format. Se utilizarán las letras "L" y "R" para distinguir entre las posiciones de los canales situadas a Ia izquierda (left, en inglés) y derecha (right, en inglés) del usuario. The letters "L" is used, and "R" to distinguish between the positions of the channels located Ia left (left, in English) and right (right, in English) of the user. También se utilizarán los términos "plano frontal" y "plano trasero" para hacer referencia a Ia posición de los canales frente al usuario o detrás del usuario, así como "plano lateral derecho" o "plano lateral izquierdo" para hacer referencia a Ia posición de los canales a los lados del usuario. The terms "front plane" and will also be used "flat back" to refer to the position of the channel towards the user or behind the user and "right side up" or "left lateral plane" to refer to the position channels on the sides of the user.

Por otro lado, el término "fuente" se refiere a una señal que contiene sonidos de un solo proceso físico, es decir, las fuentes serán, en general, música, voz y efectos. Furthermore, the term "source" refers to a sound signal containing a single physical process, that is, the sources will, in general, music, voice and effects.

Se define también el término "binaural híbrido" como un formato sonoro que mezcla canales auralizados con canales no auralizados o monofónicos. The term "hybrid binaural" is also defined as an audio format that mixes auralizados channels with no auralizados or monophonic channels. Concretamente, Ia presente invención mezcla los canales auralizados FL, FR, SL y SR con los canales no auralizados C y LFE. Specifically, the present invention mixes auralizados channels FL, FR, SL and SR with no auralizados C and LFE channels.

De acuerdo con un aspecto de Ia presente invención, se describe un procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, caracterizado porque comprende las siguientes operaciones: According to one aspect of the present invention, a method of converting audio format Hybrid 5.1 binaural described, characterized by comprising the following operations:

1 ) Obtener las señales de los canales FL, FR, C, SL, SR y LFE del formato 5.1 que se desea convertir en formato binaural híbrido. 1) Obtain the channel signals FL, FR, C, SL, SR and LFE 5.1 format you want to convert into binaural hybrid format. La información que contienen estas señales es normalmente una mezcla de varias fuentes, donde: The information contained in these signals is usually a mixture of several sources, where:

FL: contiene principalmente música, y en menor medida voz y efectos. FL, contains mainly music, and less voice and effects.

FR: contiene principalmente música, y en menor medida voz y efectos. FR, contains mainly music, and less voice and effects. C: contiene principalmente voz, y en menor medida música y efectos. C contains mainly voice, and less music and effects. SL: contiene principalmente efectos, y en menor medida música. SL, contains mainly effects, and less music. SR: contiene principalmente efectos, y en menor medida música. SR, contains mainly effects, and less music. LFE: contiene únicamente graves. LFE: contains only serious.

2) Auralizar los canales FL, FR, SL y SR en las siguientes posiciones: FL: elevación de 0 o a 30°; 2) Auralizar channels FL, FR, SL and SR in the following positions: FL: elevation of 0 or 30 °; azimut de -10 o a -30°. azimuth of -10 or -30 °.

FR: elevación de 0 o a 30°; FR: elevation of 0 or 30 °; azimut de +10 a +30°. azimuth of +10 to + 30 °.

SL: elevación de 175° a 195°; SL: elevation of 175 ° to 195 °; azimut de -30° a -60°. azimuth of -30 ° to -60 °. SR: elevación de 175° a 195°; SR: elevation of 175 ° to 195 °; azimut de +30° a +60°. azimuth of + 30 ° to + 60 °.

obteniéndose como resultado las señales FLi, FRi, SLi y SRi. obtained as a result of LiF, FRi, SLi and SRi signals.

Diremos que "auralizar" un canal en una posición determinada significa ubicar virtualmente ese canal de forma que Ia reproducción de las señales resultantes, una para el canal derecho y otra para el canal izquierdo, a través de unos auriculares producen Ia sensación en el usuario de que los sonidos de ese canal provienen de esa posición determinada del espacio. We say that "auralizar" one channel at a given position means that virtually locate Ia channel playback so that the resulting signals, one for the right channel and one for the left channel through headphones produce Ia feeling in the user sounds that come from that particular channel position in space.

Dicho de otro modo, auralizar es un proceso mediante el cual un canal carente de información espacial habitualmente monofónico, como en este caso, es decir, anecoico o seco, es procesado mediante un procedimiento llamado convolución, con Ia respuesta al impulso (respuesta en tiempo y frecuencia a un determinado estímulo acústico proveniente de un determinado punto del espacio) de un determinado oyente. In other words, auralizar is a process by which a channel devoid of regularly mono spatial information, as in this case, ie anechoic or dry, is processed by a procedure called convolution with Ia impulse response (response time and frequency to a certain acoustic stimulus from a given point in space) of a given listener.

Sin embargo, debido a las diferencias físicas entre los diferentes usuarios (tamaño, distancia entre los oídos, etc.), no todos ellos responden de igual modo ante los nuevos canales FLi, FRi, SLi y SRi. However, due to the physical differences between the different users (size, distance between the ears, etc.), not all respond the same way to the new FLi, FRi, SLi and SRi channels.

Para conocer Ia respuesta de cada tipo de usuario, se modela o se mide Ia respuesta de un determinado receptor (un maniquí o un ser humano por ejemplo) a una señal de impulso proveniente de un determinado punto del espacio (habitualmente ruido de banda ancha emitido desde un determinado punto alrededor del usuario). To know the response of each user type, is modeled or measured the response of a given receptor (a dummy or a human being for example) to a pulse signal from a given point in space (usually broadband noise emitted from a point around the user). Ésta respuesta al impulso del usuario se utiliza más tarde para procesar una fuente monofónica (sin información espacial) mediante un proceso de convolución, logrando así el efecto de escuchar dicha fuente situada en el punto donde ha sido emitido el impulso. This user impulse response is later used to process a mono source (without spatial information) by a convolution process, thus achieving the effect of listening to that source located at the point where the momentum has been issued.

Los inventores han descubierto que situar virtualmente los canales FL, FR, SL y SR dentro de los rangos angulares descritos anteriormente proporciona a todos los usuarios una sensación de espectacularidad óptima. The inventors have found that virtually placing the channels FL, FR, SL and SR within the angular ranges described above provides all users a sense of optimum spectacle.

El motivo de que los rangos angulares de los altavoces frontales (FL y FR) no sean muy grandes es evitar Ia pérdida de inteligibilidad del canal de diálogos (C) debido a una imagen estéreo excesiva de Ia música, es decir, que Ia energía del canal FL vaya casi completamente a L y Ia energía de FR vaya casi completamente a R, y evitar Ia llegada de una gran cantidad de energía a los planos laterales, cerca de los oídos que interfiera en Ia localización de los canales del plano trasero (SL y SR). The reason that the angular ranges of the front speakers (FL and FR) are not too large is to prevent the loss of intelligibility channel dialogues (C) due to an image excessive stereo Ia music, namely, that the energy of FL channel go almost entirely to the energy of L and go almost completely FR R, Ia and prevent arrival of a lot of energy to the lateral planes, near the ears which interfere with the localization of the channels of backplane (SL and SR).

El canal de diálogos (C) no se procesa en Ia operación de procesado de las señales de los canales FL, FR, SL y SR, ya que mantenerlo como fuente aporta dos grandes ventajas a Ia salida final del procedimiento. The channel dialogues (C) is not processed in the operation of signal processing channels FL, FR, SL and SR, since I keep as a source brings two major benefits to the outlet end of the procedure.

La primera de ellas es ganar en inteligibilidad respecto al formato de entrada, ya que al mantener este canal intacto y auralizar los de los planos frontal (FL y FR) y trasero (SL y SR), los diálogos (C) quedan destacados en Ia posición central, reduciendo Ia fatiga auditiva para su seguimiento. The first one is to win in intelligibility for the format input as to keep intact and auralizar those of the front and rear (SL and SR) planes (FL and FR) channel dialogues (C) are featured in Ia center position, thereby reducing the auditory fatigue for tracking.

La segunda ventaja reside en el hecho de constituir un punto de referencia auditivo para el cerebro, ya que mantener su naturaleza intracraneal hace ideal su combinación con los canales auralizados. The second advantage lies in the fact that it is a point of reference for the auditory brain as they keep their intracranial nature makes it ideal combination with auralizados channels. De este modo, el cerebro compara constantemente Ia posición de este canal con los auralizados, haciendo Ia experiencia auditiva del usuario mucho más espectacular. Thus, the brain constantly compares the position of this channel with auralizados, Ia listening experience of doing much more spectacular user.

El canal LFE tampoco se procesa en esta operación del procedimiento debido a Ia naturaleza no direccional de las frecuencias que contiene, es decir, da Ia sensación de ser escuchado en todas las posiciones. The LFE channel is not processed in this step of the process because Ia non-directional nature of the frequencies it contains, ie Ia gives feeling to be heard in all positions. Esta característica hace que los altavoces destinados a Ia reproducción de este canal puedan ser situados prácticamente en cualquier lugar del recinto. This feature makes the speakers for playback Ia this channel can be located virtually anywhere in the room.

3) Modelar respuestas de recinto independientes para los planos frontal y trasero. 3) Modeling responses of independent grounds for the front and back planes.

Se procesan los canales del plano frontal (FLi, FRi) y trasero (SU , SRi) independientemente utilizando dos respuestas a impulso de recintos optimizados diferentes. The channels of the frontal plane (LiF, FRi) Rear (SU, SRi) independently using two different impulse responses optimized enclosures are processed. El procesado por separado de los canales frontales y traseros aporta Ia ventaja de utilizar dos recintos virtuales diferentes, dotando de mayor profundidad únicamente a los canales traseros, que son los que poseen efectos más espectaculares. The processed separately from the front and rear channels provides the advantage of using two different virtual campuses, providing greater depth only to the rear channels, which are those with more spectacular effects. Una profundidad excesiva en los canales delanteros, sin embargo, dificultaría Ia inteligibilidad de los diálogos. Too deeply into the front channels, however, difficult Ia intelligibility of dialogues.

De acuerdo con realizaciones preferidas de Ia presente invención, Ia reverberación introducida en los canales Fl_i y FRi está dentro del rango de 0,5 segundos a 1 segundo, y Ia reverberación introducida en los canales SU y SRi está dentro del rango de 1 segundo a 3,5 segundos. According to preferred embodiments of the present invention, the input to the reverberation and FRi Fl_i channels is within the range 0.5 seconds to 1 second, and introduced into the reverberation Ia and SRi SU channels is within the range from 1 second to 3.5 seconds.

Así, después de Ia operación de modelar Ia respuesta del recinto se obtienen como salida las señales del plano frontal FL 2 y FR 2 , y las señales del plano trasero SL 2 y SR 2 Thus, after the operation for modeling the response of the enclosure are obtained as output signals from the frontal plane FL 2 and FR 2 and backplane signals SL 2 and RO 2

4) Mezclar las señales obtenidas en Ia operación anterior junto con las señales LFE y C originales para obtener las señales de salida del canal izquierdo y el canal derecho (L y R). 4) Mix the signals obtained in the previous operation along with the LFE and original C signals for the output signals of the left channel and right channel (L and R).

De acuerdo con una realización preferida de Ia presente invención, el procedimiento de conversión de formato sonoro 5.1 a binaural híbrido, comprende, previamente a Ia operación final de mezcla, comprimir Ia señal del canal LFE, obteniéndose una señal LFE'. According to a preferred embodiment of the present invention, the process of converting audio format binaural Hybrid 5.1, comprising, prior to the end Ia mixing operation, compress the signal of the LFE channel, yielding an LFE signal '.

Otra realización preferida de Ia invención comprende, previamente a Ia operación de auralización, las operaciones de: Another preferred embodiment of the invention comprises previously the operation for auralization, the steps of:

a) Separar las señales de los canales FL, FR, C, SL, SR en las fuentes que los componen música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R. La separación se realiza utilizando un algoritmo de análisis de componentes independientes. a) Separate channel signals FL, FR, C, SL, SR in the sources that compose music L, R music, voice and frontal impact, rear impact and rear impact L R. The separation was performed using an algorithm independent component analysis. Este análisis realiza una comparación de las distintas entradas (canales) que contienen información redundante en diferentes proporciones. This analysis makes a comparison of the different inputs (channels) that contain redundant information in different proportions. Partiendo de Ia teoría de que varias señales se pueden considerar independientes si proceden de procesos físicos distintos, se logra aislar las distintas componentes, que en este caso son voz, música y efectos. Ia starting from theory that various signals can be considered independent if they come from different physical processes, is achieved isolate the various components, which in this case are speech, music and effects.

b) Mezclar las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R para obtener las señales que constituirán Ia entrada a Ia operación subsiguiente de auralización de los canales. b) Mix music sources L, R music, voice and frontal impact, rear impact and rear impact L R signals for the inlet to form Ia auralization subsequent operation of channels. Esta operación de mezcla reconstruye las señales FL, FR, C, SL y SR con las proporciones óptimas de las fuentes que se separaron en Ia operación anterior. That mixing reconstructs the FL, FR, C, SL and SR signals with the optimum proportions of the sources that were separated in the previous operation.

De acuerdo con una realización preferida de Ia presente invención, Ia mezcla de las fuentes música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R para obtener los canales se realiza según los siguientes rangos porcentuales: According to a preferred embodiment of the present invention, the mixture of music sources L, R music, voice and frontal impact, rear impact and rear impact L R for the channels is performed according to the following percentage ranges:

FL .:: 70-90% música L, 30-10% voz y efectos frontales FL. :: L music 70-90%, 30-10% and frontal voice effects

FR *: 70-90% música R, 30-10% voz y efectos frontales FR *: R music 70-90%, 30-10% and frontal voice effects

C: 70-90% voz y efectos frontales, 30-10% música L y R C: 70-90% voice and frontal effects, music 30-10% L and R

SL: 70-90% efectos traseros L, 30-10% música L SL: 70-90% rear effects L, L 30-10% music

SR: 7700--9900%% efectos traseros R, 30-10% música R SR: 7700--9900 rear effects %% R, R Music 30-10%

El objetivo de estas dos operaciones opcionales es garantizar que cada canal en el proceso de auralización contenga Ia proporción adecuada de las distintas componentes, ya que Ia mezcla original en 5.1 estaba optimizada para su reproducción a través de 6 altavoces físicos, esquema completamente distinto a un par de auriculares. The aim of these two optional operations is to ensure that each channel in the process of auralization containing the appropriate proportion of the various components because the original 5.1 mix Ia was optimized for playback through 6 physical speakers, a completely different scheme headphones. A Ia hora de reproducir en auriculares, Ia información redundante característica de sistemas cuadrafónicos como el 5.1 obstaculiza Ia percepción de realismo espacial, y por eso es necesario este reajuste. A one hour of play in headphones, Ia feature redundant information systems like quadraphonic 5.1 Ia hinders perception of spatial realism, so this adjustment is necessary.

El canal de frecuencias graves LFE ya es en sí mismo una componente independiente, y por tanto su información no es redundante en los demás canales. The LFE channel bass frequencies is already in itself a separate component, and therefore its information is not redundant in other channels. Por este motivo no se incluye en las operaciones iniciales opcionales de separación y mezcla. Therefore it is not included in the initial separation and optional mixing operations.

De acuerdo con otro aspecto de Ia invención, ésta se extiende también a programas de ordenador, en particular programas de ordenador en contenidos en una portadora, adaptados para llevar a cabo las operaciones del procedimiento descrito. According to another aspect of the invention, the invention also extends to computer programs, particularly computer programs contained in a carrier, adapted to perform the process steps described. El programa puede estar en forma de código fuente, código objeto o un código intermedio entre el código fuente y el código objeto, como una forma parcialmente compilada, o de cualquier otra forma adecuada para implementar las operaciones de Ia invención. The program may be in the form of source code, object code or an intermediate code between source code and object code, such as a partially compiled form, or any other form suitable for implementing the operations of the invention.

La portadora puede ser cualquier dispositivo o entidad capaz de transportar el programa. The carrier may be any entity or device capable of carrying the program. Por ejemplo, Ia portadora puede comprender un medio de almacenamiento, como una ROM, un CD ROM o cualquier otro medio de almacenamiento magnético, por ejemplo un disquete o un disco duro. For example, the carrier may comprise a storage medium such as a ROM, a CD ROM or any other magnetic storage medium, eg a floppy disk or a hard disk. Además, Ia portadora puede ser una portadora de transmisión, como una señal eléctrica u óptica que se pueda comunicar a través de cable eléctrico, óptico, por radio o de cualquier otro modo. Furthermore, the carrier may be a transmission carrier such as an electrical or optical signal that can communicate through electrical cable, optical, radio or otherwise.

Alternativamente, Ia portadora puede ser un circuito integrado en el que está almacenado el programa, estando el circuito adaptado para efectuar las operaciones del procedimiento. Alternatively, Ia carrier may be an integrated circuit in which the program is stored, being adapted to perform the operations of the process circuit. En particular, podría ser un ASIC, una FPGA, un DSP, un microprocesador o un microcontrolador. In particular, it could be an ASIC, an FPGA, a DSP, a microprocessor or microcontroller.

DESCRIPCIÓN DE LOS DIBUJOS Para complementar Ia descripción que se está realizando y con objeto de ayudar a una mejor comprensión de las características de Ia invención, de acuerdo con un ejemplo preferente de realización práctica de Ia misma, se acompaña como parte integrante de dicha descripción, un juego de dibujos en donde con carácter ilustrativo y no limitativo, se ha representado Io siguiente: DESCRIPTION OF THE DRAWINGS To complement the description being made and in order to help better understand the features of the invention, according to a preferred practical embodiment thereof, is attached as an integral part of this description, a set of drawings that are illustrative and non-limiting character, represent the following:

Figura 1.- Muestra una vista de Ia ubicación de los altavoces físicos de un cine en un formato sonoro 5.1. Figure 1 shows a view of the physical location of the speakers of a film on a 5.1 audio format.

Figura 2.- Muestra un esquema explicativo de Ia posición de los ángulos de elevación (α) y de azimut (β). Figure 2 shows an explanatory diagram of the position of the elevation angles (α) and azimuth (β).

Figura 3.- Muestra un esquema general de las operaciones del procedimiento de acuerdo con Ia presente invención. Figure 3 shows an overview of the operations of the method according to the present invention.

REALIZACIÓN PREFERENTE DE LA INVENCIÓN PREFERRED EMBODIMENT OF THE INVENTION

Se parte del sonido original de una película en formato 5.1 que se desea convertir en binaural híbrido, que en este caso está grabado en un disco de tipo It was part of the original sound of a movie in 5.1 format to be converted into hybrid binaural, which in this case is recorded on a disc type

DVD. DVD. La Figura 1 muestra Ia posición de los altavoces de los canales en una sala de cine con relación a Ia posición en Ia que debe estar situado el usuario para una experiencia sonora óptima. Figure 1 shows the position of the speaker channels in a movie theater regarding Ia position in which the user must be positioned for optimal sound experience.

En este ejemplo, el procedimiento Io efectúa un ordenador que, en primer lugar, como se muestra en Ia Figura 3, obtiene a partir del DVD las señales de los canales originales en formato 5.1 (FL, FR, C, SL, SR, LFE). In this example, the Io computer performs a procedure, first, as shown in Figure 3, obtained from the DVD signal of the original channels in the 5.1 format (FL, FR, C, SL, SR, LFE ). El canal LFE es separado para ser procesado en paralelo de modo independiente, sufriendo únicamente una compresión que da como resultado Ia señal LFE'. The LFE channel is separated to be processed independently in parallel, only suffering a compression which results in the signal LFE.

En este ejemplo, se proporciona un selector (S) que permite que el usuario seleccione o no las operaciones opcionales de extraer las fuentes de los canales originales y remezclarlas de acuerdo con unas proporciones nuevas para realzar Ia espectacularidad de Ia película. In this example, a selector (S) which allows the user to select or remove the optional operations sources remixing the original channels according to new proportions to enhance a spectacle Ia of the film is provided. Para ello, se separan Ia fuentes (música L, música R, voz y efectos frontales, efectos traseros L y efectos traseros R), por ejemplo utilizando el algoritmo de separación de fuentes por análisis de componentes independientes 'FastICA', desarrollado por el HUT (Helsinki University of Technology), para volver a mezclarlos de acuerdo con unas proporciones nuevas optimizadas. To that end, the source (music L, R music, voice and frontal impact, rear impact and rear impact L R) is separated, for example using the source separation algorithm for independent component analysis' FastICA, developed by the HUT (Helsinki University of Technology), to re-mix according to a new optimized ratios. En este ejemplo supondremos que Ia película es de acción, Io cual implica Ia existencia de una serie de características sonoras, como explosiones, tiros, ruido de motores, etc. In this example we will assume that Ia movie is action, Io implies the existence of a series of sonic characteristics, such as explosions, shots, engine noise, etc. Para conseguir Ia mayor espectacularidad posible en este tipo de películas, se han determinado las siguientes proporciones óptimas de mezcla: To get more spectacular Ia possible in these films, have identified the following optimal mixing ratios:

FL': 80% música L + 20% voz y efectos frontales FR': 80% música R + 20% voz y efectos frontales FL ': 80% 20% L music + voice and frontal impact FR': 80% + 20% R Music voice and frontal impact

C: 80% voz y efectos frontales + 20% música L y R C: 80% front voice and music effects + 20% L and R

SL': 80% efectos traseros L + 20% música L SL ': 80% rear effects + 20% L L Music

SR': 80% efectos traseros R + 20% música R SR ': 80% rear effects + 20% R Music R

Una vez mezcladas las fuentes en los canales de este modo optimizado, se separa el canal de diálogos (C) del resto, los canales FL', FR', SL' y SR' son auralizados cada uno de ellos en una situación geométrica óptima para realzar Ia espectacularidad de Ia experiencia sonora del usuario. Once mixed sources in the channels of this optimized mode, the channel dialogues (C) the rest is removed, the FL 'FR' SL 'and SR are auralizados each in an optimal geometric situation Ia Ia enhance sound spectacular user experience. En este caso, se ha considerado que el oyente tiene las características de un usuario estándar basado en las respuestas al impulso de un maniquí Kemar. In this case, it was considered that the listener has the features of a standard user based on the impulse responses of a Kemar mannequin.

A continuación se presentan las posiciones óptimas de los canales, descritas a través del ángulo de elevación (α) y del ángulo de azimut (β) que forman con el oyente: Then optimal channel positions, described through the elevation angle (α) and azimuth angle (β) forming the listener is presented with:

FL': elevación 15°; FL ': elevation 15 °; azimut -20° -20 ° Azimuth

FR': elevación 15°; FR ': elevation 15 °; azimut 20° SL': elevación 180°; azimuth 20 ° SL ': lifting 180 °; azimut -40° SR': elevación 180°; azimuth -40 ° SR ': lifting 180 °; azimut 40° azimuth 40 °

La Figura 2 muestra Ia referencia de Ia ubicación de los ángulos de elevación y azimut, respectivamente α y β. Figure 2 shows the location of Ia reference angles of elevation and azimuth, respectively α and β. Después de Ia operación de auralización, se obtienen las señales FL'i, FR'i , SL'i y SRV A continuación, se procesan las señales FL'i y FR'i con Ia respuesta al impulso de un recinto similar a una sala de cine, con un tiempo de reverberación (T r ) de 0,5 segundos aproximadamente; After the operation for auralization, the FL'i, FR'i, SRV SL'i and then signals are obtained, the FL'i and FR'i signals are processed with the response to the impulse of a similar enclosure to a room cinema, with a reverberation time (T r) of about 0.5 seconds; y las señales SL'i y SR'i con Ia respuesta al impulso de otro recinto similar a una sala de cine diferente, con un tiempo de reverberación de 2 segundos aproximadamente. and SL'i and SR'i signals Ia impulse response similar to a cinema hall different grounds, a reverberation time of approximately 2 seconds.

Finalmente, se mezclan los canales obtenidos en Ia operación anterior, FL'2, FR'2, SL'2 y SR'2 con los canales LFE' y C para obtener únicamente dos señales en formato binaural híbrido correspondientes a los canales L y R de unos auriculares. Finally, channels obtained in the previous operation, FL'2, FR'2, SL'2 and SR'2 with LFE 'and C channels for just two binaural hybrid format signals corresponding to the L and R channels are mixed headphones.

Patent Citations
Cited PatentFiling datePublication dateApplicantTitle
WO2007123788A2 *3 Apr 20071 Nov 2007Srs Labs IncAudio signal processing
EP1816890A1 *30 Jan 20078 Aug 2007Sony CorporationAudio reproducing system and method thereof
US5742689 *4 Jan 199621 Apr 1998Virtual Listening Systems, Inc.Method and device for processing a multichannel signal for use with a headphone
US6002775 *14 Aug 199814 Dec 1999Sony CorporationMethod and apparatus for electronically embedding directional cues in two channels of sound
Non-Patent Citations
Reference
1 *'Neural Networks, 2005. Proceedings. 2005 IEEE International Joint Conference on Montreal', vol. 2, QUE., CANADA. article CIARAMEL THE A.: 'BSS toolbox for delayed and convolved mixtures', pages 1245 - 1250
2 *TECHNOLOGIES FOR PRESENTATION OF SORROUND-SOUND IN HEADPHONES., [Online] 17 December 2007, Retrieved from the Internet: <URL:http://www. headwize.com/tech/sshd_ tech.htm> [retrieved on 2009-03-23]
Classifications
International ClassificationH04S3/00
Cooperative ClassificationH04S2400/01, H04S3/008
European ClassificationH04S3/00D
Legal Events
DateCodeEventDescription
16 Feb 2011122
Country of ref document: EP
Kind code of ref document: A1
Ref document number: 08870792
20 Jul 2010NENP
Ref country code: DE
16 Sep 2009121
Ref document number: 08870792
Country of ref document: EP
Kind code of ref document: A1