AudioResearchBlog

Covering all audio related stuff with special focus on programming and digital signal processing

Archive for the 'sound' Category

Idea simple: Delay ajustable para sincronizar transmisiones de radio y tv

Posted by hordia on 17th February 2009

Desde hace bastantes (meses? años?) que tengo ganas de ver los partidos de river pero con el relato de Atilio Costa Febre (que va vía radio AM[1]), pero nunca podía hacerlo de una forma satisfactoria ya que la transmisión de la tele siempre estaba retrasada unos cuantos segundos (gritaban gol en la radio y uno veia la pelota por la mitad de la cancha, insoportable).

También hace bastante que se me habia ocurrido la simple solución de retrasar la transmisión de radio unos segundos con la computadora hasta que se sincronizara todo. El tema es que los plugins de audio clásicos, están pensados para hacer música y generalmente soportan muy pocos segundos de delay (por ejemplo el delay común de los LADSPA), asi que dije bueno, lo armo en CLAM y sale con fritas… Pero no habia delay temporal disponible (sí uno espectral), asi que lo tuve que programar, sino en 5 minutos tenia todo listo.

El resto, armar la red de conexiones con el NetworkEditor[2], la interfaz[3] con el QtDesigner, y listo el prototipo dominguero:

Prototipo de delay ajustable. Delay en décimas de segundos.

 

Aparte de todo el poderio y posiblidades que tiene CLAM, como me gusta que también sirva para salir del paso y resolver estos pequeños problemas…

[1] Dado que ahora están en radio mitre y esta transmite por internet, hasta se puede prescindir de una radio externa y usar el streaming por ejemplo con mplayer que soporta jack como backend, lo que permite conectar su salida a la entrada de la red del NetworkEditor fácilmente. El comando:

mplayer -cache 32 mms://streammitre.uigc.net/mitrevivo -ao jack 

[2] atilioSimple.clamnetwork
[3] atilioSimple.ui

, , , , , ,

Posted in audio, hardware, Castellano, CLAM, sound, plugins, ideas | No Comments »

La historia de Horgand (conversación con holborn)

Posted by hordia on 28th June 2008

Hace bastante tiempo que tenia archivada esta conversación sobre síntesis por FM y Horgand que quería publicar.

Qué es Horgand? un sintetizador por soft capaz de realizar sonidos de órgano y otros tipos de sonido como pianos eléctricos (Rhodes , Wurlitzer, DX E.Piano ), Jazz Guitar, Strings, Brass, Fretless Bass, Accordion etc. Esta basado en síntesis por FM, según su web:

“Is based on a FM audio synthesizer with twenty carriers (20) without modulators in a plain based algorithm.
each carrier frequency can be modified for construct complex sounds. The synthesizer incorporate also a LFO (Low frequency oscillator) for generate tremolo effects and detune effects applying LFO Pitch and Amplitude to the carrier frequency’s. Some synthesizer parameters can be edited for each sound including two ADSR, (Normal and Percussion), Fine Frequency, Attenuation, Rotary Amplitude, Transpose, etc. Four DSP effects are available for obtain more complex sounds, Rotary, Chorus, Delay and Reverberation. Sounds are stored in banks of 32 organ sounds and can be changed externally with MIDI program change (1-32).”

También incorpora reconocimiento de acordes para producir acompañamiento automático (bajo y bateria) y con líneas de bajo editables para cada ritmo.

Ejemplo de como suena: Horgand_demo.ogg

No conozco mucho de síntesis por FM y tenía curiosidad de como lograba el sonido y terminó saliendo una especie de entrevista improvisada, creo que puede ser interesante para quienes quieran adentrarse en este tipo de programación.

La conversación:

<hordia> despues me tenes que contar en que te basaste para conseguir el sonido de horgand digitalmente…
<holborn> pues en el DX7 …. tiene 32 algoritmos de colocacion de los operadores … pero si usas el plano (todos en linea)… todo lo que hagas suena a organo … a partir de ahi … pues añadirle los efectos … y claro en vez de 6 “osciladores” hay 10 … que en realidad son 20 … con lo cual pues es mas rico que un emulador de dx7 tipo hexter o en el dx7 mismo … en realidad .. para usar 20 osciladores no chupa CPU nada … otros porgramas usan 3 y ch
<holborn> claro que para ahorrar cpu .. tuve que limitar algunos parametros de edicion … pero bueno … yo lo que queria era que sonara … si nadie se pone a editar sonidos … ni dios vaya …
<hordia> que es el DX7? :P me suena a un teclado legendario pero no estoy seguro…

<holborn> el DX7 fue el primer sintetizador FM … es de yamaha .. y fue una revolucion porque era el primero que mas o menos imitaba bien sonidos reales … algunos mejor que otros …
<holborn> los vendieron todos y mas …
<holborn> yo realmente era un experto … en aquella epoca ni dios sabia nada de musica electronica … yo me hice un curso que daba un loco de la musica electronica .. y sabia programar sintes cosa que nadie sabia .. te estoy hablando de hace mil años …
<holborn> cuando salio el DX7 pues me tuve que empapar toda la info porque realmente es muy diferente a un sinte analogico tradicional … y bueno .. le pedi a un amigo que trabajaba en un distribuidor de yamaha .. que me consiguiera info de verdad … de hecho todavia la conservo ..por ahi ..
<hordia> :O
<holborn> yo llegue a trabajar programando sintes en un estudio de grabacion …. vaya no todos los dias pero me llamaban de vez en cuando
<holborn> haciendo presets … me refiero .. claro
<hordia> veo que horgand es el resultado de muchos años de experiencia…
<holborn> si … a ese nivel si … pero todo fue gracias a un ejemplo de la web de alsa .. .se llama fmminisynth.c … o lago asi … 100 lineas de codigo … entonces se me ocurrio … y empece ..

<holborn> luego buscando … encuentras mil ejemplos de codigo … en HArmony Central … no esta el codigo pero explican como funcionan los efectos … en cristiano .. sin mucha matematica … esta muy bien .. luego ya el implementarlo es cosa de uno … pero el mismo Paul Nasca dice por ahi (el del zyn) que se basa en esa explicaciones … y yo tambien claro :)
<holborn> ya te aseguro que su implementacion es mejor que la mia :)
<hordia> jeje
<holborn> ahora …la mia consume un tercio de cpu que la suya :)
<hordia> entonces hay que ver que parametros se toman para definir cual es mejor ;-)
<holborn> pues es un sinte … lo que suena … sus efectos suenan mejor …. pero … el usa 3 o 4 osciladores por sonido … yo uso 20 … con lo cual en algun lado hay que recortar …

El ejemplo que se menciona: miniFMsynth.c


, , , , , , , , , , ,

Posted in audio, algorithms, effects, free software, programming, instruments, GNU/Linux, GPL, c++, alsa, Castellano, sound | No Comments »

Afinando por vibraciones (violín)

Posted by hordia on 28th June 2008

Hace un tiempo, cuando le regalé a mi hermana un afinador para violín, para mi sorpresa (por que lo ignoraba) me enteré que hasta los afinadores más baratos incorporan el afinado por vibración (de la madera). Esto es muy conveniente por que elimina ruidos externos de una manera natural, algo imagino casi imprescindible para un violín tradicional (sin micrófonos) que en general se afina en presencia de otros instrumentos de una orquesta. Lo que se hace es colocarlo en alguna parte del instrumento con una especie de prensa que tiene para que quede bien sujeto. La verdad que me gustó.

(el afinador era un: matrix gt2)


, , , , , , ,

Posted in acoustics, instruments, noise, hardware, lutheria, Castellano, sound | No Comments »

Distortion rack prototype

Posted by hordia on 5th January 2008

A nice prototype:

CLAM distortion rack prototype

 
 

And the net behind:

CLAM distortion rack prototype


, , , , ,

Posted in effects, English, CLAM, GUI, sound | No Comments »

TAPESTREA: Modelando la escena sonora a partir de ejemplos o muestras

Posted by hordia on 1st November 2007

Hoy vi el video demostración de TAPESTREA: Techniques And Paradigms for Expressive Synthesis, Transformation, and Rendering of Environmental Audio (también conocido como taps). Intenta ser un entorno para el diseño de sonido, pero desde un enfoque totalmente nuevo (lo mejor es ver el video para entender mejor de que se trata).

Me llamó la antención (además de la división del sonido entre sus componentes sinusoidales, transitorios y residuo), la interfaz gráfica intuitiva y sencilla y la manipulacíón de sonidos en el espectrograma.


TAPESTREA: Sound Scene Modeling By Example - For more funny movies, click here

 
El video completo esta disponible aca: http://soundlab.cs.princeton.edu/listen/taps/tapestrea.mov
 

Según su web, la idea es ser un framework unificado para analizar de forma interactiva sonidos complejos, transformarlos y sintetizarlos:

  • Identificar puntos de interés en el sonido y extraerlos para crear “templates” (una muestra/un sample) reusables
  • Transformar componentes de sonido de forma independiente a su entorno y otros eventos sonoros
  • Resintetizar continuamente las texturas de fondo de una forma perceptualmente convincente
  • Posicionamiento de eventos “templatizados” sobre la escena de fondo por medio de una novedosa interfaz de usuario o scripts escritos en Chuck (un lenguaje de programación orientado al audio)
  • Recuperación de componentes de sonidos basandose en la similaridad con otros.

TAPESTREA otorga una nueva forma de transformar dinámicamente una escena de sonido, permite generar puestas de cualquier duración, facilita la composición y el diseño de sonido combinando elementos de diferentes grabaciones de forma muy sencilla y ofreciendo miles de variantes para su manipulación (solo pensar en las posiblidades que otorga el solo hecho de poder manejar por separado sinusoides, transitorio y residuo).

Sin duda, una herramienta de trabajo interesante tanto para “diseñadores de sonido” como invesitigadores del audio, compositores y cualquier persona interesada en experimentar con el sonido.

Por si todo esto fuera poco, es Software Libre y multiplataforma. El código fuente y los binarios se consiguen aquí.

Más info:


, , , , , , , , , , ,

Posted in audio, effects, signal processing, music, free software, programming, GNU/Linux, GPL, noise, Castellano, sound, Chuck | 1 Comment »

Conferencia sobre audio multicanal en Bs As

Posted by hordia on 5th August 2007

Los días 19, 20 y 21 de agosto se realizará en el hotel Panamericano de Buenos Aires (Argentina) una conferencia sobre audio multicanal. La misma tiene caracter internacional y esta organizada por AES Latinoamerica.

Esta conferencia apunta a reunir a todos los profesionales y estudiantes que tienen contacto directo o indirecto con los diferentes campos del audio. El encuentro tiene como principal misión incentivar y facilitar el intercambio de opiniones y experiencias entre todos los participantes, contando por primera vez en Latinoamérica con la presencia de numerosas personalidades del audio de máximo reconocimiento mundial.

AES Latinoamerica Conference

Los tópicos de la conferencia serán:

  • The Surround Studio
  • Surround Recording
  • Surround Mixing
  • Surround Mastering
  • Surround Live Sound
  • Surround Psychoacoustics
  • Composing for Surround
  • Surround Encoding

El programa hasta el momento es este:

programa conferencia surround aes en bs as

Todas las conferencias serán dictadas en inglés, con traducción al español.
 

También habrá una gran exposición comercial con acceso libre y gratuito con las últimas novedades en tecnología de:
AKG - ALLEN & HEATH - BEYER DYNAMICS - BSS - DBX - CAMCO - CROWN - DBA - D.A.S. AUDIO - DIGIDESIGN - FZ - JBL - LAVRY ENGINEERING - LEXICON - MEYER SOUND - MUSI-CO - NEUMANN - NEXO - R.C.F. -SELENIUM - SENNHEISER - SHURE - SOUNDCRAFT - TEVELAM - T.H.E. AUDIO - TODOMUSICA S.A - WSDG

Exhibición de:

  • Micrófonos
  • Sistemas de altavoces
  • Sistemas de monitoreo
  • Consolas de mezcla
  • Sistemas de disco rígido
  • Procesadores de audio
  • Equipamiento de medición
  • Equipamiento multimedia

También habrá varios workshops a cargo empresas. Para más detalles consultar este link: actividades.
 

Por otra parte, la lista de invitados especiales incluye a varios de los nombres más sobresalientes de la industria, por ejemplo:

Martha De Francisco: Experta en grabación y procesamiento de sonido envolvente, Martha dará una presentación teórica en conjunto con George Massenburg y luego un imperdible workshop sobre técnicas de grabación en Surround.

Kimio Hamasaki: El Investigador Senior de la compañía de broadcasting más importante del Japón, NHK (Japan Broadcasting Corporation), vendrá especialmente para disertar y demostrar las virtudes del sonido surround con altura (monitores con distintas elevaciones que otorgan un nivel de realismo nunca antes percibido).

Tomlinson Holman: El cerebro detrás del sistema universalmente conocido como THX, Tom nos mostrará su último desarrollo: el sistema 10.2, que será explicado teóricamente y demostrado en forma práctica por primera vez en América Latina.

Bob Katz: Uno de los Ingenieros de Mastering más reconocidos del mundo, autor del único libro serio editado hasta el momento sobre masterización de CD, estará presente para darnos su particular y siempre vigente punto de vista sobre este tema tan interesante.

Dan Lavry: El fundador de la muy reconocida compañía Lavry Engineering, dedicada al desarrollo de tecnología de conversión Analógica/Digital de última generación, vendrá a exponer sobre los aspectos ocultos de la conversión y el procesamiento más allá del stereo.

Jeff Levison: Consultor internacional de la firma DTS, Jeff es una personalidad reconocida en el área de codificación de audio para nuevos formatos, tales como Blu-Ray y HD-DVD. Dará una presentación y un workshop sobre la realización de mezclas en 7.1 para distintas aplicaciones.

George Massenburg: Una de las leyendas del mundo del audio, diseñador de equipos que se han utilizado en todos los estudios del mundo, George colabora asiduamente con AES desde siempre. En esta oportunidad, dará junto con Martha de Francisco una presentación teórica sobre la creciente importancia del Surround en la Ingeniería de Audio actual.

John Pellowe: convocado por Meyer Sound, John nos dará una clara explicación sobre los sistemas de arquitectura electroacústica y sus diversas aplicaciones.

John Storyk: El reconocido diseñador acústico, fundador y Presidente de Walters-Storyk Design Group, dará un seminario explicando los criterios a utilizar para el tratamiento acústico de espacios críticos, con acento en la utilización de éstos para aplicaciones de sonido Surround. John conducirá también un Studio Tour en el que mostrará la aplicación práctica de estos criterios en distintas facilidades de la Ciudad de Buenos Aires.

Wieslaw Woszczyk: Es un verdadero honor que el Presidente Mundial de AES nos visite para esta ocasión. Está a su cargo la inauguración oficial de la Conferencia y luego una muy recomendable presentación teórica sobre Comunicación Multisensorial de la música y el espacio.

El panel “Sonido Surround Platinum” está compuesto por Martha De Francisco, Tomlinson Holman, Bob Katz, Kimio Hamasaki, John Storyk, y John Pellowe; junto con los músicos y productores Pedro Aznar, Pablo Guyot y Tweety Gonzalez.

Para descargar la ficha de inscripción a la conferencia o consultar más información relacionada visite www.americalatina.aes.org.

Se entregará certificado de asistencia expedido por AES. Vacantes Limitadas.


, , , , , , , , , , , ,

Posted in audio, acoustics, music, instruments, hardware, Castellano, talks, news, events, surround, conferences, sound | No Comments »

Modelo de sinusoides más residuo

Posted by hordia on 20th May 2007

Es un modelo de análisis/síntesis para procesamiento espectral orientado a aplicaciones musicales y de audio. Se puede ver como una generalización de la STFT (transformada de tiempo corto) y los modelos sinusoidales. Básicamente añade flexibilidad a la STFT manteniendo buena fidelidad de sonido y una representación eficiente.

Este modelo también es conocido como SMS (Spectral Modeling Synthesis) y como HILN en el contexto de MPEG4.

Básicamente esta modelado como la suma de un conjunto de sinusoides (los “sobretonos” estables armónicos o no, las componentes determinísticas del sonido) más el residuo de ruido (modelado como un proceso estocástico) como dos componentes separadas:

 s(t) = \sum_{r=1}^R A_r(t) cos[ \Phi_r(t)] + e(t)

donde A_r(t) y \Phi_r(t) son la amplitud y fase instantaneas de la r^{th} sinusoide respectivamente, y e(t) es la componente de ruido en el tiempo t.
La fase instantanea de la ecuación es:  \Phi_r(t) = \int_0^t w_r(\tau) d\tau

SMS analysis



El primer paso del análisis detecta los sobretonos presentes en el espectro y los representa con sinusoides que varian con el tiempo . Luego se le resta al sonido original las componentes sinusoidales para obtener el “residuo” (ver el diagrama de bloques).

La señal residual es modelada como un proceso estocástico y se describe como ruido blanco filtrado:

 e(t) = \int_0^t h(t,\tau) u(\tau) d\tau

donde u(t) es ruido blanco y h(t,\tau) es la respuesta al impulso de un filtro que varia con el tiempo evaluada en el instante t.

El residuo comprende la energía debida a vibraciones no estacionarias y a cualquier otra componente energética de naturaleza no sinusoidal.

Algunas áreas donde este modelo se puede aplicar:

  • análisis
  • compresión de sonido
  • separación de fuentes de sonido
  • acústica musical
  • percepción musical


Algunos links con más información sobre este modelo:


Este tipo de cosas me hace acordar que tengo que postear sobre la tesis de Juan Vuletich: “Nuevas bases para el procesamiento de música en el dominio tiempo-frecuencia” (aca un paper sobre la misma idea) un enfoque diferente para este tipo de cosas (wavelets) que pienso que merece (como mínimo) un post entero lo antes posible.


, , , , , , , ,

Posted in audio, signal processing, noise, publications, Castellano, CLAM, standards, GSoC2007, sound | No Comments »

Sinusoidal plus Residual Model

Posted by hordia on 20th May 2007

Is an analysis/synthesis model for spectral processing oriented to audio and music applications. We can see it as a generalization of STFT and sinusoidal models, basically adds more flexibility to STFT while maintaining a good sound fidelity and efficient representation.

This model is also known as SMS (Spectral Modeling Synthesis) and HILN in the context of MPEG4.

Basically is modeled as the sum of a set of sinusoids (only the stable partials of a sound, harmonics or not, deterministic components) plus a noise residual (modeled as stochastic process) as two separate components:

 s(t) = \sum_{r=1}^R A_r(t) cos[ \Phi_r(t)] + e(t)

where A_r(t) and \Phi_r(t) are the instantaneous amplitude and phase of the r^{th} sinusoid respectively, and e(t) is the noise component at time t.
The instantaneous phase of the equation is:  \Phi_r(t) = \int_0^t w_r(\tau) d\tau

SMS analysis



The first analysis step detects partials present in the spectra and represents them with time-varying sinusoids. Then the sinusoidal component is subtracted from the original sound to obtain the remaining “residual” (see the block diagram).

This residual signal is modeled as stochastic process and is described as filtered white noise:

 e(t) = \int_0^t h(t,\tau) u(\tau) d\tau

where u(t) is white noise and h(t,\tau) is the response of a time varying filter to an impulse at time t.

The residual comprises the energy produced by not stationary vibrations plus any other energy component that is not sinusoidal in nature.

Some areas where this model could be applied:

  • analysis
  • sound compression
  • sound source separation
  • musical acoustics
  • music perception


Some links with more info about this model:


These kind of things remembers me that I have to post about Juan Vuletich thesis: “New bases for music processing in the time-frequency domain” (ATM only in Spanish, here a paper about the same idea) a different approach of those kind of things (wavelets) which I think deserves a (at least) an entire post ASAP.



, , , , , , , ,

Posted in audio, signal processing, noise, publications, English, CLAM, standards, GSoC2007, sound | No Comments »

Hello CLAM!

Posted by hordia on 11th April 2007

Hi all! I’m Hernán Ordiales, this is my first post to Planet CLAM but not my first post at all, I’m blogging since last year but mostly in spanish

what to say about me?
I live in Buenos Aires, Argentina. Among other things, I love programming, audio and music. I’m studying (mainly)Electronics Engineering and Computer Engineering at FIUBA and for luck (and my fun) I’ve a work in a project related with audio, programming and GNU/Linux. I also have interest in communications (networking, protocols, etc) and all kind of digital systems.

I enjoy very much using/developing under Free Software (of course GNU/Linux is my OS of choice) and I also help with the linux audio distribution called Musix GNU+Linux.

After a long time of follow Xavier Amatriain blog, last weeks I’m started to get involved with CLAM and with every step I’m discovering a lot of new wonderful things and designs that it had never seen by me in another audio projects.
I expect to contribute to and/or develop under CLAM ASAP. I think I’ll start blogging about my progress or new things developed with this framework soon (among other things).

For those who still don’t know much about CLAM project, I’d recommend you:

Here, the “magic sentence” to start developing:

svn co http://iua-share.upf.edu/svn/clam/trunk clam 

I also encourage you suscribe to user & dev mailing lists, and log in #clam channel at freenode.net!

See you!


, , , , , , , , , , , , , , , ,

Posted in audio, algorithms, effects, signal processing, music, free software, programming, GPL, c++, libraries, midi, publications, projects, English, CLAM, GSoC2007, sound | 1 Comment »

reacTable - un instrumento modular

Posted by hordia on 1st February 2007

Desarrollado por el grupo de tecnología musical de la Universidad Pompeu Fabra de Barcelona, reacTable consiste de una mesa redonda traslúcida con un proyector debajo, que por medio de visión por computadora, detecta la posición y orientación de objetos especialmente marcados. Estos pueden ser movidos libremente sobre la superficie (incluso rotar sus caras) modificando de esta forma la estructura y parámetros del sintetizador de sonido. Estos objetos vendrian a ser los típicos módulos de un sintetizador modular. Simultáneamente, el proyector muestra la actividad y las características principales del sonido producido, otorgándole de esta forma el necesario “feedback” al ejecutante.
Además, el sistema es multiusuario y por lo tanto puede ser ejecutado por varias personas simultáneamente.

reactivision
Entre otras cosas reacTable, intenta ser:

  • colaborativo: varios ejecutantes (en forma local o remota)
  • intuitivo: sin manual, sin instrucciones
  • poseedor de una sonoridad interesante y desafiante
  • enseñable y aprendible (incluso por chicos)
  • apto para novatos y músicos electrónicos avanzados (conciertos)

Para enviar mensajes utiliza el protocolo OSC (OpenSound Control) y recientemente también es capaz de enviar mensajes MIDI. Además, vale la pena destacar que el software detrás de esto es open-source y multiplataforma.

Más links:


, , , , , , , , ,

Posted in effects, signal processing, music, programming, instruments, open source, hardware, lutheria, Castellano, sound | No Comments »