Resistance is Futile

jokaydia Mini-Unconference!

En 30 minutos comienza la primera mini unconferencia del año :

Las actividades para esta primera unconferencia son :

  • Introduccion a las actividades para el 2009
  • Lanzamiento del proyecto Virtual Classroom para el 2009
  • Lanzamiento de 'The dancer' (instalacion)

Asi que este sabado nos vemos a las 10 pm en el Bar de Jokaydia en Second Life.

Enlaces :


MVoce, Sintesis de Voz en Processing

Crearemos un ejemplo para ilustrar el uso de la sintesis de voz en Processing utilizando la libreria MVoce.

Pasos :

Crear el Sketch :

  • Abrir Processing
  • Crear un nuevo sketch
  • Adicionar el siguiente codigo :
    import mjs.processing.mvoce.*;
     
    // Create library object
    MVoce mVoce;
     
    void setup() {
      // Create the voce engine with synthesis enable
      // recognition unable and no grammar
      mVoce = new MVoceP(this,true,false,"");
    }
     
    // Requiered to use events
    void draw() { }
     
    // If the user press any key
    // Synthesize a hello message
    void keyPressed() {
      mVoce.synthesize("Hello There");
    }
     
    // If the sketch is close, destroy the library
    void exit() {
      mVoce.destroy();
      super.exit();
    }
  • Ejecutar el Sketch
  • Se visualiza una ventana pequeña gris, si pulsamos una tecla la aplicacion nos saluda

MVoce, una voz para Processing

Siempre habia querido desarrollar una libreria para sintesis de vox y reconocimiento de la misma para utilizarla en los sketchs de Processing, ya habia hecho algunos intentos en ocasiones anteriores, pero esta semana que pude volver al cacharreo me di a la tarea de instalar FreeTTS y Sphinx-4, librerias hechas en Java que permiten hacer el proceso de convertir texto en voz y de reconocer voz, asi que ayer las instale, las probe y fue luego que busque si alguien tenia una libreria para Processing que permitiera hacer estas cosas y me encontre con una libreria que permitia hacer interface con FreeTTS y Sphinx-4, haciendo que la creacion de la libreria para Processing fuera mas facil todavia.

Asi nace MVoce, una la libreria para Processing que permite hacer sintesis de voz y reconocimiento de la misma. Una libreria con caracteristicas minimas pero suficientes para dotar a los sketch de una voz y de un reconocimiento basico de palabras, una libreria que por el momento suple las necesidades basicas. Esta libreria utiliza las librerias voce, FreeTTS y Sphinx-4 para hacer el trabajo, por tal motivo es necesario tener encuenta las diferentes licencias de cada una.

Limites :

  • La libreria solo soporta el idioma ingles
  • Solo posee una voz masculina por el momento
  • El proceso de reconocimiento de voz depende de una gramatica donde se especifican las palabras a reconocer.
  • La libreria contiene ejemplos que ilustran su uso para sintetizar voz, reconocer los nombres de los digitos y hacer las dos cosas al tiempo
  • Esta libreria funciona en Processing, no en Mobile Processing

Informacion de la Libreria :


Reconocimiento de Voz con Sphinx-4

Continuando con las aplicaciones de voz, ahora es el turno para Sphinx-4; un sistema de reconocimiento de voz escrito en el lenguaje Java, que reconoce palabras del ingles y el cual instalaremos en una maquina con Ubuntu Linux 8.10

Pasos :

  • Abrir una consola
  • Ir a la pagina oficial de la aplicacion
    http://cmusphinx.sourceforge.net/sphinx4
  • Descargar la ultima version (ultima 1.0 de septiembre de 2004)
    http://sourceforge.net/project/showfiles.php?group_id=1904&package_id=117949
  • Por ejemplo con wget
    wget http://superb-east.dl.sourceforge.net/sourceforge/cmusphinx/sphinx4-1.0beta-bin.zip
  • Descomprimir el archivo
    unzip sphinx4-1.0beta-bin.zip
  • Cambiar al directorio de sphinx
    cd sphinx4-1.0beta
  • Instalar el Java Speech API
    • Cambiar el directorio a lib
      cd lib
    • Instalar JSAPI
      sh jsapi.sh
    • Aceptar la licencia pulsando y
    • Cambiar de directorio
      cd ..
  • Ejecutar uno de los demos, por ejemplo los digitos;
    En este momento necesita un microfono habilitado y decir los numero en ingles :
    java -jar bin/HelloDigits.jar

Enlaces :


Instalacion de FreeTTS en Ubuntu 8.10

Para comenzar a desarrollar una aplicacion en Java que soporte sintesis de voz (convertir texto en voz), debemos comenzar por instalar el FreeTTS. Cabe recordar que esta aplicacion solo da soporte para voces en ingles.

Prerequisitos :

  • Tener instalado un JDK, por ejemplo el 6, si no lo tiene ejecutar
    sudo apt-get install sun-java6-jdk

Pasos :

  • Abrir una consola
  • Ir al sitio oficial de la libreria
    http://freetts.sf.net
  • Descargar la version mas actual (ultima version 1.2.1 de Mayo de 2005)
    http://sourceforge.net/project/showfiles.php?group_id=42080
  • Por ejemplo descargar con wget
    wget http://superb-east.dl.sourceforge.net/sourceforge/freetts/freetts-1.2.1-bin.zip
  • Descomprimir el archivo
    unzip freetts-1.2.1-bin.zip
  • Cambiar de directorio
    cd freetts-1.2.1
  • Ejecutar la aplicacion para producir la voz segun el texto
    java -jar lib/freetts.jar -text "This is a Test"
  • Utilice el siguiente comando para mostrar la ayuda
    java -jar lib/freetts.jar -help

Con esta libreria es posible almacenar el texto hablado en un archivo :

  • Ejecute el comando
    java -jar lib/freetts.jar -dumpAudio test.wav -text "This is a Text"

Enlaces :


Page 1 of 131234510...Last »
Powered by WordPress | Designed by Elegant Themes