12.176 cursos gratis
8.739.447 alumnos
Facebook Twitter YouTube
Busca cursos gratis:

Hardware de audio

Autor: marcelo alejandro montoya
Curso:
9,20/10 (52 opiniones) |18161 alumnos|Fecha publicación: 03/09/2004
Envía un mensaje al autor

Capítulo 22:

 Software de dictado de voz

El otro tipo de software de reconocimiento de voz es mucho más complejo. Convertir en texto el habla estándar es una tarea extraordinariamente difícil, dada la amplia variación en los patrones del habla humana. Por esta razón, casi todo el software de este tipo (y también algunas de las aplicaciones de comandos de voz básicos) deben ser "entrenadas" para entender la voz de un usuario en particular. Este entrenamiento lo hace usted leyendo a la computadora muestras de texto preparadas que se incluyen con el software. Debido a que el software "sabe" de antemano lo que se supone que usted dice, puede asociar ciertas palabras con la forma en que usted las pronuncia.

Los resultados de los usuarios con este tipo de aplicaciones varían mucho, debido en gran medida a los patrones de habla individuales. He oído personas entusiasmadas por poder dictar páginas de texto a su computadora sin tener que tocar el teclado, mientras que otras se quejan de que corregir los muchos errores tipográficos es más problema que teclear el texto.

Son muchas las variables que pueden incidir en la calidad del dictado de voz. Las primeras versiones de estos productos requerían que los usuarios separaran las palabras y hablaran "en-forma-de-robot- como-ésta" para hacer que la computadora reconociera el texto. Estos productos de "habla discreta" ahora son obsoletos y deben ser reemplazados por productos más recientes de "habla continua".

Un segundo factor es la "característica de entrenamiento" del software. Mi experiencia con los programas que requieren entrenamiento y los que no, sugiere que entrenar a un programa de dictado de voz para que reconozca sus patrones de habla y acento sigue siendo una buena idea para obtener mejores resultados.

Un tercer factor es el vocabulario activo y total del programa. Dados dos motores de reconocimiento de voz idénticos, el programa que tenga el vocabulario activo más grande reaccionará con mayor rapidez al dictado, y el programa que tenga el vocabulario total más extenso será capaz de almacenar más palabras específicas del usuario.

Si usted está involucrado en medicina, leyes u otras profesiones con vocabularios especializados, tal vez descubra que ahorra tiempo (y, en última instancia, dinero) al adquirir versiones especializadas de su programa de reconocimiento de voz favorito. Estos programas ofrecen vocabularios más amplios, adecuados a su línea de trabajo.

Otras características deseables incluyen los comandos de voz para operaciones de cómputo, la traducción de texto a habla para que su computadora le "lea" a usted, y un navegador Web. Las versiones móviles de esos programas emplean una grabadora digital especial para guardar su dictado cuando usted está lejos de la computadora y le permiten reproducirlo para reconocimiento de voz cuando regresa a ella.

Sin importar el programa que elija, algunos de los prerrequisitos para el éxito comprenden los siguientes:
- Una tarjeta de sonido de alta calidad (compatible con Sound Blaster 16 o mejor); consulte el sitio Web del software de la compañía para obtener una lista reciente de tarjetas de sonido recomendadas.
- Una habitación silenciosa con pocos cambios en el sonido ambiental.
- Un micrófono diseñado especialmente para reconocimiento (el software normalmente incluye uno de bajo costo, pero existen otros mejores). Usar un micrófono de calidad deficiente o una tarjeta de sonido inadecuada ocasionará problemas, incluso al mejor programa de dictado. Para mejores resultados, use un micrófono con características de cancelación de ruido o direccional, y elija un modelo que esté en la lista aprobada por el distribuidor del software de reconocimiento de voz. Por lo regular esos micrófonos emplean una diadema para el ajuste preciso del ángulo y distancia a la boca del micrófono, lo que es un elemento crucial en un buen reconocimiento de voz.
- Llevar a cabo, si se ofrece, la configuración de sonido y la capacitación de usuario, para adaptar el software a su voz y vocabulario.
- Practicar en la pronunciación de las palabras difíciles de distinguir.
- Utilizar la versión más avanzada del software que desee adquirir.

La tecnología de reconocimiento de voz es aún joven, y es sensible a los cambios en la voz de una persona. La enfermedad o el estrés pueden a menudo cambiar la voz de una persona lo suficiente como para desechar todos los productos "de consumo" de reconocimiento de voz actuales. También necesitará una computadora más rápida, por lo menos una Pentium a 200 MHz con 64 MB de RAM o más rápida, para lograr tiempos de respuesta lo suficientemente veloces para seguir su voz. Debido a que esta tecnología (en especial la de dictado de voz) puede también ayudar a evitar los efectos debilitantes de lesiones repetitivas de estrés sobre muñecas, dedos y brazos por teclear mucho tiempo sin un descanso, debe volverse cada vez más popular al aumentar la velocidad de los sistemas y mejorar el software.

Nota
Como cualquier producto ávido de recursos, su sistema debe superar los "requerimientos mínimos de RAM, velocidad de procesador y espacio libre en disco en un factor de dos o tres, si desea estar realmente satisfecho con su software.

Sin embargo, los avances en esta tecnología se están desarrollando con rapidez hacia un punto en el que cada vez más de nosotros podamos usar el habla continua con las computadoras en lugar de teclear.

Capítulo siguiente - Conferencias
Capítulo anterior - Software de comandos de voz

Nuestras novedades en tu e-mail

Escribe tu e-mail:



MailxMail tratará tus datos para realizar acciones promocionales (vía email y/o teléfono).
En la política de privacidad conocerás tu derechos y gestionarás la baja.

Cursos similares a Hardware de audio



  • Vídeo
  • Alumnos
  • Valoración
  • Cursos
1. Problemas en sistema de audio. Celulares
Uno de los inconvenientes más comunes en telefonía celular es cuando una llamada... [23/11/11]
74  
2. Video sin audio. Total video converter
Curso audiovisual. Conoce la manera de quitar el audio en un vídeo sin importar el... [21/11/11]
0  
3. PC. Hardware y software
Informática. H ardware y software de un ordenador tipo PC . El curso ofrece una... [13/03/09]
7.015  

Capítulos del curso


¿Qué es mailxmail.com?|ISSN: 1699-4914|Ayuda
Publicidad|Condiciones legales de mailxmail