[{"@context":"http:\/\/schema.org\/","@type":"BlogPosting","@id":"https:\/\/ayudaleyprotecciondatos.es\/2020\/05\/19\/reconocimiento-voz\/#BlogPosting","mainEntityOfPage":"https:\/\/ayudaleyprotecciondatos.es\/2020\/05\/19\/reconocimiento-voz\/","headline":"Reconocimiento de voz: Que es, c\u00f3mo funciona y programas que existen","name":"Reconocimiento de voz: Que es, c\u00f3mo funciona y programas que existen","description":"Aqu\u00ed tienes una completa gu\u00eda sobre el reconocimiento de voz: en qu\u00e9 consiste, c\u00f3mo funciona y los programas que existen \u00a1Descubre m\u00e1s aqu\u00ed!","datePublished":"2020-05-19","dateModified":"2020-07-21","author":{"@type":"Person","@id":"https:\/\/ayudaleyprotecciondatos.es\/author\/agonzar34\/#Person","name":"Ana Gonz\u00e1lez","url":"https:\/\/ayudaleyprotecciondatos.es\/author\/agonzar34\/","image":{"@type":"ImageObject","@id":"https:\/\/secure.gravatar.com\/avatar\/9d20ce04c893956aaa747aa424b64675?s=96&d=blank&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/9d20ce04c893956aaa747aa424b64675?s=96&d=blank&r=g","height":96,"width":96}},"publisher":{"@type":"Organization","name":"AyudaLeyProteccionDatos","logo":{"@type":"ImageObject","@id":"https:\/\/ayudaleyprotecciondatos.es\/wp-content\/uploads\/2016\/01\/ayuda-ley-proteccion-datos.png","url":"https:\/\/ayudaleyprotecciondatos.es\/wp-content\/uploads\/2016\/01\/ayuda-ley-proteccion-datos.png","width":600,"height":60}},"image":{"@type":"ImageObject","@id":"https:\/\/ayudaleyprotecciondatos.es\/wp-content\/uploads\/2016\/01\/ayuda-ley-proteccion-datos.png","url":"https:\/\/ayudaleyprotecciondatos.es\/wp-content\/uploads\/2016\/01\/ayuda-ley-proteccion-datos.png","width":100,"height":100},"url":"https:\/\/ayudaleyprotecciondatos.es\/2020\/05\/19\/reconocimiento-voz\/","about":["APPS","TECNOLOG\u00cdA"],"wordCount":4564,"articleBody":" if (typeof BingeIframeRan === \"undefined\") { window.addEventListener(\"message\", receiveMessage, false); function receiveMessage(event) { try { var parsed = JSON.parse(event.data) if (parsed.context === \"iframe.resize\") { var iframes = document.getElementsByClassName(\"binge-iframe\"); for (let i = 0; i < iframes.length; ++i) { if (iframes[i].src == parsed.src || iframes[i].contentWindow === event.source) { iframes[i].height = parsed.height; } iframes[i].style.opacity = 1; } } } catch (error) { } } var BingeIframeRan = true; } La tecnolog\u00eda de reconocimiento de voz es algo con lo que se ha so\u00f1ado y trabajado durante d\u00e9cadas.Desde el pitido de R2-D2 en Star Wars hasta la voz incorp\u00f3rea pero conmovedora de Samantha en Ella, los escritores de ciencia ficci\u00f3n han tenido un papel muy importante en la construcci\u00f3n de expectativas y predicciones sobre c\u00f3mo podr\u00eda ser el reconocimiento de voz en nuestro mundo.Sin embargo, para todos los avances de la tecnolog\u00eda moderna, el control por voz ha sido un asunto bastante poco sofisticado.Lo que supuestamente apunta a simplificar nuestras vidas, en cambio, hist\u00f3ricamente ha sido frustrantemente torpe y nada m\u00e1s que una novedad. Es decir, hasta el momento en el que el big data, el aprendizaje profundo, la inteligencia artificial y el aprendizaje autom\u00e1tico empezaron a abrirse camino para mejorar la tecnolog\u00eda.Analizaremos aqu\u00ed qu\u00e9 es el reconocimiento de voz, c\u00f3mo funciona y las principales aplicaciones existentes.\u00bfQu\u00e9 es el reconocimiento de\u00a0voz?\u00bfC\u00f3mo funciona?El reconocimiento de voz seg\u00fan el canal de comunicaci\u00f3nEl reconocimiento de voz para generar contrase\u00f1asEl papel de la biometr\u00eda en el reconocimiento por vozEl reconocimiento de voz de Google (programas y apps)Hey GoogleGoogle NowEl reconocimiento de voz en Google Docs Dictation.ioSpeechnotesReconocimiento de voz en Windows (programas y apps)Windows Speech Recognition VoiceDragon Naturally SpeakingBrainaVoxCommandoCortanaEl reconocimiento de voz en Amazon (programas y apps)Amazon TranscribeAlexa\u00bfQue otras aplicaciones y software puedo emplear para el reconocimiento de mi voz?Entradas relacionadas\u00bfQu\u00e9 es el reconocimiento de\u00a0voz?El reconocimiento de voz es la capacidad de una m\u00e1quina o\u00a0programa\u00a0para identificar palabras y frases en lenguaje hablado y convertirlas a un formato legible por m\u00e1quina.El software de reconocimiento de voz rudimentario tiene un vocabulario limitado de palabras y frases, y solo puede identificarlas si se hablan con mucha claridad.\u00a0Un\u00a0software\u00a0m\u00e1s sofisticado\u00a0tiene la capacidad de aceptar el habla natural.El primer intento registrado en la tecnolog\u00eda de reconocimiento de voz se remonta a 1,000 AD a trav\u00e9s del desarrollo de un instrumento que supuestamente podr\u00eda responder \u00abs\u00ed\u00bb o \u00abno\u00bb a preguntas directas.Aunque este experimento t\u00e9cnicamente no involucr\u00f3 el procesamiento de voz de ninguna forma, la idea detr\u00e1s de esto sigue siendo parte de la base de la tecnolog\u00eda de reconocimiento de voz: usar el lenguaje natural como entrada para desencadenar una acci\u00f3n.Siglos despu\u00e9s, los laboratorios Bell trabajaron para desarrollar \u00abAudrey\u00bb, un sistema capaz de reconocer los n\u00fameros del 1 al 9 pronunciados por una sola voz.M\u00e1s tarde, IBM desarroll\u00f3 un dispositivo que pod\u00eda reconocer y diferenciar entre 16 palabras habladas.Estos \u00e9xitos provocaron una mayor prevalencia de empresas de tecnolog\u00eda centradas en tecnolog\u00edas relacionadas con el habla.\u00a0De hecho, incluso el Departamento de Defensa quer\u00eda participar en la acci\u00f3n.\u00a0Lento pero seguro, los desarrolladores avanzaron hacia el objetivo de permitir que las m\u00e1quinas entiendan y respondan cada vez m\u00e1s a nuestros comandos verbalizados.La historia de la tecnolog\u00eda de reconocimiento de voz\u00a0ha sido larga y sinuosa.\u00a0Sin embargo, los asistentes de voz actuales como\u00a0 Amazon Alexa, Google Voice, Microsoft Cortana y Siri de Apple no se encontrar\u00edan donde est\u00e1n sin los primeros pioneros que simplificaron el camino.Gracias\u00a0a la integraci\u00f3n de nuevas tecnolog\u00edas, como el procesamiento basado en la nube, as\u00ed como los proyectos\u00a0de recopilaci\u00f3n de datos en curso, estos sistemas de voz han mejorado continuamente su capacidad de \u00abescuchar\u00bb y comprender una mayor variedad de palabras,\u00a0idiomas y acentos.\u00bfC\u00f3mo funciona?Rodeado de tel\u00e9fonos inteligentes, autom\u00f3viles inteligentes, electrodom\u00e9sticos inteligentes, asistentes de voz y m\u00e1s, es f\u00e1cil dar por sentado\u00a0c\u00f3mo funciona realmente la tecnolog\u00eda de reconocimiento de voz.\u00bfPor qu\u00e9?Porque la simplicidad de poder hablar con asistentes digitales es enga\u00f1osa.\u00a0El reconocimiento de voz es realmente incre\u00edblemente complicado, incluso ahora.Piensa en c\u00f3mo un ni\u00f1o aprende un idioma.Desde el primer d\u00eda, escuchan palabras que se usan a su alrededor.\u00a0Los padres hablan con sus hijos y, aunque el ni\u00f1o no responde, absorben todo tipo de se\u00f1ales verbales;\u00a0entonaci\u00f3n, inflexi\u00f3n y pronunciaci\u00f3n;\u00a0su cerebro forma patrones y conexiones basadas en c\u00f3mo sus padres usan el lenguaje.Aunque parezca que los humanos est\u00e1n programados para escuchar y comprender, en realidad hemos estado entrenando toda nuestra vida para desarrollar esta llamada habilidad natural.La tecnolog\u00eda de reconocimiento de voz funciona\u00a0esencialmente de la misma manera.\u00a0Mientras que los humanos han refinado nuestro proceso, todav\u00eda estamos descubriendo las mejores pr\u00e1cticas para las computadoras.\u00a0Tenemos que entrenarlos de la misma manera que nuestros padres y maestros nos capacitaron.\u00a0Y esa capacitaci\u00f3n involucra mucho pensamiento innovador, mano de obra e investigaci\u00f3n.A partir de mayo de 2017, los algoritmos de inteligencia artificial de Google han alcanzado una tasa de precisi\u00f3n de palabras del 95% para el idioma ingl\u00e9s.El reconocimiento de voz seg\u00fan el canal de comunicaci\u00f3nEl reconocimiento de voz robusto trata con desajustes entre entrenamiento y pruebas. Frente a una amplia gama de condiciones adversas inesperadas, los sistemas deben ser mejorados para hacer frente a las variaciones que provienen del altavoz, el tipo, direcci\u00f3n y posici\u00f3n del micr\u00f3fono, el canal de transmisi\u00f3n y el entorno ac\u00fastico.La variabilidad relacionada con el hablante es uno de los principales factores que influyen en los sistemas de reconocimiento de voz actuales.Los grupos de edad son algunos ejemplos de variaciones ac\u00fasticas relacionadas con el hablante. Entre ellos, fen\u00f3menos inducidos por el estr\u00e9s, diferencias de grupos de edad y producciones de habla no nativas, constituyen desaf\u00edos reales para el reconocimiento de voz que, desafortunadamente, funcionan razonablemente bien solo para condiciones cuidadosamente seleccionadas.Los micr\u00f3fonos act\u00faan como filtros lineales en la se\u00f1al de voz y deben tener en cuenta los diferentes grados de pendiente espectraldependiendo de las caracter\u00edsticas del micr\u00f3fono. Este tipo de distorsi\u00f3n est\u00e1 involucrado con la se\u00f1al del habla. Como la distancia del micr\u00f3fono al que habla es a menudo diferente, tambi\u00e9n se observa variaci\u00f3n.El reconocimiento de voz con manos libres es un problema desafiante para el cual no hay soluciones completamente satisfactorias. El inter\u00e9s en el reconocimiento de voz con manos libres lleg\u00f3 principalmente por el uso del habla por tel\u00e9fono y en un coche.En el caso del reconocimiento de voz con manos libres, la distancia y la direcci\u00f3n al micr\u00f3fono var\u00edan. la se\u00f1al de voz se degrada debido a los ecos y al ruido ambiente y la falta de coincidencia entre el entrenamiento y las pruebas es siempre variable.El reconocimiento de voz para generar contrase\u00f1asEl software de reconocimiento de voz tambi\u00e9n es utilizado para generar contrase\u00f1as.La voz es inherentemente diferente del teclado porque las personas pueden saber cu\u00e1l es tu contrase\u00f1a cuando la dices en voz alta. Y cuando la contrase\u00f1a es impronunciable, terminas deletreando, lo cual es inseguro y tedioso.Hay personas que utilizan la soluci\u00f3n no tan excelente de asignar una contrase\u00f1a cr\u00edptica a algo pronunciable utilizando el administrador de vocabulario de Dragon o la funci\u00f3n de Lista de entrada del comando Utter. Ninguno de los m\u00e9todos es muy seguro, porque el mapeo se encuentra en una utilidad que alguien simplemente puede mirar.La mejor soluci\u00f3n es marcar \u00abRecordar contrase\u00f1a\u00bb en tu navegador y cuando escribas tu nombre de usuario, la contrase\u00f1a se completar\u00e1 autom\u00e1ticamente. Establece una contrase\u00f1a maestra en tu navegador para proteger la lista de contrase\u00f1as.As\u00ed, puedes configurar tu contrase\u00f1a de acceso por voz y, al tener la opci\u00f3n de recordar contrase\u00f1a, no tendr\u00e1s que volver a decirla cada vez que accedas.El papel de la biometr\u00eda en el reconocimiento por vozA diferencia de la biometr\u00eda tradicional, como la huella digital, la cara y el iris, la voz es una combinaci\u00f3n de biometr\u00eda fisiol\u00f3gica y conductual. Los aspectos fisiol\u00f3gicos se basan en el tama\u00f1o y la forma de la boca, garganta, laringe, cavidad nasal, peso y otros factores de cada persona. Estos dan como resultado nuestro tono y timbre naturales.Las propiedades de comportamiento son aquellas formadas en base al lenguaje, la educaci\u00f3n \/ influencia y la geograf\u00eda, lo que resulta en cadencia, inflexi\u00f3n, acento y dialecto del habla variables.La biometr\u00eda de voz tiene varias ventajas distintas como m\u00e9todo para la autenticaci\u00f3n de usuarios en dispositivos m\u00f3viles, IoT y port\u00e1tiles. Es muy natural que las personas produzcan para la autenticaci\u00f3n m\u00f3vil, y pueden seguir el \u00e9xito del \u00e9xito de la biometr\u00eda de huellas digitales que se integra f\u00e1cilmente en los tel\u00e9fonos inteligentes emblem\u00e1ticos.La voz tambi\u00e9n es adecuada como soluci\u00f3n de autenticaci\u00f3n biom\u00e9trica en una amplia gama de dispositivos IoT, incluidas tabletas, dispositivos port\u00e1tiles, PC, sistemas de juegos, televisores inteligentes, incluso tel\u00e9fonos de l\u00ednea fija y autom\u00f3viles.El reconocimiento de voz ofrece una opci\u00f3n rentable y flexible en comparaci\u00f3n con otras modalidades biom\u00e9tricas que pueden verse obstaculizadas por los esfuerzos de integraci\u00f3n de hardware, particularmente en dispositivos m\u00f3viles que requieren sensores de huellas digitales y c\u00e1maras de iris NIR.Debido a su facilidad de integraci\u00f3n, el reconocimiento de voz es diferente de otros m\u00e9todos biom\u00e9tricos en que las muestras de voz se capturan din\u00e1micamente o durante un corto per\u00edodo de tiempo, como unos pocos segundos. El an\u00e1lisis se realiza en un modelo que monitoriza los cambios a lo largo del tiempo, que es similar a otros datos biom\u00e9tricos de comportamiento como la firma din\u00e1mica, la marcha y el reconocimiento de pulsaciones de teclas.El reconocimiento de voz de Google (programas y apps)A fines de 2017, Google contaba con una tasa de precisi\u00f3n de palabras del 95% para el ingl\u00e9s de los Estados Unidos; el m\u00e1s alto de todos los asistentes de voz actualmente disponibles. Esto se traduce en una tasa de error de palabras del 4.9%, lo que hace que Google sea el primero del grupo en caer por debajo del umbral del 5%.En lo que algunos llaman un intento de contraatacar en Amazon, Google ha lanzado muchos productos inquietantemente similares a Amazon. Por ejemplo, Google Home recuerda a Echo de Amazon, y Google Home Mini de Amazon Echo Dot.M\u00e1s recientemente, Google tambi\u00e9n anunci\u00f3 algunas asociaciones nuevas y clave con compa\u00f1\u00edas como Lenovo, LG y Sony para lanzar una l\u00ednea de \u00abpantallas inteligentes\u00bb con el Asistente de Google, que una vez m\u00e1s parece \u00abhacerse eco\u00bb de la imagen de Echo Show de Amazon.Hey GoogleHey Google es el ayudante virtual de Google que te permite hacer las cosas m\u00e1s r\u00e1pido. En lugar de realizar tareas manualmente tocando con el dedo en la pantalla miles de millones de veces, puedes hacer el trabajo utilizando comandos de voz.Es inteligente y est\u00e1 muy bien integrado con Android. Puedes usarlo para abrir aplicaciones, enviar mensajes, hacer llamadas, reproducir una canci\u00f3n espec\u00edfica, verificar el clima y muchas otras cosas sin tocar la pantalla de tu tel\u00e9fono.Instrucciones paso a paso sobre c\u00f3mo habilitar el Asistente:Inicia la aplicaci\u00f3n Google.Toca la opci\u00f3n \u00abM\u00e1s\u00bb en la esquina inferior derecha.Dir\u00edgete a Configuraci\u00f3n> Asistente de Google .Mover a la pesta\u00f1a \u00abAsistente\u00bb.Toca la opci\u00f3n \u00abTel\u00e9fono\u00bb en la parte inferior.Habilita la opci\u00f3n \u00abAsistente de Google\u00bb.Habilita la opci\u00f3n \u00abHey Google\u00bb.Ahora que el Asistente est\u00e1 activado, es hora de probarlo. Puedes hacerlo diciendo \u00abOk, Google\u00bb o \u00abHey, Google\u00bb, y luego indicando la acci\u00f3n. Un ejemplo de esto ser\u00eda: \u00abOk Google, reproduce un divertido v\u00eddeo de gato en YouTube\u00bb.Ten en cuenta que tu tel\u00e9fono debe estar desbloqueado para que esto funcione. Si la pantalla se apaga cuando dices un comando, el Asistente de Google lo escuchar\u00e1 pero te pedir\u00e1 que desbloquees el tel\u00e9fono antes de que pueda realizar la tarea solicitada. Es una caracter\u00edstica molesta que est\u00e1 ah\u00ed por razones de seguridad.Google NowHa habido bastante confusi\u00f3n sobre lo que realmente es Google Now.\u00a0Es f\u00e1cil describirlo como la versi\u00f3n de Google de Siri, pero en realidad es mucho m\u00e1s ambicioso que eso.Claro, puedes usarlo para establecer recordatorios para comprar leche o cenar con amigos, y puedes hacerle preguntas b\u00e1sicas sobre el clima ma\u00f1ana o qui\u00e9n dirigi\u00f3\u00a0The Shining, pero la verdadera atracci\u00f3n radica en su capacidad para evitar sus deseos y necesidades.Si dejas que Google Now aprenda sobre ti y tus h\u00e1bitos, puede arrojar informaci\u00f3n que cree que podr\u00eda interesarte. Las noticias, los resultados deportivos, el clima y la informaci\u00f3n del tr\u00e1fico se muestran en tiempo real en funci\u00f3n de tus movimientos y b\u00fasquedas anteriores.Vale la pena pasar un tiempo en la configuraci\u00f3n antes de comenzar a usar Google Now.En Android, es probable que tengas una barra de b\u00fasqueda de Google en la pantalla de inicio y puedes tocarla para abrir Google Now, o puedes seleccionar Google en el caj\u00f3n de aplicaciones. Tambi\u00e9n podr\u00e1s mantener presionado el bot\u00f3n Inicio o deslizar hacia arriba desde el bot\u00f3n Inicio para seleccionar r\u00e1pidamente Google Now.En iOS, querr\u00e1s abrir la aplicaci\u00f3n de B\u00fasqueda de Google. Se lTe pedir\u00e1 que lo configures la primera vez que lo uses, pero puedes volver a la aplicaci\u00f3n e ingresar la configuraci\u00f3n cuando lo desees, para modificar las cosas.Dale vida a Google Now y encontrar\u00e1s el men\u00fa en la esquina superior izquierda. Toca las tres l\u00edneas horizontales y elige Configuraci\u00f3n. Puedes activar y desactivar Google Now aqu\u00ed, y ajustar su comportamiento.El reconocimiento de voz en Google DocsEn Google Docs, ahora puedes simplemente hablar por dictado de voz a texto si tu ordenador tiene un micr\u00f3fono. El uso puede incluso pausar, emitir un comando, pausar nuevamente y reanudar el dictado.A continuaci\u00f3n, encontrar\u00e1s algunas instrucciones iniciales para comenzar y algunos comandos comunes que puedes utilizar.Comprueba que tu micr\u00f3fono funciona.Abre un documento en Google docs con un navegador Chrome.Haz clic en Herramientas> Escritura de voz. Aparece una caja de micr\u00f3fono.Cuando est\u00e9s listo para hablar, haz clic en el micr\u00f3fono.Habla con claridad, a un volumen y ritmo normalesCuando termines, haz clic en el micr\u00f3fono nuevamente.Puedes usar comandos para editar y formatear tu documento cuando escribes por voz. Por ejemplo, \u00abSeleccionar p\u00e1rrafo\u00bb, \u00abcursiva\u00bb o \u00abIr al final de la l\u00ednea\u00bb. Dictation.ioDictation.io es una aplicaci\u00f3n web r\u00e1pida y simple de voz a texto que se basa en el motor de reconocimiento de voz incorporado de Google Chrome para transformar tu voz en texto digital.Esta aplicaci\u00f3n gratuita no requiere registro. Funciona de forma muy parecida a Voice Typing en Google Docs. Para comenzar a dictar, haz clic en el dictado de inicio en la parte inferior de la aplicaci\u00f3n y comienza a hablar.Una vez que hayas terminado de dictar, revisa el texto en busca de errores tipogr\u00e1ficos y de puntuaci\u00f3n y, si est\u00e1s satisfecho, haz clic en el bot\u00f3n Guardar.SpeechnotesSpeechnotes es una nueva aplicaci\u00f3n de toma de notas y dictado de Android que utiliza la tecnolog\u00eda de reconocimiento de voz de Google. Agrega mucho valor extra con las caracter\u00edsticas de capitalizaci\u00f3n autom\u00e1tica y puntuaci\u00f3n autom\u00e1tica del desarrollador.Han agregado ajustes especiales para mejorar los resultados de reconocimiento. Lo que esto significa es que obtienes transcripciones muy precisas y con poca o ninguna necesidad de editar tus notas habladas. Tambi\u00e9n puedes usarlo sin conexi\u00f3n.Lo primero que debes hacer es seleccionar su idioma. Aseg\u00farate de tener habilitada la escritura de Google Voice en la configuraci\u00f3n de Idioma y entrada de tu tel\u00e9fono.Si deseas utilizar Speechnotes sin conexi\u00f3n, puedes elegir los paquetes de idiomas sin conexi\u00f3n. Cada paquete tiene una descarga aproximada de 30 MB.Una vez que se haya solucionado, toca el bot\u00f3n del micr\u00f3fono de la aplicaci\u00f3n y comienza a hablar. Habla despacio y claramente para empezar. Cuando hayas terminado, toca el bot\u00f3n de pausa. En la parte inferior de la pantalla, ver\u00e1s algunos botones de edici\u00f3n y un icono de teclado. Puedes usarlos para editar tus notas.Reconocimiento de voz en Windows (programas y apps)El reconocimiento de voz te permite escribir texto r\u00e1pidamente con solo hablarle a tu tel\u00e9fono. El reconocimiento de voz de Windows funciona en l\u00ednea o sin conexi\u00f3n. La precisi\u00f3n var\u00eda seg\u00fan tu acento, lo r\u00e1pido que hables, lo claro que pronuncies las cosas, los niveles de ruido circundante y la naturaleza del sujeto.Puede ser una forma r\u00e1pida de tomar notas, por ejemplo de un libro de texto, especialmente si no deseas tener que escribir cosas en un papel. Puedes escribir correos electr\u00f3nicos o tareas directamente por voz sin tener la distracci\u00f3n de encontrar las claves correctas o la ortograf\u00eda correcta. Tambi\u00e9n puede ayudar si tienes dificultades de ortograf\u00eda o escribes lentamente.Para poder usarlo es necesario disponer de un PC con Windows que funcione con sistemas operativos de Windows 7 y superiores.Windows Speech Recognition VoiceWindows Speech Recognition Voice puede utilizarse para:realizar tareas (por ejemplo, abrir nuevos documentos) ydictar texto directamente en un documento.La calidad del reconocimiento de voz se puede mejorar entrenando el PC y tambi\u00e9n aumentando tu propia conciencia de tu velocidad y claridad al hablar.El reconocimiento de voz elimina los errores de ortograf\u00eda, pero puede haber varios errores de interpretaci\u00f3n que necesitar\u00e1s encontrar y corregir. Dependiendo de tus necesidades, esto podr\u00eda ser m\u00e1s f\u00e1cil y r\u00e1pido que escribir todo manualmente.Dragon Naturally SpeakingEl software Dragon NaturallySpeaking es un programa de reconocimiento de voz que permite al usuario hablar por un micr\u00f3fono en una computadora con el software que traduce las palabras habladas en texto en un programa de texto.Con un programa de software como este, no es necesario escribir y el usuario puede eliminar un teclado. El usuario simplemente conecta un auricular de micr\u00f3fono en el conector de micr\u00f3fono apropiado, inicia DragonNaturally Speaking en su ordenador y pronuncia las palabras necesarias y el programa lo traducir\u00e1 en texto.Con el micr\u00f3fono apropiado, el usuario puede obtener un alto grado de precisi\u00f3n con la traducci\u00f3n de voz a texto.Para usar Dragon NaturallySpeaking, un usuario primero debe entrenar los auriculares para que el programa pueda saber la forma en que habla el usuario y si los auriculares son capaces de obtener un alto nivel. Durante esta capacitaci\u00f3n, el usuario solo lee algunos p\u00e1rrafos mientras el ordenador comprende la forma en que habla.Una vez que se completa la capacitaci\u00f3n, el usuario puede comenzar a hablar y el programa traducir\u00e1 las palabras en texto.BrainaBraina es una aplicaci\u00f3n de asistente personal inteligente para Microsoft Windows desarrollada por Brainasoft. Utiliza la interfaz de lenguaje natural y el reconocimiento de voz para interactuar con sus usuarios y les permite usar oraciones en ingl\u00e9s para realizar diversas tareas en su ordenador.La aplicaci\u00f3n puede encontrar informaci\u00f3n de Internet, reproducir canciones y v\u00eddeos a elecci\u00f3n del usuario, tomar dictados, buscar y abrir archivos, configurar alarmas y recordatorios, realizar c\u00e1lculos matem\u00e1ticos, controlar ventanas y programas, etc. La aplicaci\u00f3n de Android de Braina se puede utilizar para interactuar con sistema de forma remota a trav\u00e9s de una red Wi-Fi.El nombre Braina es una forma abreviada de cerebro artificial. El software se adapta al comportamiento del usuario con el tiempo para anticipar mejor las necesidades. El software tambi\u00e9n permite a los usuarios escribir comandos usando el teclado en lugar de decirlos. Braina viene en versi\u00f3n gratuita y de pago.VoxCommandoVoxCommando es una utilidad de reconocimiento de voz y comando que te permite tomar el control de tu PC multimedia de cine en casa. Se puede ejecutar localmente, sin sacrificar la privacidad de los servicios basados \u200b\u200ben la nube.Puedes usarlo como una herramienta de asistencia para acelerar las tareas cotidianas, reducir tu dependencia del teclado y el rat\u00f3n, o simplemente porque es divertido de usar.VoxCommando es diferente de otras aplicaciones de reconocimiento de voz en que es extremadamente personalizable. Est\u00e1 dise\u00f1ado para funcionar con una amplia variedad de servicios de automatizaci\u00f3n del hogar y programas multimedia. Es capaz de lograr un reconocimiento de voz preciso porque ya sabe qu\u00e9 medios hay en tu biblioteca.CortanaCortana es un asistente virtual controlado por voz para Microsoft Windows Phone 8.1. comparable a Siri, el asistente inteligente habilitado en dispositivos Apple, Cortana de Microsoft usar\u00e1 el motor de b\u00fasqueda Bing y los datos almacenados en el tel\u00e9fono inteligente del usuario para hacer recomendaciones personalizadas.Los usuarios podr\u00e1n iniciar Cortana desde la pantalla de inicio, donde la asistente virtual femenina ofrecer\u00e1 sugerencias para las tareas que el propietario quiera realizar en funci\u00f3n de la ubicaci\u00f3n y el comportamiento pasado. Los usuarios pueden indicar a Cortana que busque informaci\u00f3n, programe citas, establezca notificaciones y use las funciones de las aplicaciones instaladas en el dispositivo.Cortana es personalizada, basada en gran medida en la cantidad de informaci\u00f3n que comparte el usuario. Por ejemplo, al permitir el acceso al calendario, correo electr\u00f3nico, contactos e historial de navegaci\u00f3n, el asistente virtual puede usar estos datos para tratar de anticipar las necesidades del usuario.El reconocimiento de voz en Amazon (programas y apps)Al igual que Google y Windows, Amazon tambi\u00e9n dispone de diversos programas que utilizan el reconocimiento de voz.Analicemos los m\u00e1s importantes.Amazon TranscribeAmazon Transcribe es un servicio de reconocimiento autom\u00e1tico de voz que facilita a los desarrolladores agregar capacidad de voz a texto a sus aplicaciones. Con la API de Amazon Transcribe, puedes analizar archivos de audio almacenados en Amazon S3 y hacer que el servicio devuelva un archivo de texto de la voz transcrita. Tambi\u00e9n puedes enviar una transmisi\u00f3n de audio en vivo a Amazon Transcribe y recibir una transmisi\u00f3n de transcripciones en tiempo real.Amazon Transcribe se puede utilizar para muchas aplicaciones comunes, incluida la transcripci\u00f3n de llamadas de servicio al cliente y la generaci\u00f3n de subt\u00edtulos en contenido de audio y v\u00eddeo.El servicio puede transcribir archivos de audio almacenados en formatos comunes, como WAV y MP3, con marcas de tiempo para cada palabra para que pueda localizar f\u00e1cilmente el audio en la fuente original buscando el texto. Amazon Transcribe est\u00e1 continuamente aprendiendo y mejorando para mantener el ritmo de la evoluci\u00f3n del lenguaje.AlexaAlexa es un asistente digital virtual desarrollado por Amazon para su l\u00ednea de dispositivos inform\u00e1ticos Amazon Echo y Echo Dot . Las capacidades de Alexa imitan las de otros asistentes inteligentes como Apple Siri , Microsoft Cortana , Google Assistant y Samsung Bixby.Alexa responde al control por voz devolviendo informaci\u00f3n sobre productos, m\u00fasica, noticias, clima, deportes y m\u00e1s. El motor de back-end para Alexa de Amazon se ejecuta en Amazon Web Services en la nube, lo que permite que Alexa conozca las preferencias de una persona o familia y expanda su funcionalidad con el tiempo.Alexa recibe su nombre de la antigua biblioteca de Alejandr\u00eda, y se puede activar diciendo primero una palabra de activaci\u00f3n (ya sea \u00abAlexa\u00bb de forma predeterminada o \u00abEco\u00bb, \u00abAmazon\u00bb o \u00abComputadora\u00bb, seg\u00fan sus preferencias), seguido de tu consulta o solicitud Alexa usa la interpretaci\u00f3n del lenguaje natural para procesar y actuar sobre las solicitudes.Adem\u00e1s de devolver informaci\u00f3n, Alexa tambi\u00e9n permite que los dispositivos Echo funcionen como centros dom\u00e9sticos inteligentes que pueden controlar dispositivos conectados a Internet de las cosas como luces inteligentes, termostatos y dispositivos electr\u00f3nicos.Con m\u00e1s de 30,000 habilidades y creciendo, Alexa ciertamente supera a Siri, Google Voice y Cortana combinados en t\u00e9rminos de integraci\u00f3n de terceros. Con el incentivo de \u00abAgregar voz a su gran idea y llegar a m\u00e1s clientes\u00bb no es de extra\u00f1ar que los desarrolladores se apresuren a poner contenido en la plataforma de Habilidades.\u00bfQue otras aplicaciones y software puedo emplear para el reconocimiento de mi voz?Aparte de las ya mencionadas, existen otras aplicaciones de reconocimiento de voz en el mercado actual. De todas ellas, debemos destacar Siri, de Apple.Siri de Apple fue el primer asistente de voz creado por las principales compa\u00f1\u00edas tecnol\u00f3gicas que se estren\u00f3 en 2011.Desde entonces, se ha integrado en todos los iPhones, iPads, AppleWatch, HomePod, computadoras Mac y Apple TV.A trav\u00e9s de su tel\u00e9fono, Siri incluso se est\u00e1 utilizando como la interfaz de usuario clave en el sistema de infoentretenimiento CarPlay de Apple para autom\u00f3viles, as\u00ed como en los auriculares inal\u00e1mbricos AirPod.Con el lanzamiento de SiriKit, una herramienta de desarrollo que permite a compa\u00f1\u00edas externas integrarse con Siri y HomePod, el intento de Apple de tener un altavoz inteligente (luego del \u00e9xito de Amazon Echo y Google Home), las capacidades del asistente de voz se vuelven a\u00fan m\u00e1s s\u00f3lidas.Aunque Apple tuvo una gran ventaja con Siri, muchos usuarios expresaron su frustraci\u00f3n por su aparente incapacidad para comprender e interpretar adecuadamente los comandos de voz.Naturalmente, ser el primero con bastante frecuencia significa recibir la mayor parte de la falta de funcionalidad que podr\u00eda no funcionar como se esperaba.Pero, incluso hoy, Siri sigue siendo notoria por malentendidos comandos de voz.Si le pides a Siri que env\u00ede un mensaje de texto o realice una llamada en tu nombre, puede hacerlo f\u00e1cilmente. Sin embargo, cuando se trata de interactuar con aplicaciones de terceros, Siri es un poco menos robusto en comparaci\u00f3n con sus competidores, ya que solo trabaja con seis tipos de aplicaciones: transporte compartido e intercambio; mensajer\u00eda y llamadas; b\u00fasqueda de fotos; pagos; aptitud; y sistemas de infoentretenimiento autom\u00e1tico.Siri est\u00e1 disponible en m\u00e1s de 30 pa\u00edses y 20 idiomas, y, en algunos casos, en varios dialectos diferentes. Entradas relacionadas\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tReconocimiento facial \u00bfQu\u00e9 es? \u00bfC\u00f3mo funciona?\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\u00bfQu\u00e9 es un sensor de huellas dactilares? \u00bfSe le puede enga\u00f1ar?\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t"},{"@context":"http:\/\/schema.org\/","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"item":{"@id":"https:\/\/ayudaleyprotecciondatos.es\/#breadcrumbitem","name":"Ayuda Ley Protecci\u00f3n Datos"}},{"@type":"ListItem","position":2,"item":{"@id":"https:\/\/ayudaleyprotecciondatos.es\/2020\/05\/19\/reconocimiento-voz\/#breadcrumbitem","name":"Reconocimiento de voz: Que es, c\u00f3mo funciona y programas que existen"}}]}]