tag:blogger.com,1999:blog-7439962650188233512024-03-13T10:13:45.820-07:00RonelsaxA computer science engineerAbraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.comBlogger14125tag:blogger.com,1999:blog-743996265018823351.post-56752572631292791652012-05-17T12:27:00.007-07:002022-11-30T09:38:28.936-08:00<br />Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-62647368541065011572012-04-06T15:24:00.001-07:002012-04-06T15:26:40.288-07:00This is how NASA explains rockets.<div></div><blockquote><div>It's like in Mario Kart where if you drive off the side into the mud, the drag slows you down. If you drive back to the road in a perpendicular fashion, you minimize your time in the mud, but you've built up no momentum once you get to the road. If you drive parallel and angle yourself gradually toward the road, you maximize your time in the mud and waste a lot of energy, but you get to keep whatever forward momentum you've gained once you get to the road. Depending on the thickness of the mud, there's some optimum angle that describes the most efficient path back onto the road; approaching perpendicular for thicker mud, and approaching parallel for thinner mud.</div><div><br /></div><div>Now if the thickness of the mud/atmosphere decreases as you get closer to the road/space, that optimum path would be a curve, starting at perpendicular and ending at parallel, and that's exactly what rockets do.</div></blockquote><div></div><div><br /></div><div>Genius!</div>Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-63066143251715758392010-11-03T14:52:00.001-07:002010-11-03T14:54:04.536-07:00Ya con hambre!Justo ahora cuando trato de empezar a bajarle a la comida (dado que hace poco visité mi querido país y me atasqué de todo), me empieza a dar hambre mortal. Ya comí chicles, dulces y hasta una barra energética; el resultado, el mismo: ¡hambre!<div><br /></div><div>Regreso al trabajo para ver si se me olvida.</div><div>Saludos!</div>Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-74911627488685962242010-03-24T15:32:00.000-07:002010-03-24T15:35:32.766-07:00Muy cierto.<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="http://3.bp.blogspot.com/__wdSOl1KkLw/S6qTg6bvW9I/AAAAAAAAAI0/8D2M68Bdvt4/s1600/img.jpg"><img style="float: right; margin: 0pt 0pt 10px 10px; cursor: pointer; width: 320px; height: 245px;" src="http://3.bp.blogspot.com/__wdSOl1KkLw/S6qTg6bvW9I/AAAAAAAAAI0/8D2M68Bdvt4/s320/img.jpg" alt="" id="BLOGGER_PHOTO_ID_5452332492536110034" border="0" /></a><br />El fenómeno del teléfono descompuesto en el desarrollo de proyectos.<br /><br />Esta mañana me llegó por correo una imágen que tiene mucho de cierto. ¿Por qué nos pasa esto?<br /><br /><img src="file:///C:/Users/ronelsax/AppData/Local/Temp/moz-screenshot.png" alt="" />Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-53132677612972673222010-02-10T16:27:00.000-08:002010-02-10T17:14:02.752-08:00Buzz-eandoEl día de hoy corriendo entre juntas y entregas, comida e <a href="http://ict.udlap.mx">ICT</a> inicié sesión en la computadora de una amiga para ver correos viejos que había enviado. La sorpresa fue que en esta ocasión me pidió aprobar un nuevo servicio llamado "<a href="http://www.google.com/buzz">Google Buzz</a>", y pues que le apachurro aceptar.<br /><br />Ya entrados en gastos exploré rápidamente el servicio y decidí colocar un mensaje:<br />"<span class="z19Dle" id="col-z12ewhpjfuy0g3fxv04ciz3abwieuxg5v3c"><span class="zo">Checking this out!</span></span><span class="Ia dm2Ocf">"<br /><br />Inmediatamente un amigo respondió con un comentario preguntando sobre mi paradero, momentos después, mi amiga (la dueña de la compu en la que inicié sesión), comentó en el mensaje y así sucesivamente hasta que se armó la bolita de nieve. Pufff. Total que aprovechamos para discutir algunos horarios y cosas (afortunadamente) no muy relevantes. Y me aventuro a decir que todos lo hicimos bajo el supuesto de que sólo nosotros veríamos dichos mensajes. Cuál fue mi sorpresa que al regresar a ICT algunos de mis compas me dicen personalmente "ya nos enteramos de tus desmadritos" (?). Toma chango tu banana.<br /><br />Me quedé pasmado y a la vez comencé a entender un poco más del servicio Buzz. Resulta que Buzz se basa en la premisa de publicar (por defecto) todo lo que dices a todo el mundo, en especial, si tú inicias el "buzz", todos tus seguidores podrán ver el hilo completo de la conversación O_o. ¡Inclusive recibirán notificaciones cuando alguien comenta! ¿y ora pior?<br /><br />Inmediatamente chequé otras cuentas de conocidos y lo mismo, usan el servicio sin el conocimiento de que escribir un "buzz" en la modalidad "público" lo hará accesible para cualquier infeliz mortal en cualquier parte del mundo. <span style="font-style: italic;">Let anyone find and read your posts. Share your ideas with the world:</span> esas palabras en gris me las brinqué olímpicamente.<br /><br />Mi opinión al respecto es que el problema radica en Gmail. El correo electrónico es algo tan personal como la ropa interior o la graduación de los lentes (a excepción de algunos frikis), y es aquí donde surge la confusión: Escribir un "buzz" no tendrá más efecto que el de notificar a los pocos contactos que tengo. Tan tan.<br /><br />Por otro lado, el servicio es muy interesante. En poco tiempo ha recibido una buena acogida y la gente anda "buzz-eando" <span style="font-style: italic;">ene</span> cantidad de comentarios. Inclusive en Twitter es trending topic. Compartir fotos, pensamientos y videos de una forma práctica lo hacen una herramienta útil en algunos casos. Sin embargo, creo que aún le falta un poco de estudios de usabilidad y sobre todo criterios de privacidad. Lo anterior lo digo porque en mi caso, al activar Buzz, resultó que ahora tenía perfil público en donde hay varios campos con información sensible que no me gustaría revelar a medio (si no es que todo) mundo. Uno por el callo se resiste al "next-next-next"; pero ¿y los usuarios que no son cuidadosos?, ¿los que andan papaloteando?, ¿los inexpertos?. Pffff.<br /><br />Me late que Google, con gran astucia y sagacidad le anda apuntando a tener una tajada del pastel en las redes sociales (además de Orkut). Y por otro lado me huele a una adaptación del proyecto <a href="http://wave.google.com/">Google Wave</a> el cual no tuvo mucha aceptación a pesar de que todos clamaban por una invitación al servicio. ¿Será esta la forma de matar dos pájaros de un tiro: Redes sociales y puentear Gmail hacia Google Wave?<br /><br />Un saludote y hasta la próxima<br /></span>Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-34242864833546581532010-01-15T17:08:00.000-08:002010-01-15T22:05:28.618-08:00Distiller, la IEEE y una publicación de gol.Vaya sorpresita, lo que hace la ignorancia. Verán, cuando me fui de intercambio pa' los yunaites tomé una clase que se llama "Medición para Internet" (<span style="font-style: italic;">Internet Measurement</span> ¡ay güey!). Llegué cual vil infeliz mortal, esperando una clase tranquilona, leve, fácil de digerir y relacionada con el ancho de banda (ajá).<br /><br />Cuál fue mi sorpresa cuando el profe me dice "¿Cuál es tu proyecto de investigación?, ¿Por qué no viniste el semestre pasado?". Mi cara de OMG-WTF hizo que cambiara sus preguntas por "¿Quién eres?, ¿Qué haces aquí?. Soy Abraham, estudiante de intercambio de México, tomé la materia porque suena interesante. Flop.<br /><br />El profe, con sus ojos de taca-taca, me explica que los estudiantes de esa clase la toman como equivalencia de "seminario de investigación doctoral II". Pensé: "chanfles, pero si yo estudio la maestría (según)".Pues ya no había vuelta pa'tras. Ni modo, haz algo que te interese y ponte al corriente, pregúntale a tus compañeros cómo está el pex. Chass.<br /><br />Ni paper-mate, acabé sufriéndole con todas las clases y en especial con esa. Total, que de las tareitas que fui haciendo, salió una cosa coquetona sobre las redes sociales (Twitter). Me agradó cómo quedó porque el curso me fue forzando a hacer las cosas al mas puro estilo de investigación gringo. Regresé a México y el trabajo se quedó ahí arrumbado en mi compu. Sniff.<br /><br />Un buen día, vi un anuncio de un congreso en la uni. ¿Y si publico esas chambitas?, pensé. No pierdo nada y puede servir de algo. Heme aquí con la publicación aceptada y pariendo cuaches para imprimirla en pdf. GOL.<br /><br />Crear un pdf es la cosa más simple del mundo y más cuando usas mac. Pero no contaban con la astucia de la IEEE, la cual requiere que tu pdf sea visto por la <a href="http://en.wikipedia.org/wiki/Amiga">AMIGA</a> modelo 82 y rendereado con un programa llamado Distiller. Total que me peleé todo un día completo con dicho programa que a fuerza viene en la versión profesional de Adobe (lo que implica que los de la IEEE te consideran rico por tener dicha licencia).<br /><br />Al final de cuentas, la solución (como casi todas las buenas soluciones) la encontré en un foro super recóndito del negro Internet. Y oh sorpresa, Distiller no funcionaba de fábrica en su versión 9.0, el asunto se arreglaba con una simple y llana actualización. Paff ¬¬.<br /><br />Any way, pa los futuros publicadores de artículos de la IEEE, si renderean pdf's no olviden actualizar sus Distillers (y destílense uno que otro tequilazo).Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com1tag:blogger.com,1999:blog-743996265018823351.post-84258138058597603952010-01-15T16:51:00.000-08:002010-01-15T17:08:10.234-08:00Retomando bitácoras.Es 2010 y con ello siempre surgen los propósitos de año nuevo. En mi caso, no soy un escrito asiduo como habrán podido observar. Pero pa'l que caiga por error en esta bitácora y tenga algo para entretener las pupilas, retomaré esta bitácora personal.<br /><br />Creo que es un buen ejercicio, y con personajes inspiradores como <a href="http://plaqueta.blogspot.com/">Plaqueta</a>, <a href="http://guffo.blogspot.com/">Guffo</a>, y el buen <a href="http://lecturasdisidentes.wordpress.com/">Padaguan</a>, se me hace una excelente idea compartir pensamientos, soluciones, huesos atorados en el gañote y demás.<br /><br />Bueno, sin más preámbulo a darle mole de olla que la cazuela está grande. Les actualizo en lo que he andado:<br />1: Terminé mis clases de maestría en Ciencias de la Computación, ando en friega (y ni tanto como quisiera) escribiendo la tesis para titularme.<br /><br />2: Haciéndome a la idea de que en breve partiré a chambear en otro lado. Con esa cosquilla en la panza porque vine un futuro en donde me rajaré la madre programando cual vil ardilla. Como en los viejos tiempos. Chingao.<br /><br />3: Reanudando el ejercicio y la natación, que en realidad son pininos para mantener la salud. No soy Michael Phelps, pero al menos me siento bien.<br /><br />4: Escribiendo en este blog para compartir lo que caiga y dejarlo como un registro de lo que va saliendo. Me falta callo para escribir, lo sé. Pero empezando a escribir lo que sea se adquiere.<br /><br />Saludos y gracias por acompañarme en esta jornada por agarrar el cayo. (Sonó como brindis chafa, ¡Salud!)Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-49504208165962616532008-11-26T02:58:00.000-08:002008-11-26T03:52:49.518-08:00Via Voice 10La primera computadora que tuve era una ensamble de 64MB de memoria RAM y 333Mhz de procesamiento. A pesar de las características tan limitadas, traía un software que permitía dictarle a la computadora: así fue como conocí las interfaces de voz. El software era lento y fácilmente superado por una taquimecanógrafa; no obstante era lo suficientemente veloz y preciso para que el intento valiera la pena en un usuario común y corriente.<br /><br />El Software del que estoy hablando es nada más y nada menos que <a href="http://www.nuance.com/viavoice/">Via Voice de IBM</a> cuya primera versión fue liberada en 1999. Actualmente se encuentran por ahí de la versión 10 y tiene características "multi-modales", es decir, todo el proceso de dictado en un procesador de palabras se puede realizar sin tocar en ningún momento el teclado o el mouse.<br /><br />A diferencia del reconocedor de Windows es más versátil al identificar en qué momento es un comando y en qué momento se trata del dictado de palabras. La versión 10 tiene 4 ediciones diferentes: <a href="http://www.nuance.com/viavoice/pro/">Pro USB</a>, <a href="http://www.nuance.com/viavoice/advanced/">Advanced</a>, <a href="http://www.nuance.com/viavoice/standard/">Standard</a> y <a href="http://www.nuance.com/viavoice/personal/">Personal</a> (con dos alternativas similares para Mac OS).<br /><br />En la edición Advanced, el software es capaz de crear comandos dependiendo la costumbre del usuario. A difrencia del proporcionado por Windows, es el software quien se entrena para entender a la persona y no al revés. El programa funciona en cualquier aplicación que permita entrada de texto así como también para navegar por el Web utilizando la voz.<br /><br />Otra de sus características técnicas es que es uno de las primeras aplicaciones en utilizar técnicas de eliminación de ruido.<br /><br />En su versión Personal tiene un costo de 30 usd y en la Advanced de 80 usd, y es lo que a mi consideración no lo ha hecho popular a pesar de su demo gratuito.<br /><br />Por otro lado, a pesar de los grandes avances en reconocimiento de voz y adaptabilidad, el dictado no siempre es un método popular para escribir textos. La principal razón que los usuarios dan es la confiabilidad; prefieren ir a la segura con el teclado que estarse peleando con un un micrófono que quizá no les entienda del todo.<br /><br />[IBM 2005]<br />IBM Via Voice, 2005. Home Web page.Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-19797383007783555062008-11-25T23:20:00.000-08:002008-11-26T05:57:25.783-08:00Your pad or MiPadContinuando con este asunto de las interfaces de voz, una de las primeras aplicaciones desarrolladas por Microsoft en los laboratorios de reconocimiento de voz es MiPad. La aplicación es "multimodal interactive notepad", y está pensada para dispositivos móviles. Según los laboratorios de Microsoft, es la combinación perfecta entre comandos de voz y el uso de un stylus. Aquí se muestra un ejemplo de baja fidelidad de la aplicación:<br /><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="http://4.bp.blogspot.com/__wdSOl1KkLw/SS0Dm-2tEMI/AAAAAAAAAEg/dma1hf6_Ikw/s1600-h/mipad.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 320px; height: 206px;" src="http://4.bp.blogspot.com/__wdSOl1KkLw/SS0Dm-2tEMI/AAAAAAAAAEg/dma1hf6_Ikw/s320/mipad.gif" alt="" id="BLOGGER_PHOTO_ID_5272874706963075266" border="0" /></a><br /><div style="text-align: center;"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="http://4.bp.blogspot.com/__wdSOl1KkLw/SS0Dm-2tEMI/AAAAAAAAAEg/dma1hf6_Ikw/s1600-h/mipad.gif"><span><span></span></span></a></div><br />La idea es que al presionar "Tap & Talk" los campos que son difíciles de llenar con un stylus, sean llenados con comandos de voz. Y como se trata de campos predefinidos, el reconocedor de voz puede trabajar de mejor forma, ya que en campos donde se pide un número telefónico el sistema esperará vocalizaciones relacionadas con dígitos, o bien con nombres para el caso de otros registros.<br /><br />El software esaba pensado enn un inicio para el uso interno de los investigadores en Microsoft; sin embargo tuvo tanto éxito que se programó una versión comercial para iPaq de Compaq. Un video de la demostración puede ser consultado<a href="http://research.microsoft.com/srg/videos/MIPADDemo_4min_300k.wmv"><span style="font-weight: bold;"> aquí.</span></a><br /><br />MiPad ofrece la posibilidad de corregir una palabra a través de menús contextuales, haciendo tap sobre una palabra equivocada y luego repitiendo el comando de voz para corregirla. El formato Tap y habla (Tap and talk) siempre está disponible en el dispositivo, permitiendo crear accesos directos a las aplicaciones de la iPaq sin tener que muchos clics con el incómodo stylus. "Quiero registrar una cita" abrirá inmediatamente el formulario para guardar citas.<br /><br />Como vemos en el ejemplo anterior, las ventajas de las interfaces manejadas por voz son interesantes. Por enlistar algunas observamos:<br /><br />1. Se dispone de las manos y la vista libres. En el caso del ejemplo anterior sería un modo más eficiente pra introducir texto.<br /><br />2. Ideal para discapacitados. En aplicaciones Web o de escritorio para ciegos, o con problemas que impidan introducir texto de manera natural. Por ejemplo, una página Web puede ser leída automáticamente después de una búsqueda por voz.<br /><br />3. Ideal para personas con poca habilidad en el teclado. Interfaces basadas en voz son útiles para aquellos que escriben lento en el teclado.<br /><br />4. Personas disléxicas. Las interfaces de voz minimizan este problema ya que la dislexia se presenta generalmente al escribir<br /><br />[Microsoft 2008]<br />Microsoft Speech Lab, 2008. <a href="http://research.microsoft.com/srg/mipad.aspx">Your Pad or MiPad</a>. Speech Technology Home.<br /><br /><br />[Kirriemuir 2003]<br />John Kirriemuir, 2003. <a href="http://www.jisc.ac.uk/uploaded_documents/tsw_03-03.pdf">Speech Recognition Technologies</a>.Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-21603399509363473802008-11-25T18:21:00.000-08:002008-11-25T21:19:23.130-08:00Avances y Retos en los sistemas de VOZLas interfaces de voz actualmente son capaces de lidiar con la vocalización de una palabra, un conjunto de palabras, oraciones o incluso conjunto de oraciones.<br /><br />En un principio, las interfaces de voz tenían que enfrentarse a los siguientes aspectos:<br /><br /><ul><li>Dependencia en el usuario: En un principio, los sistemas eran muy dependientes al timbre de voz de un usuario específico. Era común que una vez programado un software, ya no era capaz de reconocer el timbre de voz de otro usuario. Ahora, los programas de comandos por voz son capaces de distinguir a múltiples usuarios con poco entrenamiento previo.</li><li>Generación de vocabularios: La creación de este tipo de software tenía que lidiar con la creación de librerías con vocablos elementales muy extensos (y a veces pesados, dependiendo el idioma). Estos diccionarios son quienes proveen a la computadora el mapeo entre lo que dice el usuario y los caracteres que representan.</li><li>Fidelidad: Capacidad de identificar los vocablos en diversas condiciones. La fidelidad será mejor si se cuentan con más diccionarios.</li><li>Entrenamiento: Para mejorar la fidelidad, los usuarios tienen que repetir frases estandarizadas con las que el software puede ajustarse al timbre de voz de una persona.</li></ul><br />Los puntos anteriores han sido trabajados y actualmente los programas con interfaces de voz tienen una fidelidad de hasta un 98%. Ahora, por mencionar algunos retos de estas interfaces tenemos:<br /><br /><ul><li>Robusto ante ruido: Lograr que un sistema funcione ante diversas condiciones de ruido.</li><li>Uso de diversos micrófonos: Evitar distorsión al utilizar distintos micrófonos, o una serie de micrófonos en un área determinada.</li><li>Reverberación: Identificar reverberación o sonido viciado de manera automática cuando las bocinas están muy cerca al micrófono.</li><li>Modelado acústico: ¿Cómo modelamos fonemas y variaciones acústicas?</li><li>Modelado de lenguaje: Relacionado a establecer qué tan parecidas son las palabras acústicamente hablando. Cómo identificarlas dependiendo el contexto.</li><li>Inducción gramatical automática: Lidia con el problema de crear gramáticas para facilitar el desarrollo de sistemas que hablen adecuadamente.</li></ul><div style="text-align: center;"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="http://3.bp.blogspot.com/__wdSOl1KkLw/SSzYo-OpKPI/AAAAAAAAAEY/Pb-yEJp62ks/s1600-h/Audio.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 320px; height: 110px;" src="http://3.bp.blogspot.com/__wdSOl1KkLw/SSzYo-OpKPI/AAAAAAAAAEY/Pb-yEJp62ks/s320/Audio.jpg" alt="" id="BLOGGER_PHOTO_ID_5272827462154791154" border="0" /></a><br /></div>Definitivamente abordar los retos anteriores no es nada sencillo; sin embargo, de la solución de estos problemas podremos contar con un sistema que permita una <span style="font-weight: bold;">interacción</span> por voz con uno o varios usuarios de manera <span style="font-weight: bold;">más natural</span>.<br /><br />Eso evitara que la gente se encabrite como en el siguiente video lol.<br /><br /><object height="344" width="425"><param name="movie" value="http://www.youtube.com/v/KyLqUf4cdwc&hl=en&fs=1"><param name="allowFullScreen" value="true"><param name="allowscriptaccess" value="always"></object><div style="text-align: center;"><object height="344" width="425"><embed src="http://www.youtube.com/v/KyLqUf4cdwc&hl=en&fs=1" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" height="344" width="425"></embed></object><br /></div><div style="text-align: center;"><br /></div>O conversaciones como esta:<br /><br />Computer:<br />Would you like to check your account balance or transfer funds?<br />Caller:<br />What's my account balance?<br />Computer:<br />I did not understand. Please repeat your request<br />Caller:<br />I said what's my account balance?<br />Computer:<br />I did not understand. Please repeat your request<br />Caller:<br />Listen, I want my account balance!!! or put on the line to your supervisor, now!<br />Computer:<br />I did not understand. Please repeat your request<br />Caller:<br />F****** off!!! ACCOUNT BALANCE!!! ACCOUNT BALANCE!!! peace of sh#$%<br /><br />[Jonathan 2008]<br />Jonahan Eisenzopf, 2008. <a href="http://www.developer.com/voice/article.php/1567051">Top 10 Best Practices for Voice User Interface Design</a>.<br /><br />[Stephen 2002]<br />Stephen Cook, 2002. <a href="http://www.faqs.org/docs/Linux-HOWTO/Speech-Recognition-HOWTO.html">Speach recognition, How to</a>.<br /><br />[Acero 2008]<br />Alex Acero, 2008. <a href="http://research.microsoft.com/srg/">Speech Technology (Redmond)</a>. Microsoft Research.Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-17114811618480627472008-11-25T15:26:00.000-08:002008-11-26T04:53:31.851-08:00Las interfaces de usuario basadas en VOZ¿Alguna vez han marcado al conmutador principal de la UDLA?, los que han tenido la oportunidad de hacerlo habrán notado que existe un conmutador "automático" que permite contactar a un departamento de la universidad con tan sólo decir su nombre; por ejemplo, "Segruidad", "Sorteo", "CEUDLA", etc.<br /><br />Una interfaz de usuario basada en voz es aquella donde el usuario interactua con las computadoras o dispositivos electrónicos utilizando comandos de voz para iniciar procesos o servicios automatizados. Algunos de estos pueden responder de la misma forma (con voz), mientras que otros sólo se enfocan en realizar una tarea. [Nielsen 2003]. El software con interfaces basadas en voz utiliza dispositivos como micrófonos y bocinas para procesar/transmitir mensajes de voz.<br /><br />En ocasiones para algunos, resulta difícil darse a entender con este tipo de sistemas por las siguientes razones:<br /><br />1. El usuario adopta una posición astuta y trata de corromper el software. Prueba a la máquina con palabras apenas entendibles.<br /><br />2. El que habla se siente inseguro porque identifica que su interlocutor es una máquina.<br /><br />3. El usuario se desespera cuando el sistema no reconoce lo que dijo.<br /><br />4. La persona al saber que habla con una computadora, utiliza palabras monosilábicas o frases cortadas creyendo que de esta manera será más facil darse a entender.<br /><br />5. El interlocutor no consigue su objetivo debido a que el software no interpreta adecuadamente las palabras.<br /><br />Aunque suene a tecnología sacada de star trek, las interfaces de voz tienen su fundamento en el reconocimiento del habla la cual es transformada en caracteres legibles por la computadora.<br /><br /><div style="text-align: center;"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="http://3.bp.blogspot.com/__wdSOl1KkLw/SSyuMJkoR3I/AAAAAAAAAEQ/xzsb8QJJLLM/s1600-h/soundwaves.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 224px; height: 88px;" src="http://3.bp.blogspot.com/__wdSOl1KkLw/SSyuMJkoR3I/AAAAAAAAAEQ/xzsb8QJJLLM/s320/soundwaves.jpg" alt="" id="BLOGGER_PHOTO_ID_5272780787495225202" border="0" /></a></div><br />El proceso anterior transforma los patrones de ondas sonoros en fonemas (pe: "bla", "ble", "bli", "blo", "blu"). Así mismo, tiene distintas clasificaciones, las cuales dependen de cómo el software identifica el inicio y fin de una instrucción de voz. Algunas de estas son [Stephen 2002]:<br /><br />1. Palabras aisladas: El software necesita un silencio considerable antes y después del sonido muestra. A estos sistemas se les conoce como "escucho/no-escucho".<br /><br />2. Palabras conectadas: El software puede interpretar palabras de corrido con una ligera pausa antes y después de cada palabra.<br /><br />3. Habla contínua: Son de los sistemas más complejos porque deben determinar las fronteras de cada palabra por sí solos. Son ideales para dictado y generalmente requieren entrenamiento por redes neuronales para adaptarse a la forma de hablar de una persona.<br /><br />4. Habla espontánea: Similar al anterior, son programas con la capacidad de reconocer palabras o fonemas que no tienen significado sintáctico pero sí semántico, como expresiones o interjecciones.<br /><br />5. Verificación de voz: Verifican si un comando de voz fue emitido por una persona determinada. Algunos ejemplos son los sistemas de seguridad o grupal donde se realiza una tarea dependiendo el usuario que la pide.<br /><br />Suena descabellado el que una computadora entienda lo que decimos al hablar naturalmente. Si bien ha sido un gran reto transformar el habla en comandos legibles por una computadora, los avances en hardware y software nos impresionan al observar los resultados como en programas de dictado.<br /><br />[Nielsen 2003]<br />Jackob Nielsen, 2003. <a href="http://www.useit.com/alertbox/20030127.html">Voice Interfaces: Assessing the Potential</a>.<br /><br />[Stephen 2002]<br />Stephen Cook, 2002. <a href="http://www.faqs.org/docs/Linux-HOWTO/Speech-Recognition-HOWTO.html">Speach recognition, How to</a>.Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-69332801368546793412008-10-25T20:25:00.001-07:002008-10-25T22:04:35.237-07:00Se aprende de los blogs.Hola a todos nuevamente. Sé que no soy un bloguero adicto y que por ende no actualizo este espacio con mucha frecuencia. Sin embargo, hoy tuve a bien descansar como oso polar en hibernación y dedicarle un rato a la lectura de blogs.<br /><br />Todo empezó cuando regresé de la peluquería. Recibí el correo electrónico de un compañero de la prepa que hace siglos no veo; ya desde entonces sabía que el muchacho era muy letrado, y bueno pa' la música. El correo mostraba un breve resumen de lo que fue <span style="font-weight: bold;">el concierto de Flauta traversa y medios electroacústicos ofrecido por el flautista poblano Eduardo Muñoz</span>. <a href="http://ars-sonora.blogspot.com/">Luis Alvaz</a> en su entrada describe de manera general el concierto y hace uno que otro comentario desde su perspectiva como músico y conocedor del tema.<br /><br />Ya al final de la entrada hizo una recomendación para escuchar algunas de las piezas que se ofrecieron. Lo que más me llamó la atención fue cuando el buen Luis Alvaz <span style="font-weight: bold;">comentó que la última melodía conmovió mucho al público</span> por su originalidad, la combinación de la flauta y los sampleos de la obra. Decidí escucharla y efectivamente, <span style="font-weight: bold;">me llevé el asombro de mi vida</span> al oir algo nuevo, singular, rítmico y alegre. Aquí les dejo la pieza pa' que agasajen la oreja:<br /><br />Jacob Ter Velhuis - Lipstick, para flauta y música electroacústica (fragmento)<br /><object width="353" height="132"><embed src="http://www.goear.com/files/external.swf?file=0ce2613" type="application/x-shockwave-flash" wmode="transparent" quality="high" width="353" height="132"></embed></object><br /><br />Y ahí no para la cosa, tenía rato que no visitaba su blog y en la columna derecha hallé una imagen en referencia a una campaña de la escritura: "<a href="http://escribesinfaltas.blogspot.com/">Eres lo que escribes, eres como escribes</a>". <span style="font-weight: bold;">Le eché un ojo y me sentí identificado con el movimiento.</span><br /><br />Hubo un tiempo en que la gente me criticaba el hecho de escribir con acentos comas y demás en el messenger (cabe mencionar que aún me como signos de apertura y no soy una <span style="font-style: italic;">milargueza</span> escribiendo documentos), y yo les respondía que me agradaba dejar las cosas en claro, que se me hace una buena maña y que incluso me ayuda a ser más contundente (muy pocos lo notan). Y la principal razón: <span style="font-weight: bold;">que me recontra enerva la gente que utiliza emoticones mezclados con sus mensajes.</span> Por lo anterior no me molesta en nada que los usen pa' reforzar una emoción, pero sí cuando están mezclados con lo que quieren decir, todo por descuido de no ponerles un <span style="font-style: italic;">shortcut</span> apropiado al momento de agregarlos. Pareciera que la lengua escrita se degenera y deforma literalmente en caritas felices que mueven el dedo de un lado a otro para decir un simple "NO".<br /><br />Por otro lado, en este blog aprendí que existió un Petit comité en el marco del Congreso Internacional de la Lengua Española (Petit no por pocos, sino porque se trata de chilpayates), el cual me arrancó unas buenas sonrisas por las conclusiones a las que llegaron los chamacos. Aquí les dejo parte del manifiesto pa' los que quieran echarle un ojo: <a href="http://escribesinfaltas.blogspot.com/2007/03/desempolvar-inventar-y-seleccionar.html">Congresito de la Lengua Española.</a><br /><br />Así pues, me sentí muy identificado con esa campaña y tuve la idea de compartirla con un amigo bloguero que escribe de perlas!, el estimado don <a href="http://padaguan.wordpress.com/">@padaguan</a>, de cuyo blog me he cultivado y aprendido bastante.<br /><br />Finalmente, yendo de aquí para allá, encontré el blog del buen <a href="http://guffo.blogspot.com/">@guffo</a> un caricaturista mexicano que también escribe de perlas. Ahí les dejo una de sus creaciones:<br /><br /><div style="text-align: right;"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="http://2.bp.blogspot.com/__wdSOl1KkLw/SQP2LQfzrtI/AAAAAAAAAAM/DMbCYCMcYFw/s1600-h/tira+1+oct+baja.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 246px; height: 320px;" src="http://2.bp.blogspot.com/__wdSOl1KkLw/SQP2LQfzrtI/AAAAAAAAAAM/DMbCYCMcYFw/s320/tira+1+oct+baja.jpg" alt="" id="BLOGGER_PHOTO_ID_5261319462966243026" border="0" /></a><br />[Tomada de <a href="http://guffo.blogspot.com/2008/10/la-neta-del-planeta-58-62-y-tira-de.html">Guffo Caballero</a>]</div>Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-55077882936243400922008-08-15T14:16:00.000-07:002008-08-15T14:27:54.911-07:00Cerrando ciclos.Ha llegado el momento de terminar un ciclo más: CEUDLA 2007-2008. Recapitulando me doy cuenta que al principio estaba lleno de incredulidad e incertidumbre con respecto a las cosas politiqueras; es algo que no se lleva conmigo (y que mi madre siempre me reprocha a la hora de hacer trámites o grilla). No obstante, este ciclo me dejó boqui-abierto, sorprendido y sobre todo muy satisfecho. Se consumieron muchos proyectos que no tenía contemplados en paralelo con la innombrable (la tesis). Me hice de amigos (muy buenos) y puntos de vista diferentes y ahora sí como dicen por ahí, le di la oportunidad a la grilla, a la polaca y un tanto al chisme: salgo bien librado y a gusto.<br /><br />Por ahora, a darle átomos y retomar las cuestiones académicas nuevamente, conseguir una agenda y organizarme todavía un poco mas.<br /><br />No cabe duda que <span style="font-weight: bold;">diversificar</span> es la opción... intenten agregarle a sus vidas de todo un poco (novelas, chistes, antros, libros, juegos, deleites de pupila, etc...). Si no les gustó algo sabrán por dónde no caminar, pero si el resultado es agradable tendrán una satisfacción tremenda y algo más pal costal de las experiencias.<br /><br />To be old and wise, you must first be young and stupid.Abraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0tag:blogger.com,1999:blog-743996265018823351.post-11811512475212778252008-08-13T15:27:00.001-07:002008-08-13T15:27:58.911-07:00Reactivando entradasEi, saludos.<br /><br />Hello worldAbraham Ronelhttp://www.blogger.com/profile/08961590954834124753noreply@blogger.com0