La universidad que potencia el ingenio, la innovación y el emprendimiento.
Nuestros estudiantes experimentan la ingeniería, la computación y los negocios desde el día uno a través de nuestra metodología de aprendizaje activo
Ese es el ADN de nuestros estudiantes: alcanzar el más alto nivel académico y desarrollo personal.
El paso decisivo para encontrar las mejores soluciones.
Informes de sostenibilidad
contacto:
Giancarlo Marcone
DIRECTOR DE HACS
gmarcone@utec.edu.pe
La universidad que potencia el ingenio, la innovación y el emprendimiento.
Nuestros estudiantes experimentan la ingeniería, la computación y los negocios desde el día uno a través de nuestra metodología de aprendizaje activo
Ese es el ADN de nuestros estudiantes: alcanzar el más alto nivel académico y desarrollo personal.
El paso decisivo para encontrar las mejores soluciones.
Informes de sostenibilidad
contacto:
Giancarlo Marcone
DIRECTOR DE HACS
gmarcone@utec.edu.pe
Por: Gonzalo Ramírez Herrera, Profesor Contratado de Comunicaciones e Introducción al Quechua y Brian O’Hara, Director de Innovación y Calidad Educativa.
I. Introducción
El viernes 13 de abril, Ray Kurzweil, el célebre futurólogo y Director de Ingeniería en Google, presentó “TalkToBooks”, una herramienta que le permite al usuario interactuar con el contenido de cientos de miles de libros. Esto a través de una función de búsqueda distinta, basada, ya no en el conocido “keyword matching” (equivalencia, similaridad, “relatedness”, etc.), sino en un nuevo sistema de algoritmos de IA entrenado por billones de entradas de “pares de información”. Dichos algoritmos permiten predecir, con un nivel de acierto considerable, la información que mejor se ajusta -a la manera de una respuesta- a cada input interrogativo. Todo ello tiene lugar mediante el uso del lenguaje natural, es decir, que la interacción se da en el terreno de la comprensión y la representación del significado del lenguaje en su uso cotidiano.
II. Características y aplicaciones
La plataforma presentada por Google busca contenidos específicos dentro de un universo de aproximadamente cien mil libros. El criterio que utiliza es semántico y trabaja a nivel de oración; no de autor o tópico. Este tiene tres características distintas a otros sistemas similares: el uso de voz, la manera como se procesa la información suministrada como input y que las preguntas que se le formulen pueden ser procesadas en toda su amplitud, sin recurrir al uso de keywords.
En primer lugar, la gran innovación de este buscador reside en que el interesado “habla”, literalmente, con el sistema en cuestión: puede ser una pregunta, un comentario o frase. Por un lado, en relación al buscador, esto nos podría procurar -a futuro- búsquedas más acertadas. Por otro lado, y en relación al usuario, “TalkToBooks” facilita el uso a personas que no se encuentran tan cercanas a las computadoras en sus procesos de búsquedas bibliográficas. Realiza, entonces, búsquedas más precisas y mediante una interfaz bastante sencilla.
En segundo lugar, el algoritmo de búsqueda implica autoaprendizaje. Este sistema crea generalizaciones de comportamiento a partir de la información suministrada. Esta mejora, conforme los usuarios vayan aumentando el número de búsquedas, se irá afinando y volviéndose más útil en temas puntuales y en respuestas más específicas, ahorrando tiempo al investigador.
En tercer lugar, el sistema de búsqueda no opera necesariamente en base al uso de keywords. Muchos de los dominios de conocimiento actuales desarrollan, por decirlo de alguna manera, un dialecto propio. Incluso dentro de las misma áreas de conocimiento, ciertas tendencias presentan tanto características en su léxico como en su discurso. “TalkToBooks” podría atender a estar particularidades, delimitando ámbitos de búsqueda cada vez más específicos y relevantes para el investigador. Este es un aporte en tanto permite una búsqueda menos dependiente de problemas de polisemia y de respuestas más concretas a nuestras preguntas. Así, permite abarcar más fuentes de información de calidad en nuestras búsquedas.
Estas innovaciones parecen mejorar dos ámbitos de aplicación muy puntuales: por un lado, integrarse a Google para desarrollar y afinar las búsquedas; y, por otro lado, naturalizar la solicitud de información mediante el uso de la voz. Todo con el fin de mejorar la experiencia del usuario.
III. Pros
Por un lado, la calidad de la información es bastante buena. Reducir el universo del Internet a uno compuesto solamente por libros -previamente editados, publicados y recogidos por Google en versiones digitales- deja fuera fuentes menos formales: por ejemplo, blogs o páginas web personales, información proveniente de individuos en redes sociales, las hoy extendidas “noticias falsas”, etc. Es decir, información que se vierte a la web, sin pasar necesariamente por los mecanismos de filtro, edición y corroboración que -al menos en principio- supone el proceso de publicar un libro con alguna editorial de mediano prestigio.
Por otro lado, y siguiendo un adagio propio de la era digital, la mejor tecnología suele ser la que se “quita del camino” y se “hace invisible” al usuario. El diseño tecnológico debe siempre apuntar a reducir la fricción. Relacionarse con un motor de búsqueda selectivo mediante el habla nos acerca a un modo de interacción humano-máquina que hasta hace no mucho era tan solo un postulado de la ciencia ficción. Esto no hace sino confirmar que la distancia entre lo que concebimos y lo que somos capaces de llevar a cabo, cada vez se acorta más y de modo más acelerado.
Finalmente, TalkToBooks es hoy lo que otrora hubiera sido el tener presente un bibliotecario tan curtido en su oficio como erudito, solo que en todo momento y en cualquier lugar. Con TalkToBooks podremos ganar una nueva relación con los libros, con la consulta bibliográfica académicamente rigurosa y, finalmente, con todo el acervo bibliográfico de la humanidad.
IV. Problemas
En un sentido, el procesamiento del lenguaje natural, en la intersección de la ciencia de la computación, la inteligencia artificial y la lingüística, es un rubro aún en proceso de desarrollo y perfeccionamiento. El habla humana, en tanto que un fenómeno multinivel es difícil de decodificar. Los análisis fonéticos, fonológicos, morfológicos, sintácticos, semánticos y de discurso que llevamos a cabo los seres humanos en tiempo real, son difíciles de replicar en la cibernética aún al nivel del Machine y Deep Learning, y a pesar de las enormes cantidades de data de que se alimentan y que informan a dichos programas o sistemas. Es por ello, quizás, que la significación (qué quieres decir cuando dices “x”, qué significa un significante “x” y por qué) ha sido confundida desde los antiguos estoicos con un fenómeno cuasi-mágico.
Parte de las dificultades son la complejidad detrás del representar, aprender y utilizar información lingüística, visual, situacional, etc. Y es que la esencia del lenguaje humano, parece ser su ambigüedad, a diferencia de lo que ocurre, precisamente con los lenguajes de programación u otros lenguajes formales. De allí que asuntos de polisemia, ambigüedad léxica y contextual sean difíciles de ser captados en su real dimensión y representadas por una entidad u objeto artificialmente inteligente.
*P.D. Todas las consultas y búsquedas de información para la escritura de este artículo se realizaron utilizando la herramienta TalkToBooks en vez de un motor de búsqueda convencional y los autores no pueden quejarse sobre la calidad de la información a la que tuvieron un rápido y fácil acceso.
Carreras en ingeniería y tecnología que van de la mano con la investigación y la creación de soluciones tecnológicas de vanguardia, comprometidas con las necesidades sociales y la sostenibilidad.
Decide convertirte en el profesional que el mundo necesita. Estudia en UTEC y lleva tu ingenio hacia el futuro.