Esta tecnología del campo de la inteligencia artificial trae soluciones a problemas de diversas industrias y, para su aplicación y éxito, deben contemplarse distintas etapas del proceso y los desafíos que se presentan, indican desde NTT DATA.

En la actualidad, los asistentes virtuales (ChatBots) abundan en la mayoría de sitios webs de
productos y servicios, los cuales fueron creados con el objetivo de responder preguntas
frecuentes y sencillas realizadas por usuarios.

Esta solución está creada a partir de lenguaje natural (NLP por sus siglas en inglés), el cual permite la construcción de este asistente que recopila el requerimiento del usuario y propone soluciones al requerimiento con una tasa de satisfacción aceptable.

Sin embargo, esta es tan sólo una de las aplicaciones del NLP –quizá la más conocida-, ya que el NPL emplea herramientas computacionales para procesar datos no estructurados con origen en el lenguaje natural con la finalidad de extraer información de relevancia, es por eso que puede ser utilizado en distintas industrias, con diferentes objetivos.

Esta tecnología del campo de la inteligencia artificial puede aplicarse de forma escrita, debido a que puede reconocer el contexto, generar texto, responder pregunta, realizar traducciones; u oral, dado que permite llevar palabras a texto, llevar texto a palabras, reconocer idioma hablado, dividir oraciones en palabras.

Luis Landaeta, Machine Learning Engineer – Evangelist, NTT DATA Argentina

En este sentido, lo más importante es primero identificar y comprender cuál es el requerimiento del negocio, para luego dar paso a las etapas de adquisición, entendimiento y preparación de los datos.

En el caso de proyectos en NLP es necesario mencionar que estas etapas tienen pasos adicionales:

  • Pre-procesamiento / Normalización: limpieza del texto según el problema que se vaya a
    resolver, dado que dependiendo de éste es recomendable emplear u omitir alguna
    técnica de limpieza de datos.
  • Embbedings: para que las palabras puedan ser procesadas por los algoritmos es
    necesario convertirlas a un formato que puede ser entendido por el computador de una
    manera más eficiente. Esta representación consiste en transformar palabras a vectores
    numéricos, lo cual se conoce como Word embbedings.
  • Modelado: este depende exclusivamente de la tarea que se desea realizar. Si la tarea
    es, por ejemplo, reducir la tasa de churning -tasa de abandono del cliente-, entonces un
    enfoque es detectar sentimientos negativos en feedbacks de usuarios, y para esto se
    deberá modelar el problema como análisis de sentimientos. En cambio, si la tarea a
    resolver consiste en obtener las mejores opciones similares a una opción en particular,
    el problema deberá moldearse como de rankeo.
  • Despliegue: los modelos en NLP suelen requerir una infraestructura que permita realizar
    predicciones en modo online, con la menor latencia posible. Un ejemplo es el procesamiento de discurso aplicado a detección de discurso de odio. Este tipo de sistema debe detectar palabras clave ni bien terminen de escribirse y no esperar a que termine el autor el texto completo.
  • Evaluación: es la etapa que posee mayor complejidad debido a que, en la mayoría de las
    aplicaciones basadas en NLP, se tienen 2 o más conjuntos de métricas establecidas por
    equipos de distintas áreas, por ejemplo, el de negocio y técnico, desde los cuales no
    siempre se tiene una comprensión global de las métricas en su conjunto. Además, las
    métricas de negocio solo pueden medirse post despliegue.

¿Cuáles son los desafíos al momento de abordar un problema en NLP?

Si bien pueden presentarse distintos desafíos de acuerdo a cada industria, existen tres que son trasversales a todas y deben tenerse en cuenta al momento de iniciar un proyecto:

  • Desafíos con respecto al dato: este es el primero de los desafíos y, en mucho sentido, el más complejo. Éste involucra conocer y adherirse a políticas de privacidad de los datos y regulaciones en torno a la privacidad de información personal y sensible, que deben conocerse de antemano.
  • Desafíos con respecto a la infraestructura: la mayoría de los modelos necesitan una
    gran cantidad de datos, lo cual se traduce en costos de almacenamiento de la
    información y capacidad para procesamiento. Además, varios modelos deben ser
    entrenados, lo cual debe considerarse al momento de realizar el presupuesto.
  • Desafíos con respecto a la cultura: NLP está dejando de ser una tecnología “nicho” para convertirse en una herramienta de uso cotidiano. Sin embargo, en algunos sectores aún persiste la idea que puede implementarse en periodos de tiempo muy breve, cuando en realidad las aplicaciones en NLP toman tiempo en construirse.

Autor