EL USO DEL APRENDIZAJE AUTOMÁTICO EN LOS PROCESOS DE EDISCOVERY

Tradicionalmente, la tarea de revisión de la documentación, como parte de los procesos de eDiscovery, se ha basado en procedimientos lineales, realizados principalmente por revisores humanos, donde la información es filtrada, revisada y producida de forma manual, aún con la ayuda de herramientas informáticas.

Sin embargo, en los últimos tiempos se han añadido nuevas capacidades de analítica avanzada, como el aprendizajeactivo, que suponen una mejora significativa de la eficiencia del proceso de revisión. 

Basado en las técnicas del aprendizaje automático (del inglés machinelearning), el aprendizaje activo implica la selección estratégica de muestras de datos para su posterior revisión manual. Es decir, en lugar de realizar la revisión de todos los documentos de un conjunto de datos, el algoritmo de aprendizaje activo identifica primero aquellos documentos que, basados en su contenido, pudieran ser más relevantes, y los presenta para su revisión manual. A medida que se revisan estos documentos, el alfmagoritmo aprende de los comentarios y decisiones de los revisores humanos, lo que le permite refinar y mejorar la selección de los nuevos documentos que se incluyen en la cola de revisión.

A menudo, los métodos tradicionales como la búsqueda por palabras clave equivalen a dar palos de ciego. Por el contrario, el uso de técnicas de aprendizaje automático permite aprovechar los documentos existentes para entrenar el algoritmo sobre su relevancia. Permitiendo también, seleccionar nuestro propio conjunto de documentos de ejemplo para el aprendizaje, libres de las restricciones de contener o no las palabras clave.

Al seleccionar estratégicamente los documentos para su revisión manual, el proceso de revisión es más rápido y eficiente, lo que permite ahorrar tiempo y recursos.

Este cambio en el modelo de revisión, de un proceso lineal a uno basado en técnicas de aprendizaje automático, ha sido impulsado por la continua necesidad de mejorar la eficiencia y reducir los costes asociados al proceso de revisión.

Aplicaciones del aprendizaje automático en los procesos de eDiscovery
  • Clasificación de documentos: A la postre la tarea más importante en el proceso de eDiscovery, y en la que el aprendizaje automático se utiliza para mejorar la eficiencia de la clasificación y acortar los plazos de la revisión, mediante la identificación de patrones y características comunes en los documentos considerados relevantes para el caso.
  • Identificación de documentos con contenido similar: Encontrar documentos con contenido similar o casi duplicado, es muy común en grandes conjuntos de datos. Sobre todo cuando se trata de correo electrónico o de versiones similares de un mismo documento. En este caso, el aprendizaje automático permite identificar esos documentos, eliminándolos de la revisión.
  • Análisis de sentimientos: Esta técnica se refiere a la identificación de la opinión o el tono de un documento, a partir de su contenido. Pudiéndose analizar automáticamente si un documento tiene un tono positivo, negativo o neutral.
  • Extracción de información: Relacionado con la identificación de información relevante en los documentos, como: fechas, nombres y secuencias numéricas (teléfonos, números de cuentas), reduciendo el riesgo de errores humanos en la extracción manual de esa información.
Ventajas del uso del aprendizaje automático en los procesos de eDiscovery
  • Eficiencia mejorada de la revisión: La automatización de ciertos procesos de revisión de documentos y análisis de datos, acelera el proceso de la revisión y reduce el tiempo dedicado a tareas manuales repetitivas.
  • Precisión mejorada de la revisión: Gracias a la identificación de documentos relevantes y patrones ocultos en grandes conjuntos de datos, que podrían haber sido pasados por alto en una revisión manual.
  • Reducción de costes: La automatización de ciertos procesos y la reducción de los plazos y de los recursos necesarios para la revisión, permiten reducir significativamente los costes asociados con el proceso de eDiscovery.
  • Reducción del riesgo de errores humanos: Las revisiones manuales conllevan la asunción de errores humanos, cuánto mayor es el volumen de documentos. El uso del aprendizaje automático, reduce esos errores humanos, aumentando la precisión y la fiabilidad de los resultados.
  • Mejora de la calidad general del proceso: Las técnicas de aprendizaje automático mejoran la calidad del proceso de eDiscovery, al proporcionar un análisis más completo y detallado de los datos y documentos relevantes.

En resumen, la utilización de las técnicas de análisis avanzado basadas en la inteligencia artificial, proporcionan claros beneficios en los procesos de eDiscovery, acelerando el trabajo de revisión de los documentos, y mejorando la precisión, la calidad y la objetividad de los resultados. Lo que contribuye a la reducción de los costes globales de todo el proceso.

Indudablemente aparecerán muchos más avances en el campo de la inteligencia artificial, como es el caso de #chatgpt, impulsados por una mayor concienciación de las posibilidades existentes. Resaltando así, la necesidad de seguir investigando las nuevas utilidades que esos avances pueden aportar en la resolución de los problemas actuales de los procesos de eDiscovery.