EVOLUCIÓN Y ADAPTACIÓN DEL MARCO DE TRABAJO DEL EDISCOVERY

Acostumbrados ya a los procesos de eDiscovery para la recopilación, procesamiento y revisión de fuentes de datos digitales, abordamos en este artículo si el modelo de referencia para trabajos de eDiscovery, el conocido EDRM (Electronic Discovery Reference Model), continúa vigente y cómo habría que adaptarlo a la evolución constante de las fuentes de datos.

Desde sus inicios, el proceso de eDiscovery se ha estandarizado en el uso de una metodología lineal de fases claramente diferenciadas, representada en el gráfico del marco de trabajo del modelo EDRM.

El modelo EDRM sigue plenamente vigente y es la referencia utilizada tanto por los creadores y diseñadores de herramientas de eDiscovery, como por los analistas que nos dedicamos a proveer este servicio en investigaciones y revisiones de fuentes de datos digitales.

Sin embargo, no deja de verse impactado, en varias de sus fases, por la constante evolución de la tecnología en aspectos tales como: las nuevas formas de almacenar y acceder a las fuentes de datos, los nuevos formatos de esas fuentes, y las nuevas técnicas de revisión y análisis de la información basadas en la aplicación de modelos de inteligencia artificial.

Desde una perspectiva de proveedor de servicios de eDiscovery, hemos ido adaptando nuestros procedimientos de trabajo, modificando el modelo tradicional, según las implicaciones que han traído cada nueva fuente de datos y que repasamos a continuación.

 

Nuevas formas de almacenamiento y acceso a los datos

Cada vez es menos frecuente encontrarnos las fuentes de datos almacenadas en los ordenadores personales de los usuarios.

Atrás quedaron los tiempos en los que el ordenador personal era la principal, y en ocasiones casi la única, fuente de la que extraer los datos.

La adopción generalizada de los servicios en la Nube (principalmente a través de los modelos de uso de Aplicaciones como Servicio – SaaS), y la utilización mayoritaria de otros dispositivos como el teléfono móvil,  han introducido grandes cambios en las primeras tareas del modelo. Aquellas que se refieren a la localización e identificación de las fuentes de datos, así como a su posterior acceso y recopilación.

El control de las fuentes de datos, en términos de: localización, disponibilidad, acceso, aseguramiento y mantenimiento en el tiempo, ha pasado a ser responsabilidad de los proveedores de las nubes en Internet y demás servicios asociados. Por lo que hay que involucrarles en las primeras fases del eDiscovery.

Incluso algunos de ellos ya disponen de herramientas del tipo eDiscovery, para facilitar el descubrimiento y localización de los datos potencialmente relevantes para el caso.

 

Nuevos formatos de datos

La irrupción de los chats y las plataformas de colaboración basadas en la Nube, han dado lugar a la generación de nuevos formatos de datos no estructurados. A la ya típica organización en “familias” de los correos electrónicos y de sus adjuntos, se les unen nuevos datos generados por estas herramientas colaborativas.

Estas herramientas permiten trabajar de forma simultánea sobre los documentos, ofreciendo la posibilidad de comentar y compartir información a través de los chats, actualizar los documentos con posterioridad y por supuesto, compartirlos con terceros vía correo electrónico.

Datos que, en definitiva, se generan de una forma más fluida e informal, a los que hay que prestar atención en las fases de identificación y recopilación para determinar su relevancia en el contexto de una investigación o litigio, que nos pueda ayudar a trazar el historial de la fuente de datos de una forma completa.

 

Nuevas capacidades de análisis de las herramientas de eDiscovery

A través del uso de técnicas de inteligencia artificial y de aprendizaje automático, las herramientas de eDiscovery han incorporado nuevas capacidades de análisis que permiten, en las fases de revisión y análisis, trabajar sobre conjuntos de datos más grandes, con datos actuales y pasados. Esto ha permitido a los equipos de revisores llevar a cabo revisiones más eficientes, reduciendo el número de recursos a utilizar, y hacerlas más eficaces, aumentando las posibilidades de encontrar la información clave en un menor tiempo.

 

Cómo afectan estos cambios al modelo del EDRM

En este contexto, cada fuente de datos tiene un impacto en las decisiones a tomar en cada fase que, a su vez, tienen reflejo en las siguientes de la cadena. Por ejemplo, la aparición de nuevas fuentes de datos en mitad del trabajo de revisión, hace que se tenga que volver a las fases iniciales de recopilación y procesamiento, mientras se avanza en la revisión de los datos ya procesados.

De igual manera, es frecuente que en un mismo trabajo de eDiscovery se realicen varias revisiones de forma simultánea, y con procesos de recopilación, procesamiento y revisión específicos a cada fuente de datos. Haciendo que el proyecto original se tenga que dividir en varios procesos de “minis eDiscovery”.

En estas situaciones, el tradicional modelo de trabajo lineal en el que hay que recopilar, procesar y revisar todas las fuentes de datos de una sola vez, generando enormes colecciones de documentos, no es aplicable o, cuanto menos, poco práctico.

Esta aproximación de “mini procesos de eDiscovery” adaptados a cada fuente de datos, ayuda mejor a los analistas y revisores en su gestión y tratamiento de cada fase del proceso. Permitiéndoles estar preparados para repetir todo de nuevo, según aparecen más fuentes de datos, o para adaptar los procesos cuando se produce un cambio en los datos ya procesados.

De cara a abordar con garantías un proceso de eDiscovery, recomendamos siempre definir una estrategia y un modelo de trabajo, con unos controles y unos flujos adaptados a las fuentes de datos que se vayan a recopilar y revisar.