En un mundo inundado de datos y un entorno altamente cambiante con muchos desafíos sociales y económicos, la necesidad ser eficientes en cuanto al análisis de datos, combinada con la creciente velocidad en la toma de decisiones está aumentando la demanda de más implementación de procesos estandarizados.
Cualquier proceso de datos habitual es esencialmente el mismo:
i) Generación de datos
ii) Extracción de datos
iii) Transformación de datos
iv) Carga de datos
v) Análisis de datos
vi) Ingestión de datos
Este proceso se puede simplificar combinando varios pasos en uno (como ‘Extracción-Transformación-Carga’); o amplificado agregando otros (como ‘Modelado de datos’, por ejemplo, o incluso ‘Toma de decisiones’)
Entendiendo el contexto
Tradicionalmente, la intervención humana para ejecutar todo este proceso es muy alta, ya que es habitual que cada paso se realice dentro de un sistema o herramienta independiente.
Al agregar más datos -entre otras razones- también aumenta la complejidad de cada paso. Esto significa que en un escenario normal, una sola persona no puede manejar todo el proceso, por lo que se requieren de varias personas para tal fin. Y todos sabemos algo: cuando existe intervención humana, ocurren errores y discrepancias. Más aún cuando varias personas están involucradas dentro de un mismo proceso.
Por si esto no fuera suficiente, agreguemos más externalidades a este proceso, como la regulación específica de la industria, gestión de riesgos, ciber seguridad, el cumplimiento interno, GDPR. Todos esos elementos no son inherentes a los datos en sí mismos, pero debido al entorno hiperconectado tienen un gran impacto en cualquier proceso de datos en cualquier organización, y en cualquier parte del mundo.
Entonces, todas esas externalidades están agregando aún más desafíos a los profesionales de datos, que son más propensos que nunca a cometer errores.
En los últimos años, la aplicación de Automatización Robótica de Procesos -RPA- e Inteligencia Artificial -IA- se ha convertido en el mayor socio tecnológico para cualquier profesional de datos, ya que automatiza muchos de los procesos y tareas comunes, aumentando la eficiencia, la productividad y reduciendo los errores. A veces, el simple uso de un buen script de código -en cualquier lenguaje de programación- o el conjunto adecuado de herramientas es lo suficientemente bueno para automatizar muchas tareas, por lo que RPA o AI no siempre son la única respuesta a la automatización.
Sin embargo, no todo es tan bonito y perfecto cuando se trata de automatización, ya que se está reduciendo la exposición y la intervención de la máquina de inteligencia más sofisticada que jamás haya existido, capaz de identificar y comprender lo que ningún otro sistema, máquina o computadora puede hacer: la cerebro humano. Veámoslo con más detalle.
Cuándo automatizar los procesos de datos
Antes de pensar en automatizar algo, piense en optimizar el proceso existente. Evite el error de automatizar un proceso largo e ineficiente y dejarlo como está. La optimización de procesos suele implicar cuestionar el status quo de las operaciones comerciales, las personas y los departamentos que están acostumbrados a ese proceso -es muy fácil hacer ‘enemigos’ al optimizar procesos-, pero esto es absolutamente necesario. Al automatizar un proceso largo e ineficiente, es fácil fallar o incluso detener dicha automatización y corregir dicho fallo de la automatización tampoco es fácil. La automatización también falla.
Los beneficios de la automatización de los procesos de datos, ya sea mediante RPA o IA, son innegables. Los mejores casos y/o escenarios para la automatización son:
i) Procesos o tareas con resultado único o limitada. Por ejemplo, procesos internos dentro de un paso. Por lo general, hay muchos pequeños micropasos que deben ocurrir dentro de cada gran paso del proceso. Esas microtareas se pueden automatizar fácilmente, ya que el único resultado posible es solo una o muy pocas opciones.
ii) Procesos o tareas con alta regulación. Cuando es necesario realizar tareas críticas y el resultado de esas tareas está sujeto a una regulación o cumplimiento específico.
iii) En general, cualquier proceso que involucre datos estructurados. Al tratar con datos estructurados, es más fácil anticipar el resultado final, por lo que cualquier automatización de procesos es muy adecuada cuando se trata de datos estructurados.
Hay otros escenarios adecuados para la automatización, pero esos son los 2 más simples a considerar para automatizar. La automatización puede ocurrir dentro de cualquier parte del proceso de datos y no se limita a un paso específico en el proceso.
Cuándo no automatizar los procesos de datos
Siguiendo con el primer consejo del apartado anterior, evite automatizar un proceso de datos que no haya sido optimizado. Más temprano que tarde fallará. Si se corrige cuando falla, volverá a fallar y la falla ocurrirá con más frecuencia.
Suponiendo que su proceso general se haya optimizado -o al menos revisado-, este es uno de los principales escenarios en los que no se recomienda automatizar un proceso de datos:
i) Procesos o tareas con resultado múltiple o desconocido. Hay procesos complejos o procesos simples con datos complejos -normalmente datos semiestructurados, no estructurados o en tiempo real- que es difícil anticipar el resultado del proceso. En este caso, es necesario la intervención humana para reaccionar ante el resultado.
Ideas final
El propósito de la automatización es mejorar las capacidades humanas, no reemplazar a los seres humanos ni reducir las capacidades humanas. Es permitir que los humanos puedan hacer más con menos [recursos].
La automatización será altamente efectiva solo si los procesos han sido analizados y optimizados, de lo contrario, es como instalar un motor Ferrari en un Ford Fiesta. Funcionará por un tiempo, pero creará más problemas.