* ¿Por qué son importantes los datos en salud? Características del dato
Desde mediados del siglo XX se han desarrollado herramientas de almacenamiento y procesamiento de datos. Con el devenir del tiempo, su uso se ha expandido a todos los sectores de la economía y actividades. Inclusive en la salud. En concordancia, los datos se han constituido en un recurso estratégico. Las características que se le atribuyen son:
- Sensibilidad:
Son cruciales en todas las decisiones que se toman en cada instante.
2. Veracidad:
Debe reflejar estrictamente la realidad de las situaciones.
3. Volumen:
La magnitud de datos que se captan y procesan diariamente es muy alta. También son de singular importancia y complejidad.
4. Velocidad:
La rapidez con la que se reproducen y circulan los datos en medicina es muy considerable.
5. Variedad:
Las fuentes, medios de tratamiento, tipos de datos son innumerables y sometidas a un cambio continuo.
Con el advenimiento del Big Data se han introducido otras características que permiten conocer con mayor precisión la complejidad de los datos. Éstas son:
- Viscosidad:
Se refiere a la relevancia de los datos para el uso en el proceso decisorio.
- Valor:
Se obtiene a partir de la manipulación y análisis de los datos. Está dado por las ventajas competitivas y comparativas que impactan en la rentabilidad del negocio.
- Visualización:
Se refiere a la manera en que se exponen los datos a fin de ser utilizados en el proceso decisorio y el control de la gestión.
- Viabilidad:
Está representado por la eficacia en el uso del gran volumen de datos.
* Ciclo de vida de los datos
Una cuestión de importancia de establecer es la vida útil de los datos. Lo que es lo mismo que decir, su ciclo de vida. Comprende seis etapas:
- Captura/recolección/creación:
Es el comienzo de la vida de un dato. Las formas en las que se pueden obtener son dos. La primera, es el método manual, por ejemplo, la historia clínica manuscrita. Mientras que la segunda supone el uso de metodologías automática, ya sea con la ayuda de dispositivos o por webscraping.
- Almacenamiento:
Está integrado por el conjunto de elementos en los que se conservan los datos hasta ser procesados. También, se alojan allí una vez que se han sometido a algún tipo de procesamiento. Permanecen en el almacenamiento hasta que son utilizados.
- Procesamiento:
Esta etapa supone una serie de tareas de integración, enriquecimiento y limpieza. También, incluye extracción, transformación y carga (ETL).
- Uso de los datos:
Se recuperan los datos para ser utilizados en los procesos diarios. Para ello se pueden establecer diferentes perfiles de usuarios, a fin de garantizar la adecuada protección de los mismos. Otra cuestión es el plazo por el cual se pueden utilizar y los medios de acceso.
- Publicidad:
Es el procedimiento por el cual se comunica la existencia de ese dato a los interesados. Éstos sujetos podrán ser internos o externos a la organización. También debe definirse cuáles serán los medios de comunicación. Por ejemplo, notas de papel, correo electrónico, presentaciones, publicaciones digitales, intranet, internet, etc).
- Archivo o eliminación:
Se ejecutan procedimientos y se prevén las formas de resguardo de los datos. Asimismo, es necesario conocer por cuánto tiempo se van a conservar; o, qué tratamiento se le dará.
* ¿Cómo actúa el Big Data para la generación de conocimiento?
Las técnicas de las que proveen las herramientas de Big Data permiten la obtención de nuevos conocimientos a partir de proceso y manipulación de los datos. El procedimiento que aplica para poder desarrollar esta tarea comprende las siguientes etapas:
- Selección:
Se procede a elegir cuáles serán las fuentes de las que provendrán los datos. También, establece cuál será la metodología de captura y recolección. Las técnicas habitualmente utilizadas son lectores ópticos, digitalización de documentos, métodos manuales.
- Pre procesamiento:
Es una etapa anterior al data mining. Se trata de un momento de importancia que, a veces, es dejado de lado. Ello es así debido a que permite depurar la base, antes de proceder a ejecutar los softwares analíticos.
- Transformación:
Los procedimientos aplicados son de mayor complejidad. Aquí se establecen cuáles serán las variables, la sintaxis, etc. Por otra parte, se mejora la calidad de los datos de que se dispone. De esta manera, se optimizan los resultados de procedimientos como el Data Mining y el Machine Learning.
- Data Mining:
Son un conjunto de algoritmos, técnicas y utilidades aplicadas al conjunto de datos para obtener una información determinada. El objetivo de esta técnica es determinar las relaciones y los patrones de comportamiento de los datos. El Machine Learning contribuye a exponer los patrones ocultos en el volumen de datos.
- Interpretación:
En esta última etapa se explican los comportamientos que han sido detectados. También se efectúa el cotejo entre los resultados obtenidos y los estándares de la planeación estratégica. A partir de la información obtenida, se puede verificar el cumplimiento de una hipótesis o rechazarla. En este último caso, retroalimenta el sistema creando una nueva etapa de investigación.
* Aplicación en la salud
En el caso particular de las instituciones sanitarias y las ciencias médicas, el uso de las técnicas de Big Data y Data Mining contribuyen a los descubrimientos de patrones de comportamiento de las enfermedades, potenciales formas de cura. En la farmacología, se puede establecer la eficiencia y eficacia de un producto en los tratamientos. En definitiva, se trata de una herramienta esencial a fin de obtener un considerable valor agregado en la atención de los pacientes.