Análisis cienciométrico de la relación entre inteligencia artificial eingeniería de datos: tendencias, colaboración y evolución.

Autores/as

  • Angelo José Britto Berrocal Universidad Nacional de Colombia
  • Delcides Miguel Cordoba Rizo Universidad Nacional de Colombia

Palabras clave:

Inteligencia artificial, Ingeniería de datos, Preprocesamiento de datos, Aprendizaje profundo, Aprendizaje automático, Cienciometría

Resumen

La ingeniería de datos se ha convertido en un paso fundamental para la inteligencia artificial (IA)
porque la calidad del entrenamiento depende de la calidad de los datos. Esta conexión temática es
relativamente nueva y la literatura sobre el tema está bastante dispersa. Por lo tanto, el propósito de
esta revisión es identificar los principales aportes en esta área mediante la aplicación del algoritmo
del Árbol de la Ciencia. Este algoritmo procesa los resultados de consultas de Scopus y Web of
Science para clasificar los artículos en raíz, tronco y ramas. El principal resultado del estudio fue la
identificación de tres áreas emergentes. El primero se centra en el uso de la IA para analizar y mejorar
datos científicos complejos, haciendo hincapié en la resolución de desafíos de optimización
específicos. El segundo aborda la implementación práctica de la IA, abordando cuestiones como la
limpieza de datos y la mejora de la eficiencia operativa. El tercero destaca el desarrollo de la IA desde
su creación hasta su mantenimiento una vez implementada, aprovechando la ingeniería de datos como
herramienta clave para mejorar la formación y el rendimiento de la IA. Estos hallazgos son dignos de
mención porque arrojan luz sobre el uso actual de aplicaciones de IA para optimizar procesos en
diversos sectores. La capacidad de procesar grandes volúmenes de datos rápidamente mejora la
eficiencia y acelera la toma de decisiones en sectores como la salud, la industria y la ciberseguridad.
Esto permite diagnósticos personalizados, optimización de procesos y respuestas inmediatas a las
amenazas. Sin embargo, es importante enfatizar que estos beneficios dependen de la calidad de los
datos y de la adecuada implementación de sistemas de análisis, que aseguren un procesamiento
efectivo y resultados confiables. 

Descargas

Referencias

[1]C. Ordonez, W. Macyna, and L. Bellatreche, "Data engineering and modeling for artificial intelligence", Data Knowl. Eng., vol. 153, p. 102346, 2024.

[2]V. Sessions and M. Valtorta, "The effects of data quality on machine learning algorithms", in Proceedings, pp. 485–498, 2006.

[3]D. T. Holloway, M. A. Kon, and C. DeLisi, "Machine learning methods for transcription data integration", IBM J. Res. Dev., vol. 50, pp. 631–643, 2006.

[4]S. Yao, S. Hu, Y. Zhao, A. Zhang, and T. Abdelzaher, "DeepSense", in Proceedings of the 26th International Conference on World Wide Web, International World Wide Web Conferences Steering Committee, Republic and Canton of Geneva, Switzerland, 2017. doi: 10.1145/3038912.3052577.

[5]F. Napolitano et al., "Drug repositioning: a machine-learning approach through data integration", J. Cheminform., vol. 5, p. 30, 2013.

[6]G. Manogaran et al., "Machine learning based big data processing framework for cancer diagnosis using hidden Markov model and GM clustering", Wirel. Pers. Commun., vol. 102, pp. 2099–2116, 2018.

[7]J. Wang, X. Niu, L. Zhang, Z. Liu, and X. Huang, "A wind speed forecasting system for the construction of a smart grid with two-stage data processing based on improved ELM and deep learning strategies", Expert Syst. Appl., vol. 241, p. 122487, 2024.

[8]S. Surehali, T. Han, J. Huang, A. Kumar, and N. Neithalath, "On the use of machine learning and data-transformation methods to predict hydration kinetics and strength of alkali-activated mine tailings-based binders", Constr. Build. Mater., vol. 419, p. 135523, 2024.

[9]D. V. Jyothi, D. T. Sreelatha, D. T. M. Thiyagu, R. Sowndharya, and N. Arvinth, "A data management system for smart cities leveraging artificial intelligence modeling techniques to enhance privacy and security", J. Internet Serv. Inf. Secur., vol. 14, pp. 37–51, 2024.

[10]J. Y. Kim, W.-S. Ryu, D. Kim, and E. Y. Kim, "Better performance of deep learning pulmonary nodule detection using chest radiography with pixel level labels in reference to computed tomography: data quality matters", Sci. Rep., vol. 14, p. 15967, 2024.

[11]C. Huang et al., "Machine-learning-based data processing techniques for vehicle-to-vehicle channel modeling", IEEE Commun. Mag., vol. 57, pp. 109–115, 2019.

[12]S. Mieruch, S. Demirel, S. Simoncelli, R. Schlitzer, and S. Seitz, "SalaciaML: A deep learning approach for supporting ocean data quality control", Front. Mar. Sci., vol. 8, 2021.

[13]A. Gharieb et al., "In-house integrated big data management platform for exploration and production operations digitalization: From data gathering to generative AI through machine learning implementation using cost-effective open-source technologies - experienced mature workflow", in Day 2 Tue, April 23, 2024, SPE, 2024. doi: 10.2118/218560-ms.

[14]Y. Yin and J. Antonio, "Application of 3D laser scanning technology for image data processing in the protection of ancient building sites through deep learning", Image Vis. Comput., vol. 102, p. 103969, 2020.

[15]S. Zheng et al., "Big data processing architecture for radio signals empowered by deep learning: Concept, experiment, applications and challenges", IEEE Access, vol. 6, pp. 55907–55922, 2018.

[16]K. Zhang, "Incorporating deep learning model development with an end-to-end data pipeline", IEEE Access, vol. 12, pp. 127522–127531, 2024.

[17]T. Harrison et al., "The data firehose and AI in government", in Proceedings of the 20th Annual International Conference on Digital Government Research, ACM, New York, NY, USA, 2019. doi: 10.1145/3325112.3325245.

[18]X. Xiang et al., "Enhancing CRISPR-Cas9 gRNA efficiency prediction by data integration and deep learning", Nat. Commun., vol. 12, p. 3238, 2021.

[19]Y. Yu et al., "Improved prediction of bacterial CRISPRi guide efficiency from depletion screens through mixed-effect machine learning and data integration", Genome Biol., vol. 25, p. 13, 2024.

[20]O. P. Olawale and S. Ebadinezhad, "Cybersecurity anomaly detection: AI and Ethereum blockchain for a secure and tamperproof IoHT data management", IEEE Access, vol. 12, pp. 131605–131620, 2024.

[21]R. Koulali, H. Zaidani, and M. Zaim, "Image classification approach using machine learning and an industrial Hadoop-based data pipeline", Big Data Res., vol. 24, p. 100184, 2021.

[22]G. Manias et al., "Advanced data processing of pancreatic cancer data integrating ontologies and machine learning techniques to create holistic health records", Sensors (Basel), vol. 24, p. 1739, 2024.

[23]Y. Shen et al., "A deep-learning-based data-management scheme for intelligent control of wastewater treatment processes under resource-constrained IoT systems", IEEE Internet Things J., vol. 11, pp. 25757–25770, 2024.

[24]J. Wang, "Practical research on blended teaching in higher vocational institutes based on ICVE platform: Take artificial intelligence data processing course as an example", in Proc. 2022 3rd Int. Conf. Educ., Knowl. Inf. Manag. (ICEKIM), IEEE, 2022. doi: 10.1109/ICEKIM55072.2022.00047.

[25]Y. Li and A. Ngom, "Data integration in machine learning", in Proc. 2015 IEEE Int. Conf. Bioinf. Biomed. (BIBM), IEEE, 2015. doi: 10.1109/BIBM.2015.7359925.

[26]S. Guo, J. Lin, Y. Zhang, and Z.-L. Huang, "Enhancing the data processing speed of a deep-learning-based three-dimensional single molecule localization algorithm (FD-DeepLoc) with a combination of feature compression and pipeline programming", J. Innov. Opt. Health Sci., 2024. doi: 10.1142/S1793545824500251.

Descargas

Publicado

2025-04-07

Número

Sección

Artículos

Cómo citar

Britto Berrocal, A. J. ., & Cordoba Rizo, D. M. . (2025). Análisis cienciométrico de la relación entre inteligencia artificial eingeniería de datos: tendencias, colaboración y evolución. Interfaces, 7(2). https://revistas.unilibre.edu.co/index.php/interfaces/article/view/12714