Diseño e implementación de un dispositivo electrónico para asistencia de lectura de textos impresos mediante visión computacional para personas con discapacidad visual

Palabras clave: Raspberry Pi, reconocimiento óptico de caracteres, texto a voz, discapacidad visual

Resumen

Este artículo presenta el diseño e implementación de un dispositivo electrónico para ayudar a personas con discapacidades visuales en la lectura de textos impresos. Este sistema mecatrónico utiliza una cámara Raspberry Pi V3 montada en unas gafas para capturar imágenes de textos impresos. Las imágenes se procesan mediante el reconocimiento óptico de caracteres, y el texto extraído se convierte a audio mediante un sintetizador de texto a voz, lo que permite al usuario acceder al contenido visual de manera auditiva. El dispositivo se basa en un microcontrolador Raspberry Pi 3 modelo B+ para la gestión de datos y el control de los componentes electrónicos. Está diseñado para ser portátil, ergonómico y de bajo consumo energético, con una batería de larga duración.

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

Cristhian Kevin Rafael Rosales, Facultad de Ingeniería Mecánica, Universidad Nacional de Ingeniería, Perú

Estudiante de décimo ciclo de la carrera de Ingeniería Mecatrónica en la Universidad Nacional de Ingeniería

José Erasmo Salazar Minchan, Facultad de Ingeniería Mecánica, Universidad Nacional de Ingeniería, Perú

Egresado en Ingeniería Mecatrónica en la Universidad Nacional de Ingeniería. Actualmente, se desempeña como practicante profesional en Divemotor.

Jorge Enrique Ortiz Porras, Facultad de Ingeniería Mecánica, Universidad Nacional de Ingeniería, Perú

Doctor en Ingeniería Industrial y Gestión de Empresas por la Universidad Nacional Mayor de San Marcos, Perú. Magíster en Administración de Empresas y magíster en Dirección de Operaciones y Logística, ambas por la Universidad Peruana de Ciencias Aplicadas. Magíster en Docencia Universitaria y Gestión Educativa por la Universidad Tecnológica del Perú. Es ingeniero Mecatrónico por la Universidad Nacional de Ingeniería. Actualmente, se desempeña como docente universitario en la Universidad Nacional de Ingeniería y en la Universidad Nacional Mayor de San Marcos.

Citas

Adjetey, C., & Adu-Manu, K. S. (2021). Content-based image retrieval using Tesseract OCR engine and levenshtein algorithm. International Journal of Advanced Computer Science and Applications, 12(7), 666-675. https://dx.doi.org/10.14569/IJACSA.2021.0120776

AlSaid, H., AlKhatib, L., AlOraidh, A., AlHaidar, S., & Bashar, A. (2019). Deep learning assisted smart glasses as educational aid for visually challenged students [Presentación de escrito]. 2019 2nd International Conference on new Trends in Computing Sciences (ICTCS), Amman, Jordania. http://dx.doi.org/10.1109/ICTCS.2019.8923044

Arias Acosta, M. D. (2022). Diseño e implementación de gafas inteligentes como herramienta de asistencia para lectura y reconocimiento del entorno para personas con discapacidad visual utilizando inteligencia artificial [Tesis de licenciatura, Universidad de las Fuerzas Armadas]. Repositorio institucional de la Universidad de las Fuerzas Armadas de Ecuador. http://repositorio.espe.edu.ec/handle/21000/35773

Basantes Varela, D. A., & Chalaco Chamba, E. A. (2019). Desarrollo de un prototipo de gafas para lectura de texto con visión artificial que asista a personas con discapacidad visual [Tesis de licenciatura, Universidad Politécnica Salesiana]. Repositorio Institucional de la Universidad Politécnica Salesiana. http://dspace.ups.edu.ec/handle/123456789/17841

Chinchero Iza, J. L. (2019). Desarrollo de un dispositivo que mediante visión artificial permita adquirir imágenes con palabras para la conversión a audio, orientado a la ayuda de personas invidentes [Tesis de licenciatura, Universidad Tecnológica Israel]. Repositorio Digital de la Universidad de Israel. http://repositorio.uisrael.edu.ec/handle/47000/2117

Consejo Nacional para la Integración de la Persona con Discapacidad. (2025). Registro Nacional de la Persona con Discapacidad. Observatorio Nacional de la Discapacidad. https://observatorio.conadisperu.gob.pe/

Cuesta, I. I., Martínez-Pañeda, E., Díaz, A., & Alegre, J. M. (2019). The essential work of fracture parameters for 3D printed polymer sheets. Materials & Design, 181, 107968. https://doi.org/10.1016/j.matdes.2019.107968

eSpeak. (s. f.). eSpeak text-to-speech software. http://espeak.sourceforge.net/

Howse, J., & Minichino, J. (2020). Learning OpenCV 4 Computer Vision with Python 3. Get to grips with tools, techniques, and algorithms for computer vision and machine learning (3.a ed.). Packt Publishing.

Instituto Nacional de Estadística e Informática. (2019). Perfil sociodemográfico de la población con discapacidad, 2017. https://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib1675/libro.pdf

Karmel, A., Sharma, A., Pandya, M., & Garg, D. (2019). IoT based assistive device for deaf, dumb and blind people. Procedia Computer Science, 165, 259-269. https://doi.org/10.1016/j.procs.2020.01.080

Kuriakose, B., Shrestha, R., & Sandnes, F. E. (2022). Tools and technologies for blind and visually impaired navigation support: A review. IETE Technical Review, 39(1), 3-18. https://doi.org/10.1080/02564602.2020.1819893

López Jiménez, S. (2019). Ayudas electrónicas para pacientes con discapacidad visual [Tesis de maestría, Universidad de Valladolid]. Repositorio de la Universidad de Valladolid. http://uvadoc.uva.es/handle/10324/37124

Luna Soria, D. O. (2022). Desarrollo de un prototipo de dispositivo para reconocimiento de texto tipo imprenta y su conversión en audio orientado a personas con discapacidad visual mediante técnicas de visión artificial [Tesis de licenciatura, Escuela Superior Politécnica de Chimborazo]. Repositorio Institucional de la Escuela Superior Politécnica de Chimborazo. http://dspace.espoch.edu.ec/handle/123456789/21272

Malkadi, A., Alahmadi, M., & Haiduc, S. (2020, June). A study on the accuracy of OCR engines for source code transcription from programming screencasts [Presentación de escrito]. Proceedings of the 17th International Conference on Mining Software Repositories, Nueva York, Estados Unidos. https://doi.org/10.1145/3379597.3387468

Manage, P., Ambe, V., Gokhale, P., Patil, V., Kulkarni, R. M., & Kalburgimath, P. R. (2020, 3-5 de diciembre). An intelligent text reader based on python [Presentación de escrito]. 2020 3rd International Conference on Intelligent Sustainable Systems (ICISS), Thoothukudi, India. https://doi.org/10.1109/ICISS49785.2020.9315996

Namysl, M., & Konya, I. (2019, 20-25 de septiembre). Efficient, lexicon-free OCR using deep learning [Presentación de escrito]. 2019 International Conference on Document Analysis and Recognition (ICDAR), Sydney, Australia. https://doi.org/10.1109/ICDAR.2019.00055

Navarro Pérez, V. M. (2021). Sistema portátil de reconocimiento de texto para la asistencia de personas ciegas o con dificultad en la visión [Tesis de grado, Universidad Rey Juan Carlos]. Repositorio de la Universidad Rey Juan Carlos. http://hdl.handle.net/10115/18188

Organización Mundial de la Salud. (2023). Ceguera y discapacidad visual. https://www.who.int/news-room/fact-sheets/detail/blindness-and-visual-impairment

Raspberry Pi Foundation. (2023). Raspberry Pi 3 Model B+. Product brief. https://datasheets.raspberrypi.com/rpi3/raspberry-pi-3-b-plus-product-brief.pdf

Raspberry Pi Foundation. (2024). Raspberry Pi Camera Module 3. Product brief. https://datasheets.raspberrypi.com/camera/camera-module-3-product-brief.pdf

Smith, R. (2007, septiembre). An overview of the Tesseract OCR engine [Presentación de escrito]. 9th International Conference on Document Analysis and Recognition (ICDAR), Curitiba, Brasil. https://doi.org/10.1109/ICDAR.2007.4376991

Soans, R., & Fukumizu, Y. (2024). Custom anchorless object detection model for 3D synthetic traffic sign board dataset with depth estimation and text character extraction. Applied Sciences, 14(14), 6352. https://doi.org/10.3390/app14146352

Taylor, P. (2009). Text-to-speech synthesis. Cambridge University Press.

Vidal, E., Toselli, A. H., Ríos-Vila, A., & Calvo-Zaragoza, J. (2023). End-to-end page-level assessment of handwritten text recognition. Pattern Recognition, 142, 109695. https://doi.org/10.1016/j.patcog.2023.109695

Wong Cam, C. F., & Wong Morales, C. A. (Eds.). (2019). Enfermedades de los ojos y ceguera en el Perú. American Offset Editores. https://wongoftalmologos.com.pe/wp-content/uploads/2024/04/Libro-Enfermedad-y-Ceguera-en-el-Peru-1.pdf

Xiaomi. (s. f.). Manual de usuario de 10 000 mAh Mi 18W Fast Charge Power Bank 3. https://i01.appmifile.com/webfile/globalimg/Global_UG/Mi_Ecosystem/10000mAh_Mi_18W_Fast_Charge_Power_Bank_3/es-ES_V1.pdf

Yataco Marín, R. M. (2022). Tiflotecnología y el acceso a la información de las personas con discapacidad visual. Fénix, (50), 76-90. https://doi.org/10.51433/fenix-bnp.2022.n50.p76-90

Publicado
2025-06-10
Cómo citar
Rafael Rosales, C. K., Salazar Minchan, J. E., & Ortiz Porras, J. E. (2025). Diseño e implementación de un dispositivo electrónico para asistencia de lectura de textos impresos mediante visión computacional para personas con discapacidad visual. Ingeniería Industrial, (48), 241-261. https://doi.org/10.26439/ing.ind2025.n48.7607
Sección
Ciencia y tecnología / Science and technology