Diseño e implementación de un dispositivo electrónico para asistencia de lectura de textos impresos mediante visión computacional para personas con discapacidad visual

Cristhian Kevin Rafael Rosales; José Erasmo Salazar Minchan; Jorge Enrique Ortiz Porras

doi:10.26439/ing.ind2025.n48.7607

Authors

Cristhian Kevin Rafael Rosales Facultad de Ingeniería Mecánica, Universidad Nacional de Ingeniería, Perú https://orcid.org/0009-0004-8642-0627
José Erasmo Salazar Minchan Facultad de Ingeniería Mecánica, Universidad Nacional de Ingeniería, Perú https://orcid.org/0009-0004-4791-1466
Jorge Enrique Ortiz Porras Facultad de Ingeniería Mecánica, Universidad Nacional de Ingeniería, Perú https://orcid.org/0000-0002-9605-3670

DOI:

https://doi.org/10.26439/ing.ind2025.n48.7607

Keywords:

Raspberry Pi, optical character recognition, text to speech, visually impaired

Abstract

This article presents the design and implementation of an electronic device to assist visually impaired people in reading printed texts. This mechatronic system uses a Raspberry Pi V3 camera mounted on glasses to capture images of printed texts. The images are processed through Optical Character Recognition, and the extracted text is converted to audio using a Text-to-Speech synthesizer, allowing the user to access the visual content audibly. The device is based on a Raspberry Pi 3 Model B+ microcontroller for data management and control of the electronic components. It is designed to be portable, ergonomic, and energy-efficient, with a long-lasting battery.

Downloads

Download data is not yet available.

Author Biographies

Cristhian Kevin Rafael Rosales, Facultad de Ingeniería Mecánica, Universidad Nacional de Ingeniería, Perú

Estudiante de décimo ciclo de la carrera de Ingeniería Mecatrónica en la Universidad Nacional de Ingeniería
José Erasmo Salazar Minchan, Facultad de Ingeniería Mecánica, Universidad Nacional de Ingeniería, Perú

Egresado en Ingeniería Mecatrónica en la Universidad Nacional de Ingeniería. Actualmente, se desempeña como practicante profesional en Divemotor.
Jorge Enrique Ortiz Porras, Facultad de Ingeniería Mecánica, Universidad Nacional de Ingeniería, Perú

Doctor en Ingeniería Industrial y Gestión de Empresas por la Universidad Nacional Mayor de San Marcos, Perú. Magíster en Administración de Empresas y magíster en Dirección de Operaciones y Logística, ambas por la Universidad Peruana de Ciencias Aplicadas. Magíster en Docencia Universitaria y Gestión Educativa por la Universidad Tecnológica del Perú. Es ingeniero Mecatrónico por la Universidad Nacional de Ingeniería. Actualmente, se desempeña como docente universitario en la Universidad Nacional de Ingeniería y en la Universidad Nacional Mayor de San Marcos.

References

Adjetey, C., & Adu-Manu, K. S. (2021). Content-based image retrieval using Tesseract OCR engine and levenshtein algorithm. International Journal of Advanced Computer Science and Applications, 12(7), 666-675. https://dx.doi.org/10.14569/IJACSA.2021.0120776

AlSaid, H., AlKhatib, L., AlOraidh, A., AlHaidar, S., & Bashar, A. (2019). Deep learning assisted smart glasses as educational aid for visually challenged students [Presentación de escrito]. 2019 2nd International Conference on new Trends in Computing Sciences (ICTCS), Amman, Jordania. http://dx.doi.org/10.1109/ICTCS.2019.8923044

Arias Acosta, M. D. (2022). Diseño e implementación de gafas inteligentes como herramienta de asistencia para lectura y reconocimiento del entorno para personas con discapacidad visual utilizando inteligencia artificial [Tesis de licenciatura, Universidad de las Fuerzas Armadas]. Repositorio institucional de la Universidad de las Fuerzas Armadas de Ecuador. http://repositorio.espe.edu.ec/handle/21000/35773

Basantes Varela, D. A., & Chalaco Chamba, E. A. (2019). Desarrollo de un prototipo de gafas para lectura de texto con visión artificial que asista a personas con discapacidad visual [Tesis de licenciatura, Universidad Politécnica Salesiana]. Repositorio Institucional de la Universidad Politécnica Salesiana. http://dspace.ups.edu.ec/handle/123456789/17841

Chinchero Iza, J. L. (2019). Desarrollo de un dispositivo que mediante visión artificial permita adquirir imágenes con palabras para la conversión a audio, orientado a la ayuda de personas invidentes [Tesis de licenciatura, Universidad Tecnológica Israel]. Repositorio Digital de la Universidad de Israel. http://repositorio.uisrael.edu.ec/handle/47000/2117

Consejo Nacional para la Integración de la Persona con Discapacidad. (2025). Registro Nacional de la Persona con Discapacidad. Observatorio Nacional de la Discapacidad. https://observatorio.conadisperu.gob.pe/

Cuesta, I. I., Martínez-Pañeda, E., Díaz, A., & Alegre, J. M. (2019). The essential work of fracture parameters for 3D printed polymer sheets. Materials & Design, 181, 107968. https://doi.org/10.1016/j.matdes.2019.107968

eSpeak. (s. f.). eSpeak text-to-speech software. http://espeak.sourceforge.net/

Howse, J., & Minichino, J. (2020). Learning OpenCV 4 Computer Vision with Python 3. Get to grips with tools, techniques, and algorithms for computer vision and machine learning (3.a ed.). Packt Publishing.

Instituto Nacional de Estadística e Informática. (2019). Perfil sociodemográfico de la población con discapacidad, 2017. https://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib1675/libro.pdf

Karmel, A., Sharma, A., Pandya, M., & Garg, D. (2019). IoT based assistive device for deaf, dumb and blind people. Procedia Computer Science, 165, 259-269. https://doi.org/10.1016/j.procs.2020.01.080

Kuriakose, B., Shrestha, R., & Sandnes, F. E. (2022). Tools and technologies for blind and visually impaired navigation support: A review. IETE Technical Review, 39(1), 3-18. https://doi.org/10.1080/02564602.2020.1819893

López Jiménez, S. (2019). Ayudas electrónicas para pacientes con discapacidad visual [Tesis de maestría, Universidad de Valladolid]. Repositorio de la Universidad de Valladolid. http://uvadoc.uva.es/handle/10324/37124

Luna Soria, D. O. (2022). Desarrollo de un prototipo de dispositivo para reconocimiento de texto tipo imprenta y su conversión en audio orientado a personas con discapacidad visual mediante técnicas de visión artificial [Tesis de licenciatura, Escuela Superior Politécnica de Chimborazo]. Repositorio Institucional de la Escuela Superior Politécnica de Chimborazo. http://dspace.espoch.edu.ec/handle/123456789/21272

Malkadi, A., Alahmadi, M., & Haiduc, S. (2020, June). A study on the accuracy of OCR engines for source code transcription from programming screencasts [Presentación de escrito]. Proceedings of the 17th International Conference on Mining Software Repositories, Nueva York, Estados Unidos. https://doi.org/10.1145/3379597.3387468

Manage, P., Ambe, V., Gokhale, P., Patil, V., Kulkarni, R. M., & Kalburgimath, P. R. (2020, 3-5 de diciembre). An intelligent text reader based on python [Presentación de escrito]. 2020 3rd International Conference on Intelligent Sustainable Systems (ICISS), Thoothukudi, India. https://doi.org/10.1109/ICISS49785.2020.9315996

Namysl, M., & Konya, I. (2019, 20-25 de septiembre). Efficient, lexicon-free OCR using deep learning [Presentación de escrito]. 2019 International Conference on Document Analysis and Recognition (ICDAR), Sydney, Australia. https://doi.org/10.1109/ICDAR.2019.00055

Navarro Pérez, V. M. (2021). Sistema portátil de reconocimiento de texto para la asistencia de personas ciegas o con dificultad en la visión [Tesis de grado, Universidad Rey Juan Carlos]. Repositorio de la Universidad Rey Juan Carlos. http://hdl.handle.net/10115/18188

Organización Mundial de la Salud. (2023). Ceguera y discapacidad visual. https://www.who.int/news-room/fact-sheets/detail/blindness-and-visual-impairment

Raspberry Pi Foundation. (2023). Raspberry Pi 3 Model B+. Product brief. https://datasheets.raspberrypi.com/rpi3/raspberry-pi-3-b-plus-product-brief.pdf

Raspberry Pi Foundation. (2024). Raspberry Pi Camera Module 3. Product brief. https://datasheets.raspberrypi.com/camera/camera-module-3-product-brief.pdf

Smith, R. (2007, septiembre). An overview of the Tesseract OCR engine [Presentación de escrito]. 9th International Conference on Document Analysis and Recognition (ICDAR), Curitiba, Brasil. https://doi.org/10.1109/ICDAR.2007.4376991

Soans, R., & Fukumizu, Y. (2024). Custom anchorless object detection model for 3D synthetic traffic sign board dataset with depth estimation and text character extraction. Applied Sciences, 14(14), 6352. https://doi.org/10.3390/app14146352

Taylor, P. (2009). Text-to-speech synthesis. Cambridge University Press.

Vidal, E., Toselli, A. H., Ríos-Vila, A., & Calvo-Zaragoza, J. (2023). End-to-end page-level assessment of handwritten text recognition. Pattern Recognition, 142, 109695. https://doi.org/10.1016/j.patcog.2023.109695

Wong Cam, C. F., & Wong Morales, C. A. (Eds.). (2019). Enfermedades de los ojos y ceguera en el Perú. American Offset Editores. https://wongoftalmologos.com.pe/wp-content/uploads/2024/04/Libro-Enfermedad-y-Ceguera-en-el-Peru-1.pdf

Xiaomi. (s. f.). Manual de usuario de 10 000 mAh Mi 18W Fast Charge Power Bank 3. https://i01.appmifile.com/webfile/globalimg/Global_UG/Mi_Ecosystem/10000mAh_Mi_18W_Fast_Charge_Power_Bank_3/es-ES_V1.pdf

Yataco Marín, R. M. (2022). Tiflotecnología y el acceso a la información de las personas con discapacidad visual. Fénix, (50), 76-90. https://doi.org/10.51433/fenix-bnp.2022.n50.p76-90

Design and implementation of an electronic device for reading assistance of printed texts using computer vision for visually impaired people

Authors

DOI:

Keywords:

Abstract

Downloads

Author Biographies

References

Downloads

Published

Issue

Section

License

How to Cite

Most read articles by the same author(s)

Make a Submission

etica

proceso

equipo

standards

tutoriales

indexacion

Language

statistics