Diseño e implementación de un dispositivo electrónico para asistencia de lectura de textos impresos mediante visión computacional para personas con discapacidad visual
Resumen
Este artículo presenta el diseño e implementación de un dispositivo electrónico para ayudar a personas con discapacidades visuales en la lectura de textos impresos. Este sistema mecatrónico utiliza una cámara Raspberry Pi V3 montada en unas gafas para capturar imágenes de textos impresos. Las imágenes se procesan mediante el reconocimiento óptico de caracteres, y el texto extraído se convierte a audio mediante un sintetizador de texto a voz, lo que permite al usuario acceder al contenido visual de manera auditiva. El dispositivo se basa en un microcontrolador Raspberry Pi 3 modelo B+ para la gestión de datos y el control de los componentes electrónicos. Está diseñado para ser portátil, ergonómico y de bajo consumo energético, con una batería de larga duración.
Descargas
Citas
Adjetey, C., & Adu-Manu, K. S. (2021). Content-based image retrieval using Tesseract OCR engine and levenshtein algorithm. International Journal of Advanced Computer Science and Applications, 12(7), 666-675. https://dx.doi.org/10.14569/IJACSA.2021.0120776
AlSaid, H., AlKhatib, L., AlOraidh, A., AlHaidar, S., & Bashar, A. (2019). Deep learning assisted smart glasses as educational aid for visually challenged students [Presentación de escrito]. 2019 2nd International Conference on new Trends in Computing Sciences (ICTCS), Amman, Jordania. http://dx.doi.org/10.1109/ICTCS.2019.8923044
Arias Acosta, M. D. (2022). Diseño e implementación de gafas inteligentes como herramienta de asistencia para lectura y reconocimiento del entorno para personas con discapacidad visual utilizando inteligencia artificial [Tesis de licenciatura, Universidad de las Fuerzas Armadas]. Repositorio institucional de la Universidad de las Fuerzas Armadas de Ecuador. http://repositorio.espe.edu.ec/handle/21000/35773
Basantes Varela, D. A., & Chalaco Chamba, E. A. (2019). Desarrollo de un prototipo de gafas para lectura de texto con visión artificial que asista a personas con discapacidad visual [Tesis de licenciatura, Universidad Politécnica Salesiana]. Repositorio Institucional de la Universidad Politécnica Salesiana. http://dspace.ups.edu.ec/handle/123456789/17841
Chinchero Iza, J. L. (2019). Desarrollo de un dispositivo que mediante visión artificial permita adquirir imágenes con palabras para la conversión a audio, orientado a la ayuda de personas invidentes [Tesis de licenciatura, Universidad Tecnológica Israel]. Repositorio Digital de la Universidad de Israel. http://repositorio.uisrael.edu.ec/handle/47000/2117
Consejo Nacional para la Integración de la Persona con Discapacidad. (2025). Registro Nacional de la Persona con Discapacidad. Observatorio Nacional de la Discapacidad. https://observatorio.conadisperu.gob.pe/
Cuesta, I. I., Martínez-Pañeda, E., Díaz, A., & Alegre, J. M. (2019). The essential work of fracture parameters for 3D printed polymer sheets. Materials & Design, 181, 107968. https://doi.org/10.1016/j.matdes.2019.107968
eSpeak. (s. f.). eSpeak text-to-speech software. http://espeak.sourceforge.net/
Howse, J., & Minichino, J. (2020). Learning OpenCV 4 Computer Vision with Python 3. Get to grips with tools, techniques, and algorithms for computer vision and machine learning (3.a ed.). Packt Publishing.
Instituto Nacional de Estadística e Informática. (2019). Perfil sociodemográfico de la población con discapacidad, 2017. https://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib1675/libro.pdf
Karmel, A., Sharma, A., Pandya, M., & Garg, D. (2019). IoT based assistive device for deaf, dumb and blind people. Procedia Computer Science, 165, 259-269. https://doi.org/10.1016/j.procs.2020.01.080
Kuriakose, B., Shrestha, R., & Sandnes, F. E. (2022). Tools and technologies for blind and visually impaired navigation support: A review. IETE Technical Review, 39(1), 3-18. https://doi.org/10.1080/02564602.2020.1819893
López Jiménez, S. (2019). Ayudas electrónicas para pacientes con discapacidad visual [Tesis de maestría, Universidad de Valladolid]. Repositorio de la Universidad de Valladolid. http://uvadoc.uva.es/handle/10324/37124
Luna Soria, D. O. (2022). Desarrollo de un prototipo de dispositivo para reconocimiento de texto tipo imprenta y su conversión en audio orientado a personas con discapacidad visual mediante técnicas de visión artificial [Tesis de licenciatura, Escuela Superior Politécnica de Chimborazo]. Repositorio Institucional de la Escuela Superior Politécnica de Chimborazo. http://dspace.espoch.edu.ec/handle/123456789/21272
Malkadi, A., Alahmadi, M., & Haiduc, S. (2020, June). A study on the accuracy of OCR engines for source code transcription from programming screencasts [Presentación de escrito]. Proceedings of the 17th International Conference on Mining Software Repositories, Nueva York, Estados Unidos. https://doi.org/10.1145/3379597.3387468
Manage, P., Ambe, V., Gokhale, P., Patil, V., Kulkarni, R. M., & Kalburgimath, P. R. (2020, 3-5 de diciembre). An intelligent text reader based on python [Presentación de escrito]. 2020 3rd International Conference on Intelligent Sustainable Systems (ICISS), Thoothukudi, India. https://doi.org/10.1109/ICISS49785.2020.9315996
Namysl, M., & Konya, I. (2019, 20-25 de septiembre). Efficient, lexicon-free OCR using deep learning [Presentación de escrito]. 2019 International Conference on Document Analysis and Recognition (ICDAR), Sydney, Australia. https://doi.org/10.1109/ICDAR.2019.00055
Navarro Pérez, V. M. (2021). Sistema portátil de reconocimiento de texto para la asistencia de personas ciegas o con dificultad en la visión [Tesis de grado, Universidad Rey Juan Carlos]. Repositorio de la Universidad Rey Juan Carlos. http://hdl.handle.net/10115/18188
Organización Mundial de la Salud. (2023). Ceguera y discapacidad visual. https://www.who.int/news-room/fact-sheets/detail/blindness-and-visual-impairment
Raspberry Pi Foundation. (2023). Raspberry Pi 3 Model B+. Product brief. https://datasheets.raspberrypi.com/rpi3/raspberry-pi-3-b-plus-product-brief.pdf
Raspberry Pi Foundation. (2024). Raspberry Pi Camera Module 3. Product brief. https://datasheets.raspberrypi.com/camera/camera-module-3-product-brief.pdf
Smith, R. (2007, septiembre). An overview of the Tesseract OCR engine [Presentación de escrito]. 9th International Conference on Document Analysis and Recognition (ICDAR), Curitiba, Brasil. https://doi.org/10.1109/ICDAR.2007.4376991
Soans, R., & Fukumizu, Y. (2024). Custom anchorless object detection model for 3D synthetic traffic sign board dataset with depth estimation and text character extraction. Applied Sciences, 14(14), 6352. https://doi.org/10.3390/app14146352
Taylor, P. (2009). Text-to-speech synthesis. Cambridge University Press.
Vidal, E., Toselli, A. H., Ríos-Vila, A., & Calvo-Zaragoza, J. (2023). End-to-end page-level assessment of handwritten text recognition. Pattern Recognition, 142, 109695. https://doi.org/10.1016/j.patcog.2023.109695
Wong Cam, C. F., & Wong Morales, C. A. (Eds.). (2019). Enfermedades de los ojos y ceguera en el Perú. American Offset Editores. https://wongoftalmologos.com.pe/wp-content/uploads/2024/04/Libro-Enfermedad-y-Ceguera-en-el-Peru-1.pdf
Xiaomi. (s. f.). Manual de usuario de 10 000 mAh Mi 18W Fast Charge Power Bank 3. https://i01.appmifile.com/webfile/globalimg/Global_UG/Mi_Ecosystem/10000mAh_Mi_18W_Fast_Charge_Power_Bank_3/es-ES_V1.pdf
Yataco Marín, R. M. (2022). Tiflotecnología y el acceso a la información de las personas con discapacidad visual. Fénix, (50), 76-90. https://doi.org/10.51433/fenix-bnp.2022.n50.p76-90