Hacer un algoritmo que calculé lo difícil de leer que es una palabra es complicado, depende de muchos factores, algunos propios del lector: cultura, velocidad, conocimiento del tema, problemas con algunas sílabas,… Por lo que el valor obtenido hay que tomarlo como un indicador y no como un valor absoluto
En nuestro modelo vamos a asociar la dificultad para lectura con la dificultad para pronunciar. Por ello descompondremos la palabra en sílabas y calcularemos la dificultad de cada una.
Dificultad de lectura de una sílaba
El modelo que usaremos puntúa con valor númerico a cada letra de la silaba, además suma o resta puntos por ciertas combinaciones de letras. El resutado final de sumar todo da la dificultad de lectura.
- Las vocales son más faciles de leer que las consonantes. (+1)
- La h al ser muda no afecta a la pronunciación. (+0)
- Las consonantes habituales tienen una dificultad media (+2)
- Hay consonantes poco comunes que hacen más dificiles la pronunciciación debido a la falta de habito. (+3)
Valores de cada letra:
- +0: h
- +1: a,e,i,o,u
- +2: b,c,d,f,g,j,l,m,n,ñ,p,q,r,s,t,v
- +3: k,w,x
Hay excepciones en las que una letra no cuenta, por lo que en esos casos esa letra no aporta valor, para ello se realizaran los siguientes remplazos:
que = qe
qui = qi
gui = ge
gue = ge
rr = r
ll = y
Dos consonantes seguidas complican la pronunciacion:Si la segunda consonanete es «hbrls» +1Si la segunda consonanete es cualquier otra +2
Dificultad:
Baja | 1-3 | a, be, ca |
Media | 4-6 | del, bra, tri |
Alta | 7-… | tras, blas |
Problemas y mejoras:
- No sirve para otros idiomas.
- Considera que todo es valido, por ejemplo «mnztr» puntua alto pero lo considera «legible»
Dificultad de lectura de una palabra
Para saber la dificultad de una palabra basta con sumar la dificultad de cada una de sus sílabas. Aunque se puede usar el valor medio (dividiéndolo entre el número de sílabas o de letras) yo recomiendo usar el valor absoluto ya que así se refleja la longitud de la palabra. Por ejemplo «catarata» a mí me parece más difícil que «cabra». Si usamos el valor absoluto catarata puntúa 12 y cabra 9. En valor medio 3 y 4,5.
El primer problema es dividir la palabra en sílabas, por suerte aquí tienes una solución.
Ahora se puede valorar cada sílaba y sumarlas. Para saber qué dificultad tiene cada palabra se pueden usar los siguientes valores que he calculado
a prueba y error:
Baja | 1-9 |
Media | 10-13 |
Alta | 14-… |
Problemas y mejoras:
- Los plurales, simplemente añadir una s o una es al final puede hacer que una palabra suba su dificultad cuando muchas veces no se corresponde con el incremento «real» de la dificultad.
- Hay sílabas que cuando van seguidas aumenta la dificultad de pronunciarlas, en este modelo no se ha tenido en cuenta.