Último mensaje de la página anterior:
wilco2009 escribió:Se me ocurre la siguiente codificacion:
- todos los bytes que esten entre 0 y 31 son letra directa.(añadiendo el bit 6)
- los bytes entre 64 y 254 son para apuntar a una lista de palabras frecuentes.
- 255 mas un segundo byte es para una segunda lista de palabras menos frecuentes.
Muchas gracias por la idea.
El añadido del 255 como indicador de lista alternativa es interesante, pero utilizar dos bytes para
identificar a una palabra, se puede sustituir directamente por la dirección de inicio de dicha
palabra y te ahorras el peñazo de pasar por una tabla de direcciones ...
Otro tema es la cuestión de las Mayúsculas ...
En el fondo toda palabra de MAS de dos letras reduce espacio al sustituirla por su apuntador
El tema serán las palabras usadas solamente una vez
Voy a darle vueltas a la tuerca cuanto mas estandarizado mejor.
El rollo es hacer la lista de palabras y luego lo mismo para inglés
saludos
pere