[Ovillo] [OT] Buscando otra lista de correo
Tei
oscar.vives en gmail.com
Lun Mar 30 14:21:48 UTC 2009
Creo que ninguno habeis dado en la diana, pero han sido buenos tiros.
Me explico un poco mejor, porque el tema es complicado.
Que tengo:
Un documento PDF, en el cual se lee el texto nepalis, en sus
caracteres propios.
Este texto tiene incrustrada la fuente Kantipur (TrueType).
De varias maneras distintas extraigo el texto de este PDF.
El resultado son secuencias de caracteres como "xfdLnfO{ yfxf 5 ;a}
dfG5] leGgleGg", en lugar de cosas como "क्षेत्रफल १,४७,१८१ वर्ग".
Evidentemente si pego la cadena leggle (por llamarla de alguna manera)
en una pagina web, aparece como leggle, y no nepales. Si leggle (
xfdLnfO{ yfxf 5 ;a} dfG5] leGgleGg) se puede convertir otra vez en
nepales, no se la manera. He probado con alguna de las herramientas
online que habeis enlazado y no parece el camino. Tambien puede ser
que leggle sea una conversion con perdida.. mas que nada, porque
UTF-8 convertido a iso-8859 tiene mas bien este otro aspecto:
"कॠषेतॠरफल १,४à¥,१८१ वरॠग. ".
Mi sistema es un Ubuntu, es lo suficientemente "poderoso" para
mostrarme correctamente la wikipedia en nepali. Asi que parece que
tengo las fuentes, o al menos una version unicode de la fuente de la
wikipedia lo suficientemente poderosa. Pero me huelo que la "perdida
de informacion" ya se produce cuando hago el "copiar" desde el PDF.
De todos modos he tomado una solucion salomonica, y ya no necesito una
solucion urgente. Aunque si estoy interesado en sugerencias de otras
listas de correo que puedan interesarse en este tipo de dudas. No
quiero polucionar nuestra querida ovillo :-)
--
--
ℱin del ℳensaje.
Más información sobre la lista de distribución Ovillo