iso8859-1, utf8 et sed

Daniel Caillibaud ml at editionsdidier.com
Fri Aug 24 11:49:51 CEST 2007


Bonjour,

En bref, mon pb est comment remplacer des charactères non utf8 avec sed ?

En moins bref :

J'ai un script pour nettoyer des noms de fichiers, mais je viens de constater que s'il y a un pb d'encodage dans le nom, 
ça passe au travers.
Par exemple, sur un système en utf8, le sed suivant ne fait rien

echo tést|iconv -t ISO8859-1 -f utf8|sed -e 's/[^a-z0-9_\-\.]/_/g;'

alors que j'attendais naïvement t_st.

Un moyen de remplacer tout ce qui ne serait pas a-z0-9_ en utf8 par _ ?

-- 
Daniel


More information about the Shell mailing list