locales, utf8, sensibilité a la casse

4 Jan 2006

      Bonjour,

J'ai remarqué un truc bizarre, et je n'ai pas trouvé de réponse en
cherchant (donc, j'ai certainement mal cherché ;-) )

Sur 2 machines je fais un grep, et le résultat différe. Après
recherche et essais, il se toruve que le problème est une problèmes de
locale :
Si LC_CTYPE est a "en_US", grep est sensible a la casse,
si LC_CTYPE est a "en_US.UTF-8" grep n'est pas sensible a la casse.

A priori l'unicode est capable de faire la différence. Je ne comprend
donc pas pourquoi le comportement de grep est différent ?

Pour information, le fichier contient :
artichaud
pont des arts
Cartouche
tarte tatin

 et la commande est :
grep -E '^[a-z]*art' essai

Cartouche est trouvé en "en_US.UTF-8", mais pas en "en_US".

Merci pour votre aide !

Jeremy
--
Linux Registered User #317862
Linux From Scratch Registered User #16571
Please do not send me .doc, .xls, .ppt, as I will *NOT* read them.

Jeremy Monnet

Vincent Lefevre

Jeremy Monnet

Vincent Lefevre

Jeremy Monnet

tags

participants (2)