Problème

Il s'affiche "mon site qui va me rapporter du blé !", et vous essayerez avec d'autres caractères accentués, ça ne passera pas non plus, en sortant toute sortes de caractères bizarres. Eh bien sachez le dès maintenant, ces caractères ne sont pas sortis de nulle part !

Un monde de bits

Vous n'êtes pas débiles, vous savez que "tout est binaire" sur un ordinateur, et ça change beaucoup de choses pour vous, à commencé par le fait que par défaut, les navigateurs considèrent une page comme de l'ISO-8859-1. En gros, c'est un encodage de caractères prévu pour les langues ouest-européenne, qui représente tout caractère sur 8 bits, un octet.
La lettre "a" est donc représentée par 1100001, et la lettre "é" par 11101001, mais on s'en fiche.
Le problème est que vous avez enregistré votre page en UTF-8 (encodage par défaut de gedit, et bien d'autre logiciels), et en utf-8, un caractère peut être codé sur un nombre d'octets variable (de 1 à 4). En UTF-8 donc, la lettre "é" est représentée par 11000011 10101001, mais le navigateur quand à lui ne sait PAS que c'est de l'utf-8, comment pourrait-il le deviner ?
Il lit donc le document comme si il était en ISO, et affiche les caractères au code 11000011 puis 10101001, qui sont respectivement à et ©.
Pourquoi gedit utilise l'UTF-8 par défaut ? Pour vous compliquer la vie ?
Non, juste parce qu'en ISO-8859-1, l'on peut afficher que 191 caractères, tandis que l'on dépasse le million en UTF-8 (en théorie, de toutes les langues du monde).

Conclusion ?

Je ne vous dirait pas comment résoudre ce ridicule petit problème de fillette, je voulais juste vous inciter à vous intéresser à la grande (et passionnante pour ma part) question du choix de l'encodage de ses fichiers ({oui mais si j'utilise l'utf-8, mes fichiers seront plus lourds ?} ou {et si jamais je devais incorporer des caractères étrangers, je ferai comment ?} etc...) . Car oui, ça concerne toute sorte de fichiers. En conclusion donc, je vous invite fortement à lire les liens qui suivent :