Il semble que pour cet auteur particulier, le texte a été édité dans un éditeur qui supposait qu'il n'était pas UTF8, puis l'a réécrit en UTF8. Je me base sur le fait que si je dis à mon navigateur d'interpréter la page comme différents encodages communs, aucun ne l'affiche correctement. Cela me dit qu'une conversion a été effectuée à un moment donné de manière incorrecte.
Le seul problème avec UTF8 est qu'il n'y a pas de méthode standardisée pour reconnaître qu'un fichier est UTF8, et jusqu'à ce que tous les éditeurs standardisent UTF8, il y aura toujours des erreurs de conversion. Pour les autres variantes Unicode, un Byte Order Mark (BOM) est assez standard pour aider à identifier un fichier, mais les BOM dans les fichiers UTF8 sont assez rares.
Pour éviter qu'il n'apparaisse dans votre contenu, assurez-vous que vous utilisez toujours des éditeurs compatibles Unicode et que vous ouvrez toujours vos fichiers avec les encodages appropriés. C'est une douleur, malheureusement, et des erreurs surgiront de temps en temps. La clé est simplement de les attraper tôt afin que vous puissiez l'annuler ou apporter quelques modifications.