🔤

Detector de Encoding

Identifique e corrija problemas de encoding (UTF-8 vs Latin-1) em textos com caracteres estranhos.

Ferramentas Relacionadas

O Detector de Encoding do Utilitarioz identifica o charset de texto colado (UTF-8, Latin-1/ISO-8859-1, Windows-1252 etc.) e converte entre encodings, resolvendo problemas de caracteres corrompidos (mojibake) em dados importados.

Encodings mais comuns no Brasil

  • UTF-8 — padrão universal, suporta todos os caracteres
  • ISO-8859-1 (Latin-1) — legado, suporta acentos do português
  • Windows-1252 — extensão do Latin-1 usada no Windows
  • UTF-16 — usado internamente pelo JavaScript e Java

Perguntas Frequentes — Detector de Encoding

Por que aparecem caracteres como ã no lugar de ã?

É mojibake — o texto UTF-8 foi interpretado como Latin-1. O ã (U+00E3) em UTF-8 são os bytes C3 A3, que no Latin-1 são lidos como à e £.