Já teve seu texto do banco de dados ou de algum outro lugar infestado de códigos que começa com [&] e termina cim [;]? Sua solução chegou, converta ou remova qualquer entidade HTML com nosso conversor de Entidades HTML.
Sumário
O que são entidades HTML?
Entidades HTML são caracteres especiais que têm significados especiais dentro de um documento HTML. Eles são representados por um código de entidade, que começa com um caractere ‘&’ e termina com um ponto e vírgula ‘;’. As entidades HTML são usadas para representar caracteres que não podem ser exibidos diretamente no HTML, como caracteres acentuados, símbolos matemáticos e emojis.
Por exemplo, o caractere acentuado ‘á’ pode ser representado na forma de entidade HTML á
. Quando um navegador processa um documento HTML, ele converte automaticamente todas as entidades HTML em seus caracteres correspondentes antes de exibir o conteúdo na tela.
Como remover entidades HTML usando JavaScript
Às vezes, pode ser necessário remover entidades HTML de um texto antes de exibi-lo na tela. Por exemplo, se você estiver extraindo texto de uma página da web, pode querer remover todas as entidades HTML para exibir apenas o texto puro.
Felizmente é fácil remover ou converter as entidades HTML usando nosso formulário abaixo:
Por que meu texto ficou cheio de entidades HTML?
Há várias situações em que um texto pode acabar contendo entidades HTML, algumas delas incluem:
- Texto copiado de uma página da web – Quando você copia texto de uma página da web, o texto pode conter entidades HTML que foram usadas para exibir caracteres especiais ou símbolos matemáticos.
- Submissão de formulários HTML – Se um formulário HTML permitir a entrada de texto com caracteres especiais, esses caracteres podem ser automaticamente convertidos em entidades HTML para evitar problemas de segurança ou formatação incorreta.
- Interação com APIs – Se você estiver interagindo com uma API que retorna dados em formato HTML, o texto pode conter entidades HTML.
- Inserção de conteúdo em um CMS – Alguns sistemas de gerenciamento de conteúdo (CMS) podem converter automaticamente caracteres especiais em entidades HTML para garantir a compatibilidade com vários navegadores e sistemas operacionais.
- Manipulação de texto com Plugins – Um grande exemplo no qual enfrentei e resolvi criar esse conversor foi devido ao plugin Translatepress que acaba de uma hora pra outra gerando traduções com entidades dentro do banco de dados.
Lista de Entidades HTML
Aqui está uma lista completa de entidades HTML comuns, organizadas por categoria:
Símbolos Gerais
&
– & (e comercial)<
– < (menor que)>
– > (maior que)"
– ” (aspas duplas)'
– ‘ (aspas simples)¢
– ¢ (centavo)£
– £ (libra esterlina)¥
– ¥ (iene japonês)€
– € (euro)©
– © (direitos autorais)®
– ® (marca registrada)™
– ™ (marca comercial)¦
– ¦ (barra vertical quebrada)§
– § (seção)¶
– ¶ (parágrafo)·
– · (ponto médio)•
– • (ponto)…
– … (reticências)
Símbolos Matemáticos
±
– ± (mais ou menos)×
– × (multiplicação)÷
– ÷ (divisão)=
– = (igual)≠
– ≠ (diferente)≤
– ≤ (menor ou igual)≥
– ≥ (maior ou igual)∞
– ∞ (infinito)
Setas
←
– ← (seta para esquerda)↑
– ↑ (seta para cima)→
– → (seta para direita)↓
– ↓ (seta para baixo)↔
– ↔ (seta para esquerda e direita)↵
– ↵ (seta de retorno de carro)⇐
– ⇐ (seta dupla para esquerda)⇑
– ⇑ (seta dupla para cima)⇒
– ⇒ (seta dupla para direita)⇓
– ⇓ (seta dupla para baixo)⇔
– ⇔ (seta dupla para esquerda e direita)
Pontuação
¡
– ¡ (ponto de exclamação invertido)¿
– ¿ (ponto de interrogação invertido)«
– « (aspas angulares invertidas para a esquerda)»
– » (aspas angulares invertidas para a direita)‘
– ‘ (aspas simples para a esquerda)’
– ’ (aspas simples para a direita)“
– “ (aspas duplas para a esquerda)–
– – (travessão)—
– — (travessão longo)‘
– ‘ (aspas simples para a esquerda)’
– ’ (aspas simples para a direita)‚
– ‚ (aspas simples inferiores)“
– “ (aspas duplas para a esquerda)”
– ” (aspas duplas para a direita)„
– „ (aspas duplas inferiores)‹
– ‹ (aspas angulares simples para a esquerda)›
– › (aspas angulares simples para a direita)«
– « (aspas angulares duplas para a esquerda)…
– … (reticências)‾
– ‾ (linha superior)‍
– (juntar zero largura)‌
- (não juntar zero largura)
Símbolos de Moeda
¤
– ¤ (símbolo de moeda genérico)€
– € (euro)¢
– ¢ (centavo)£
– £ (libra esterlina)¥
– ¥ (iene japonês)$
– $ (dólar americano)
Símbolos de Cartas
♠
– ♠ (espadas)♣
– ♣ (pontos)♥
– ♥ (corações)♦
– ♦ (diamantes)- Outros Símbolos Especiais
‰
– ‰ (por mil)′
– ′ (marca de pé)″
– ″ (marca de polegada)‾
– ‾ (linha superior)⁄
– ⁄ (barra de fração)℘
– ℘ (letra de script maiúscula P)ℑ
– ℑ (letra de script maiúscula I)ℜ
– ℜ (letra de script maiúscula R)ℵ
– ℵ (aleph)