Tradução automática
De Wikipedia, a enciclopédia encyclopedia
A tradução automática (TA) é o processo automático de tradução de uma mensagem de um idioma original para outro através de um programa de computador,[1][2] sendo um dos exemplos mais conhecidos a ferramenta Google Tradutor.
A tradução automática é uma subsecção da linguística computacional que investiga o uso de programas de computador para traduzir textos ou discursos de uma língua natural para outra. No seu nível básico, a TA executa a substituição simples de palavras numa língua natural por palavras noutra. Isto raramente produz traduções de qualidade, por várias razões: nem todas as palavras numa língua têm equivalentes diretos noutra língua; muitas palavras têm mais do que um significado; e frequentemente é necessária a compreensão de uma frase completa para se conhecer o seu equivalente noutra língua, sendo que a substituição palavra-a-palavra nestes casos pode levar a traduções com um significado muito diferente do texto original.
Usando técnicas de corpus, podem ser conseguidas traduções mais complexas, que têm em conta as diferenças de tipologia linguística, reconhecimento de frases, e tradução de idiomas, bem como a isolação das anomalias.
Os programas atuais de tradução automática muitas vezes permitem uma personalização por domínio ou profissão (tal como relatórios meteorológicos) — melhorando os resultados por limitar o escopo de substituições admissíveis. Esta técnica é especialmente eficaz em domínios onde a língua formal ou formulaica é usada. Logo a tradução automática de documentos do governo e legais mais prontamente produz resultados usáveis que a conversação ou textos menos padronizados.
A tradução não é nada simples. Não é uma mera substituição de cada palavra, mas ter a habilidade de conhecer "todas palavras" em uma frase ou oração e como uma pode influenciar a outra. As línguas humanas consistem em morfologia (o modo com que as palavras são montadas a partir de pequenas unidades de sentido), sintaxe (estrutura de frase), e semântica (sentido). Mesmo textos simples podem estar repletos de ambiguidades.