quinta-feira, 14 de fevereiro de 2013

Os números da ortografia - Recapitulando

Com o aparecimento de alguns erros no tratamento da tabela do Vocabulário da Mudança, resolvi ir rever tudo o que ficou para trás. O resultado foi a descoberta de mais um erro, desta vez numa fórmula: quando calculei quantas das palavras convergentes convergiram para a anterior norma portuguesa e quantas convergiram para a anterior norma brasileira esqueci-me da possibilidade de haver convergências para uma ortografia nova, não utilizada até agora por ninguém. E de facto há algumas. Mais precisamente 20.

Por outro lado, nos verbos nenhuma mudança existe.

Ou seja, recapitulando, os números após correção dos erros são os seguintes:

  • O Vocabulário da Mudança contém um total de 6573 vocábulos
  • Entre esses, contam-se 3703 casos de grafias anteriormente divergentes que hoje são duplas (ou, em raríssimos casos, triplas). Na sua grande maioria são casos em que a prática anterior não muda.
  • Contam-se 1400 casos de grafias anteriormente idênticas que continuam hoje a ser idênticas (mas diferentes das anteriores).
  • Contam-se 1249 casos de convergência, grafias anteriormente diferentes que passaram a ser iguais.
  • Contam-se 221 casos de divergência, palavras que anteriormente se escreviam de forma igual mas passaram a aceitar dupla grafia.
  • Entre os casos de convergência, são 616 os que se fazem para a antiga norma portuguesa.
  • Entre os casos de convergência, são 613 os que se fazem para a antiga norma brasileira.
  • 20 casos de convergência para uma ortografia inexistente antes do AO90.
Em suma: há pequenas alterações nos valores, mas as tendências gerais não sofrem qualquer alteração.

O passo seguinte (que já está meio posto em prática) é analisar as mudanças caso a caso. Isso deve levar algum tempo, até porque tem uma componente manual relevante pois, se é fácil isolar automaticamente as palavras que incluem sequências consonantais, hífenes, tremas ou quaisquer dos outros detalhes que sofreram alterações com a nova ortografia, separar aquelas que as incluíam e continuam a incluir das que incluíam mas deixaram, total ou parcialmente, de incluir não é factível sem ir verificar os casos um a um. Ou pelo menos não o é sempre.

Trocando por miúdos, isto vai ainda durar vários dias.

Sem comentários:

Enviar um comentário

Por motivos de spam persistente, todos os comentários neste blogue são moderados. Comentários legítimos passam, mas pode demorar algum tempo. Como sempre acontece, paga a maioria por uma minoria de idiotas. Parece ser assim que o mundo funciona, infelizmente.