19 feb 2011

LDK 100: O TEI

A TEI ou Text Encoding Initiative é un consorcio de diferentes institucións, grupos e proxectos de investigación que desde 1980 vén desenvolvendo e mantendo un estándar para a representación de textos nun formato dixital.

O seu lanzamento máis importante é o conxunto de Guidelines, que desde 1995 veñen marcando o estándar de codificación para textos en formato dixital, especialmente nas humanidades e as ciencias sociais.

Estas Guidelines definen máis de medio milleiro de diferentes compoñentes textuais e conceptos, que poden ser expresados cunha linguaxe de marcación e definidas por un esquema DTD ou XML. O esquema de TEI é modular, deseñado de forma tal que pode ser modificable dacordo cos diferentes intereses do usuario mediante a combinación de modulos independentes que permiten a creación de esquemas de programación ad hoc. Deste xeito o TEI ten unha grande versatilidade e permite un número moi importante de aplicacións diferentes combinando un número limitado de módulos e elementos.

Os elementos básicos do TEI levan sendo estables desde hai máis dunha década. En 1994 publicouse TEI P3, que foi actualizado á versión P4, adaptada para o uso do XML, en 2002. A versión actual, que regulariza boa parte das prácticas de codificación de XML segundo as directrices promovidas por W3C (eliminación de algunhas etiquetas e potenciación do uso de atributos), saíu á luz en 2007.

Usan TEI, entre outros moitos proxectos, o British National Corpus ou o Perseus Project.

Podedes ler as Guidelines nesta ligazón.

No hay comentarios:

Publicar un comentario