Bem-vindos à minha página, onde vou gradualmente colocar meus vários projetos. O conteúdo antigo, para alunos e professores de italiano, está sendo reorganizado, mas ainda pode ser acessado no endereço antigo (sigam este link).

Benvenuti alla mia pagina, dove un po' alla volta inserirò i miei vari progetti. Le pagine vecchie, per studenti e insegnanti di italiano, saranno riorganizzate, ma nel frattempo possono essere lette all'indirizzo antico (seguite questo link).

Welcome to my page, where I will gradually post my various projects. The old pages, for students and teachers of Italian, are being reorganized, but can still be found at the old addresses (follow this link).



Highlights
  • Tradução do De Vulgari Eloquentia - um projeto para a divulgação no Brasil de uma das mais importantes obras lingüísticas da Idade Média, o De Vulgari Eloquentia de Dante Alighieri. A obra é relevante não apenas no estudo das origens da língua italiana, mas também na evolução do pensamento sociolingüístico. Além de uma longa apresentação/introdução, estão disponíveis trechos da tradução ao português do original latino.
  • ACOPOST - I am now the maintainer of ACOPOST, originally developed by Ingo Schröder. ACOPOST is a free and open source collection of part-of-speech taggers written in standard C, taylored for fast experimentation. In corpus linguistics, part-of-speech tagging (POS tagging or POST), also called grammatical tagging or word-category disambiguation, is the process of marking up the words in a text (corpus) as corresponding to a particular part of speech, based on both its definition, as well as its context — i.e. relationship with adjacent and related words in a phrase, sentence, or paragraph. A simplified form of this is commonly taught to school-age children, in the identification of words as nouns, verbs, adjectives, adverbs, etc. Once performed by hand, POS tagging is now done in the context of computational linguistics, using algorithms which associate discrete terms, as well as hidden parts of speech, in accordance with a set of descriptive tags.
  • Free language corpora - Have you ever thought about using text from Wikipedia to generate a free language corpus or a free language model? Here there is some preliminary work, covering the following languages: Afrikaans, Catalan, English, Esperanto, Basque, Galician, Icelandic, Italian, Neapolitan, Piedmontese, Portuguese, Quechua, Slovenian, Swahili, and Yoruba.