Corpus Folchetto |
CNR-Opera del Vocabolario Italiano |
Guida ai contenuti |
1. IL CORPUS
Il corpus lemmatizzato delle poesie di Folchetto di Marsiglia è nato in
funzione della presentazione del programma GattoWeb al VI Convegno della
Società Italiana di Filologia Romanza (SIFR) di Padova (27 settembre - 1
ottobre 2006). Comprende i ventisette componimenti del trovatore pubblicati ne Le
poesie di Folchetto di Marsiglia. Edizione critica a cura di Paolo
Squillacioti, Pisa, Pacini 1999, con le modifiche apportate nell'editio minor
Folquet de Marselha, Poesie, a cura di Paolo Squillacioti, Roma,
Carocci, 2003. Nell'elenco che segue si indica a sinistra della parentesi tonda
la forma del corpus e fra parentesi la forma dell'edizione del 1999. Alcune
correzioni, segnalate con un asterisco, sono state effettuate nel corso
dell'allestimento di questo corpus (fra parentesi la forma delle edizioni).
155,4 (canz.), XXII, 3: no m’aguda (no·m aguda);
16: no m’ausi (no·m ausi); 17 e l’autor (e·l autor)
155,5 (canz.), I, 34: aflebit (afleblit)
155,6 (canz.), XVII 30: qu’el (qu’e·l)
155,8 (canz.), XI, 6: alre no m’ave (al re no·m ave); 8: Per
(per); 25: pel (pe·l)
155,9 (canz.), XV, 22: el (e·l)
*155,10 (canz.), XII, 36: totztemps (totz temps)
155,15 (canz.crociata), XVIII, 44: el (e·l)
*155,17 (canz.), XVI, 10: que.l (qu'el)
155,18 (canz.), III, 47: deia (deja)
155,19 (Busslied), XXVII: 100, 105, 128: el (e·l)
155,26 (alba relig.), XXVII, 3: que m’essenha (que·m essenha);
20: d'espinas (de spinas); 40: ni m’engane (ni·m engane)
*155,21 (canz.), VII, 12: luz (lutz) 155,27 (canz.), X, 57: els
(e·ls)
I brani associati contengono sempre la traduzione italiana, conforme (ma con
poche indispensabili correzioni) all'edizione del 1999, eccetto quella dell'estribot
FqMars 155,25, XXV ricavata dall'editio minor.
La maggior parte dei componimenti presenta anche un apparato di note dove
trovano posto le versioni alternative o, per le poesie con una tradizione di
uno, due o tre testimoni, l'apparato delle varianti sostanziali.
È previsto un ampliamento del corpus con il testo della vida e delle razos,
e con le versioni catalane del Busslied 155,19, XXVII.
2. LEMMATIZZAZIONE E IPERLEMMATIZZAZIONE
La lemmatizzazione del corpus è integrale: tutte le occorrenze (10277 in
totale) di ciascuna forma grafica distinta (2239 in totale) sono state
ricondotte a un lemma. Rinviando alla seconda fase del lavoro una più
dettagliata descrizione del sistema di lemmatizzazione e iperlematizzazione, si
avverte che congiunzioni, preposizioni e pronomi sono stati provvisoriamente
lemmatizzati con la sola etichetta di lemma e un 'punto' come categoria
grammaticale. La scelta si è resa necessaria per rendere disponibile un corpus
integralmente lemmatizzato per la presentazione al convegno SIFR.
Anche l'iperlemmatizzazione ha una mera funzione dimostrativa, ed è limitata a
due iperlemmi di primo livello, PERSONALI (che raccoglie i pronomi personali) e
POSSESSIVI (che raccoglie i pronomi possessivi). È previsto un ampliamento
degli iperlemmi di tipo grammaticale e l'individuazione di altri iperlemmi (per
es. di tipo tematico), con la conseguente individuazione di iperlemmi di
livello superiore.
[28 settembre 2006]