Corpus Folchetto
CNR-Opera del Vocabolario Italiano
Guida ai contenuti


 


1. IL CORPUS

Il corpus lemmatizzato delle poesie di Folchetto di Marsiglia è nato in funzione della presentazione del programma GattoWeb al VI Convegno della Società Italiana di Filologia Romanza (SIFR) di Padova (27 settembre - 1 ottobre 2006). Comprende i ventisette componimenti del trovatore pubblicati ne Le poesie di Folchetto di Marsiglia. Edizione critica a cura di Paolo Squillacioti, Pisa, Pacini 1999, con le modifiche apportate nell'editio minor Folquet de Marselha, Poesie, a cura di Paolo Squillacioti, Roma, Carocci, 2003. Nell'elenco che segue si indica a sinistra della parentesi tonda la forma del corpus e fra parentesi la forma dell'edizione del 1999. Alcune correzioni, segnalate con un asterisco, sono state effettuate nel corso dell'allestimento di questo corpus (fra parentesi la forma delle edizioni).

155,4 (canz.), XXII, 3: no m’aguda (no·m aguda); 16: no m’ausi (no·m ausi); 17 e l’autor (e·l autor)
155,5 (canz.), I, 34: aflebit (afleblit)
155,6 (canz.), XVII 30: qu’el (qu’e·l)
155,8 (canz.), XI, 6: alre no m’ave (al re no·m ave); 8: Per (per); 25: pel (pe·l)
155,9 (canz.), XV, 22: el (e·l)
*155,10 (canz.), XII, 36: totztemps (totz temps)
155,15 (canz.crociata), XVIII, 44: el (e·l)
*155,17 (canz.), XVI, 10: que.l (qu'el)
155,18 (canz.), III, 47: deia (deja)
155,19 (Busslied), XXVII: 100, 105, 128: el (e·l)
155,26 (alba relig.), XXVII, 3: que m’essenha (que·m essenha); 20: d'espinas (de spinas); 40: ni m’engane (ni·m engane)
*155,21 (canz.), VII, 12: luz (lutz) 155,27 (canz.), X, 57: els (e·ls)

I brani associati contengono sempre la traduzione italiana, conforme (ma con poche indispensabili correzioni) all'edizione del 1999, eccetto quella dell'estribot FqMars 155,25, XXV ricavata dall'editio minor.
La maggior parte dei componimenti presenta anche un apparato di note dove trovano posto le versioni alternative o, per le poesie con una tradizione di uno, due o tre testimoni, l'apparato delle varianti sostanziali.
È previsto un ampliamento del corpus con il testo della vida e delle razos, e con le versioni catalane del Busslied 155,19, XXVII.

2. LEMMATIZZAZIONE E IPERLEMMATIZZAZIONE

La lemmatizzazione del corpus è integrale: tutte le occorrenze (10277 in totale) di ciascuna forma grafica distinta (2239 in totale) sono state ricondotte a un lemma. Rinviando alla seconda fase del lavoro una più dettagliata descrizione del sistema di lemmatizzazione e iperlematizzazione, si avverte che congiunzioni, preposizioni e pronomi sono stati provvisoriamente lemmatizzati con la sola etichetta di lemma e un 'punto' come categoria grammaticale. La scelta si è resa necessaria per rendere disponibile un corpus integralmente lemmatizzato per la presentazione al convegno SIFR.
Anche l'iperlemmatizzazione ha una mera funzione dimostrativa, ed è limitata a due iperlemmi di primo livello, PERSONALI (che raccoglie i pronomi personali) e POSSESSIVI (che raccoglie i pronomi possessivi). È previsto un ampliamento degli iperlemmi di tipo grammaticale e l'individuazione di altri iperlemmi (per es. di tipo tematico), con la conseguente individuazione di iperlemmi di livello superiore.

[28 settembre 2006]