La classificazione a faccette (o multidimensionale – come suggerisce Claudio Gnoli citando Eugenio Gatto) è un sistema di classificazione dell’informazione elaborato nell’ambito della biblioteconomia come alternativa agli schemi di classificazione enumerativi (classificazione decimale Dewey; classificazione della Library of Congress). Benché riconosciuta come più potente dei sistemi tradizionali, la classificazione a faccette non si è mai imposta come standard in ambito bibliotecario, subendo anzi una sorta di oblio negli ultimi anni. È stato l’avvento dell’architettura dell’informazione per il web a rilanciare questa nozione, intuendone i grandi vantaggi derivanti dalla sua applicazione in ambiente digitale.
La classificazione mediante faccette sfrutta un sistema di attributi (metadati) mutuamente esclusivi rappresentanti ciascuno un aspetto o proprietà persistente dell’oggetto e capaci – nel loro insieme – di descrivere esaustivamente l’oggetto stesso. Tali attributi sono detti faccette (termine introdotto in questa accezione dal biblioteconomista e matematico indiano Ranganathan), e sono contraddistinti da queste peculiarità:
Tali caratteristiche rendono particolarmente efficace l’adozione di
questo sistema in ambienti digitali, per un più veloce ed efficiente
ritrovamento dell’informazione (cf. Wynar, cit. da P. Murray, Faceted
classification of information).
Per fare un esempio concreto, poniamo di dover costruire un catalogo di
vini.
Potremmo allora rappresentare ciascun vino mediante questo set di proprietà
o faccette:
Tali faccette sono mutuamente esclusive l’una rispetto alle altre, vale a dire che fra esse non vi è sovrapposizione semantica (ciò non significa però che un vino può comparire solo in una di esse; anzi, ogni vino è rappresentato dall’insieme delle varie faccette).
Ciascuna faccetta, potrà essere a sua volta suddivisa/scomposta in più topic (o foci, o faccette di secondo livello – la nomenclatura può variare da autore ad autore):
Una bottiglia di Taurasi 1996, risulta descritta da queste coordinate:
C(r), V(agl), P(c), A(96).
Ciò significa che:
Nei sistemi di classificazione tradizionali (detti anche tassonomie
tradizionali o sistemi enumerativi), ogni elemento è
classificato sotto una e una sola categoria. Esso possiede una
corretta e univoca collocazione all’interno di un
unico schema, ampio e gerarchicamente molto profondo, e può essere
ritrovato attraverso un percorso a gradini categoria padre > categoria
figlio. (Giovanni
M. Sacco definisce le tassonomie tradizionali come dei codificatori
di proprietà che, partendo dalla categoria-padre generano via
via categorie-figlie mediante l’aggiunta di nuove proprietà).
Ne sono un esempio il sistema di Linneo, il sistema decimale
Dewey e quello della Library of Congress.
Un sistema di questo tipo è quindi monodimensionale
(il criterio di catalogazione è unico), e molto esteso in verticale
– seppure è possibile cercare al suo interno attraverso più
modalità (comunque limitate: essenzialmente, titolo, soggetto, autore).
Essi costituiscono una sorta di ‘recipienti’ chiusi, disposti
in sequenza, e concepiti in forma di matrioska (sistema di scatole nella
scatole, con forte gerarchizzazione).
Alla verticalità dei sistemi di catalogazione tradizionali (i. e.
eccessiva ramificazione in profondità delle gerarchie), e alla loro
rigidità, la classificazione a faccette contrappone un sistema di
classi (faccette) orizzontale e aperto (laddove ciascuna
faccetta è descrittiva di una proprietà o faccia dell’oggetto).
I principali tratti distintivi di un sistema a faccette sono così
sintetizzabili:
Dati alla mano, le applicazioni basate su sistemi di classificazione a faccette hanno dimostrato di essere molto più veloci da consultare e di garantire più alte percentuali di successo rispetto a quelle più tradizionali. Giovanni M. Sacco (Università di Torino) ha posto sperimentalmente a confronto due sistemi di classificazione, uno basato su tassonomie tradizionali, l’altro su tassonomie dinamiche (faccette): eseguendo una ricerca su un corpus di 114.042 documenti descritti da 1100 concetti (dove ogni documento è classificato in media attraverso 11.19 topics), la media dei risultati è stata
In conclusion, whereas a conventional taxonomy would require the
user to inspect result lists of several hundreds documents, a dynamic
taxonomy requires only one zoom operation to produce an average result
size of 13 to 27 documents
(G. M. Sacco, Conventional
Taxonomies vs. Dynamic Taxonomies, p. 10).
Di seguito alcuni esempi di applicazione al web del metodo della classificazione a faccette.
Inserisco di seguito una rappresentazione di un sistema a faccette, riguardante l’applicazione della classificazione a faccette ai formaggi.
Articolo interessante e chiaro, grazie!
Dubbio: quanto ci mette un catalogatore a classificare un documento con questo metodo?
Ciao!
Alessandra
L'articolo è chiaro ed interessante, così come la classificazione a faccette. Tuttavia temo di non aver colto a pieno dove risieda la novità di questa tassonomia. Mi sembra che la navigazione attraverso molteplici chiavi - ossia la tassonomia dinamica - sia ampiamente utilizzata nel web da quando (e ormai si parla di un po' di anni) si è cominciato a mettere dei db dietro ai siti (meglio ancora se si tratta di veri epropri CMS)...
Scritto da: Francesca il 18.12.03 17:21
sssss
Scritto da: prova il 22.12.03 14:31
-- In risposta a Alessandra Longobardi:
Vero, purtroppo la qualità dell'indicizzazione semantica (a faccette o meno) è proporzionale al tempo che ci si investe. I metodi automatici sono molto più economici, ma i loro limiti sono noti.
-- In risposta a Francesca:
Sì, la ricerca attraverso diverse chiavi di un database è analoga al concetto di faccette illustrato da Luca Rosati. Tuttavia la vera classificazione a faccette non finisce qui, ma comprende criteri per l'ordinamento entro le faccette, per l'ordinamento tra le faccette, per l'ordinamento delle classi principali, per la notazione ecc.: questioni che emergono inevitabilmente non appena il database cresce oltre il centinaio di record. Solo che la teoria della classificazione, sviluppata in ambito bibliotecario ma applicabilissima oggi ai documenti digitali, è un po' complessa per poterla spiegare interamente in un solo articolo: sarebbe quindi interessante proseguire con altri aspetti, come quello di "successione conveniente" che Ranganathan pone alla base della classificazione.
Un saluto.
ma quando si effettua una ricerca che tipo di parametri vengono richiesti? Mi spiego: se cerco in un sito una cosa , in che modo mi vengono presentati i parametri per la ricerca? Devo scegliere fra decine di parametri diversi? Oppure ci pensa un programma a cercarmi le cose giuste con pochi dati richiesti?
grazie ciao
Silvia
"eseguendo una ricerca su un corpus di 114.042 documenti descritti da 1100 concetti (dove ogni documento è classificato in media attraverso 11.19 topics)...". Non ho capito bene l'uso dei termini nell'esempio citato da luca: i "concetti" corrispondono alle faccette e i topics alle diciamo faccette di secondo livello? Se la risposta è si ho la stessa curiosità di Silvia.
mario
Ho trovato l'articolo estremamente interessante, ma l'esempio illustrato nel punto 4.1 mi ha lasciato perplesso. Mi sembrava di aver capito che una Faccetta, potesse essere composta solo da Topic, e che questi non fossero a loro volta scomponibili.
L'albero illustrato nell'esempio, ha invece una profondità di ben 4 livelli.
Il sottoalbero della faccetta "Abbinamenti", ad esempio, induce secondo mè una classificazione di tipo gerarchico, che il sistema a faccette invece dovrebbe permettere di evitare.
Potete chiarirmi il dubbio?
Ciao
Scritto da: luca il 18.11.04 13:11