IA INSTITUTE - Italia | Per un accesso multidimensionale all'informazione<br/>O della classificazione a faccette

Benché riconosciuta come più potente dei sistemi tradizionali, la classificazione a faccette non si è mai imposta come standard in ambito bibliotecario, subendo anzi una sorta di oblio negli ultimi anni. È stato l’avvento dell’architettura dell’informazione per il web a rilanciare questa nozione, intuendone i grandi vantaggi derivanti dalla sua applicazione in ambiente digitale.

Luca Rosati

1 agosto 2003

1. INTRODUZIONE

La classificazione a faccette (o multidimensionale – come suggerisce Claudio Gnoli citando Eugenio Gatto) è un sistema di classificazione dell’informazione elaborato nell’ambito della biblioteconomia come alternativa agli schemi di classificazione enumerativi (classificazione decimale Dewey; classificazione della Library of Congress). Benché riconosciuta come più potente dei sistemi tradizionali, la classificazione a faccette non si è mai imposta come standard in ambito bibliotecario, subendo anzi una sorta di oblio negli ultimi anni. È stato l’avvento dell’architettura dell’informazione per il web a rilanciare questa nozione, intuendone i grandi vantaggi derivanti dalla sua applicazione in ambiente digitale.

La classificazione mediante faccette sfrutta un sistema di attributi (metadati) mutuamente esclusivi rappresentanti ciascuno un aspetto o proprietà persistente dell’oggetto e capaci – nel loro insieme – di descrivere esaustivamente l’oggetto stesso. Tali attributi sono detti faccette (termine introdotto in questa accezione dal biblioteconomista e matematico indiano Ranganathan), e sono contraddistinti da queste peculiarità:

sono invariabili dal punto di vista semantico (ad es. la proprietà COLORE di un oggetto può variare in termini di valori che può assumere – giallo, rosso etc. – ma è invariabile come concetto; cioè quell’oggetto avrà sempre un colore)
costituiscono un insieme aperto, per cui è sempre possibile aggiungere nuove faccette a quelle già esistenti
sono utilizzabili come attributi di ricerca sia singolarmente sia in combinazione.

Tali caratteristiche rendono particolarmente efficace l’adozione di questo sistema in ambienti digitali, per un più veloce ed efficiente ritrovamento dell’informazione (cf. Wynar, cit. da P. Murray, Faceted classification of information).

2. FUNZIONAMENTO

Per fare un esempio concreto, poniamo di dover costruire un catalogo di vini.
Potremmo allora rappresentare ciascun vino mediante questo set di proprietà o faccette:

COLORE (C)
VITIGNO (V)
PROVENIENZA (P)
ANNATA (A)
...

Tali faccette sono mutuamente esclusive l’una rispetto alle altre, vale a dire che fra esse non vi è sovrapposizione semantica (ciò non significa però che un vino può comparire solo in una di esse; anzi, ogni vino è rappresentato dall’insieme delle varie faccette).

Ciascuna faccetta, potrà essere a sua volta suddivisa/scomposta in più topic (o foci, o faccette di secondo livello – la nomenclatura può variare da autore ad autore):

COLORE (C)
- rosso (r)
- bianco (b)
- rosato (s)
VITIGNO (V)
- aglianico (agl)
- merlot (mr)
- sangiovese (sg)
- ...
PROVENIENZA (P)
- campania (c)
- piemonte (p)
- sicilia (s)
- ...
ANNATA (A)
- 1961
- ...

Una bottiglia di Taurasi 1996, risulta descritta da queste coordinate: C(r), V(agl), P(c), A(96).
Ciò significa che:

è possibile ricercare questo vino utilizzando una sola delle sue faccette, oppure una combinazione di esse (es. C(r) & V(agl) & P(c))
è possibile in ogni momento implementare nuove faccette di primo livello (ad es. PRODUTTORE, ABBINAMENTI, GRADAZIONE etc.)
è possibile in ogni momento aumentare il numero dei topics o faccette di secondo livello interni a una faccetta di primo livello.

3. CLASSIFICAZIONE A FACCETTE vs CLASSIFICAZIONE TRADIZIONALE

Nei sistemi di classificazione tradizionali (detti anche tassonomie tradizionali o sistemi enumerativi), ogni elemento è classificato sotto una e una sola categoria. Esso possiede una corretta e univoca collocazione all’interno di un unico schema, ampio e gerarchicamente molto profondo, e può essere ritrovato attraverso un percorso a gradini categoria padre > categoria figlio. (Giovanni M. Sacco definisce le tassonomie tradizionali come dei codificatori di proprietà che, partendo dalla categoria-padre generano via via categorie-figlie mediante l’aggiunta di nuove proprietà).
Ne sono un esempio il sistema di Linneo, il sistema decimale Dewey e quello della Library of Congress.
Un sistema di questo tipo è quindi monodimensionale (il criterio di catalogazione è unico), e molto esteso in verticale – seppure è possibile cercare al suo interno attraverso più modalità (comunque limitate: essenzialmente, titolo, soggetto, autore).
Essi costituiscono una sorta di ‘recipienti’ chiusi, disposti in sequenza, e concepiti in forma di matrioska (sistema di scatole nella scatole, con forte gerarchizzazione).

Alla verticalità dei sistemi di catalogazione tradizionali (i. e. eccessiva ramificazione in profondità delle gerarchie), e alla loro rigidità, la classificazione a faccette contrappone un sistema di classi (faccette) orizzontale e aperto (laddove ciascuna faccetta è descrittiva di una proprietà o faccia dell’oggetto).
I principali tratti distintivi di un sistema a faccette sono così sintetizzabili:

pluridimensionalità: inversamente ai sistemi tradizionali, nei sistemi a faccette, ogni oggetto è classificato secondo una pluralità di attributi (detti – appunto – faccette)
persistenza: tali attributi/faccette costituiscono proprietà essenziali e persistenti dell’oggetto; in questo modo l’impatto (sullo schema di classificazione) di eventuali cambiamenti (di nomenclatura, di workflow etc.) è fortemente ridotto o nullo
scalarità: è sempre possibile aggiungere una nuova faccetta descrittiva di un nuovo aspetto dell’oggetto
flessibilità: esiste una pluralità di chiavi di accesso parallele (faccette); ogni oggetto può essere reperito utilizzando una singolo attributo di ricerca (o faccetta) alla volta, oppure più attributi insieme in combinazione.

Dati alla mano, le applicazioni basate su sistemi di classificazione a faccette hanno dimostrato di essere molto più veloci da consultare e di garantire più alte percentuali di successo rispetto a quelle più tradizionali. Giovanni M. Sacco (Università di Torino) ha posto sperimentalmente a confronto due sistemi di classificazione, uno basato su tassonomie tradizionali, l’altro su tassonomie dinamiche (faccette): eseguendo una ricerca su un corpus di 114.042 documenti descritti da 1100 concetti (dove ogni documento è classificato in media attraverso 11.19 topics), la media dei risultati è stata

di 1246.22 documenti con tassonomie tradizionali (in tal caso l’utente deve ispezionare manualmente una tale mole di documenti – nessun utente lo fa)
di 27.68 documenti con tassonomie dinamiche, dopo aver operato un singolo ‘zoom’.

In conclusion, whereas a conventional taxonomy would require the user to inspect result lists of several hundreds documents, a dynamic taxonomy requires only one zoom operation to produce an average result size of 13 to 27 documents
(G. M. Sacco, Conventional Taxonomies vs. Dynamic Taxonomies, p. 10).

4. ESEMPI

Di seguito alcuni esempi di applicazione al web del metodo della classificazione a faccette.

Wine.com
President’s Choice - Recipes
Informe Design (in particolare cf. pagina All categories)
Vino-web.com

4.1. Rappresentazioni (Deliverables)

Inserisco di seguito una rappresentazione di un sistema a faccette, riguardante l’applicazione della classificazione a faccette ai formaggi.

Tipo di latte
- vaccini
- pecorini
- caprini
- bufalini
- misti
Temperatura di lavorazione
- Crudi (temperatura cagliata < 38°C)
- Semicotti (temperatura cagliata fra 38°C e 48°C)
- Cotti (temperatura cagliata > 38°C)
Grado di maturazione
- Freschi
- Stagionati
  - Media stagionatura
  - Lunga stagionatura
Percentuale di grasso
- Grassi (materia grassa > 42%)
- Semigrassi (materia grassa fra 20% e 42%)
- Magri (materia grassa < 20%)
Azione di muffe o batteri
- Erborinati (penicillium glaucum)
- A crosta fiorita (penicillium)
- A crosta lavata (bacterium linens)
Abbinamenti
- Conserve, salse, mieli
  - Cotognate, marronate e sim.
  - Mieli
    - Acacia
    - Arancio
    - Castagno
    - Corbezzolo
    - millefiori
  - Mostarde
    - Cremonese
    - Mantovana
    - vicentina
  - Salse
    - a base di frutta
    - a base di verdura
    - a base di mele o pere
    - a base di miele
- Frutta
  - Albicocca
  - Arancia
  - cachi
  - Ciliegia
  - Fico
  - Frutti di bosco
  - Mela
  - Melone
  - Nespola
  - Pera
  - Pesca
  - Prugna
  - uva
- Frutta secca
  - Mandorle
  - Noci
  - Nocciole
  - Pinoli, pistacchi
- Pasta
  - Corta e media
  - Lunga
  - Risi e risotti
- Polenta
  - Bianca
  - Gialla
  - Integra
  - taragna
- Verdure, legumi, cereali
  - Asparagi
  - Cardo
  - Cavolo
  - Ceci, fagioli, lenticchie
  - Fave
  - Finocchio
  - Insalata
  - Patate
  - Peperoni
  - Pomodori
  - Sedano
  - Spinaci
  - Zucchine
- Vini
  - Giovani
    - Aromatici
    - Secchi
  - Medio corpo
  - Invecchiati
  - Passiti, Muffe nobili
  - Spumanti, champagne
Conservazione
- In frigo
- In luoghi freschi e asciutti

MarcoEstebanCalzolari — 02.08.03 08:32

Commenti

Articolo interessante e chiaro, grazie!
Dubbio: quanto ci mette un catalogatore a classificare un documento con questo metodo?
Ciao!
Alessandra

Scritto da: Alessandra Longobardi il 04.12.03 14:30

L'articolo è chiaro ed interessante, così come la classificazione a faccette. Tuttavia temo di non aver colto a pieno dove risieda la novità di questa tassonomia. Mi sembra che la navigazione attraverso molteplici chiavi - ossia la tassonomia dinamica - sia ampiamente utilizzata nel web da quando (e ormai si parla di un po' di anni) si è cominciato a mettere dei db dietro ai siti (meglio ancora se si tratta di veri epropri CMS)...

Scritto da: Francesca il 18.12.03 17:21

sssss

Scritto da: prova il 22.12.03 14:31

-- In risposta a Alessandra Longobardi:
Vero, purtroppo la qualità dell'indicizzazione semantica (a faccette o meno) è proporzionale al tempo che ci si investe. I metodi automatici sono molto più economici, ma i loro limiti sono noti.

-- In risposta a Francesca:
Sì, la ricerca attraverso diverse chiavi di un database è analoga al concetto di faccette illustrato da Luca Rosati. Tuttavia la vera classificazione a faccette non finisce qui, ma comprende criteri per l'ordinamento entro le faccette, per l'ordinamento tra le faccette, per l'ordinamento delle classi principali, per la notazione ecc.: questioni che emergono inevitabilmente non appena il database cresce oltre il centinaio di record. Solo che la teoria della classificazione, sviluppata in ambito bibliotecario ma applicabilissima oggi ai documenti digitali, è un po' complessa per poterla spiegare interamente in un solo articolo: sarebbe quindi interessante proseguire con altri aspetti, come quello di "successione conveniente" che Ranganathan pone alla base della classificazione.

Un saluto.

Scritto da: Claudio Gnoli il 21.01.04 09:22

ma quando si effettua una ricerca che tipo di parametri vengono richiesti? Mi spiego: se cerco in un sito una cosa , in che modo mi vengono presentati i parametri per la ricerca? Devo scegliere fra decine di parametri diversi? Oppure ci pensa un programma a cercarmi le cose giuste con pochi dati richiesti?

grazie ciao
Silvia

Scritto da: Silvia il 22.04.04 09:38

"eseguendo una ricerca su un corpus di 114.042 documenti descritti da 1100 concetti (dove ogni documento è classificato in media attraverso 11.19 topics)...". Non ho capito bene l'uso dei termini nell'esempio citato da luca: i "concetti" corrispondono alle faccette e i topics alle diciamo faccette di secondo livello? Se la risposta è si ho la stessa curiosità di Silvia.
mario

Scritto da: mario il 04.05.04 16:30

Ho trovato l'articolo estremamente interessante, ma l'esempio illustrato nel punto 4.1 mi ha lasciato perplesso. Mi sembrava di aver capito che una Faccetta, potesse essere composta solo da Topic, e che questi non fossero a loro volta scomponibili.
L'albero illustrato nell'esempio, ha invece una profondità di ben 4 livelli.
Il sottoalbero della faccetta "Abbinamenti", ad esempio, induce secondo mè una classificazione di tipo gerarchico, che il sistema a faccette invece dovrebbe permettere di evitare.
Potete chiarirmi il dubbio?

Ciao

Scritto da: luca il 18.11.04 13:11

News Recenti

Per un accesso multidimensionale all'informazione
O della classificazione a faccette

1. INTRODUZIONE

2. FUNZIONAMENTO

3. CLASSIFICAZIONE A FACCETTE vs CLASSIFICAZIONE TRADIZIONALE

4. ESEMPI

4.1. Rappresentazioni (Deliverables)

Commenti

Scrivi un commento

News Recenti

Per un accesso multidimensionale all'informazioneO della classificazione a faccette

1. INTRODUZIONE

2. FUNZIONAMENTO

3. CLASSIFICAZIONE A FACCETTE vs CLASSIFICAZIONE TRADIZIONALE

4. ESEMPI

4.1. Rappresentazioni (Deliverables)

Commenti

Scrivi un commento

Per un accesso multidimensionale all'informazione
O della classificazione a faccette