Ministero dell'Universita' e della Ricerca Scientifica e Tecnologica
Dipartimento Affari Economici

RELAZIONE ANNUALE



3.Rendiconto scientifico delle attivitą presso le sedi partecipanti

     Unità di       Universita' degli Studi di PADOVA
     Responsabile MARISTELLA AGOSTI  
     Quota Cofinanziamento Murst  31.040.000
     Quota Cofinanziamento Ateneo  22.285.000 (RD+RA certificata)
     Fondi complessivi utilizzati il primo anno  7.765.680
     Illustrazione dell'attivita' svolta
L'unita' e' coinvolta nel Tema 2, "Estrazione di informazioni distribuite sul WWW".

L'attivita' del primo anno e' stata caratterizzata da una prima parte di studio
metodologico e da una seconda di progettazione e realizzazione di un prototito.

Lo studio metodologico ha riguardato le tecniche e le problematiche di estrazione di
frammenti con un contenuto informativo omogeneo e una dimensione 'ottimale'. I risultati
dello studio si sono concretizzati in una rassegna. Lo scopo principale dello studio e'
stato quello di trovare metodi per ridurre il 'rumore' rappresentato dalla massa di
informazioni non pertinenti contenute nei documenti di grande dimensione.

Il prototipo progettato ha la struttura di un motore di ricerca costituito, quindi, da un
robot e da un sistema di information retrieval (IR). La funzione del prototipo e' di:

- raccogliere, mediante il robot, frammenti di documenti in formato HTML distribuiti sul
Web,

- indicizzare, mediante il sistema di IR, i frammenti raccolti e organizzare gli indici
secondo la tipologia dei frammenti,

- combinare gli indici relativi ai frammenti di tipo diverso per ottenere, a seconda
delle esigenze, diversi indici relativi ai documenti a seconda delle specifiche
informazioni contenute a cui si vuole dare peso,

- rispondere alle interrogazioni espresse dall'utente finale in forma non-strutturata
presentando in ordine di importanza i documenti Web piu' pertinenti sulla base delle
informazioni contenute negli indici,

- generare automaticamente dei collegamenti ipertestuali tra i documenti recuperati allo
scopo di integrare le funzionalita' di interrogazione con quelle di navigazione.

La fase di costruzione automatica dei collegamenti ipertestuali e' ancora in una fase di
studio e raffinamento, riguardando la Fase 2 del progetto e come specificato nel
programma di ricerca (si veda Descrizione della Fase 2, Tema 2).


La gran parte della strumentazione utilizzata era gia' disponibile all'Unita' della
Universita' degli studi di Padova. Sono stati solo acquisiti alcuni componenti periferici
che hanno migliorato le possibilita' di interazione con la strumentazione presente (un
monitor, un HD, una stampante, unita'"zip").

I prodotti della ricerca sono stati:

T2-R03 M. Melucci, "Approcci per l'estrazione di frammenti o passaggi da documenti di
grandi dimensioni", rapporto tecnico, agosto 1998.

T2-S12 F. Crivellari, M. Melucci, "AWIR: Prototipo di un motore di ricerca per la
raccolta, indicizzazione e recupero di documenti Web sulla base dei loro frammenti",
rapporto tecnico e software, febbraio 1999.

Per quel che riguarda le pubblicazioni relative a questa ricerca:

1 su rivista a diffusione internazionale 3 su atti di conferenze internazionali con
revisione.

Schema riassuntivo dei fondi utilizzati (cifre spese o impegnate)
 
Voce di spesa Cifra spesa o impegnata Descrizione
Materiale inventariabile 1.797.000  Monitor e stampante
Grandi Attrezzature 0.000  
Materiale di consumo 1.113.475  
Spese per calcolo ed elaborazione dati 1.886.525  
Personale a contratto 0.000  
Servizi esterni 0.000  
Missioni 2.796.147  Partecipazione a convegni
Altro 172.533