Coordinatore | PAOLO ATZENI | |
Titolo della Ricerca | DATA-X: GESTIONE, TRASFORMAZIONE E SCAMBIO DI DATI IN AMBIENTE WEB | |
Finanziamento assegnato | M£ 530 , Euro 273722,157 | |
Rd+Ra | M£ 261 , Euro 134795,251 (dichiarata) | |
Durata | 24 mesi | |
Obiettivo della Ricerca |
La recente introduzione di XML (eXtensible Markup Language), lo standard per la descrizione e la formattazione delle informazioni proposto dal Consorzio W3, e' destinata a far crescere l'importanza del Web come piattaforma essenziale per l'accesso a sistemi informativi di ogni tipo. A fronte, pero', di uno sviluppo rapidissimo del mercato legato al Web, dovuto essenzialmente alle opportunita' commerciali che esso offre, non si e' ancora verificata un'altrettanto veloce maturazione delle metodologie e delle tecniche per la gestione dei dati in questo contesto: questo sviluppo "a due velocita'" -velocissimo della domanda di soluzioni, piu' lento per quanto riguarda l'approfondimento delle tecniche e delle metodologie -rischia di pregiudicare la grande opportunita' tecnologica che il Web rappresenta.
Poiche' e' previsto lo sviluppo di strumenti software prototipali, che dovranno essere sperimentati, una specifica attivita' trasversale, cui concorreranno tutte le unita', sara' volta ad individuare applicazioni specifiche su cui sperimentare le metodologie e gli strumenti, fermo restando l'obiettivo di considerare la generalita' dei sistemi informativi su Web come riferimento complessivo. |
Innovazione rispetto allo stato dell'arte nel campo |
I principali contributi innovativi sono illustrati nel seguito tema per tema.
Una volta che i dati siano stati analizzati e classificati secondo le tecniche sviluppate nel tema precedente, l'obiettivo e' quello di sviluppare tecniche che consentano di manipolare efficacemente le informazioni. Come punto di partenza per lo studio della modellazione e dell'interrogazione di sorgenti di dati in ambiente Web, le unita' coinvolte hanno individuato un modello di dati di riferimento (vedi la voce "Base di Partenza Scientifica" relativa al Tema 2 per una descrizione piu' accurata del modello). Sulla base del modello, la ricerca affrontera':
TEMA 3: Produzione e Scambio di Sorgenti di Dati in Ambiente Web; Il processo di trasformazione dei dati analizzati e interrogati secondo le tecniche sviluppate nei due temi precedenti si conclude con la produzione di nuove sorgenti, a cui e' dedicato il Tema 3. Tali sorgenti possono essere siti orientati alla navigazione da parte degli utenti, oppure collezioni di dati destinati allo scambio tra applicazioni interoperanti. Per quanto riguarda lo sviluppo di siti, le unita' coinvolte hanno individuato un contesto metodologico di riferimento per il progetto e la creazione di siti Web (vedi la voce "Base di Partenza Scientifica" relativa al Tema 3 per una descrizione piu' accurata). Questo contesto di riferimento rappresentera' la base di partenza per la ricerca, che riguardera':
Infine, per quanto riguarda lo scambio di sorgenti di dati, l'enfasi sara' sulla definizione di protocolli basati su XML, e sulla loro ottimizzazione ai fini di applicazioni di scambio. |
Criteri di verificabilità |
1) I risultati attesi del progetto sono di natura scientifico-metodologica ("avanzamento delle conoscenze", descritti in rapporti tecnici e successivamente in pubblicazioni) e realizzativa (sviluppo di prototipi). Per ciascuna fase sono state indicate le attivita' previste per ciascuno dei temi su cui il progetto e' articolato e i relativi prodotti. I prodotti previsti sono elencati analiticamente nella proposta e per ciascuno e' indicata l'unita' o le unita' che parteciperanno al confezionamento. Le metodologie e i prodotti saranno sperimentati con riferimento ad applicazioni reali, sufficientemente generali ed appositamente individuate. Pertanto, la valutazione potra' essere fatta esaminando (per esempio con il contributo di revisori specializzati, probabilmente internazionali) la qualita' dei rapporti tecnici redatti e dei prototipi realizzati. |
2) |
3) |
4) |
Unità di Ricerca
1] Unità di Universita' degli Studi ROMA TRE | Responsabile Paolo ATZENI |
Rd+Ra M£ 54 , Euro 27888,673 (dichiarata) |
Finanziamento M£ 115 , Euro 59392,543 |
Compito |
Per quanto riguarda il Tema 1, l'obiettivo principale e' quello di studiare strumenti per il riconoscimento di struttura all'interno di documenti Web. Poiche' XML e' parzialmente tipato (i DTD possono esistere o meno, i link non sono tipati), importanti informazioni strutturali che la sorgente dati XML puo' presentare possono non essere esplicitamente descritte (ad esempio il fatto che un certo link, di una certa classe di documenti porta ad una istanza di un certo tipo). E' importante quindi sviluppare strumenti che, sulla base di un'analisi sintattica della sorgente dati, siano in grado di ricostruirne la struttura in maniera dettagliata. Inoltre, e' importante estendere le stesse tecniche anche alle sorgenti dati Web non-XML, per esempio ai milioni di pagine HTML che sono tuttora disponibili su Web (come anche ai dati in altri formati testuali); gli algoritmi e le tecniche sviluppate per XML verranno quindi estese al caso piu' generale - e molto piu' difficile - di HTML.
|
2] Unità di Politecnico di MILANO | Responsabile Letizia TANCA |
Rd+Ra M£ 72 , Euro 37184,897 (dichiarata) |
Finanziamento M£ 148 , Euro 76435,621 |
Compito |
TEMA 2: MODELLIZZAZIONE E INTERROGAZIONE DI SORGENTI DI DATI IN AMBIENTE WEB: I moderni sistemi informativi basati sulle reti devono spesso gestire dati organizzati in documenti con struttura meno rigida e regolare di quella richiesta dalle basi di dati; tali dati si dicono semistrutturati. Per interagire in modo efficace con questo tipo di fonti informative occorrono modelli dei dati che tengano conto delle speciali necessita' dell'attivita' di gestione di documenti.
|
3] Unità di Universita' degli Studi di VENEZIA | Responsabile Augusto CELENTANO |
Rd+Ra M£ 27 , Euro 13944,336 (dichiarata) |
Finanziamento M£ 54 , Euro 27888,673 |
Compito |
L'unita', coinvolta nel Tema 3 del Progetto, intende studiare la possibilita' di utilizzare XML come linguaggio per definire protocolli di interscambio dati tra sorgenti e applicazioni, considerando in particolare i punti di seguito dettagliati.
|
4] Unità di Universita' degli Studi di BRESCIA | Responsabile Valeria DE ANTONELLIS |
Rd+Ra M£ 21 , Euro 10845,595 (dichiarata) |
Finanziamento M£ 40 , Euro 20658,276 |
Compito |
Obiettivo della ricerca dell'unita' dell'Universita' di Brescia e' lo sviluppo di un ambiente di strumenti di tipo semi-automatico per l'indicizzazione, la classificazione e integrazione di sorgenti di dati e siti XML in ambiente Web. Tale ambiente intende fornire supporto alla creazione di una interfaccia di interrogazione uniforme per la cooperazione di sistemi informativi basati su Web. Un problema cruciale per garantire l'efficacia delle attivita' di cooperazione e scambio dati, riguarda il disegno di meccanismi che consentano di organizzare lo spazio di ricerca dell'informazione in modo ottimale rispetto alle interrogazioni attese. A tale scopo, sono necessarie tecniche sofisticate di indicizzazione delle sorgenti che discriminino termini rilevanti e relativi pesi. Inoltre, sono necessari strumenti per la classificazione di meta-informazioni, ad esempio contenute in DTD, che consentano di raggruppare sorgenti che rispondano di stesse o simili strutture. Particolare rilevanza assumono in tale contesto problematiche di ricerca inerenti la costruzione di ontologie di concetti a supporto della classificazione automatica di documenti rispetto al contenuto informativo. Per gli aspetti di integrazione, a partire dai risultati della attivita' di ricerca svolta nel progetto INTERDATA MURST, saranno proposti metodi e strumenti per riconciliare sorgenti semi-strutturate che contengono documenti XML, e relativi schemi di descrizione, rappresentati mediante DTD.
|
5] Unità di Universita' degli Studi di PISA | Responsabile Giorgio GHELLI |
Rd+Ra M£ 27 , Euro 13944,336 (dichiarata) |
Finanziamento M£ 56 , Euro 28921,586 |
Compito |
L'unità è coinvolta nel tema 2 del progetto (Modellizzazione e Interrogazione di Sorgenti di Dati in Ambiente Web).
|
6] Unità di Politecnico di TORINO | Responsabile Elena Maria BARALIS |
Rd+Ra M£ 24 , Euro 12394,966 (dichiarata) |
Finanziamento M£ 48 , Euro 24789,931 |
Compito |
L'attivita` di questa unita` si colloca all'interno del Tema 1 (Analisi e Classificazione di Sorgenti di Dati in Ambiente Web) del progetto di ricerca Data-X: Gestione, Trasformazione e Scambio di Dati in Ambiente Web.
|
7] Unità di Universita' degli Studi della CALABRIA | Responsabile Sergio GRECO |
Rd+Ra M£ 36 , Euro 18592,448 (dichiarata) |
Finanziamento M£ 69 , Euro 35635,526 |
Compito |
L'attivita di ricerca dell'unita sara sviluppata secondo due linee fondamentali:
|