MURST'99 - Modello B - Visualizza modello

ATZENI	PAOLO
(cognome)	(nome)
Università degli Studi ROMA TRE	Facoltà di INGEGNERIA
(università)	(facoltà)
K05A	Dipartimento di INFORMATICA E AUTOMAZIONE
(settore scient.discipl.)	(Dipartimento/Istituto)

ATZENI

PAOLO

(cognome)

(nome)

Università degli Studi ROMA TRE

Facoltà di INGEGNERIA

(università)

(facoltà)

K05A

Dipartimento di INFORMATICA E AUTOMAZIONE

(settore scient.discipl.)

(Dipartimento/Istituto)

atzeni@dia.uniroma3.it
(E-mail)

atzeni@dia.uniroma3.it

(E-mail)

GRECO	SERGIO
(cognome)	(nome)

GRECO

SERGIO

(cognome)

(nome)

Professore associato	25/11/1955	GRCSRG55S25B790M
(qualifica)	(data di nascita)	(codice di identificazione personale)

Professore associato

25/11/1955

GRCSRG55S25B790M

(qualifica)

(data di nascita)

(codice di identificazione personale)

Università degli Studi della CALABRIA	Facoltà di INGEGNERIA
(università)	(facoltà)
K05A	Dipartimento di ELETTRONICA, INFORMATICA E SISTEMISTICA
(settore scient.discipl.)	(Dipartimento/Istituto)

Università degli Studi della CALABRIA

Facoltà di INGEGNERIA

(università)

(facoltà)

K05A

Dipartimento di ELETTRONICA, INFORMATICA E SISTEMISTICA

(settore scient.discipl.)

(Dipartimento/Istituto)

0984/494751	0984/494713	greco@deis.unical.it
(prefisso e telefono)	(numero fax)	(E-mail)

0984/494751

0984/494713

greco@deis.unical.it

(prefisso e telefono)

(numero fax)

(E-mail)

Nº	Cognome	Nome	Dipart./Istituto	Qualifica	Settore scient.	Mesi uomo
1999	2000

1	GRECO	SERGIO	ELETTRONICA, INFORMATICA E SISTEMISTICA	Prof. associato	K05A	4	4
2	SACCA'	DOMENICO	ECOLOGIA	Prof. ordinario	K05A	4	4

Nº

Cognome

Nome

Dipart./Istituto

Qualifica

Settore
scient.

Mesi
uomo

1999

2000

GRECO

SERGIO

ELETTRONICA, INFORMATICA E SISTEMISTICA

Prof. associato

K05A

SACCA'

DOMENICO

ECOLOGIA

Prof. ordinario

K05A

Nº	Cognome	Nome	Università	Dipart./Istituto	Qualifica	Settore scient.	Mesi uomo
1999	2000

1	BUCCAFURRI	FRANCESCO	REGGIO CALABRIA	INFORMATICA, MATEMATICA, ELETTRONICA E TRASPORTI	Ricercatore	K05A	4	8

Nº

Cognome

Nome

Università

Dipart./Istituto

Qualifica

Settore
scient.

Mesi
uomo

1999

2000

BUCCAFURRI

FRANCESCO

REGGIO CALABRIA

INFORMATICA, MATEMATICA, ELETTRONICA E TRASPORTI

Ricercatore

K05A

Nº	Cognome	Nome	Dipart./Istituto	Anno del titolo	Mesi uomo
1.	X	X	ELETTRONICA, INFORMATICA E SISTEMISTICA	1999	8

Nº

Cognome

Nome

Dipart./Istituto

Anno del titolo

Mesi uomo

ELETTRONICA, INFORMATICA E SISTEMISTICA

1999

Nº	Cognome	Nome	Dipart./Istituto	Anno del titolo	Mesi uomo
1.	BASTA	STEFANO	ELETTRONICA, INFORMATICA E SISTEMISTICA	1997	8
2.	FLESCA	SERGIO	ELETTRONICA, INFORMATICA E SISTEMISTICA	1996	8

Nº

Cognome

Nome

Dipart./Istituto

Anno del titolo

Mesi uomo

BASTA

STEFANO

ELETTRONICA, INFORMATICA E SISTEMISTICA

1997

FLESCA

SERGIO

ELETTRONICA, INFORMATICA E SISTEMISTICA

1996

Nº	Qualifica	Costo previsto	Mesi uomo
1.	laurea in ingegneria	24	12

Nº

Qualifica

Costo previsto

Mesi uomo

laurea in ingegneria

L'unita' e' coinvolta nei temi 2 ( Modellizzazione e Interrogazione di Sorgenti di Dati in Ambiente Web) e 3 (Produzione e Scambio di Sorgenti di Dati in Ambiente Web) del progetto.
L'attività di ricerca sarà quindi concentrata su due linee principali, identificate nel seguito come linea A e linea B, aventi come scopo, rispettivamente, la definizione di un linguaggio per l'interrogazione e la ristrutturazione di dati semistrutturati e la definizione di protocolli efficienti per la trasmissione di grosse moli di dati.
Per quanto riguarda la linea A, recentemente sono stati definiti diversi linguaggi e sistemi per l'interrogazione e la manipolazione di dati semistrutturati, cioè di collezioni di dati che non hanno una struttura rigidamente fissata come, ad esempio, quelli disponibili sul Web (Abiteboul, 1997). Tali linguaggi sono, nella maggior parte dei casi, estensioni di SQL (Abiteboul et al., 1997). Alcuni di questi, detti linguaggi di prima generazione, quali W3QL (Konopnicki, Shmueli, 1995) e WebSQL (Mendelzon et al., 1996) assumono che il Web sia un insieme di documenti connessi tra di loro e ciascun documento contenga un numero fissato di informazioni (URL, Titolo, Testo, ecc.), mentre altri, detti linguaggi di seconda generazione, come ad esempio i linguaggi Lorel (Abiteboul et al., 1997), UnQL (Buneman et al., 1996), Strudel (Fernandez et al., 1998) tentano di rappresentare la struttura interna dei documenti, di solito in formato HTML. Tuttavia, entrambe le classi di linguaggi non sono soddisfacenti a causa della quasi totale mancanza di struttura all'interno dei documenti HTML. Per superare i limiti derivanti dall'uso del linguaggio HTML per la creazione di documenti, recentemente e' stato proposto come nuovo standard XML.
XML e' particolarmente adatto per rappresentare dati semistrutturati in quanto i documenti sono costituiti da aggregazioni di unità indipendenti, chiamate entità, che contengono l'informazione. Inoltre, XML supporta la possibilità di definire tipi di documento (DTD) che specificano la struttura. L'introduzione di XML ha portato alla definizione di nuovi linguaggi basati sull'utilizzo di modelli più fortemente tipati che hanno permesso di applicare risultati e tecniche precedentemente definite per le basi di dati orientate agli oggetti. Molti dei modelli proposti sono basati sull'utilizzo di diversi tipi unione per il trattamento delle irregolarità all'interno dei dati semistrutturati. Alcuni dei linguaggi e sistemi implementati per la gestione di dati semistrutturati sono stati, recentemente, estesi per la gestione di documenti XML.
Una seconda limitazione e' costituita dal fatto che tali linguaggi non permettono il controllo della ricerca in un fissato spazio. Infatti, la maggior parte dei linguaggi proposti fa uso di espressioni regolari per specificare lo spazio di ricerca ma non permette di specificare come esplorare tale spazio per cercare un numero limitato di soluzioni. Per superare tali limitazioni e' stato proposto un linguaggio basato sull'uso di espressioni regolari estese che permettono di definire dinamicamente priorità tra i diversi cammini utilizzati nell'esplorazione di documenti presenti nel Web. Tale linguaggio appartiene alla classe dei linguaggi della prima generazione in quanto assume che i documenti abbiano una struttura 'piatta' (Flesca, Greco, 1999).
Un ulteriore limite di tali linguaggi è dato dall'impossibilità di esprimere interrogazioni di documenti sulla base di una 'distanza' da documenti dati, espressa dinamicamente all'interno delle interrogazioni. Infatti, sebbene alcuni sistemi come, ad esempio, Lore, permettono di esprimere interrogazioni sulla base della distanza tra documenti, la metrica usata per calcolare tale distanza è fissata, non permette di poter definire tali criteri dinamicamente all'interno delle interrogazioni. Ad esempio, si consideri un insieme di documenti contenenti informazioni su città aventi al loro interno collegamenti a documenti di regioni e nazioni. Una interrogazione del tipo "trova le città capoluogo di provincia 'più vicine' alle città Assisi e Orvieto" restituirebbe l'insieme delle città italiane con la stessa distanza dall'insieme di partenza.
Per quanto riguarda la trasmissione di grosse moli di dati semistrutturati(linea B), non sono state fin qui studiate tecniche specializzate particolarmente efficienti per il trattamento di gerarchie di priorità. I protocolli attuali riguardano essenzialmente la trasmissione di immagini video in forma digitale. MPEG (Le Gall, 1991) è uno standard diffusissimo che permette una elevata compressione attraverso l'invio dei dati completi solo per alcune immagini (quadri di tipo I) mentre per le altre vengono inviati solo quei dati che permettono la loro ricostruzione (quadri P) o interpolazione (quadri B). Dato che i quadri I sono necessari per determinare gli altri tipi di quadri, essi hanno la priorità massima; una priorità più bassa è mantenuta dai quadri P e quelli B hanno una priorità ancora più bassa. Lo standard MPEG tuttavia non indica come trasmettere un messaggio in modo che le porzioni a più elevata priorità siano recuperate per prima. Una soluzione interessante è stata fornita in (Shacham, 1992) che partiziona il messaggio in vari livelli secondo le priorità e invia solo quei livelli che il destinatario è in grado di ricevere sulla base della banda trasmissiva disponibile. Recentemente è stato proposto un protocollo per la gestione delle priorità , il PET (Albanese e Luby, 1996), che invia sempre tutti i livelli ma l'eventuale perdita di pacchetti a causa dell'insufficienza della banda comporterà la perdita dei soli dati a priorità più bassa. L'idea centrale del PET è che ogni pacchetto debba contenere dati per tutta una sequenza di quadri con un peso diverso a secondo della priorità dei quadri. Supponiamo che si vogliano trasmettere i dati a1, b1, a2, b2, a3, b3 tali che a1 e b1 abbiano priorità maggiore di a2 e b2 e questi a loro volta abbiano priorità maggiore degli ultimi due. Il codice PET costruisce i seguenti tre polinomi:
P1(X)= a1 + b1 X
P2(X)= a21 + a22 X + b21 X2 + b22 X3
P3(X)= a31 + a32 X + a33 X2 + b31 X3 + b32 X4 + b33 X5
dove a2= a21*a22, b2= b21*b22, a3= a31*a32*a33, b3= b31*b32*b33, '*' è l'operatore di concatenazione per cui i valori di P2 e P3 richiedono la metà e un terzo rispettivamente dello spazio di memorizzazione dei valori di P1. Il PET invia i seguenti pacchetti:
0, P1(0), P2(0), P3(0)
1, P1(1), P2(1), P3(1)
2, P1(2), P2(2), P3(2)
3, P1(3), P2(3), P3(3)
4, P1(4), P2(4), P3(4)
5, P1(5), P2(5), P3(5)
cosicché i valori a1 e b1 sono calcolati non appena siano stati ricevuti due qualsiasi pacchetti, a2 e b2 non appena siano stati ricevuti quattro qualsiasi pacchetti e a3 e b3 non appena siano stati ricevuti tutti e sei i pacchetti.
Nell'ultimo anno è stata avviata dall'unità in collaborazione con l'istituto di ricerca ICSI dell'Università di Berkeley una linea di ricerca per estendere il codice MPEG e quello PET al trasferimento di dati semistrutturati in modo che l'interruzione del trasferimento di pacchetti non comporta perdere tutte le informazioni ma soltanto quelle a priorità più bassa che saranno eventualmente recuperate con la trasmissione successiva dei pacchetti mancanti.

L'unita' e' coinvolta nei temi 2 ( Modellizzazione e Interrogazione di Sorgenti di Dati in Ambiente Web) e 3 (Produzione e Scambio di Sorgenti di Dati in Ambiente Web) del progetto.
La ricerca sarà quindi sviluppata secondo due linee fondamentali:
A. La definizione di un linguaggio per l'interrogazione e la ristrutturazione di dati semistrutturati basato sull'uso di espressioni regolari estese per esplorare efficientemente collezioni di documenti distribuiti su vari siti WEB - tale linea ricade all'interno del Tema 2 "Modellizzazione e Interrogazione di Sorgenti di Dati in Ambiente WEB";
B. La estensione di recenti protocolli efficienti per la trasmissione di immagini con priorità al caso di grosse moli di dati semistrutturati definiti in XML che debbono essere ricevuti in tempi stretti anche a costo di eventualmente trascurare alcune porzioni di dati di minor rilievo; il protocollo deve permettere di inviare i dati in base alla loro priorità e di poter riprendere la trasmissione in sessioni successive senza dover rispedire tutti i dati già trasmessi - tale linea ricade all'interno del Tema 3 "Produzione e Scambio di Sorgenti di Dati in Ambiente WEB".
Il programma di ricerca della linea A prevede la definizione e la sperimentazione di un linguaggio per l'interrogazione di documenti semistrutturati (ad esempio documenti XML) e la creazione automatica di nuovi documenti a partire da documenti esistenti (ristrutturazione di documenti). Per tale scopo e' necessario definire un modello di dati che permetta di descrivere dati semistrutturati di diversa natura quali, ad esempio, i documenti XML. In particolare, il modello di riferimento e' un modello orientato agli oggetti complessi in cui ciascuna risorsa di dati e' vista come un oggetto, opportunamente identificato (dal suo URL o URI), e con una serie di attributi. Per la costruzione dei tipi, il modello prevede, tra l'altro, primitive per rappresentare insiemi di tipi di base, link di diverso tipo, tuple, collezioni e tipi unione.
Un insieme di dati descritti attraverso il modello introdotto, può essere rappresentato mediante un grafo (database graph) che potrà essere interrogato attraverso un linguaggio appositamente progettato. Il linguaggio sarà basato sull'uso di espressioni regolari estese, per esprimere un ordinamento parziale sulle stringhe che definiscono cammini nel grafo, mentre la semantica formale potrà essere definita in termini di graph grammars. Un secondo aspetto del linguaggio sarà costituito dalla possibilità di esprimere relazioni di "vicinanza" tra documenti. In particolare, il linguaggio dovrà permettere la ricerca di documenti rilevanti secondo una metrica stabilita dall'utente quale ad esempio la "distanza" (numero di link) da un insieme di documenti dati. Inoltre, il criterio di distanza dovrà essere definibile dinamicamente nella interrogazione. L'insieme dei documenti appartenenti al risultato di una interrogazione potrà essere (parzialmente) ordinato sulla base della loro rilevanza rispetto ai criteri introdotti nell'interrogazione.
Il programma della linea B di ricerca riguarda la trasmissione di grosse mole di dati semistrutturati, definiti in XML su siti WEB , a seguito di interrogazioni o apposite transazioni di scambio di dati. Molte applicazioni WEB gestiscono grandi moli di informazioni organizzate su vari livelli di aggregazione e/o di astrazione e memorizzate in basi di dati di notevoli dimensioni per cui il trasferimento di dati può diventare estremamente oneroso in termini di occupazione di banda oltre che dispersivo in quanto si costringe l'utente a ricevere dettagli che spesso non sono necessari e solo appesantiscono la lettura dell'informazione rilevante. La recente introduzione di XML e una adeguata combinazione della sua potenzialità di rappresentare dati semistrutturati con la tecnologia delle basi di dati costituisce una notevole opportunità per la realizzazione di applicazioni WEB in cui sia chiara e di facile e flessibile consultazione sia la struttura dell'informazione di interesse sia le varie istanze dei dati opportunamente organizzate a vari livelli di aggregazione e/o di astrazione. La possibilità di definire livelli di aggregazione e astrazione tramite XML è particolarmente efficace nel caso in cui i dati gestiti siano di tipo multi-dimensionale, cioè di relazioni in cui gli attributi sono di due tipi: (i) le dimensioni che descrivono le proprietà di un oggetto, e (ii) le misure che memorizzano valori. Ad esempio, nella relazione multi-dimensionale VENDITE (Prodotto, Cliente, DataVendita, QuantitàVenduta, Introito) i primi tre attributi sono le dimensioni mentre gli ultimi due sono misure. Le vendite possono essere aggregate attraverso il calcolo delle somme delle quantità vendute e degli introiti per opportuni gruppi di vendite (ad esempio per prefissate classi di prodotti, categorie di clienti e intervalli di tempo) ottenendo così varie modalità possibili di presentazione dei dati. Evidentemente i dati a livelli di aggregazione maggiore saranno quelli con più alta priorità in modo che possano essere scambiati velocemente e comunque prima del trasferimento dei dati di dettaglio che può addirittura essere annullata se l'informazione aggregata è sufficiente o rinviata a sessioni successive.
Come risultato finale della linea B di ricerca verrà realizzato un prototipo di un sistema per l'assegnazione delle priorità alle varie possibili aggregazioni dei dati in una applicazione WEB e per la trasmissione dei dati tramite un protocollo che estenda il PET e lo specializzi al caso di dati semistrutturati in modo da gestire le priorità. Una proprietà importante del protocollo sarà che l'interruzione del trasferimento di pacchetti (operazione drastica spesso frequente in presenza di congestioni della rete) non comporterà perdere tutte le informazioni ma soltanto quelle a priorità più bassa che potranno essere eventualmente completate con la trasmissione successiva dei pacchetti mancanti.
Le attività del progetto saranno articolate in 4 fasi, ciascuna della durata di 6 mesi. Ciascuna fase consiste di 2 attività distinte che fanno riferimento alle due linee del progetto.
FASE 1-A:
Verranno analizzati i linguaggi per l'interrogazione di dati semistrutturati quali, ad esempio, Lorel (università di Stanford), ed StruQL (AT&T labs). In questa fase verranno altresì analizzati i linguaggi per l'interrogazione di Basi di dati rappresentabili mediante grafi ("Graph Databases") e verrà definito, insieme alle altre unità, il modello dei dati di riferimento.
PRODOTTI:
T2.1-R1 (in collaborazione con le altre unità): rapporto con la definizione del modello dei dati di riferimento;
T2.1-R4 : rapporto contenente l'analisi dei linguaggi attuali e la definizione dei requisiti dei linguaggi di interrogazione;
FASE 1-B:
Verranno adattate e estese le tecniche di trasmissione di dati con priorità in modo da specializzarli per il caso di dati semistrutturati definiti in XML e in cui siano stati introdotti vari livelli di astrazione e aggregazione a cui corrispondono priorità differenti.
PRODOTTO:
T3.1-R5: Rapporto sull'utilizzo di tecniche basate su priorità per la trasmissione di dati definiti in XML.
FASE 2-A:
Verrà definito un nuovo linguaggio per l'interrogazione di dati descritti mediante il modello dei dati definito nella Fase 1.
PRODOTTI:
T2.2-R1 (in collaborazione con le altre unità): rapporto con la definizione della sintassi e della semantica di una prima versione del linguaggio di interrogazione per sorgenti XML descritte secondo il modello di riferimento;
T2.2-R4 (in collaborazione con le altre unità): rapporto contenente la definizione dell'architettura del prototipo del linguaggio;
FASE 2-B:
Le tecniche di trasmissione di dati con priorità verranno implementate e incluse come strumenti in una coppia servente-cliente WEB connessi attraverso una rete la cui banda è opportunamente controllabile in modo da valutare il comportamento in varie situazioni di congestione.
PRODOTTO:
T3.2-S7: Primo prototipo del sistema per la trasmissione di dati XML con priorità.
FASE 3-A:
Verrà implementato un prototipo del linguaggio definito nella fase precedente e verrà definita una estensione del linguaggio per la ristrutturazione dei dati.
PRODOTTI:
T2.3-S1 (in collaborazione con le altre unità): prototipo del linguaggio di interrogazione per siti Web
FASE 3-B:
Il prototipo verrà sperimentato in varie situazioni, con varie tipologie di reti e di clienti in modo da avere una validazione approfondita dei limiti e vantaggi delle tecniche proposte in modo da individuare possibili miglioramenti e definire gli scenari di utilizzo ottimale.
PRODOTTO:
T3.3-R5: Rapporto sulla sperimentazione delle tecniche di trasmissione di dati XML con priorita'.
FASE 4-A:
Verrà implementato un prototipo del linguaggio esteso per sperimentare la sua utilità nella soluzione di problemi di interesse pratico.
PRODOTTI:
T2.4-S1 (in collaborazione con le altre unità): secondo prototipo del linguaggio di interrogazione;
T2.4-R2 (in collaborazione con le altre unità): rapporto sulla sperimentazione del prototipo;
T2.4-R4 (in collaborazione con le altre unità): rapporto conclusivo: sviluppi futuri della ricerca e applicabilità dei risultati.
FASE 4-B:
Sulla base delle sperimentazioni della Fase 3, il prototipo sarà revisionato e risottoposto a ulteriori sperimentazioni e valutazioni; saranno anche valutati i possibili sviluppi futuri della ricerca, in particolare la possibilità di applicazioni industriali delle tecniche di trasmissione proposte.
PRODOTTI:
T3.4-S5: Revisione del prototipo del sistema per la trasmissione di dati XML con priorità
T3.4-R5 (in collaborazione con le altre unità): Rapporto conclusivo sul Tema 3: sviluppi futuri della ricerca e applicabilita' dei risultati.

The team of the University of Calabria is involved in the Themes 2 (Modeling and querying data sources in a WEB environment) and 3 (Production and exchange of data sources in a WEB environment).
Thus, the research will be carried out along two main lines:
(1) The definition of a language for querying and restructuring semistructured data, based on regular expressions suitably extended to enable efficient navigations through documents distributed on various WEB sites - this line is part of the Topic 2 "Modeling and querying data sources in a WEB environment";
(2) The extension of recent efficient protocols for image transmission based on priorities to the case of very large pieces of semistructured XML data which must be received within very restricted time limits, possibly by discarding less relevant data; the protocol therefore transmits data according to their priorities and is able to recovery loss data in subsequent sessions without having to retransmit all data - this line is part of the Topic 3 "Production and exchange of data sources in a WEB environment".
The research of line A is based on the definition and the experimentation of a language for querying and restructuring semistructured data such as XML documents. A data model to describe different types of semistructured data will be first defined. In particular, the new data model is an object-oriented data model where each data source is an object having an identifier (URL or URI) and a set of attributes. In order to define new data types, the data model provides, among others, primitives to represent sets of base types, links of different types, collections and union types.
A set of data described by means of the new data model, can be also represented by means of a (database) graph which could be queried by means of a language designed for graph databases. The language will be based on the use regular expressions extended to express a partial order among the strings corresponding to paths in the graph; the formal semantics could be defined in terms of graph grammars.
A further characteristic of the language will be the possibility to express proximity relations among documents. In particular, the language should permit to search documents on the base of criteria defined by the user, such as the minimal distance (number of links) from a given set of nodes.
Further, the criteria should be definable dynamically in the query. The set of documents computed by a query should be partially ordered on the base of their relevance with respect to the criteria introduced in the query.
The program of the research line B concerns the transmission of large semistructured data sets, defined in XML on WEB sites, which are the results of queries or ad-hoc transactions for data exchange. Many WEB applications manage large pieces of information, organized on various layers of aggregations and/or abstractions and stored in large databases so that data transmission may result very costly in terms of band consumption as well as quite dispersive for it may oblige the user to collect details which are not necessary and, besides, hide the relevant information. The recent introduction of XML and the combinition of it expressive power for semistructured data definition with the database technology represents a remarkable opportunity for the implementation of WEB applications with clear and flexible data structures and suitable organizations of data at various levels of aggregations and/or abbstractions. The possibility of using XML to define such levels is particularly effective when the data are multi-dimensional, thus they are stored in relations with two types of attributes: (i) the dimensions describing the properties of an object, and (ii) the measures for storing values. For instance, given the multi-dimensional relation SALES (Product, Customer, DateOfSale, Quantity, Takings), the first three attributes are the dimensions and the last two are the measures. The sales can be aggregated by summing the quantities or the takings for suitable groups of sales (e.g., for given product classes, customer categories, and time periods) thus obtaining several possible data presentation layouts . Obviously, the data at the higher layers of aggregations will have higher priorities so that they can be exchanged very quickly and definitely before transmitting detail data. The latter transmission can be posponed to next sessions or even cancelled if aggregata data turn out to carry the wanted information.
The final result of the research line B will be a prototype of a system for assigning priorities to data of a WEB application according to their level of aggregation/abstraction and for transmitting such data by means of a protocol extending PET to wotk with semistructured data with priorities. An important property of the protocol will be that a possible interruption in the transmission (a situation which often arises in congested networks) will not cause to loose all data but only with lower priorities. Lost data can be eventually recovered with a later transmissions of the missing packets.
The activities of the research will be organized into 4 phases, each one of 6-month duration:
PHASE 1-A
Query languages for semistructured data, such as , Lorel (università di Stanford), ed StruQL (AT&T labs) and for graph databases will be analyzed. In this phase will be also defined the new data model to describe semistructured data.
PRODUCT:
T2.1-R1 (in cooperation with the other project teams): report containing the definition of data model used to represent semistructured data;
T2.1-R4 : report analyzing languages actually available and defining the requirements for the new query language;
PHASE 1-B
Techniques for the transmission of data with priorities will be extended in order to handle semistructured data defined in XML, organized in various layers of aggregations/abstractions: such layers will correspond to various levels of priorities.
PRODUCT:
T3.1-R5: Report on the usage of techniques for the transmission of XML data with priorities.
PHASE 2-A
A new language for querying semistructured data described by means of the model introduced in the previous phase will be defined.
PRODUCT:
T2.2-R1 (in cooperation with the other project teams): report on the definition of the syntax and semantics of a first version of the language for XML data described using the reference model;
T2.2-R4 (in cooperation with the other project teams): report on the architecture of a prototype of the language.
PHASE 2-B:
Techniques for the transmission of data with priorities will be implemented and added as tools in a pair WEB server-client, connected through a network whose band can be suitably tuned so that performances can be evaluated under varios scenarios of congestion.
PRODUCT:
T3.2-S7: First prototype of the system for the transmission of XML data with priorities.
PHASE 3-A
A prototype of the language defined in the previous phase will be implemented. Furthermore, in this phase will be defined an extension of the language for data restructuring.
PRODUCT:
T2.3-S1 (in cooperation with the other project teams): prototype of the language for querying semistructured data on the Web;
PHASE 3-B:
The prototype will be experimented in various situations, with different schemes of networks e classes of users in order to obtain a thorough validation of the ins and outs of the proposed techniques; as a results, possible improvements of the techniques as well as scenarios of optimal utilizations will be singled out.
PRODUCT:
T3.3-R5: Report on the experimentation of the techniques of the transmission of XML data with priorities.
PHASE 4-A
A prototype of the extended language will be implemented and experimented in the solution of practical problems.
PRODUCT:
T2.4-S1 (in cooperation with the other project teams): second prototype of the query language;
T2.4-R2 (in cooperation with the other project teams): report on the experimentation on the use of the query language;
T2.4-R4 (in cooperation with the other project teams): Final report on Theme 2: further research and result exploitation..
PHASE 4-B:
Following the sperimentations of Phase 3, the prototype will be revisioned and further evaluated; moreover, future possible evolutions of the research will be analyzed and the exploitation of the results towards industrial application will be investigated.
PRODUCTS:
T3.4-S5: Revision of the prototype for the transmission of XML data with priorities.
T3.4-R5 (in cooperations with the other project teams): Final report on the Theme 3: further research and result exploitation.

Nº	Anno di acquisizione	Descrizione
Testo italiano	Testo inglese
1.	1998	PC-Server CPU Intel Pentium II, SO Windows NT	PC-Server, CPU Intel Pentium II, Windows NT OS
2.	1998	PC con CPU Intel Pentium 200, SO Windows 95	PC, CPU Intel Pentium 200, Windows 95 OS
3.	1998	PC con CPU Intel Pentium 200, SO Windows 95	PC, CPU Intel Pentium 200, Windows 95 OS
4.	1998	PC con CPU Intel Pentium 200, SO Windows 95	PC, CPU Intel Pentium 200, Windows 95 OS
5.	1992	WS Sun Sparc 10, SO Solaris 2.5	Sun Sparc 10, Solaris 2.5 OS

Nº

Anno di acquisizione

Descrizione

Testo italiano

Testo inglese

1998

PC-Server CPU Intel Pentium II, SO Windows NT

PC-Server, CPU Intel Pentium II, Windows NT OS

1998

PC con CPU Intel Pentium 200, SO Windows 95

PC, CPU Intel Pentium 200, Windows 95 OS

1998

PC con CPU Intel Pentium 200, SO Windows 95

PC, CPU Intel Pentium 200, Windows 95 OS

1998

PC con CPU Intel Pentium 200, SO Windows 95

PC, CPU Intel Pentium 200, Windows 95 OS

1992

WS Sun Sparc 10, SO Solaris 2.5

Sun Sparc 10, Solaris 2.5 OS

Voce di spesa	Spesa	Descrizione
M£	Euro	Testo italiano	Testo inglese
Materiale inventariabile	25	12.911	Personal computers, stampanti	Workstations, printers
Grandi Attrezzature
Materiale di consumo e funzionamento	5	2.582	Materiale di cancelleria, carta per stampante, toner	Stationery, printer paper, toner
Spese per calcolo ed elaborazione dati
Personale a contratto	24	12.395	Collaboratore per lo sviluppo dei prototipi previsti dal progetto	Specialist to be involved in the implementation of software prototypes
Servizi esterni
Missioni	66	34.086	Missioni del personale impegnato nel progetto in Italia e all'estero	Travelling and living expenses of personnel involver in the project
Altro

Voce di spesa

Spesa

Descrizione

M£

Euro

Testo italiano

Testo inglese

Materiale inventariabile

12.911

Personal computers, stampanti

Workstations, printers

Grandi Attrezzature

Materiale di consumo e funzionamento

2.582

Materiale di cancelleria, carta per stampante, toner

Stationery, printer paper, toner

Spese per calcolo ed elaborazione dati

Personale a contratto

12.395

Collaboratore per lo sviluppo dei prototipi previsti dal progetto

Specialist to be involved in the implementation of software prototypes

Servizi esterni

Missioni

34.086

Missioni del personale impegnato nel progetto in Italia e all'estero

Travelling and living expenses of personnel involver in the project

Altro

	M£	Euro
Costo complessivo del Programma dell'Unità di Ricerca	120	61.975

Costo minimo per garantire la possibilità di verifica dei risultati	96	49.580

Fondi disponibili (RD)	24	12.395

Fondi acquisibili (RA)	12	6.197

Cofinanziamento richiesto al MURST	84	43.382

M£

Euro

Costo complessivo del Programma dell'Unità di Ricerca

120

61.975

Costo minimo per garantire la possibilità di verifica dei risultati

49.580

Fondi disponibili (RD)

12.395

Fondi acquisibili (RA)

6.197

Cofinanziamento richiesto al MURST

43.382

Provenienza

Anno

Importo disponibile

nome Resp. Naz.

Note

M£

Euro

Università

1998

6.714

Dipartimento

MURST (ex 40%)

CNR

Unione Europea

1998

5.681

progetto Contact, programma Adapt-bis, resp. S. Greco

Altro

TOTAL

12.395

Provenienza

Anno della domanda o stipula del contratto

Stato di approvazione

Quota disponibile per il programma

Note

M£

Euro

Università

Dipartimento

CNR

Unione Europea

Altro

1999

accettato

6.197

contratto con consorzio TELCAL

TOTAL

6.197