MINISTERO DELL'UNIVERSITÀ E DELLA RICERCA SCIENTIFICA E TE CNOLOGICA
DIPARTIMENTO AFFARI ECONOMICI
PROGRAMMI DI RICERCA SCIENTIFICA DI RILEVANTE INTERESSE NAZIO NALE
RICHIESTA DI COFINANZIAMENTO

(DM n. 811 del 3 dicembre 1998)
PROGETTO DI UNA UNITÀ DI RICERCA - MODELLO B
Anno 1999 - prot. 9909A77532_002


Parte: I
1.1 Programma di Ricerca di tipo: interuniversitario

Area Scientifico Disciplinare: Ingegneria Industriale e dell'informazione (80%)
Area Scientifico Disciplinare: Scienze Matematiche (20%)

1.2 Durata del Programma di Ricerca: 24 mesi

1.3 Titolo del Programma di Ricerca

Testo italiano

Data-X: Gestione, Trasformazione e Scambio di Dati in Ambiente Web

Testo inglese

Data-X: Management, Transformation and Exchange of Data in a Web Environment

1.4 Coordinatore Scientifico del Programma di Ricerca

ATZENI PAOLO  
(cognome) (nome)  
Università degli Studi ROMA TRE Facoltà di INGEGNERIA
(università) (facoltà)
K05A Dipartimento di INFORMATICA E AUTOMAZIONE
(settore scient.discipl.) (Dipartimento/Istituto)


atzeni@dia.uniroma3.it
(E-mail)


1.5 Responsabile Scientifico dell'Unità di Ricerca

TANCA LETIZIA  
(cognome) (nome)  


Professore ordinario 09/05/1955 TNCLTZ55E49H703J
(qualifica) (data di nascita) (codice di identificazione personale)

Politecnico di MILANO Facoltà di INGEGNERIA
(università) (facoltà)
K05A Dipartimento di ELETTRONICA E INFORMAZIONE
(settore scient.discipl.) (Dipartimento/Istituto)


02/23993531 02/23993411 tanca@elet.polimi.it
(prefisso e telefono) (numero fax) (E-mail)


1.6 Settori scientifico-disciplinari interessati dal Programma di Ricerca

K05A K05B


1.7 Parole chiave

Testo italiano
WORLD WIDE WEB ; LINGUAGGI DI MARCATURA ; XML ; BASI DI DATI ; MODELLI DEI DATI ; LINGUAGGI DI INTERROGAZIONE ; DATI SEMISTRUTTURATI ; METODOLOGIE DI PROGETTO ; PERSONALIZZAZIONE

Testo inglese
WORLD WIDE WEB ; MARK-UP LANGUAGES ; XML ; DATABASES ; DESIGN METODOLOGIES ; QUERY LANGUAGES ; SEMISTRUCTURED INFORMATION ; DATA MODELS ; PERSONALIZATION


1.8 Curriculum scientifico del Responsabile Scientifico dell'Unità di Ricerca

Testo italiano

Letizia Tanca ha studiato Matematica all'Universita' di Napoli, dove ha ottenuto la laurea con una tesi in Logica Matematica; ha poi lavorato per 4 anni in industrie di telecomunicazioni. Letizia Tanca ha ottenuto il dottorato di ricerca in Matematica Applicata e informatica nel 1988, ed ha in seguito lavorato presso il Politecnico di Milano prima come ricercatore e poi come professore associato. Nel 1994 e' diventata professore straordinario presso l'Universita' di Bari, dove e' rimasta per un anno accademico, per passare all'Universita' di Verona dove e' rimasta fino all'ottobre del 1998. Presso quest'ultima universita' Letizia Tanca ha svolto il ruolo di presidente del Consiglio di Corso di Laurea in Informatica. Letizia Tanca e' attualmente professore ordinario presso il Politecnico di Milano;
presso tutte queste universita' ha insegnato in corsi di Informatica di base e di Basi di Dati.
Letizia Tanca e' autore di diverse pubblicazioni internazionali sulle basi di dati e sulla teoria delle basi di dati, e del libro ``Logic Programming and Databases", scritto con S. Ceri e G. Gottlob. Ha partecipato a vari progetti nazionali e internazionali.
I suoi interessi di ricerca riguardano tutta la teoria delle basi di dati, in particolare le basi di dati deduttive, attive e orientate agli oggetti, i linguaggi a grafi per basi di dati, e la semantica delle basi di dati evolute.
Negli ultimi tempi si e' occupata della rappresentazione e l'interrogazione di informazione semistrutturata, in particolare l'informazione disponibile sul World Wide Web. E' stata revisore di varie riviste internazionali e membro del comitato di programma di varie conferenze nazionali e internazionali. Ha curato, insieme con Dan Suciu, un numero speciale della rivista internazionale Journal of Computer Systems Science and Engineering sulla semantica nel World Wide Web.

Testo inglese

Letizia Tanca studied Mathematics at the University of Naples, where she
obtained her Master's degree in Mathematical Logic; she then
worked for four years as a software engineer in telecommunication firms.
She obtained her Ph.D. in Computer Science in 1988. Later, she remained with Politecnico di Milano first as a research associate and then as an associate professor, until 1994, when she became a full professor at the University of Bari. She joined the University of Verona in 1995 and stayed there as the dean of the Computer Science course until 1998. Letizia Tanca is currently
with Politecnico di Milano again, as a full professor.
In all these universities she has taught and teaches courses
on Databases and the Foundations of Computer Science. She is the author of
several papers on databases and database theory, published in international
journals and conferences, and of the book ``Logic Programming and Databases",
coauthored with S. Ceri and G. Gottlob. She has taken part to several national and international projects.
Her research interests range over all database theory, especially on deductive,
active and object oriented databases, graph-based languages for databases, and the semantics of advanced database and information systems. Her current research interests concern the representation and querying of semistructured information, particularly information on the World Wide Web. She has been a referee of several international
journals, and a member of the programm committee of a large number of
international conferences. She has co-edited, together with Dan Suciu,
a special issue of the Journal of Computer Systems Science and Engineering
on Semantics in the World Wide Web.

1.9 Pubblicazioni scientifiche più significative del Responsabile Scientifico dell'Unità di Ricerca
  1. PAREDAENS, J., PEELMAN, P., TANCA L., "G-log: a graph based query language" , Rivista: IEEE Transactions on knowledge and Data Engineering , Volume: 7(3) , pp.: 436-453 , (1995) .
  2. PAREDAENS J., PEELMAN, P., TANCA L., "Merging graph-based and Rule-based Computation: the language g-log" , Rivista: data and Knowledge Engineering , Volume: 25(3) , pp.: 267-300 , (1998) .
  3. FRATERNALI, P., TANCA L., "A structured Approach for the definition of the semantics of Active databases" , Rivista: ACM Transactions on Database Systems , Volume: 20(4) , pp.: 414-471 , (1995) .
  4. CERI, S., COMAI, S., DAMIANI, E., FRATERNALI, P., PARABOSCHI, S., TANCA L., "XML-GL: a graphical language for querying and restructuring XML documents" , Rivista: International Journal of Computer and telecommunications networking , Volume: ? , pp.: ? , (1999) in corso di pubblicazione .
  5. CERI, S., FRATERNALI, P., PARABOSCHI S., TANCA L., "Automatic generation of Production rules for integrity maintenance" , Rivista: ACM Transactions on database Systems , Volume: 19(3) , pp.: 367-422 , (1994) .

1.10 Risorse umane impegnabili nel Programma dell'Unità di Ricerca

1.10.1 Personale universitario dell'Università sede dell'Unità di Ricerca

Cognome Nome Dipart./Istituto Qualifica Settore
scient.
Mesi
uomo
1999 2000
 
1  TANCA  LETIZIA  ELETTRONICA E INFORMAZIONE  Prof. ordinario  K05A  4  4
2  BRACCHI  GIAMPIO  ELETTRONICA E INFORMAZIONE  Prof. ordinario  K05A  1  1
3  CERI  STEFANO  ELETTRONICA E INFORMAZIONE  Prof. ordinario  K05A  3  3
4  FRANCALANCI  CHIARA  ELETTRONICA E INFORMAZIONE  Ricercatore  K05A  2  2
5  FRATERNALI  PIERO  ELETTRONICA E INFORMAZIONE  Prof. associato  K05A  4  4
6  FUGINI  MARIA GRAZIA  ELETTRONICA E INFORMAZIONE  Prof. associato  K05A  3  3
7  PARABOSCHI  STEFANO  ELETTRONICA E INFORMAZIONE  Prof. associato  K05A  3  3
8  PERNICI  BARBARA  ELETTRONICA E INFORMAZIONE  Prof. ordinario  K05A  3  3
9  POZZI  GIUSEPPE  ELETTRONICA E INFORMAZIONE  Ricercatore  K05A  2  2
 

1.10.2 Personale universitario di altre Università

Cognome Nome Università Dipart./Istituto Qualifica Settore
scient.
Mesi
uomo
1999 2000
 
1  DAMIANI  ERNESTO  MILANO  SCIENZE DELL'INFORMAZIONE  Ricercatore  K05B  4  4
2  SAMARATI  PIERANGELA  MILANO  SCIENZE DELL'INFORMAZIONE  Prof. associato  K05B  3  3
 
3  OLIBONI  BARBARA  VERONA  SCIENTIFICO E TECNOLOGICO  altro    6  6

1.10.3 Titolari di assegni di ricerca

Cognome Nome Dipart./Istituto Anno del titolo Mesi uomo
1. PSAILA  GIUSEPPE  ELETTRONICA E INFORMAZIONE  1998 

1.10.4 Titolari di borse per Dottorati di Ricerca e ex L. 398/89 art.4 (post-dottorato e specializzazione)

Cognome Nome Dipart./Istituto Anno del titolo Mesi uomo
1. BONIFATI  ANGELA  ELETTRONICA E INFORMAZIONE  2001 
2. COMAI  SARA  ELETTRONICA E INFORMAZIONE  1999 
3. MAURINO  ANDREA  ELETTRONICA E INFORMAZIONE  2001 

1.10.5 Personale a contratto da destinare a questo specifico programma

Qualifica Costo previsto Mesi uomo
1. LAUREATO  20  11 
2. LAUREATO  20  11 
3. DOTTORE DI RICERCA  30  11 

1.10.6 Personale extrauniversitario dipendente da altri Enti

Cognome Nome Dipart./Istituto Qualifica Mesi uomo


Parte: II
2.1 Titolo specifico del programma svolto dall'Unità di Ricerca

Testo italiano

MODELLIZZAZIONE, INTERROGAZIONE E PERSONALIZZAZIONE DI SORGENTI DI DATI IN AMBIENTE WEB

Testo inglese

MODELING, QUERYING AND PERSONALIZING DATA SOURCES IN A WEB BASED ENVIRONMENT

2.2 Base di partenza scientifica nazionale o internazionale

Testo italiano

TEMA 2: Modellizzazione e Interrogazione di Sorgenti di
Dati in Ambiente Web
L'enorme massa di dati pubblicati sul World Wide Web ha prodotto una serie di lavori di ricerca su tecniche per l'indicizzazione, l'interrogazione e la ristrutturazione del contenuto di siti Web (Florescu 1998).
Il nostro approccio propone l'uso di un formalismo basato su grafi per rappresentare schemi di documenti (DTD) e formulare interrogazioni, e ha le sue radici nell'esperienza gia' maturata relativa alla progettazione di linguaggi grafici per rappresentare e interrogare dati complessi (Paredaens 1998) e
Dati del WWW (Florescu 1998, Comai 1998). Lungo questa via, si e' anche lavorato nella direzione di trovare una semantica specialmente concepita per l'interrogazione di dati su Web (Cortesi 1998).
Nel contesto di XML, in (Brickley 1998) viene definito RDF, come un DTD XML per la rappresentazione di metadati. RDF fornisce sia un formalismo testuale
che uno grafico, e quest'ultimo si rivela molto efficace per rappresentare informazioni legate alla semantica dei documenti; nessun linguaggio di interrogazione e' pero' stato definito per RDF. Nel dominio di XML le proposte di linguaggi di interrogazione sono oggi ancora in una fase iniziale (Ceri 1999). Molti contributi preliminari sono raccolti negli atti del workshop QL98 (Query languages 1998).
TEMA 3:Produzione e Scambio di Sorgenti di Dati in
Ambiente Web
La personalizzazione dei siti e` stata individuata come un componente
chiave nella realizzazione di siti Web "data-intensive" (Ceri 1999).
Il supporto completo di queste funzioni richiede diversi componenti
concettuali. Tra questi, dovranno comparire uno strumento per la
specifica del modello dell'utente (per descrivere l'utente e le sue
prerogative), un linguaggio per la specifica dell'estrazione (per
specificare quali dati, propri di ogni utente, devono essere
utilizzati nella costruzione di pagine personalizzate) e un linguaggio
per la cattura dei profili (per costruire profili di utente in modo
automatico, derivandoli da preferenze espresse dall'utente in modo
esplicito o implicito).
La personalizzazione sta diventando un aspetto sempre piu` importante
nella costruzione di siti sofisticati, particolarmente nel contesto di
applicazioni di commercio elettronico. Infatti, la personalizzazione
"one-to-one" e' una delle direzioni strategiche di sviluppo seguite
dai produttori di strumenti avanzati per lo sviluppo di applicazioni
Web.
Il prodotto piu` importante, tra quelli che offrono dei meccanismi
basati su regole di personalizzazione per siti di tipo data-intensive,
e` Broadvision (Boadvision 1999). Broadvision offre un componente
centrale per la definizione di regole di business, che permettono di
costruire una corrispondenza tra il contenuto del sito e gli utenti,
basandosi sui profili degli utenti, sulla storia della transazioni
occorse sul sito, sulla storia dell'accesso al sito, e su altre
informazioni.
Un prodotto che e` stato un pioniere nel campo della personalizzazione
di siti Web e` Passport della Firefly (Firefly 1999). In questa
soluzione, la personalizzazione si basa sull'uso dei dati contenuti
nei profili personali degli utenti; le modalita` d'uso di questi
profili sono sotto il controllo del proprietario delle informazioni.
Un altro strumento specificamente focalizzato sulla personalizzazione
e` SelectCast di Aptex (Aptex, 1999), una collezione di tool di
supporto nella creazione di contenuto di siti Web e nella
realizzazione di siti per commercio elettronico. Il prodotto si basa
su un server Web dedicato, capace di tenere traccia del comportamento
dell'utente e di scegliere automaticamente quali sono le informazioni
che devono essere trasmesse all'utente.
Per gli aspetti di sicurezza, il progetto e la manutenzione della
sicurezza dei dati nei sistemi basati su Web sono divenuti sempre piu`
evidenti per il diffondersi delle reti, per l'evoluzione delle
architetture e per gli interventi legislativi in materia di privacy e
autenticazione della trasmissione di dati e documenti (Castano 1995).

Testo inglese

Theme 2: modeling and querying datasources in a web based environment.
The huge amount of data published via the World Wide Web has led to a
number of research efforts on techniques to index, query and
restructure Web sites contents(Florescu 1998).
Our approach proposes a graph based formalism to represent document schemata (DTD's) and formulate queries, based on our experience on graphical query and representation languages for complex data (Paredaens 1998) and Web site information (Florescu 1998, Comai 1998). In this respect, some work has also been done in the direction of finding the appropriate semantics for querying World Wide Web information (Cortesi 1998).
In the context of XML, RDF (Brickley 1998) has been defined as an XML DTD, in order to represent document metadata. RDF has a textual formulation as well as a graphical formulation, wich turns out to be very effective to convey information on document semantics. However, no query language has been defined for RDF. Indeed, in the specific domain of XML documents, proposals for query languages are in their infancy (Ceri 1999). Several preliminary contributions and position papers are collected in QL98 (Query languages 1998).
Theme 3:Datasource production and exchange in a Web based environment
Personalization has been identified as a key component of
data-intensive Web sites in (Ceri 1999). The complete support of this
functionality requires several conceptual components, like a user
modelling tool (to define users and their properties), a delivery
specification language (to express the user-specific data extractions
needed to generate personalized pages), and a profile capturing
language (to instantiate profiles automatically, deriving them from
explicit and implicit user preferences).
Personalization is becoming increasingly popular, especially in
electronic commerce applications. In fact, one-to-one personalization
is one of the strategic directions pursued by advanced tools for Web
application development and Web hosting.
The most relevant product addressing rule-based personalization for
data-intensive Web sites is Broadvision (Broadvision 1999), which
offers a command center for defining business rules matching content
to users based on profile information, transaction history, session
behavior, and other data.
A pioneering Web personalization solution is Firefly's Passport
technology, in which customization relies on user data stored in a
personal profile, the usage of which is under control of the owner
(Firefly 1999).
Another tool specifically focusing on personalization is Aptex
SelectCast, a tool suite for content publishing and electronic
commerce (Aptex 1999), which relies on a dedicated server capable of
tracking user behavior and automatically choosing the content to be
delivered to users.
For security, the design and maintenance of data security in Web-based
information systems have become more and more evident due to network
technology, to the evolution of architectures, and to legislative
proposals on privacy and authentication in data and document exchange
(Castano 1995).

2.2.a Riferimenti bibliografici

Tema 2:
(Brickley 1998) D.Brickley, R.Guha, and A.Layman.
W3c RDF schemas (working draft), Oct. 1998.
http://www.w3.org/TR/WD-rdf-schema/.
(Ceri 1999) S. Ceri, S. Comai, E. Damiani, P. Fraternali, S. Paraboschi, L. Tanca: XML-GL: a graphical language for querying and restructuring XML documents, Proc. of the 8th int. Conf. on the WWW (WWW8), Toronto, Canada, May 1999; also in The Intn. Journal of Computer and Telecommunications Networking, Elsevier Publishers.
(Comai 1998) S.Comai, E.Damiani, R.Posenato, L.Tanca. "A Schema-based Approach to Modeling and Querying WWW Data", Int. Conf. on Flexible Query Answering Systems, FQAS'98, Denmark, 1998, also as LNAI 1495, Springer Verlag.
(Cortesi 1998) A. Cortesi, A. Dovier, E. Quintarelli, and L. Tanca. Operational and Abstract Semantics of a Query
Language for Semi-Structured Information. In Proceedings of 6th Int. Workshop on Deductive Databases and Logic Programming DDLP'98.
(Florescu 1998)
D.Florescu, A.Levy, and A.Mendelzon.
Database techiques for the world-wide web: a survey.
ACM SIGMOD Record, 27(3), Sept. 1998.
(Paredaens 1995) Paredaens, J., Peelman, P. Tanca, L. ``G-log:
A Declarative Graphical Query Language". IEEE Trans. on Knowledge and
Data Eng., vol.7 , 1995 436-453
(Query Languages 98) Proceedings QL'98 - The Query Languages Workshop http://www.w3.org/TR/1998/NOTE-xml-ql-19980819/.
Tema 3:
(Aptex 1999) http://www.aptex.com/products-selectcast.htm
(Broadvision 1999) http://www.broadvision.com
(Castano 1995) S.Castano, M.G. Fugini, G. Martella, P.Samarati,
Database Security, Addison Wesley, 1995
(Ceri 1999) S. Ceri, P. Fraternali, S. Paraboschi. "Design Principles
for Data-Intensive Web Sites", ACM SIGMOD RECORD, Vol. 28, N. 1,
Mar. 1999.
(Firefly 1999) http://www.firefly.net

2.3 Descrizione del programma e dei compiti dell'Unità di Ricerca

Testo italiano

Tema 2: Modellizzazione e Interrogazione di Sorgenti di
Dati in Ambiente Web
I moderni sistemi informativi basati sulle reti di comunicazione devono spesso gestire dati organizzati in documenti, la cui struttura e' meno rigida e regolare di quella richiesta dalle basi di dati. In questo caso i dati si dicono semistrutturati. Tra gli esempi piu' interessanti di dati semistrutturati abbiamo quelli che si trovano sul WWW, che noi vorremmo trovare, modellare e ristrutturare come siamo abituati a fare con i dati di una base di dati.
A tale scopo, occorre concepire modelli dei dati che tengano conto delle speciali necessita' dell'attivita' di modellazione, trasformazione e interrogazione di documenti.
Il linguaggio XML costituisce una raccomandazione del consorzio del WWW come linguaggio di marcatura di documenti, poiche' esso permette a coloro che pubblicano i documenti di specificare e usare un insieme di marcatori disegnati appositamente per rendere le proprieta' concettuali dell'informazione da pubblicare.
In questo progetto ci occupiamo di progettare un nuovo linguaggio per modellare, estrarre e ristrutturare informazioni provenienti da documenti XML: poiche' la struttura di un documento XML si presta bene per una rappresentazione di tipo grafico, il nostro approccio propone l'uso di un formalismo visuale basato su grafi) per rappresentare schemi (DTD) di documenti e per formulare interrogazioni.
Fase 1: I Semestre
L'Unita' Operativa del Politecnico di Milano si basera' sul modello dei dati di riferimento proposto nel Modello A della presente proposta di progetto. La prima fase della ricerca prevede lo studio del lessico per rendere in forma grafica tale modello, e l'esame delle caratteristiche particolari che differenziano un modello dei dati per linguaggio di marcatura dalla classica concezione di modello dei dati adoperata nella ricerca sulle basi di dati. Inoltre, si cominceranno a investigare i formalismi di base per l'interrogazione di sorgenti dei dati XML. Il vincolo fondamentale e' che una interrogazione restituisca uno o piu' documenti XML, in modo che piu' interrogazioni possano essere combinate. Si produrra' per questa prima formulazione anche una equivalente formulazione testuale.
I PRODOTTI DELLA PRIMA FASE:
T2.1-R1-Rapporto tecnico con la definizione del lessico e della sintassi grafica del modello dei dati di riferimento;
Fase 2: II Semestre
Nella seconda fase del progetto si procedera' allo studio di una semantica formale del linguaggio proposto. In particolare, si studiera' una semantica parametrica per il linguaggio di interrogazione, che permetta di richiedere una aderenza piu' o meno precisa dei documenti inclusi nel risultato alle condizioni specificate nell'interrogazione. Inoltre, si realizzera' una prima versione del prototipo del linguaggio grafico, concentrandosi su un ambiente visuale
per l'interrogazione: studieremo una interfaccia efficace per supportare la visualizzazione grafica del DTD di un documento, e una collezione di primitive grafiche per ritagliare e trasportare elementi grafici dello schema al fine di comporre le interrogazioni.
I PRODOTTI DELLA SECONDA FASE
T2.2-R1-Rapporto tecnico con la definizione della sintassi e della semantica di una prima versione del linguaggio grafico di interrogazione per sorgenti XML.
T2.2-R3- Rapporto su estensioni del linguaggio di interrogazione di sorgenti XML per l'aggiornamento di schemi a tempo di esecuzione.
T2.2-R4- Rapporto contenente la definizione dell'architettura di un prototipo del linguaggio di interrogazione.
T2.2-R5- Rapporto sulla definizione dell'ambiente di interrogazione visuale.
Fase 3: III Semestre
Nella terza fase del progetto ci si occupera' di precisare ulteriormente il linguaggio, identificandone costrutti avanzati per la ristrutturazione di documenti, e studiando le caratteristiche peculiari relative ai linguaggi di marcatura, come ad esempio la modellazione dell'ordinamento tra elementi
e la trasformazione di stringhe. Si studieranno poi tecniche di ottimizzazione per il linguaggio definito. Inoltre, si studiera' una versione fuzzy del linguaggio che, basandosi sulla semantica parametrica, sara' in grado di restituire documenti rispondenti a una misura di similarita' rispetto alle condizioni specificate nella query.
I PRODOTTI DELLA TERZA FASE:
T2.3-R3-Rapporto tecnico contenente la definizione della versione fuzzy del linguaggio
T2.3-R5-Rapporto tecnico contenente la definizione di costrutti avanzati del linguaggio, in particolare adatti a ristrutturare documenti.
T2.3-S1- Prototipo del linguaggio di interrogazione.
Fase 4: IV Semestre
La quarta fase vedra' l'unita' impegnata principalmente in attivita' di implementazione e sperimentazione.
I PRODOTTI DELLA QUARTA FASE:
T2.4-R2- Rapporto sulla sperimentazione del prototipo
T2.4-R3- Rapporto sulle tecniche di ottimizzazione delle interrogazioni.
T2.4-S1- Secondo prototipo del linguaggio, possibilmente ottimizzato.
T2.4-R4- Rapporto conclusivo: sviluppi futuri della ricerca e sua applicabilita'.
Tema 3: Produzione e Scambio di Sorgenti di Dati in
Ambiente Web
Quando un sito Web viene generato automaticamente, estraendo il suo
contenuto da grandi sorgenti di dati (come ad esempio cataloghi
elettronici di beni di consumo), e` importante che il processo di
generazione venga personalizzato, in modo tale da tenere conto delle
proprieta` e caratteristiche di ogni utente e gruppo di utenti, in un
modo che rispetti gli obiettivi specifici dell'applicazione (per
esempio, in applicazioni di commercio elettronico, la possibilita` di
mostrare ad ogni utente esattamente quegli oggetti che hanno la
probabilita` piu` elevata di essere comprati).
La personalizzazione realizza quindi il cosiddetto "one-to-one Web
delivery", ovvero la possibilita` di dare ad ogni utente l'impressione
di interagire con l'applicazione tramite un'interfaccia dedicata,
specificamente adattata ai bisogni e preferenze dell'utente. In
questo progetto ci dedichiamo al problema della progettazione di siti
Web, in modo tale da offrire un'efficace realizzazione
dell'"one-to-one Web delivery", con particolare attenzione per il
contesto dei siti Web "data-intensive".
La ricerca studia anche tecniche e standard per assicurare e certificare la
sicurezza, l'integrita` e la privatezza dei dati scambiati tra
sorgenti di dati su siti Web.
FASE 1: I Semestre
L'obiettivo della prima fase sara` l'individuazione degli strumenti
concettuali richiesti per la gestione della personalizzazione in siti
Web di tipo data-intensive. Una particolare attenzione verra`
dedicata a far si` che che questi strumenti concettuali siano
strettamente integrati con tutti gli altri strumenti
e astrazioni sviluppati nell'ambito del progetto. Un obiettivo
importante sara` l'analisi del ruolo che una specifica in termini di
"regole di personalizzazione" puo` avere in questo contesto.
PRODOTTI DELLA PRIMA FASE:
T3.1-R1- rapporto contenente la descrizione del contesto metodologico di riferimento per il progetto e lo sviluppo dei siti Web.
T3.1-R4- Rapporto tecnico sui concetti e strumenti richiesti per la
personalizzazione dei siti, nel contesto di siti di tipo
data-intensive
Fase 2: II Semestre
Nella seconda fase, la ricerca si concentrera` sulla progettazione di
una prima versione del modello per descrivere la personalizzazione del
sito. E` probabile che questo modello conterra` diversi componenti
integrati tra di loro, ognuno dedicato a un particolare aspetto della
personalizzazione. Al momento prevediamo, ma cio` verra` sottoposto a
verifica nell'ambito della prima fase del lavoro, che la
personalizzazione possa essere di tipo statico, dinamico, basata sulla
storia degli accessi al sito (trace-based), o reattiva: ognuna di
queste prospettive richiede una specifica astrazione e un insieme di
opportuni strumenti concettuali. In questa fase implementeremo anche
un prototipo che permettera` al progettista di verificare la
correttezza delle specifiche prodotte e implementera` almeno una parte
dei servizi di personalizzazione definiti.Inoltre si studieranno le estensioni a XML necessarie a trattare aspetti di sicurezza dati.
PRODOTTI DELLA SECONDA FASE:
T3.2-R2- Rapporto tecnico che descrive gli strumenti concettuali definiti
per la progettazione della personalizzazione dei siti
T3.2-S3- Prototipo software di un sistema in grado di riconoscere la
specifica della personalizzazione del sito e in grado di implementare
almeno parte dei servizi previsti.
T3.2-R4-Rapporto sulle estensioni di XML necessarie per garantire la sicurezza su Web.
Fase 3: III Semestre
Nella terza fase concentreremo il lavoro sulla valutazione degli
strumenti concettuali proposti nella seconda fase, prestando
particolare attenzione alle caratteristiche di facilita` d'uso,
completezza e efficienza. Ci aspettiamo che questo lavoro di verifica
porti a un raffinamento delle specifiche. Svilupperemo inoltre un
modello di sicurezza per i dati presenti nel sito Web, partendo dalla
specifica della personalizzazione e adattandola ai meccanismi di
mantenimento della sicurezza. L'enfasi sara` sulle caratteristiche di
modellizzazione e non sugli effettivi meccanismi di basso livello
(cifratura, assenza di cover-channels) che sono necessari per la
realizzazione di un sito sicuro.
PRODOTTI DELLA TERZA FASE:
T3.3-R2- Rapporto tecnico che valuta, in termini di usabilita`, completezza e
efficienza, i modelli di personalizzazione proposti
T3.3-R3- Rapporto tecnico che presenta un modello concettuale dedicato alla
specifica degli aspetti di sicurezza di un sito Web di tipo
data-intensive.
Fase 4: IV Semestre
Nella quarta fase concluderemo la progettazione del modello di
personalizzazione. Produrremo inoltre una versione finale del
prototipo, in grado di elaborare la specifica della personalizzazione
e di effettuare esperimenti con essa, permettendo al progettista di
valutare la completezza e la correttezza della soluzione. Produrremo
inoltre un prototipo di un sistema in grado di gestire il modello di
sicurezza dei dati prodotto nella fase 3. Il sistema offrira` una
semplice implementazione dei servizi di sicurezza, dimostrando il
potere di questa proposta.
PRODOTTI DELLA QUARTA FASE:
T3.4-S2- Prototipo software di un sistema in grado di gestire la versione
finale del modello di personalizzazione, implementando i servizi
descritti
T3.4-S3- Prototipo software di un sistema che, a partire da una specifica
concettuale delle caratteristiche di sicurezza dei dati di un sito
(che specificano quali utenti hanno diritti di lettura/scrittura su
quali informazioni), produce un sito che rispetta la specifica.
T3.4-R5- Rapporto conclusivo: sviluppi futuri della ricerca e sua applicabilita'.

Testo inglese

THEME 2: MODELING AND QUERYING DATASOURCES IN WEB BASED ENVIRONMENTS
Modern network-oriented information systems often have to deal with data
whose format is not as structured as that of traditional databases:
often data are organized into documents, whose structure is less strict
or regular than that required by database management systems: in this
case, data are called semistructured. The most interesting example of semistructured data are World Wide Web data, which we would like to model, query and restructure as we do for data in a database.
In order to do this effectively, we need appropriate data models, which take into account the special caracteristics of documental modeling, querying and transformation.
XML is a recent recommendation of the World Wide Web consortium as a metalanguage to define markups for content publishing on the Web, since it allows document producers to define and use a set of tags that best mirrors the conceptual properties of the information they want to publish. In this project, we deal with the problem of designing novel languages and formalisms for modeling, extracting and restructuring information from XML documents. Since the structure of XML documents well lends itself to a graphical representation,
our approach proposes the use of a visual (graph-based) formalism to represent document schemata and formulate queries.
PHASE I: I SEMESTER
The data model that will be used to represent XML documents is the reference data model described in the A part of this project proposal. The first phase of the research comprises the study of a graphical form for the reference data model, understanding
the modeling issues that distinguish a markup language from traditional database modeling languages. Moreover, we will start studying the formalism for querying XML data sources. The constraint is that a query must return one or more XML documents,so that various queries can be combined.
An equivalent textual formulation will also be produced.
PRODUCTS OF THE 1ST PHASE:
T2.1-R1- Technical Report including the lexicon definition and the graphical
syntax of the reference data model
PHASE II: 2ND SEMESTER:
In the second phase we will study a formal semantics for the proposed language.
A parametric semantics will be studied for the query language
allowing the user to pose queries requiring a more or less strict adherence between the desired document features and those of the query conditions. A prototype will
be implemented showing the first issues of the interface characteristics of
the query environment. We will concentrate on the deployment of the language within a Web-based visual environment, by studying an effective query
interface supporting the automatic display of DTDs and/or documents
and a collection of graphical primitives for clipping and dragging
schema elements and for incrementally constructing the query graphs.
PRODUCTS OF THE SECOND PHASE:
T2.2-R1- Technical Report including the definition of the syntax and
semantics of a first version of the graphical query language for XML sources.
T2.2-R3 Technical report on extensions of the query language for dealing with schema updates.
T2.2-R4- Technical Report describing the architecture of a first prototype of
the query language
T2.2-R5- Technical report on the visual query environment.
PHASE III: 3RD SEMESTER
In this third phase, we will formalize the language, identifying its
advanced constructs for document restructuring, and studying issues typical
of markup languages: for example, element sorting and
string transformation. We will study techniques of language optimization
and a fuzzy version of the language, able, on the basis of a parametric
semantics, to return documents fitting criteria of similarity to the query conditions, with respect to a specified similarity measure.
PRODUCTS OF THE 3RD PHASE:
T2.3-S1- Query language prototype
T2.3-R3- Technical Report including the definition of the fuzzy version of the
language
T2.3-R5- Technical Report including the definition of the advanced language
constructs, particularly for document restructuring
PHASE IV: 4TH SEMESTER
In the 4th phase the unit will focus on implementation and
testing activities.
PRODUCTS OF THE 4TH PHASE:
T2.4-R2- Technical Report on prototype operation
T2.4-S1- Second prototype of the language, possibly optimized
T2.4-R3- Technical Report on language optimiziation
T2.4-R4-Final report: future extensions of the research and its applicability.
THEME 3: DATA SOURCE PRODUCTION AND EXCHANGE IN WEB BASED ENVIRONMENTS.
When a Web site is automatically generated by extracting its content
from data sources, the generation process can be personalized so as to
take into account the properties of each user or user group, in a
way that fulfills some application-specific goal (e.g., in
electronic commerce, showing to each user exactly those goods that he
will most likely purchase).
Such Data-Intensive Web Sites are typically generated by means of tools
that extract content from large data sources (e.g., catalogs of
goods). One important aspect of these tools is their ability to
support one-to-one Web delivery}, i.e., to give each user the
impression of interacting with the application by means of a dedicated
interface, specifically tailored to the user's needs and preferences.
In this project we address the problem of designing Web sites in order to allow effective one-to-one
Web delivery, particularly in the case of data-intensive applications.
PHASE 1: I SEMESTER
The goal of the first phase will be the identification of the
conceptual tools required for the management of personalization in a
data-intensive Web site. Particular emphasis will be given to a
smooth integration of these tools with all the other abstractions and
tools developed in the project. An important goal will be the
investigation on the role that a specification in terms of
"personalization rules" may have in this context.
PRODUCTS OF THE FIRST PHASE:
T3.1-R4- Technical Report on the concepts and tools required for site
personalization, in the context of data-intensive Web sites.
PHASE 2 : II SEMESTER
In the second phase, our research will concentrate on the design of a
first version of a model describing the personalization of a site. We
expect this model to contain several integrated components, each
dedicated to a particular aspect of user personalization. We
currently envision, but this will be tested in the first phase, that
personalization may be static, dynamic, trace-based, reactive: each of
this perspectives requires a specific abstraction and set of modelling
tools. We will also implement a prototype which will allow the
designer to test the correctness of the specification produced and
will also implement at least the minimal personalization services.
Moreover, extensions to XML will be studied necessary to handle data
security aspects.
PRODUCTS OF THE 2ND PHASE:
T3.2-R2- Technical report describing the conceptual tools defined for the
design of site personalization.
T3.2-S3- Software prototype of a system able to understand the specification
of site personalization and able to implement at least part of the
services described.
T3.3-R4- Techical report on the XML extensions needed for ensuring Web security.
PHASE 3: 3RD SEMESTER
In the third phase we will concentrate on the evaluation of the
modelling concepts proposed in the second phase, paying attention to
the properties of usability, completeness, and efficiency. We expect
this evaluation to produce a refinement of the specification. We will
also develop a model of data security for Web sites, which starts from
the personalization services and customizes them to be used as
security enforcement mechanisms. The emphasis will be on the
modelling features, rather than on the actual low-level mechanisms (e.g.,
cryptography, absence of cover-channels) that are necessary in a
secure site.
PRODUCTS OF THE 3RD PHASE:
T3.3-R2- Technical report evaluating, in terms of usability, completeness,
and efficiency the proposed models.
T3.3-R3- Technical report presenting a conceptual model dedicated to the
security aspects of data-intensive Web sites.
PHASE 4: 4TH SEMESTER
In the fourth phase we will conclude the design of the personalization
model. We will also produce a final version of the prototype, able to
process the specification of a site personalization and to experiment
with it, evaluating the correctness and completeness of the solution.
We will also produce a prototype of a system able to process the
specification of a data security model developed in Phase 3. The
system will offer a simple implementation of such services,
demonstrating the capabilities of this proposal.
PRODUCTS OF THE 4TH PHASE:
T3.4-S2- Software prototype of a system able to process the final version of
the site personalization models; the prototype will also implement the
services described.
T3.4-S3- Software prototype of a system that starts from the conceptual
specification of the security features of a site (which users are
permitted to read/write which information) and produces a site
T3.4-R5-Final report: future extensions of the research and its applicability.
respecting them.

2.4 Descrizione delle attrezzature già disponibili ed utilizzabili per la ricerca proposta

Anno di acquisizione Descrizione
Testo italiano Testo inglese
1.  19976 PERSONAL COMPUTER DOTATI DI AMBIENTE WINDOWS 95 OPPURE NT; 2 PERSONAL COMPUTER PORTATILI.  6 PERSONAL COMPUTERS ENDOWED WITH WINDOWS 95 OR NT; 2 LAPTOP COMPUTERS. 
2.  19987 PERSONAL COMPUTER DOTATI DI AMBIENTE WINDOWS 95 OPPURE NT; 2 PERSONAL COMPUTER PORTATILI.  7 PERSONAL COMPUTERS ENDOWED WITH WINDOWS 95 OR NT; 2 LAPTOP COMPUTERS. 
3.  19992 PERSONAL COMPUTER CON AMBIENTE WINDOWS NT.  2 PERSONAL COMPUTERS ENDOWED WITH WINDOWS NT. 
4.     
5.     


2.5 Descrizione della richiesta di Grandi attrezzature (GA)

Attrezzatura I
Descrizione

valore presunto (milioni)   percentuale di utilizzo per il programma

Attrezzatura II
Descrizione

valore presunto (milioni)   percentuale di utilizzo per il programma


Parte: III
3.1 Costo complessivo del Programma dell'Unità di Ricerca

Voce di spesa Spesa Descrizione
Euro Testo italiano   Testo inglese  
Materiale inventariabile 60  30.987  PERSONAL COMPUTERS DOTATI DI WINDOWS NT (DESKTOP O LAPTOP) . LIBRI. RIVISTE...  PERSONAL COMPUTERS (DESKTOP AND LAPTOP) ENDOWED WITH WINDOWS 95 OR NT, books, journals,.. 
Grandi Attrezzature        
Materiale di consumo e funzionamento 2.582  MATERIALE VARIO (DISCHI, CAVI, DISCHI OTTICI ETC.)  CABLES, DISKS, CD'S... 
Spese per calcolo ed elaborazione dati        
Personale a contratto 70  36.152  PERSONALE DA COINVOLGERE NELLA RICERCA E NELLA PROGETTAZIONE  RESEARCHERS AND DESIGNERS 
Servizi esterni 20  10.329  SPESE DI SVILUPPO SOFTWARE  SW DEVELOPMENT EXPENSES 
Missioni 85  43.899  PARTECIPAZIONE A CONVEGNI E WORKSHOP NAZIONALI E INTERNAZIONALI  participations to NATIONAL AND INTERNATIONAL CONFERENCES AND WORKSHOPS 
Altro        


  Euro
Costo complessivo del Programma dell'Unità di Ricerca 240  123.950 
 
Costo minimo per garantire la possibilità di verifica dei risultati 200  103.291 
 
Fondi disponibili (RD) 72  37.185 
 
Fondi acquisibili (RA) 0   
 
Cofinanziamento richiesto al MURST 168  86.765 
 


Parte: IV
4.1 Risorse finanziarie già disponibili all'atto della domanda e utilizzabili a sostegno del Programma

QUADRO RD

Provenienza Anno Importo disponibile nome Resp. Naz. Note
Euro
Università          
Dipartimento 1998   33  17.043    FONDO RICERCA DI ATENEO 1997 TIT. PROF. PERNICI E FONDO RIC. ATENEO 1998 TIT. PROF. TANCA 
MURST (ex 40%)          
CNR          
Unione Europea 1997   39  20.142    FONDO CEE PROG. ESPRIT IDEA TIT. PROF. CERI 
Altro          
TOTAL   72  37.185     

4.1.1 Altro


4.2 Risorse finanziarie acquisibili in data successiva a quella della domanda e utilizzabili a sostegno del programma nell'ambito della durata prevista

QUADRO RA

Provenienza Anno della domanda o stipula del contratto Stato di approvazione Quota disponibile per il programma Note
Euro
Università          
Dipartimento          
CNR          
Unione Europea          
Altro          
TOTAL        

4.2.1 Altro


4.3 Certifico la dichiarata disponibilità e l'utilizzabilità dei fondi di cui ai punti 4.1 e 4.2:      SI     

Firma ____________________________________________




(per la copia da depositare presso l'Ateneo e per l'assenso alla diffusione via Internet delle informazioni riguardanti i programmi finanziati; legge del 31.12.96 n° 675 sulla "Tutela dei dati personali")




Firma ____________________________________________ 30/03/1999 17:40:49