MINISTERO DELL'UNIVERSITÀ E DELLA RICERCA SCIENTIFICA E TE CNOLOGICA
DIPARTIMENTO AFFARI ECONOMICI
PROGRAMMI DI RICERCA SCIENTIFICA DI RILEVANTE INTERESSE NAZIO NALE
RICHIESTA DI COFINANZIAMENTO

(DM n. 811 del 3 dicembre 1998)
PROGETTO DI UNA UNITÀ DI RICERCA - MODELLO B
Anno 1999 - prot. 9909A77532_004


Parte: I
1.1 Programma di Ricerca di tipo: interuniversitario

Area Scientifico Disciplinare: Ingegneria Industriale (80%)
Area Scientifico Disciplinare: Scienze Matematiche (20%)

1.2 Durata del Programma di Ricerca: 24 mesi

1.3 Titolo del Programma di Ricerca

Testo italiano

DATA-X: Gestione, Trasformazione e Scambio di Dati in Ambiente Web

Testo inglese

Data-X: Management, Transformation and Exchange of Data in a Web Environment

1.4 Coordinatore Scientifico del Programma di Ricerca

ATZENI PAOLO  
(cognome) (nome)  
Università degli Studi ROMA TRE Facoltà di INGEGNERIA
(università) (facoltà)
K05A Dipartimento di INFORMATICA E AUTOMAZIONE
(settore scient.discipl.) (Dipartimento/Istituto)


atzeni@dia.uniroma3.it
(E-mail)


1.5 Responsabile Scientifico dell'Unità di Ricerca

DE ANTONELLIS VALERIA  
(cognome) (nome)  


Professore ordinario 11/06/1951 DNTVLR51H51C976B
(qualifica) (data di nascita) (codice di identificazione personale)

Università degli Studi di BRESCIA Facoltà di INGEGNERIA
(università) (facoltà)
K05A Dipartimento di ELETTRONICA PER L'AUTOMAZIONE
(settore scient.discipl.) (Dipartimento/Istituto)


030/3715469 030/380014 DEANTONE@ELET.POLIMI.IT
(prefisso e telefono) (numero fax) (E-mail)


1.6 Settori scientifico-disciplinari interessati dal Programma di Ricerca

K05A K05B


1.7 Parole chiave

Testo italiano
BASI DI DATI ; WORLD WIDE WEB ; XML ; MODELLI DI DATI ; CLASSIFICAZIONE ; INTEGRAZIONE

Testo inglese
DATABASE ; WORLD WIDE WEB ; XML ; DATA MODEL ; CLASSIFICATION ; INTEGRATION


1.8 Curriculum scientifico del Responsabile Scientifico dell'Unità di Ricerca

Testo italiano

Valeria De Antonellis e' professore ordinario di Sistemi Informativi presso la Facolta' di Ingegneria dell'Universita' di Brescia. Precedentemente e' stata professore ordinario presso l'Universita' di Ancona (1994-1996), e professore associato al Politecnico di Milano (1991-1994) e all'Universita' di Milano (1989-1991).
Principali interessi di ricerca sono nell'area delle metodologie e strumenti per la progettazione di basi di dati e, piu' in generale, di sistemi informativi. L'attivita' di ricerca e' focalizzata su problematiche di progettazione concettuale, analisi e integrazione di basi di dati, re-ingegnerizzazione e riuso di dati e processi applicativi. Su questi temi ha lavorato nell'ambito di numerosi progetti di ricerca nazionali e internazionali. Ha partecipato ai seguenti progetti ESPRIT: OSSAD (Office Support Systems Analysis and Design), sviluppando il modello OSSAD per la modellazione di requisiti;
ITHACA, collaborando allo sviluppo di una metodologia orientata ad oggetti; F3 (From Fuzzy to Formal), sviluppando un modello e una metodologia di riuso; RENOIR (network of excellence for requirements engineering).
E' stata coordinatore del Gruppo di Lavoro AICA su Basi di Dati (1990-1997). E' membro dell' ACM e dell'IEEE Computer Society.

Testo inglese

Valeria De Antonellis is full professor of Computer Science at the University of Brescia. Previously she has been full professor at the University of Ancona (1994-1996), and associate professor at Politecnico di Milano (1991-1994) and University of Milano (1989-1991).
Her research interests are devoted to methodologies and tools for database and information system design, with focus on conceptual modeling, database integration, data and process re-engineering and reuse. She has been working on these topics within several national and international research projects and collaborations. She participated in the following ESPRIT projects: OSSAD (Office Support Systems Analysis and Design), developing the OSSAD model for requirements modeling; ITHACA, working for the definition of an object-oriented methodology; F3 (From Fuzzy to Formal), developing a reuse model and methodology; RENOIR (network of excellence for requirements engineering).
She has been chair of AICA Working Group on Databases (1990-1997). She is a member of the ACM and the IEEE Computer Society.

1.9 Pubblicazioni scientifiche più significative del Responsabile Scientifico dell'Unità di Ricerca
  1. S. CASTANO, DE ANTONELLIS V., "A schema analysis and reconciliation tool environment for heterogeneous information sources" , Rivista: IEEE Proc. of Int. Data Engineering and Applications Symposium (IDEAS'99) , (1999) .
  2. S. CASTANO, DE ANTONELLIS V., "A Discovery-Based Approach to Database Ontology Design" , Rivista: Distributed and Parallel Databases - Special Issues on Ontologies and Databases , Volume: Vol.7, N.1 , (1999) .
  3. S. CASTANO, DE ANTONELLIS V., M.G.FUGINI, B. PERNICI, "Conceptual Schema Analysis: Techniques and Applications" , Rivista: ACM Transactions on Database Systems , (1998) scheduled for the September issue .
  4. S. CASTANO, DE ANTONELLIS V., "Semantic Dictionary Design for Database Interoperability" , Rivista: Proceedings of IEEE International Conference on Data Engineering (ICDE'97) , (1997) .
  5. S. CASTANO, DE ANTONELLIS V., "Deriving global conceptual views from multiple information sources" , Rivista: Proc. of International Pre-Conference ER'97 Symposium on Conceptual Modeling , (1997) .

1.10 Risorse umane impegnabili nel Programma dell'Unità di Ricerca

1.10.1 Personale universitario dell'Università sede dell'Unità di Ricerca

Cognome Nome Dipart./Istituto Qualifica Settore
scient.
Mesi
uomo
1999 2000
 
1  DE ANTONELLIS  VALERIA  ELETTRONICA PER L'AUTOMAZIONE  Prof. ordinario  K05A  4  4
2  LAMPERTI  GIAN FRANCO  ELETTRONICA PER L'AUTOMAZIONE  Ricercatore  K05A  5  5
 

1.10.2 Personale universitario di altre Università

Cognome Nome Università Dipart./Istituto Qualifica Settore
scient.
Mesi
uomo
1999 2000
 
 

1.10.3 Titolari di assegni di ricerca

Cognome Nome Dipart./Istituto Anno del titolo Mesi uomo

1.10.4 Titolari di borse per Dottorati di Ricerca e ex L. 398/89 art.4 (post-dottorato e specializzazione)

Cognome Nome Dipart./Istituto Anno del titolo Mesi uomo
1. MELCHIORI  MICHELE  ELETTRONICA PER L'AUTOMAZIONE  2000  11 

1.10.5 Personale a contratto da destinare a questo specifico programma

Qualifica Costo previsto Mesi uomo

1.10.6 Personale extrauniversitario dipendente da altri Enti

Cognome Nome Dipart./Istituto Qualifica Mesi uomo
1. BIANCO  GIOVANNI  Centro di Calcolo - Univ. Verona  DOTTORE DI RICERCA 
2. RIZZI  ALESSANDRO  Consulenza  DOTTORE DI RICERCA 


Parte: II
2.1 Titolo specifico del programma svolto dall'Unità di Ricerca

Testo italiano

Metodi e Strumenti per l'Indicizzazione, Classificazione e Integrazione di
Sorgenti di Dati e Siti XML

Testo inglese

Methods and Tools for Indexing, Classifying and Integrating Data Sources
and XML Sites

2.2 Base di partenza scientifica nazionale o internazionale

Testo italiano

Problematiche di ricerca relative al trattamento di sorgenti di dati in ambiente Web richiedono lo sviluppo di metodi e strumenti per attivita' di classificazione rispetto a meta-informazioni disponibili, e di integrazione rispetto ad eterogeneita' esistenti, per facilitare il reperimento e lo scambio di informazioni e documenti. Problematiche generali relative alla classificazione e integrazione di schemi sono trattati in (Ram and Ramesh 1998). Strumenti di integrazione e traduzione per sorgenti eterogenee sono stati studiati in ambienti multidatabase come riportato in (Bright et al. 1994) e in (Reddy et al 1994). Approcci di integrazione di informazione basati su linguaggi mediatori e ontologie sono descirtti, rispettivamente, in (Chawathe et al. 1994) e in (Mena et al. 1996). In ambienti multidatabase, schemi globali sono derivati per facilitare la cooperazione tra basi di dati. In sistemi con mediatori sono presentate regole e linguaggi per una rappresentazione integrata di informazioni eterogenee. Infine, ontologie sono realizzate come strumento per mediare fra sorgenti eterogenee nella gestione di interrogazioni. Nella letteratura piu' recente, contributi specifici per sorgenti di dati e siti Web sono descritti in (Milo and Zohar 1998) e in (Haas et al. 1999) dove tecniche di schema-matching e sistemi middleware sono proposti per attivita' di trasformazione e integrazione di dati.
L'unita' UNIBS ha prodotto contributi per lo sviluppo di tecniche di analisi di schemi, in termini generali, come riportato in (Castano 1998), e piu' specificamente per la definizione di metodi di classificazione di
schemi concettuali di basi di dati mediante costruzione di ontologie, come descritto in (Castano 1999a). Ha, inoltre, sviluppato nel progetto MURST INTERDATA l'ambiente di supporto al progettista ARTEMIS per l'integrazione di sorgenti strutturate, descritto in (Castano 99b). Tali metodi e strumenti, concepiti essenzialmente per dati strutturati, vanno opportunamente estesi per trattare sorgenti di dati e siti XML in ambiente
Web.

Testo inglese

Research issues related to management and access to data sources in the Web environment, are concerned with the development of methods and tools for classification with respect to available meta-information, and for integration with respect to existing heterogeneity, to facilitate document retrieval and exchange. General issues related to schema classification and integration are discussed in (Ram and Ramesh 1998). Integration and mapping tools have been studied in multidatabase environments, as reported in (Bright et al. 1994) and in (Reddy et al. 1994). Information integration approaches based on mediator languages and ontologies have been developed, see for example (Chawathe et al. 1994) and (Mena et al. 1996). In multidatabase environments, global schemas are derived to support cooperation of multiple databases. In mediator-based systems, rules and languages for declarative specification of mediators are presented for information integration. Ontologies are exploited as a means to mediate across different heterogeneous sources in answering queries. Recently, in the literature, specific contributions for data sources and Web sites are given in (Milo and Zohar 1998) and in (Haas et al. 1999) where schema-matching techniques and middleware systems are proposed for data transformation and integration.
The research team at University of Brescia has produced contributions to the development of schema analysis techniques, in general terms, as described in (Castano 1998), and more specifically for the definition of schema classification methods by constructing ontologies, as described in (Castano 99b). Such methods and tools, mainly conceived for structured data, have to be extended for data
sources and XML sites in the Web environment.

2.2.a Riferimenti bibliografici

(Bright et al. 1994), M.W. Bright, A.R. Hurson, S.Pakzad, "Automated resolution of semantic heterogeneity in multidatabases", ACM Trans. on Database Systems, Vol.19, N.2, 1994.(Castano 99a) S. Castano, V. De Antonellis, "A Discovery-Based Approach to
Database Ontology Design", Distributed and Parallel Databases - Special
Issue on Ontologies and Databases, Vol.7, N.1, 1999.
(Castano 99b) S. Castano, V. De Antonellis, "A schema analysis and
reconciliation tool environment for heterogeneous information sources",
IDEAS'99, Montreal, Canada, 1999.
(Castano 98) S. Castano, V. De Antonellis, M.G. Fugini, B. Pernici,
"Conceptual Schema Analysis: Techniques and Applications", ACM
Transactions on Database Systems, scheduled for the September issue, 1998.
(Chawathe et al. 1994) S. Chawathe, H. Garcia Molina, J. Hammer, K. Ireland, Y. Papakostantinou, J. ullman, J. Widom, "The TSIMMIS project: integration of heterogeneous information sources", in Proc. of 100th Anniversary Meeting of the Information Processing Soc. of Japan, Tokyo, 1994.
(Haas et al. 1999) L.M. Haas, R.J. Miller, B. Niswonger, M. Tork Roth, P.M.
Schwarz, E.L. Wimmers, "Transforming heterogeneous data with database
middleware: beyond integration", Bulletin of the IEEE TC on Data
Engineering, 1999.
(Mena et al. 1996) E. Mena, V. Kashyap, A. Sheth, A. Illallamendi, "OBSERVER: An approach for query processing in global information systems based on ineroperation across pre-existing ontologies", Proc. of CoopIS'96, 1996.
(Milo and Zohar 1998) T. Milo, S. Zohar, "Using schema matching to simplify
heterogeneous data translation", VLDB'98, New York, USA, 1998.
(Ram and Ramesh 1998) S. Ram, V. Ramesh, "Schema integration: past, present
and future", in A. Elmagarmid et al. Eds, Management of Heterogeneous and
Autonomous Database Systems, Morgan-Kaufmann, 1998.
(Reddy et al. 1994) M.P. Reddy, B. E. Prasad, P.G. Reddy, A. Gupta, "A methodology fo integration of heterogeneouis databases", IEEE Trans. on Knowledge and Data Engineering, Vol.6, N.6, December 1994.

2.3 Descrizione del programma e dei compiti dell'Unità di Ricerca

Testo italiano

Obiettivo della ricerca dell'unita' UNIBS e' lo sviluppo di un ambiente di strumenti di tipo semi-automatico per l'indicizzazione, la classificazione e integrazione di sorgenti di dati e siti XML in ambiente Web. Tale ambiente intende fornire supporto alla creazione di una interfaccia di interrogazione uniforme per la cooperazione di sistemi informativi basati su Web. Un problema cruciale per garantire l'efficacia delle attivita' di cooperazione e scambio dati, riguarda il disegno di meccanismi che consentano di organizzare lo spazio di ricerca dell'informazione in modo ottimale rispetto alle interrogazioni attese. A tale scopo, sono necessarie tecniche sofisticate di indicizzazione delle sorgenti che discriminino termini rilevanti e relativi pesi. Inoltre, sono necessari strumenti per la classificazione di meta-informazioni, ad esempio contenute in DTD, che consentano di raggruppare sorgenti che rispondano di stesse o simili strutture. Particolare rilevanza assumono in tale contesto problematiche di ricerca inerenti la costruzione di ontologie di concetti a supporto della classificazione automatica di documenti rispetto al contenuto informativo.
Per gli aspetti di integrazione, a partire dai risultati della attivita' di ricerca svolta nel progetto INTERDATA MURST, saranno proposti metodi e strumenti per riconciliare sorgenti semi-strutturate che
contengono documenti XML, e relativi schemi di descrizione, rappresentati mediante DTD.
Il programma di ricerca e' articolato nelle fasi descritte nel seguito.
Fase 1: I Semestre
- Definizione preliminare delle possibili estensioni ai modelli di classificazione basati su indici e gerarchie di concetti per trattare sorgenti di dati e siti XML in base a meta-informazioni disponibili.
- Definizione preliminare delle possibili estensioni al modello di integrazione supportato dall'ambiente di aiuto al progettista ARTEMIS, per poter considerare proprieta' specifiche di sorgenti di dati e siti XML in
ambiente Web.
Prodotti della Fase 1:
Rapporto Tecnico con indicazione di soluzioni preliminari alle problematiche di interesse.
Fase 2: II Semestre
- Definizione di tecniche di indicizzazione di sorgenti di dati e siti XML in ambiente Web, in cui pesare termini in base alla rilevanza assunta nel rappresentare il contenuto informativo, e tecniche di classificazione di meta-informazioni per raggruppare sorgenti che rispondano di stesse o
simili strutture.
- Definizione di una metodologia per l'integrazione di sorgenti di dati e siti XML, che faccia uso di meta-informazioni su struttura e contenuto per trattare proprieta' di somiglianza e aspetti di schema-matching.
Prodotti della Fase2:
Rapporto Tecnico di descrizione della tecniche di classificazione e della metodologia di integrazione.
Fase 3: III Semestre
- Progetto di strumenti di aiuto al progettista per la indicizzazione, classificazione e integrazione di sorgenti di dati e siti XML, basati sull'architettura dell'ambiente ARTEMIS.
Prodotti della Fase3:
Rapporto Tecnico di specifica degli strumenti di supporto.
Fase 4: IV Semestre
- Sviluppo di un ambiente prototipale di supporto al progettista per la indicizzazione, classificazione e integrazione di sorgenti di dati e siti XML in ambiente Web.
Prodotti della Fase 4
Prototipi software degli strumenti di interesse.

Testo inglese

Goal of the research at UNIBS is the development of a design tool environment to support indexing, classification and integration of data sources and XML sites in the Web environment. The environment intends to support the creation of a uniform query interface for cooperation between Web-based information systems. One of the major problems for effectiveness of cooperation and data exchange activities, is concerned with mechanisms for organizing the information search space with respect to
expected queries. For this purpose, advanced indexing techniques are required, to determine relevant terms and related weights. Furthermore, tools to classify meta-information, for example in DTDs, are needed to group sources with same or similar structures. In this framework, research issues concerned with the construction of concept ontologies are particularly relevant to effectively support document classification.
For the integration, starting from results of the research activity developed in the INTERDATA MURST project, methods and tools for reconciling semistructured sources will be developed.
The research activity is articulated in the following phases.
Phase 1: I Semester
-Preliminary definition of possible extensions to classification models based on indexes and concept hierarchies, to treat with data sources and XML sites according to available meta-information.
-Preliminary definition of possible extensions to the integration model supported by the ARTEMIS tool environment, to consider properties specific of data sources and XML sites in the Web environment.
Products of Phase 1:
Technical report on preliminary solutions to the addressed research issues.
Phase 2: II Semester
- Definition of indexing techniques for data sources and XML sites in the Web environment, with weighted terms, and classification techniques for meta-information, to group sources with same or similar structures.
- Development of a methodology to integrate data sources and XML sites, based on the use of meta-information to treat with similarity properties and schema-matching.
Products of Phase2:
Technical report on the proposed classification techniques and integration methodology.
Phase 3: III Semester
- Development of tools for indexing, classification and integration of data sources and XML sites, based on the ARTEMIS architecture.
Products of Phase3:
Technical specification documents of the proposed tools.
Phase 4: IV Semester
- Implementation of design support tools for indexing, classification and integration of data sources and XML sites in the Web environment.
Products of Phase4:
Software prototypes of the proposed tools.

2.4 Descrizione delle attrezzature già disponibili ed utilizzabili per la ricerca proposta

Anno di acquisizione Descrizione
Testo italiano Testo inglese
1.  1999PC COMPAQ DESKPRO EP PII 400 NT  PC COMPAQ DESKPRO EP PII 400 NT 
2.  1994WORKSTATION SUN SPARK 20  WORKSTATION SUN SPARK 20 
3.     
4.     
5.     


2.5 Descrizione della richiesta di Grandi attrezzature (GA)

Attrezzatura I
Descrizione

valore presunto (milioni)   percentuale di utilizzo per il programma

Attrezzatura II
Descrizione

valore presunto (milioni)   percentuale di utilizzo per il programma


Parte: III
3.1 Costo complessivo del Programma dell'Unità di Ricerca

Voce di spesa Spesa Descrizione
Euro Testo italiano   Testo inglese  
Materiale inventariabile 20  10.329  PC - Workstation  PC - Workstation 
Grandi Attrezzature        
Materiale di consumo e funzionamento 10  5.165  acquisto materiale accessorio per elaborazione dati e documentazione  Consumables 
Spese per calcolo ed elaborazione dati        
Personale a contratto        
Servizi esterni        
Missioni 40  20.658  missioni per incontri, seminari, conferenze nazionali e internazionali inerenti il progetto  participation at meeetings, seminars, national and international conferences 
Altro        


  Euro
Costo complessivo del Programma dell'Unità di Ricerca 70  36.152 
 
Costo minimo per garantire la possibilità di verifica dei risultati 56  28.922 
 
Fondi disponibili (RD) 10  5.165 
 
Fondi acquisibili (RA) 11  5.681 
 
Cofinanziamento richiesto al MURST 49  25.306 
 


Parte: IV
4.1 Risorse finanziarie già disponibili all'atto della domanda e utilizzabili a sostegno del Programma

QUADRO RD

Provenienza Anno Importo disponibile nome Resp. Naz. Note
Euro
Università 1999   10  5.165    60%-98 + 60%-99 
Dipartimento          
MURST (ex 40%)          
CNR          
Unione Europea          
Altro          
TOTAL   10  5.165     

4.1.1 Altro


4.2 Risorse finanziarie acquisibili in data successiva a quella della domanda e utilizzabili a sostegno del programma nell'ambito della durata prevista

QUADRO RA

Provenienza Anno della domanda o stipula del contratto Stato di approvazione Quota disponibile per il programma Note
Euro
Università 1999   disponibile in caso di accettazione della domanda  11  5.681   
Dipartimento          
CNR          
Unione Europea          
Altro          
TOTAL     11  5.681   

4.2.1 Altro


4.3 Certifico la dichiarata disponibilità e l'utilizzabilità dei fondi di cui ai punti 4.1 e 4.2:      SI     

Firma ____________________________________________




(per la copia da depositare presso l'Ateneo e per l'assenso alla diffusione via Internet delle informazioni riguardanti i programmi finanziati; legge del 31.12.96 n° 675 sulla "Tutela dei dati personali")




Firma ____________________________________________ 30/03/1999 14:07:24