Progettazione e realizzazione
di una applicazione basata su dati estratti da
Web
Si vuole sviluppare una applicazione
basata su dati provenienti da numerosi siti Web
attraverso programmi di estrazione
generati automaticamente dal prototipo di ricerca
roadRunner.
Requisiti: POO, Basi di
dati, Analisi e Progettazione del Sw, Sistemi
Distribuiti
Manutenzione dei programmi di
estrazione dati da Web
Applicazioni alimentate da dati
provenienti da Web si basano sull'uso di programmi
di estrazione, tipicamente chiamati
wrapper. Un cambiamento nelle pagine del sito
da cui si estraggono i dati puo'
richiedere la generazione di un nuovo wrapper.
Il nuovo wrapper potrebbe organizzare i
dati estratti in una struttura logica
differente da quella del wrapper
precedente. Il problema che si affronta e' quindi
quello di generare una trasformazione che
consenta di mappare la struttura dei dati
associata al nuovo wrapper sullo schema
dei dati offerto dal wrapper attivo
precedentemente al cambiamento.
Requisiti: Informatica
teorica I, Basi di dati, POO
Tecniche avanzate aumentare
l'espressivita' dei programmi di estrazione di
dati da Web
L'attuale algoritmo per la generazione
automatica di programmi di estrazione dati da Web
ha una applicabilita' limitata alle
pagine con una struttura molto regolare; la
principale
causa di questo limite risiede nel
ridotto potere espressivo delle grammatiche che e'
possibile inferire. Obiettivo della tesi
e' quello di estendere l'algoritmo di inferenza
del prototipo di ricerc aroadRunner con
tecniche avanzate che consentano di incrementare
l'espressivita' della classe di
grammatiche dei wrapper generabili.
Requisiti: Informatica teorica, POO
Sviluppo di una interfaccia
grafica amichevole per il raffinamento del
wrapper
Si vuole sviluppare un'interfaccia
grafica amichevole per il prototipo di generazione
di programmi di estrazione dati da Web RoadRunner.
Requisiti: POO, Analisi e Progettazione del Sw
Tecniche per aumentare la
robustezza dei programmi di estrazione dati da
Web
Un programma di estrazione di dati da Web
sostanzialmente e' una grammatica. Il prototipo di
ricerca roadrunner e' in grado di
inferire automaticamente grammatiche per
l'estrazione di
dati a partire da un piccolo insieme di
pagine di esempio. Tuttavia, la classe di
grammatiche
generate dal sistema di inferenza di
RoadRunner sono estremamente precise e
dettagliate.
Questa caratteristica puo' compromettere
la resistenza del programmi di estrazione
ai cambiamenti delle pagine da cui estrae
informazioni. Obiettivo del progetto e' quello di
studiare tecniche aumentare la robustezza
dei programmi di estrazione, senza ridurne la
precisione.
Requisiti: Informatica teorica, POO
Crawling e Classificazione di siti Web regolari
L'obiettivo del progetto e' quello di
sviluppare un sistema di crawling scalabile in
grado
di navigare e classificare le pagine Web
di un sito in base alla loro somiglianza
strutturale.
Requisiti: Intelligenza
artificiale, POO, Analisi e Progettazione del Sw,
Sistemi Distribuiti
Inferenza di grammatiche per
pagine web: proprieta' computazionali
Obiettivo del progetto e' quello di
studiare proprieta' formali delle classi di
grammatiche
usate per esprimere programmi di
estrazone di dati da Web dei corrispondenti
algoritmi di
apprendimento.
Requisiti: Informatica teorica
Sviluppo di un ambiente di
testing e valutazione di programmi di estrazione
dati da Web
Obiettivo del progetto e' quello di
progettare e sviluppare un ambiente per testare e
valutare le
prestazioni di un programma di estrazione di dati da Web.
Requisiti: POO, Analisi
e Progettazione del Sw, Sistemi Distribuiti
Sviluppo materiale e strumenti di
aulisio all'insegnamento di POO
Obiettivo del progetto e' quello di
progettare e sviluppare programmi e materiale di
ausilio all'insegnamento della
Programmazione Orientata agli oggetti.
Requisiti: POO, Analisi e Progettazione del Sw
Sviluppo materiale e strumenti di aulisio
all'insegnamento di Sistemi informativi su
Web
Obiettivo del progetto e' quello di progettare e
sviluppare programmi e materiale di
ausilio all'insegnamento di alcuni framework (es.
Torque, Struts) nell'ambito delle
tematiche affrontate nel corso di Sistemi informativi su Web.
Requisiti: POO, Analisi e
Progettazione del Sw, Sistemi distribuiti
Sviluppo di applicazioni prototipali
Obiettivo del progetto e' quello di progettare e
sviluppare applicazioni prototipali per
il digitale terrestre in ambiente Microsoft .Net.
Requisiti: POO, Analisi e Progettazione del Sw
Accessibilita' e usabilita' applicazioni digitale terrestre
Obiettivo del progetto e' quello di definire
linee guida per lo sviluppo e per la valutazione
di applicazioni digitale terrestre altamente accessibili e usabili.
Requisiti: POO, Analisi e
Progettazione del Sw, Sistemi distribuiti