Ministero dell'Universita' e della Ricerca scientifica e tecnologica
Dipartimento Affari Economici
Programmi di Ricerca scientifica - richiesta di cofinanziamento
(DM del 23 aprile 1997)
PROGETTO DI UNA UNITA' DI RICERCA - MODELLO B
Anno 1997 - prot. 9709A77351_008


1. Programma di Ricerca di tipo: interuniversitario


Area Scientifico Disciplinare: Ingegneria industriale dell'informazione
Per programmi inter-area:
Area: Scienze matematiche (35%)

2. Coordinatore Scientifico del Programma di Ricerca
ATZENI
(Cognome)
PAOLO
(Nome)

(Cognome acquisito - facoltativo)
IIIa Università
(Università)
INGEGNERIA
(Facoltà)
DIP INFORMATICA E AUTOMAZIONE
(Dipartimento/Istituto)

3. Titolo del Programma di Ricerca Metodologie e tecnologie per la gestione di dati e processi su reti Internet e Intranet


4. Responsabile Scientifico dell'Unità di Ricerca
TANCA
(Cognome)
LETIZIA
(Nome)

(Cognome acquisito - facoltativo)
Professore Ordinario
(Qualifica)
09/05/55
(Data di nascita)
TNCLTZ55E49H703J
(Codice di identificazione personale)
VERONA
(Università)
SCIENZE MATEMATICHE FISICHE e NATURALI
(Facoltà)
IST. POLICATTEDRA DELLA FAC. DI SCIENZE
(Dipartimento/Istituto)
599
(Codice conto Tesoreria Unica del Dip/Ist.)
045 /8098908
(Prefisso e telefono)
045 /8098929
(Numero fax)
tanca@sci.univr.it, tanca@elet.polimi.it
(Indirizzo di posta elettronica)


5. Settori disciplinari interessati dal Programma di Ricerca
K05A K05B


6. Titolo specifico del programma svolto dall'Unità di Ricerca
METODOLOGIE E TECNOLOGIE PER LA GESTIONE DI DATI E PROCESSI SU RETI INTERNET E INTRANET: ESTRAZIONE DI INFORMAZIONI DISTRIBUITE SUL WWW


7. Descrizione del Programma dell'Unità di Ricerca
L' evoluzione dei modelli concettuali e dei linguaggi per
l'interrogazione delle basi di dati suggerisce la definizione di un ambiente concettuale per la modellazione e l'accesso alle informazioni del Web. Questo approccio e' basato sulla convinzione che, al fine di catturare in maniera il piu' possibile appropriata l'informazione di interesse, occorre specificare la semantica dei siti. Nel mondo delle basi di dati cio' e' fatto
specificando uno schema dell'applicazione; analogamente, ci si propone di mantenere una rappresentazione astratta delle
informazioni dei siti WEB mediante schemi basati su grafi,
permettendo di specificare interrogazioni su questi schemi sempre in forma di grafi. Lo schema e le interrogazioni si possono riferire alla natura logica o
navigazionale dei concetti e dei legami presenti nel sito. Il linguaggio che permetterebbe di specificare schemi di siti, i siti stessi, le viste su di essi e le interrogazioni e' WG-log, un linguaggio basato su grafi, contenente elementi lessicali tipici dei linguaggi di progettazione ipermediali, ma fortemente espressivo dal punto di vista delle interrogazioni.In questo modo e' possibile, gia' in fase di progetto di un sito mediante una metodologia di progettazione strutturata, ricavare anche uno schema concettuale del sito che puo' essere usato come base per le interrogazioni.


Un altro paradigma di interrogazione che vogliamo sperimentare e' basato sull'uso della realta' virtuale:
tra le tecniche di interazione con strutture dati complesse, in particolare con oggetti multimediali, la grafica tridimensionale e la realta' virtuale sono state oggetto di particolare interesse per il loro grande potere espressivo. In ambito Internet, si possono utilizzare i mondi virtuali come metafore di accesso alle strutture informative presenti in WWW, attraverso la costruzione dinamica di oggetti tridimensionali che riproducono le relazioni tra informazioni esistenti, esprimendo anche eventuali vincoli di accesso.


La ricerca si articolera' in 4 fasi, di durata semestrale:
PRIMA FASE:


L'interazione con il WEB mediante il linguaggio WG-log prevede che dei programmi chiamati Schema Robots gestiscano gli schemi dei siti di struttura nota, e forniscano all'utente un'interfaccia basata su parole chiave attraverso le quali e' facile identificare lo schema del sito che contiene le informazioni desiderate. A questo punto, noti gli schemi dei siti da interrogare, l'utente, mediante un'interfaccia grafica fornita dal sistema, formula una query visuale che viene spedita ai siti di interesse, presso i quali risiede un modulo di gestione delle interrogazioni detto Query Manager. La risposta alla query avra' a sua volta struttura ipermediale, organizzata secondo modalita' che e' possibile specificare attraverso la query stessa. In questa prima fase prevediamo di definire quindi le architetture dello Schema Robot e del Query Manager.


Nel caso di informazioni multimediali, si intende studiare la possibilita' di utilizzare i mondi virtuali per un accesso efficace al WWW.


I PRODOTTI DELLA PRIMA FASE:


-Rapporto tecnico con la definizione del lessico, della sintassi e della semantica del linguaggio WG-Log.


-Rapporto tecnico con la definizione della struttura degli Schema Robot e del Query Manager


-Rapporto tecnico contenente l'analisi delle tecniche di
rappresentazione di dati multimediali attraverso la metafora dei mondi virtuali.


SECONDA FASE:


Si definira' l'architettura generale del sistema basato su WG-log, e si produrra' un primo prototipo di tale sistema.
Si studieranno le query ( e le viste) "interessanti", cioe' quelle piu' frequenti e utili, per poter progettare algoritmi di accesso piu' efficaci per questi particolari tipi di query.


Dal punto di vista dell'accesso alle informazioni multimediali, si intende progettare un sistema di rappresentazione di strutture di dati multimediali che permetta di costruire e risolvere interrogazioni con la metafora dell'interazione immersiva.


I PRODOTTI DELLA SECONDA FASE


- Rapporto tecnico con la definizione dell'architettura globale del sistema basato su WG-log


- Studio di algoritmi efficienti di interrogazione per particolari classi di query WG-log, con relativa analisi di complessita'


-Implementazione di un primo prototipo del sistema WG-log;


- Rapporto tecnico contenente il progetto di un sistema di rappresentazione di dati multimediali per l'interrogazione attraverso la realta' virtuale


TERZA FASE:

Alcune delle altre unita' operative del progetto si doteranno di schemi WG-log dei propri siti, rendendoli accessibili al prototipo di Schema Robot; gli utenti avranno quindi la possibilita' di interrogare mediante WG-log i siti WWW interessati. In tal modo si avviera' una fase di sperimentazione che permettera' di produrre, nelle fasi successive, versioni sempre piu' significative del prototipo, in termini di efficienza e di efficacia.


I PRODOTTI DELLA TERZA FASE:

-Rapporto tecnico contenente la definizione di opportune strutture di dati ed algoritmi allo scopo di
diminuire i tempi di risposta del sistema WG-log

-sperimentazione e validazione del prototipo di WG-log

QUARTA FASE :

La quarta fase vedra' l'unita' impegnata principalmente in attivita' di implementazione e sperimentazione.


I PRODOTTI DELLA QUARTA FASE:

- implementazione di un secondo prototipo del sistema WG-log

- implementazione di un primo prototipo di sistema per l'interrogazione di siti WWW attraverso la metafora della
realta' virtuale

- rapporto conclusivo: sviluppi futuri della ricerca e sua
applicabilita'


8. Obiettivo del programma dell'Unità di Ricerca
Il rapido sviluppo di Internet e del World Wide Web, unito alla evoluzione dei modelli concettuali e dei linguaggi per l'interrogazione delle basi di dati, ha portato alla definizione di un ambiente globale in cui muoversi per l'accesso alle informazioni. La rete puo' essere vista sempre piu' come un unico grande contenitore di informazioni distribuite, la cui natura eterogenea e fortemente dinamica poneproblemi di interrogazione poiche' le ovvie potenzialita' del mezzo a disposizione si scontrano spesso con la poverta' delle attuali modalita' di accesso alle informazioni di interesse, spesso basate su una ricerca per parole chiave. Rispetto a problemi come quello descritto puo' venirci in soccorso la disciplina delle basi di dati, il cui obbiettivo principale e' da anni trovare delle tecniche di modellazione concettuale in grado di rappresentare in modo sintetico e completo le informazioni significative riguardanti qualunque realta'di interesse.
L'interazione con il WEB mediante il linguaggio WG-log,
derivato dal linguaggio grafico per basi di dati G-log (vedere riferimenti al punto 9) prevede, dal punto di vista architetturale, dei programmi
chiamati Schema Robots, che gestiscano tali informazioni e forniscano
all'utente un'interfaccia basata su parole chiave attraverso le quali e' facile identificare lo schema del sito che contiene le
informazioni desiderate. A questo punto, noti gli
schemi dei siti da interrogare, l'utente, mediante
un'interfaccia grafica fornita dal sistema, formula una query visuale
che viene spedita ai siti di interesse, presso i quali risiede un modulo di gestione delle interrogazioni detto Query Manager. La risposta alla query avra' a sua volta struttura ipermediale,
organizzata secondo modalita' che e' possibile specificare attraverso la query stessa.
Questo approccio e' inizialmente rivolto
all'interrogazione di siti che presentano un'interfaccia di stile opportuno, e quindi in particolare alle applicazioni Intranet, mentre nel
caso piu' generale di Internet occorre presupporre una scelta in questo senso da parte dei progettisti del sito. I vantaggi di un tale metodo sono molteplici:
1) possibilita' di estrarre informazioni specificando anche il contesto logico o navigazionale nel quale devono trovarsi;
2) possibilita' di definire viste su particolari siti o insiemi federati di siti, consentendo un accesso personalizzato alle
informazioni, ad esempio "tour guidati" creati appositamente per le varie classi di utenza e le diverse esigenze ad esse correlate;
3) classificazione e reperimento dell'informazione contenuta in un sito
sulla base della semantica intesa, contenuta negli schemi, e non delle sole parole chiave
usate nelle istanze, che potrebbero essere fuorvianti o estranee alla
semantica stessa.
4) possibilita' di definire in maniera formale stili personalizzati di
presentazione dei risultati delle interrogazioni, mediante un concetto
di "goal" che permetterebbe di estrarre dal risultato di una query la
sola parte di interesse e ristrutturarla secondo le proprie necessita'
di visualizzazione o riutilizzo.
5) possibilita' di riuso di schemi gia' progettati per piu' siti che abbiano la stessa struttura semantica e/o navigazionale, sfruttando
gli schema robots come repository per le informazioni di progetto.
Nel caso di informazioni multimediali, si intende poi studiare la possibilita' di utilizzare i mondi virtuali per un accesso efficace al WWW.


9. Base di partenza scientifica
Il problema di estrarre informazioni dal Web con modalita' diverse dalla semplice ricerca basata su parole chiave e' stato recentemente affrontato (Konoonicki 1995 e Mendelzon 1996), adottando un approccio che vede il Web come un enorme grafo di documenti collegati da link, e permette di esprimere interrogazioni sia di struttura che di contenuto.
Il nostro approccio e' simile, basato su un linguaggio che permetterebbe di specificare schemi di siti, i siti stessi, le viste su di essi e le interrogazioni e' WG-log (Damiani 1997), un'evoluzione del linguaggio G-log (Paredaens 1995 e 1997), definito presso l'Universita' di Anversa alcuni anni fa e per l'appunto basato su grafi. Nella nuova
formulazione si introducono elementi lessicali
tipici dei linguaggi di progettazione ipermediali, mantenendo il
forte potere espressivo di G-log dal punto di vista delle interrogazioni.
In ambito Internet, si possono poi utilizzare i mondi virtuali come metafore di accesso alle strutture informative presenti in WWW, attraverso la costruzione dinamica di oggetti tridimensionali che riproducono le relazioni tra informazioni esistenti, esprimendo anche eventuali
vincoli di accesso (Celentano 1995).
BIBLIOGRAFIA:
(Konopnicki 1995) D. Konopnicki, O. Shmueli "W3QS: a query system for the World wide Web", in Proc. 21rd VLDB, 1995.
(Mendelzon 1996) A.O.Mendelzon, G. Mihaila, T. Milo "Querying the World Wide Web" in Proc. on the 1st Int, Conference on Parallel and Distributed Information Systems", 1996.
(Paredaens 1995) J. Paredaens, P. Peelman, L. Tanca "G-Log: a graph-based query language", IEEE Transactions on Knowledge and data Engineering",
Giugno 1995.
(Paredaens 1997) J. Paredaens, P. Peelman, L. Tanca "Merging Graph-based and Rule-based Computation: the Language G-Log", Data and knowledge Engineering, 1997.
(Damiani 1997) E. Damiani, L. Tanca "WG-log, a graph oriented language for the WEB" Proc. 2nd International Workshop on Logic Programming tools for Internet Applications"; http://clement.info.umoncton.ca~Ipnet proceedings97S4.
(Celentano 1995) A. Celentano, "Query and retrieval in multimedia databases: a new perspective", in SDAIR 1995, Symposium on Document Analysis and Information Retrieval", Las Vegas, Aprile 1995.


10. Durata del Programma di Ricerca 24 (mesi)


11. Pubblicazioni scientifiche più significative del Responsabile dell'Unità di Ricerca
  1. J. Paredaens, P. Peelman, L. Tanca "G-Log: a graph-based query language", IEEE Transactions on Knowledge and data Engineering", Giugno 1995.
  2. J. Paredaens, P. Peelman, L. Tanca "Merging Graph-based and Rule-based Computation: the Language G-Log", Data and knowledge Engineering, 1997.
  3. E. Damiani, L. Tanca "WG-log, a graph oriented language for the WEB" Proc. 2nd International Workshop on Logic Programming tools for Internet Applications"; http://clement.info.umoncton.ca~Ipnet proceedings97S4.


12. Risultati ottenibili con fondi propri
- Rapporto tecnico con la definizione del lessico, della sintassi e della semantica del linguaggio WG-Log

- Rapporto tecnico con la definizione della struttura degli Schema Robot e del Query Manager di WG-log


-Rapporto tecnico sul progetto di sistema per l'interrogazione di siti WWW attraverso la metafora della realta' virtuale.


- Implementazione e sperimentazione di un primo prototipo del sistema WG-log (con funzionalita' ridotte)



13. Risorse umane impegnabili nel Programma dell'Unità di Ricerca
(un docente-ricercatore può far parte di una sola Unità di Ricerca)

13.1 Personale universitario dell'Università sede dell'Unità di Ricerca


No. Cognome Nome Dipart./Istituto Qualifica Mesi uomo
1. TANCA LETIZIA IST. POLICATTEDRA Professore Ordinario 8
2. PRIAMI CORRADO IST. POLICATTEDRA Ricercatore 8
3. CRISTANI MATTEO IST. POLICATTEDRA Ricercatore 8

13.2 Personale universitario di altre Università:

No. Cognome Nome Università Dipart./Istituto Qualifica Mesi uomo
1. CELENTANO AUGUSTO UNIVERSITA' DI VENEZIA MAT. APPLICATA E INFORMATICA Professore Ordinario 8
2. NOTA GIANCARLO UNIV. DI SALERNO INFORMATICA Ricercatore 8

13.3 Titolari di borse ex L. 398/89 art. 4 (post-dottorato e specializzazioni)

No. Cognome Nome Dipart./Istituto Mesi uomo

13.4 Titolari di borse per dottorato di ricerca

No. Cognome Nome Università sede amm. Dipart./Istituto Ciclo Mesi uomo
1. COMAI SARA POLITECNICO DI MILANO ELETTRONICA E INFORMAZIONE 12 12

13.5 Personale extrauniversitario - aggregabile al programma senza oneri aggiuntivi

No. Cognome Nome Ente Qualifica Mesi uomo

13.6 Personale a contratto

No. Cognome Nome Qualifica Costo previsto Mesi uomo


14. Risorse finanziarie a sostegno del Programma già disponibili all'atto della domanda
(tutte le cifre sono espresse in milioni)

QUADRO RD

Provenienza anno di assegnazione importo disponibile nome Resp. Naz.
Universita'    
Dipartimento    
MURST (ex 40%)  antecedente 1995  
MURST (ex 40%)  1995    
MURST (ex 40%)  1996  17,000  PAOLO ATZENI
CNR    
Unione Europea    
Altro    
TOTALE    17,000

14.1 Altro (origine e importi dettagliati):


15. Risorse finanziarie acquisibili in data successiva a quella della domanda e utilizzabili a sostegno del Programma
(tutte le cifre sono espresse in milioni)

QUADRO RA

Provenienza anno della domanda o stipula del contratto stato di approvazione disponibilità per il programma
Università  1997  disponibili in caso di accettazione della domanda  16,000
Dipartimento      
CNR  1996  APPROVATO  7,000
Unione Europea      
Altro  1997  APPROVATO  12,000
TOTALE      35,000

15.1 Disponibilità per il programma(articolare negli anni di durata del programma)

1 anno: 7.000.000 provenienti dal finanziamento CNR;

6.000.000 messi a disposizione del Consorzio per gli Studi Universitari dell Universita' di Verona (voce: altro)

2 anno: 16.000.000 messi a disposizione dall'Universita' di Verona;

6.000.000 messi a disposizione del Consorzio per gli Studi Universitari dell Universita' di Verona (voce: altro)

15.2 Altro (origine e importi dettagliati)

L. 12.000.000 sono messi a disposizione dal Consorzio per gli Studi Universitari dell' Universita' di Verona


16. Apparecchiature o grandi attrezzature

16.1 Disponibili ed utilizzabili per la ricerca proposta
(tutte le cifre sono espresse in milioni)

descrizione anno di acquisizione valore all'acquisto finanziamenti ottenuti dal MURST % di utilizzo per la ricerca proposta
 Workstation Unix  1995  12  0  30
         
         

L'uso delle attrezzature disponibili richiede, per la ricerca proposta, interventi di adeguamento? no

Quota necessaria per l'adeguamento:


16.2 Descrizione sintetica dell'adeguamento richiesto


16.3 Richiesta di grandi attrezzature (GA)
(tutte le cifre sono espresse in milioni)
  1. Descrizione:


    Valore presunto (milioni):    

  2. Descrizione:


    Valore presunto (milioni):    

  3. Descrizione:


    Valore presunto (milioni):    


17. Certifico la disponibilità e l'utilizzabilità dei fondi si



Firma ________________________________ (per la copia da depositare presso l'Ateneo)


18. Costo complessivo del Programma dell'Unità di Ricerca (in milioni di lire)

Costo complessivo

di cui:
 130,000

Voce importo
Materiale inventariabile - (Voce A)  50,000
Spese generali - (Voce B)  80,000
Grandi attrezzature - (Voce GA)  


Risorse disponibili all'atto della domanda (RD)  17,000
Risorse acquisibili (RA)  35,000
Cofinanziamento richiesto al MURST  78,000
Costo minimo per garantire
la possibilità di verifica dei risultati
 96,000

Occorre precisare che la quota di cofinanziamento massimo del Programma di Ricerca deve essere pari a:
(Totale RD + Totale RA) x 1.5 per progetti Interuniversitari e
(Totale RD + Totale RA) x 0.66 per progetti Intrauniversitari

(per la copia da depositare presso l'Ateneo e per l'assenso alla divulgazione via Internet delle informazioni riguardanti i programmi finanziati; legge del 31.12.96 n° 675 sulla "Tutela dei dati personali")



Firma ____________________________________ Data 18/7/97
Ora  15:29:15