Ministero dell'Universita' e della Ricerca Scientifica e Tecnologica
Dipartimento Affari Economici

 FORM PER IL COORDINATORE SCIENTIFICO


Coordinatore     PAOLO ATZENI
Titolo della Ricerca     METODOLOIE E TECNOLOGIE PER LA GESTIONE DI DATI E PROCESSI SU RETI INTERNET E INTRANET
Totale finanziamento (*)     914,000
Rd+Ra     963,700 (dichiarata)   881,685 (certificata)
Spese di coordinamento     27,420
Durata     24 mesi

(*) tutte le cifre indicate nel modulo sono espresse in milioni!

 Obiettivo della Ricerca


La grandissima diffusione del World Wide Web (WWW) ne fa al giorno d'oggi
un'interfaccia pressoche' uniforme per la condivisione delle informazioni.
Il numero e l'importanza dei siti WWW cresce di giorno in giorno,
prefigurando un futuro in cui il WWW rappresentera' uno strumento
essenziale per la diffusione delle informazioni e la disseminazione dei
dati e per l'accesso a sistemi informativi di ogni tipo.

Peraltro, la rapida diffusione delle tecnologie legate al WWW non e'
stata adeguatamente sostenuta da uno sviluppo organico di metodologie, ne'
al livello informatico (correlate agli strumenti) ne' a quello
organizzativo. Al riguardo, si possono individuare vari tipi di problemi.

Per quanto riguarda la gestione dei dati e delle informazioni,
l'organizzazione ipertestuale delle informazioni sul WWW rende difficile
lo svolgimento di attivita' sistematiche di ricerca, interrogazione e
acquisizione dei dati: gli strumenti disponibili per la ricerca, cioe' i
robot, non sono completamente soddisfacenti e comunque non e' possibile
"interrogare" il WWW nel modo, ormai riconosciuto molto utile, in cui si
interrogano le basi di dati. Inoltre, e' spesso difficile addirittura
sapere quali sono le informazioni disponibili, in quanto la documentazione
e' limitata e la non esistenza di strumenti per l'accesso globale rende
spesso necessaria una faticosa esplorazione preliminare.
Un altro problema osservato e' la difficolta' nella predisposizione e
manutenzione di siti WWW: e' stato recentemente notato che forse la meta'
dei siti WWW sono "in disuso" (creati sulla base di un entusiasmo o un
finanziamento iniziale, ma non aggiornati) e che in moltissimi casi la
manutenzione dei siti presenta costi organizzativi e umani molto superiori
alle valutazioni iniziali. Infine, sono tutt'ora irrisolti i problemi
legati alla sicurezza nell'interazione con siti WWW, funzionalita'
essenziale per un suo pieno utilizzo in attivita' produttive.

Il progetto si pone l'obiettivo di affrontare sistematicamente le
problematiche connesse con la gestione, attraverso il World Wide Web, di
grandi moli di dati e delle relative applicazioni. Il progetto che qui
viene descritto, e che verra' anche indicato con l'acronimo INTERDATA, si
articolera' secondo sette temi, ognuno rappresentativo di un fondamentale
aspetto della problematica generale:

1) applicazioni per basi di dati su Internet e Intranet

2) estrazione di informazioni distribuite sul WWW

3) integrazione di informazioni estratte da siti WWW

4) analisi delle informazioni estratte dal WWW

5) visualizzazione di informazioni provenienti dal WWW

6) metodologie di progettazione di siti WWW

7) sicurezza e controllo degli accessi in siti WWW


In questo modo, si affronteranno, nel primo tema, le problematiche
relative alle applicazioni che utilizzano la rete e in particolare i dati
definiti su di essa. Nei successivi quattro si affronteranno vari aspetti,
logicamente successivi, nell'utilizzo di informazioni provenienti da siti
WWW esistenti: estrazione di informazioni da singoli siti (tema 2),
integrazione di informazioni provenienti da siti diversi (tema 3), analisi
al fine dell'utilizzo (tema 4) e visualizzazione (tema 5).
Negli ultimi due temi si affronteranno problematiche di natura progettuale:
l'organizzazione complessiva anche con riferimento all'uso di basi di dati
(tema 6) e la definizione e gestione della sicurezza (tema 7).



Innovazione rispetto allo stato dell'arte nel campo


Su ciascuno dei temi il progetto si propone di fornire contributi
scientifici e sperimentazioni originali, secondo il seguente breve
dettaglio.


TEMA 1: APPLICAZIONI PER BASI DI DATI SU INTERNET E INTRANET



Obiettivo del presente tema e' la specifica e la realizzazione
di applicazioni per basi di dati su Internet e Intranet per la gestione di
processi aziendali e di applicazioni distribuite su reti Internet.
I contributi saranno di tipo sia metodologico sia applicativo,
in ambiente di controllo industriale e
nell'ambito dei servizi della Pubblica Amministrazione.



TEMA 2: ESTRAZIONE DI INFORMAZIONI DISTRIBUITE SUL WWW



Le attuali modalita' di accesso all'informazione distribuita sul WWW
(navigazione manuale ed uso di motori di ricerca) non possono essere
sempre considerate soddisfacenti, per la complessita` del processo e
per la scarsa accuratezza e strutturazione dei risultati.
Obiettivo del tema e' pertanto studiare soluzioni e sviluppare strumenti
che consentano un'interazione piu' efficace ed efficiente con il WWW.



TEMA 3: INTEGRAZIONE DI INFORMAZIONI ESTRATTE DA SITI WWW



La possibilita' di disporre di grandi quantita' di informazioni estratte da
siti WWW pone in evidenza la necessita' di poter definire viste globali
delle informazioni provenienti da sorgenti distribuite ed eterogenee, per
fornire una rappresentazione integrata dei dati.
Obiettivo del presente tema di ricerca e' lo sviluppo di metodi e strumenti
per la ristrutturazione e integrazione di informazioni e conoscenza
disponibili su Internet e Intranet.



TEMA 4: ANALISI DELLE INFORMAZIONI ESTRATTE DAL WWW



A causa della mole rilevante di dati che puo` essere estratta dal Web si
rendono necessarie elaborazioni successive che permettano
sia di individuare informazioni rilevanti per una specifica applicazione,
sia di fornire un supporto efficace alle decisioni da intraprendere.
L'attivita` di ricerca sara` focalizzata sui seguenti temi:
progettazione di data warehouse;
metodi per l'analisi dei dati;
analisi delle prestazioni.



TEMA 5: VISUALIZZAZIONE DI INFORMAZIONI PROVENIENTI DAL WWW



Con la globalizzazione delle informazioni, determinata dall'uso crescente
del WWW, l'accesso a grandi quantita' di dati e' diventata una necessita'
per gli utenti di sistemi informatici.
Obiettivo del tema e' l'identificazione di appropriate forme di
visualizzazione che permettano di esaminare lo stesso insieme di dati da
differenti angolazioni, evidenziando diverse caratteristiche. Inoltre,
l'interazione con tali visualizzazioni permettera' all'utente di guidare
facilmente il successivo processo di analisi.



TEMA 6: METODOLOGIE DI PROGETTAZIONE DI SITI WWW



Con l'affermarsi del Web quale strumento principe per l'accesso a grandi
collezioni di dati, e' divenuto sempre piu' importante progettare siti Web
che consentano una interazione organica, semplificando al massimo la
gestione dei dati contenuti nel sito. In questo senso, la tecnologia delle
basi di dati rappresenta una risorsa essenziale. L'obiettivo di questa
ricerca e' lo studio di metodologie e tecniche che supportino la
progettazione di siti Web e delle relative basi di dati in ambiente
Internet/Intranet.




TEMA 7: SICUREZZA E CONTROLLO DEGLI ACCESSI IN SITI WWW



L'obiettivo dell'attivita' di ricerca proposta e' lo sviluppo di un
meccanismo di controllo degli accessi a pagine WWW. Il meccanismo di
controllo e' di tipo discrezionario e deve permettere di garantire e
revocare autorizzazioni a singoli utenti ed a gruppi di utenti. Il
meccanismo di controllo degli accessi che si prevede di sviluppare sara'
basato sui vari tipi di accesso che si eseguono a pagine WWW, come
letture, navigazioni, modifiche attraverso forms.




Criteri di verificabilità

1) Il progetto e' stato articolato in fasi semestrali e
per ciascuna fase (e per ciascun tema) sono state indicate le attivita'
previste, con i relativi prodotti (rapporti tecnici e prototipi
software).
Pertanto, la valutazione potra' essere fatta esaminando la
qualita' dei prodotti stessi.

2) 

3) 

4) 

Unità di Ricerca

1]  Unità di       IIIa Universita' degli Studi di ROMA
 
     Responsabile PAOLO ATZENI  
 
     Rd+Ra      68,000 (dichiarata) 68,000 (certificata)
 
     Finanziamento   75,660
 
     Compito
     

L'unita` e` coinvolta nei temi 2, 4 e 6.


Tema 2: Estrazione di informazioni distribuite sul WWW



Saranno sviluppati strumenti che consentano
un'interazione piu' efficace con il WWW, nello spirito dei linguaggi di
interrogazione
per basi di dati. Sono previsti i seguenti prodotti:



- definizione del modello di dati per la descrizione
di siti Web e di un linguaggio di interrogazione
ad alto livello;



- definizione e realizzazione di un linguaggio per la
scrittura dei wrapper, cioe' di programmi che permettano
al linguaggio di interrogazione di estrarre informazioni dalle pagine HTML



- realizzazione prototipale di un sistema che permetta di interrogare
siti WWW.



- sperimentazione del prototipo e sviluppo di strumenti di ausilio, sia
riguardo all'esecuzione efficiente di interrogazioni sia riguardo al
supporto alla formulazione di interrogazioni.





Tema 4: Analisi delle informazioni estratte dal WWW



A causa della mole rilevante di dati che puo` essere estratta dal
Web si rendono necessarie elaborazioni successive che permettano sia di
individuare informazioni rilevanti per una specifica applicazione, sia di
fornire un supporto efficace alle decisioni da intraprendere. Sono
previsti le attivita' e i prodotti seguenti:



- definizione di un modello logico per rappresentare aspetti dimensionali
di un data warehouse su Web e di linguaggi per l'analisi dei
dati.



- sviluppo di un prototipo per un linguaggio per l'interrogazione di basi
di dati multidimensionali



- definizione e sperimentazione di un quadro metodologico integrato
per il progetto di data warehouse, con riferimento agli aspetti di
analisi delle fonti informative, di
integrazione delle stesse, di progettazione concettuale e logica del data
warehouse e di progettazione della base di dati multidimensionale



Tema 6: Metodologie di progettazione di siti WWW



E' divenuto sempre piu' importante progettare siti Web che
consentano una interazione organica, semplificando al massimo la gestione
dei dati contenuti nel sito. In questo senso, la tecnologia delle basi di
dati rappresenta una risorsa essenziale. E' necessario dunque sviluppare
metodologie e strumenti che supportino la progettazione di siti Web e
delle relative basi di dati.



- definizione dei modelli di dati (concettuale e logico) per la descrizione
di siti Web;



- definizione di passi metodologici che permettano di sviluppare
gradualmente i vari aspetti di un sito WWW: contenuto informativo (a
livello concettuale e logico), struttura ipertestuale, e presentazione;



- sviluppo di strumenti a supporto della metodologia, in particolare per
la generazione automatica delle pagine HTML a partire dal contenuto
di basi di dati



- sperimentazione della metodologia su casi applicativi concreti.




2]  Unità di       Universita' degli Studi di MODENA
 
     Responsabile SONIA BERGAMASCHI MONARI  
 
     Rd+Ra      48,000 (dichiarata) 32,000 (certificata)
 
     Finanziamento   40,740
 
     Compito
     


L'unita` e' coinvolta nei temi 1 e 3, come segue.




Tema 1: applicazioni per basi di dati su Internet e Intranet




Obiettivo:
Progetto e sviluppo di un prototipo software di generatore di servizi di
accesso a basi di dati in
ambiente Internet.




Si intende affrontare il problema di distribuire servizi DBMS in ambiente
Internet garantendo
elevata portabilita`, semplicita` di installazione e sicurezza degli
accessi. Si intende utilizzare il linguaggio Java per costruire un
generatore di servizi di accesso a basi di dati
fondato su due classi di attori: i gestori di servizio, che progettano le
transazioni parametriche da mettere a
disposizione, e gli utenti, che utilizzano le interfacce generate
automaticamente in fase di progettazione
dei servizi.




Tema 3: integrazione di informazioni estratte da siti WWW




Obiettivi:
Definizione delle estensioni a logiche descrittive al fine di definire un
linguaggio per la generazione di
"mediatori", cioe' di componenti software che integrino informazioni
provenienti da sorgenti multiple
ed eterogenee di dati testuali strutturati e semi-strutturati.
Progetto e sviluppo di un componente software per la generazione di
"mediatori", basato su logiche
descrittive.




L'approccio che si intende adottare fa uso del formalismo di Logica
Descrittiva OLCD (Object
Languages with Complements allowing Descriptive cycles), sviluppato
dall'unita` stessa per la
modellazione di basi di dati ad oggetti complessi e derivato da formalismi
sviluppati in in ambito
Intelligenza Artificiale.




Attraverso OLCD e sue estensioni, ci si propone di fornire:




- una descrizione comune delle sorgenti di informazione, basata sullo
standard
ODMG93, che permetta di rappresentare informazioni strutturate (relazionale
e ad oggetti) e semi-strutturate, quali documenti HTML, file system, banche dati;




- tecniche di inferenza per accedere in modo efficiente alle sorgenti;




- un linguaggio dichiarativo per la specifica di "mediatori", cioe` di
componenti che integrano i dati
provenienti da sorgenti eterogenee.




Prodotti previsti:




- rapporto tecnico relativo all'individuazione delle caratteristiche comuni
dei servizi DBMS in rete e progettazione dell'architettura
software del sistema




- prototipo software di generatore di servizi di accesso a basi di
dati in ambiente Internet.




- rapporto tecnico sullo stato dell'arte relativo
all'approccio al problema dell'integrazione di
informazioni eterogenee di altri
gruppi di ricerca internazionali e analisi delle soluzioni, note come
datawarehouse, proposte in ambito commerciale




- rapporto Tecnico sull'architettura del sistema di integrazione di informazioni.
Definizione delle estensioni di OLCD al fine di definire un linguaggio
per la
generazione di mediatori.
Specifica funzionale di mediatori.




- rapporto Tecnico sulla specifica funzionale dei componenti
software che implementano il
mediatore




- realizzazione di un prototipo software del mediatore





3]  Unità di       Universita' degli Studi della CALABRIA
 
     Responsabile DOMENICO SACCA'  
 
     Rd+Ra      77,000 (dichiarata) 77,000 (certificata)
 
     Finanziamento   62,080
 
     Compito
     

L'unita' e' coinvolta nel tema 2 (Estrazione di informazioni distribuite sul WWW)
con l'obiettivo della
definizione e implementazione di un prototipo di un linguaggio logico
"non deterministico" per l'accesso al Web. Tale linguaggio e' ottenuto
mediante l'estensione all'interno di un linguaggio logico per basi di dati
con costrutti per l'interrogazione del Web e costrutti di tipo non
deterministico.
Il linguaggio logico definito, basato su Datalog, permette di navigare in
modo controllato la rete utilizzando la ricorsione. Tuttavia per poter
esprimere un maggiore controllo dell'enorme spazio di ricerca (che in
alcuni approcci viene considerato infinito) sono necessari costrutti che
permettono di esprimere vincoli sul tipo di inferenze. L'uso di costrutti
non deterministici, precedentemente introdotti nell'ambito dei linguaggi
logici per basi di dati, permette di realizzare tale obiettivo e di
controllare la dimensione e la priorita' delle risposte all'interrogazione.
L'uso del non-determinismo produce vantaggi sia in termini di espressivita`
(l'insieme delle interrogazioni esprimibili) che in termini di efficienza
(la ricerca nel Web viene limitata ad un sottoinsieme della rete).
Per poter verificare l'applicabilita' del linguaggio proposto, verra'
realizzato un prototipo di un sistema che permetta di interrogare il Web
utilizzando il linguaggio precedentemente definito. Il prototipo del
sistema, oltre alla implementazione del linguaggio, disporra' di una
interfaccia utente di tipo visuale. L'implementazione del prototipo verra'
effettuata utilizzando i linguaggi Prolog e Java in ambiente Windows.



4]  Unità di       Universita' degli Studi de L'AQUILA
 
     Responsabile PAOLINO DI FELICE  
 
     Rd+Ra      43,500 (dichiarata) 34,000 (certificata)
 
     Finanziamento   44,620
 
     Compito
     


Ll'unita' e' coinvolta nel tema 3
(integrazione di informazioni estratte da siti WWW).




Tra i molteplici effetti indotti dall'avvento della rete Internet c'e' stata
una costante crescita di disponibilita' di dataset spaziali su vari siti
Web. Tale disponibilita' ha evidenziato l'opportunita' di abbandonare
l'architettura cosiddetta "monolitica", imperante nel modo dei GISs, a
favore di una architettura il più possibile "aperta". In tale scenario si
va consolidando la nozione di interoperabilita' tra applicazioni distinte
intesa come l'abilita' da parte di sistemi autonomi di operare con dati
prelevati da siti differenti. Un notevole impulso verso la realizzazione
dell'interoperabilita' tra applicazioni spaziali e' stato dato dal Consorzio
OpenGIS, la cui finalita' e' pervenire alla definizione
di specifiche per l'implementazione di interfacce software comuni
attraverso le quali realizzare un protocollo a supporto
dell'interoperabilita'. L'attivita' di ricerca proposta tende
al superamento di alcuni dei limiti attuali della proposta del Consorzio
OpenGIS, riconducibili, nell'ordine: alla limitata generalita' del modello
dei dati spaziali adottato, all'incompletezza del repertorio di operazioni
spaziali offerte e al non ottimale livello di interoperabilita' garantito.



Corrispondentemente, l'attivita' di ricerca verra' articolata in varie
direzioni, per ciascuna delle quali i risultati verranno descritti in
opportuni rapporti tecnici.



Trattamento dell'incertezza nella geometria



Il modello per la geometria adottato nella proposta OpenGIS fa riferimento
a feature semplici con geometria esatta. Nel contesto
geografico tale ipotesi costituisce una evidente semplificazione.
Verranno introdotti modelli che consentano di
trattare l'incertezza con la quale si conosce, e quindi si rappresenta, lo
spazio fisico che ci circonda.



Relazioni spaziali tra oggetti geometrici



Si procedera' alla definizione di un insieme minimo e completo
di operatori per le relazioni topologiche tra oggetti con contorno
indeterminato. Inoltre, si prevede di ampliare il repertorio di operatori
topologici da applicare anche a oggetti con contorno esatto per dare la
possibilita' di esaminare una gamma di invarianti topologici il più
possibile ampia, e quindi poter fare interrogazioni più dettagliate. Per
quanto riguarda le relazioni di orientamento e di distanza, andra' svolto un
lavoro ancora più approfondito in quanto attualmente la proposta OpenGIS e'
carente rispetto ad esse.



Modelli multi-risoluzione per dati spaziali



In un ambiente che debba operare su dati prelevati da Web e' essenziale
poter utilizzare dati in formato diverso e a risoluzione diversa. Al
riguardo e' necessario disporre di strumenti formali che permettano il
controllo della qualita' degli stessi a seguito di ogni trasformazione che
li riguarda. La definizione di un modello multi-risoluzione e' lo strumento
essenziale in tal senso.




Modelli per l'interazione con i dati




Due aspetti fondamentali del progetto di un'interfaccia utente sono il
modello esterno (visibile all'utente), ed il modello di interazione
(intermedio tra l'interfaccia vera e propria e il data repository
sottostante, e che include la definizione formale di strutture di
visualizzazione e primitive di interazione con tali strutture. Gli
obiettivi principali saranno pertanto rivolti alla definizione di strutture
ipertestuali e paradigmi d'interazione di tipo navigazionale fondati su
presentazione incrementale dell'informazione reperita, col duplice
vantaggio di ridurre il traffico su rete e guidare l'utente
nell'esplorazione del risultato, nonche' di un ambiente d'interazione
visuale basato su tali strutture e paradigmi.





5]  Unità di       Ia Universita' degli Studi di ROMA "La Sapienza"
 
     Responsabile SILVIO SALZA  
 
     Rd+Ra      50,000 (dichiarata) 50,000 (certificata)
 
     Finanziamento   52,380
 
     Compito
     


L'unita` e' coinvolta
nei temi 4 ( analisi delle informazioni estratte dal WWW ) e
5 (visualizzazione di informazioni provenienti dal WWW), con riferimento a
due ordini di problemi:



a) definizione di un'architettura di warehouse e di metodologie di progetto
dello schema e delle procedure di estrazione e di accesso alla data
warehouse;



b) definizione e progetto di interfacce visuali per la gestione del
risultato del processo di analisi dei dati contenuti nella data warehouse.



Per il primo aspetto si intende approfondire le problematiche generali di
integrazione delle sorgenti informative e di progettazione e gestione del
data warehouse, inclusi alcuni aspetti peculiari che si possono manifestare
in un contesto di rete, sia riguardo alla estrazione ed al trasferimento
dei dati, che al loro accesso da parte delle applicazioni di analisi.
Verrano inoltre approfonditi gli aspetti di analisi del carico, alla
progettazione fisica al dimensionameno delle piattaforme parallele di per
la geatione del data warehouse.



Per il secondo aspetto ci si concentrera' da una parte su tecniche avanzate di
visualizzazione, che permettano di esaminare lo stesso insieme di dati da
differenti angolazioni, allo scopo di evidenziare diverse caratteristiche dei
dati e di permettere all'utente di scoprire facilmente correlazioni non ovvie.
Dall'altra, si definira' l'interfaccia utente complessiva dell'intero sistema.
Tale interfaccia dovra' avere come caratteristiche essenziali l'usabilita' e
l'adattabilita' alle diverse esigenze e compiti delle diverse classi di
utenti,
al fine ultimo di realizzare un'interazione efficace, efficiente e
soddisfacente
per l'utente finale.




Infine si intende condurre, in stretto contatto con altre unita', lo
sviluppo e la sperimentazione di un'applicazione prototipale utilizzando le
metodologie e gli strumenti definiti nel progetto. Scopo di questa di
questa attivita' e' la sperimentazione operativa delle metodologie messe a
punto nelle tre fasi precedenti, nonche' l'integrazione dei prototipi
sviluppati per i singoli moduli.In particolare si intende selezionare di
un'applicazione sufficientemente completa ed articolta da consintere un
collaudo significativo, di tutti i passi del processo di sviluppo e di
tutti i moduli del sistema. Inoltre per quanto concerne l'interfaccia
utente sara' intrapresa una specifica sperimentazione tesa a
caratterizzarne in modo quantitativo il livello di usabilita'.



I principali prodotti dell'attivita' di ricerca saranno:



- documenti che illustrano lo stato dell'arte nel settore del
data warehousing e propongono una architettura di riferimento ed una
metodologia sistematica di progetto, a livello concettuale logico e fisico,
con particolare riguardo agli aspetti di analisi delle prestazioni e
dimensionamento.



- documenti che sviluppano una analisi comparativa sullo stato dell'arte nei
seguenti settori: tecniche di visualizzazione per grandi quantita' di dati e
loro relazione con attivita' di data mining; interfacce visuali adattive;
usabilita' dei sistemi informativi.



- documenti che descrivono le scelte progettuali relative all'interfaccia
utente
ed al modulo di visualizzazione dei dati.



- prototipo di uno strumento di supporto alla progettazione per l'analisi del
carico ed il dimensionamento del data warehouse su piattaforma parallela.



- prototipo di primo livello della interfaccia utente dell'intero sistema.



- prototipo di primo livello del modulo di visualizzazione dei dati.



- realizzazione, in collaborazione con altre unita', di un'applicazione
prototipale che copra tutti i principali aspetti, che vanno dall'estrazione
dei dati da WWW alla loro visualizzazione tramite interfaccia utente
amichevole.




6]  Unità di       Universita' degli Studi di MILANO
 
     Responsabile ELISA BERTINO  
 
     Rd+Ra      100,000 (dichiarata) 100,000 (certificata)
 
     Finanziamento   69,840
 
     Compito
     


L'unita` e' coinvolta
nel tema 7 (sicurezza e controllo degli accessi in siti WWW).




L'attivita' di ricerca riguarda lo sviluppo di un meccanismo di controllo
degli accessi a pagine WWW di tipo tipo discrezionario. Il meccanismo di
controllo degli accessi che si prevede di sviluppare sara' basato sui vari
tipi di accesso che si eseguono a pagine WWW, come letture, navigazioni,
modifiche attraverso forms. Le funzioni principali che il meccanismo di
controllo deve fornire includono: garanzia e revoca di autorizzazioni per
l'accesso a pagine WWW a livelli variabili di granularita' (quali
directories, pagine, porzioni di pagine) e con diverse modalita' di revoca
(on-line e off-line); controllo dell'accesso in base al contenuto degli
oggetti, dove gli oggetti possono anche essere multimediali; gestione di
domini logici di autorizzazione, dove un dominio logico e' un insieme di
pagine e link tra le pagine che puo' essere considerato come un singolo
oggetto da parte del meccanismo di controllo degli accessi; meccanismi di
credenziali, basati anche su profili utente; garanzia di anonimita'. Nello
sviluppare il modello si includeranno aspetti rilevanti di standard, come
ad esempio lo standard PICS proposto nell'ambito del consorzio W3C.




I prodotti che si prevede di ottenere dalla ricerca in oggetto includono
rapporti tecnici e prototipi:




un rapporto tecnico che
descrive il modello di autorizzazione e la specifica dell'architettura del
sistema di controllo degli accessi;




un rapporto tecnico che descrive il modello di autorizzazione esteso
con autorizzazioni temporali ed autorizzazioni dipendenti dalla storia
degli accessi;




un rapporto tecnico che descrive il modello di
autorizzazione esteso in base allo standard PICS, proposto da parte del
consorzio W3C;




un rapporto che descrive il meccanismo di credenziali;




un rapporto che descrive le estensioni all'architettura del sistema di
controllo degli accessi con i meccanismi di credenziali.




due prototipi di sistema di
controllo degli accessi in successione; il primo prototipo implementera'
gli aspetti di base del sistema di controllo delle autorizzazioni, mentre
il secondo introdurra' funzionalita' avanzate.





7]  Unità di       Universita' degli Studi di BOLOGNA
 
     Responsabile PAOLO CIACCIA  
 
     Rd+Ra      87,000 (dichiarata) 72,000 (certificata)
 
     Finanziamento   81,480
 
     Compito
     


L'unita` e' coinvolta
nei temi 2,4 e 6.




TEMA 2: "Estrazione di informazioni distribuite sul WWW"




Il compito e` definire e realizzare un ambiente integrato per la ricerca,
in stile dichiarativo SQL-like, di informazioni sul WWW. Tale ambiente,
denominato WaDer, e` pensato per la gestione di sorgenti di dati eterogenee
e di 'viste' di interesse sul WWW.
L'obiettivo verra` perseguito definendo innanzitutto un modello dei dati di
riferimento e un linguaggio di interrogazione non procedurale basato su
tale modello. Si definira` poi l'architettura software del sistema WaDer e
si realizzera` un primo prototipo del sistema.
Al fine di garantire efficienza nella ricerca ci si occupera' del problema
dell'ottimizzazione delle interrogazioni in tale contesto eterogeneo e
distribuito, e si considereranno aspetti legati alla rilevanza dei
risultati delle interrogazioni.





TEMA 4: "Analisi delle informazioni estratte dal WWW"




Compito dell'unita` e` la messa a punto di una metodologia di progettazione
orientata al data warehousing (DW). Verra' dapprima definito un modello
concettuale che permetta di rappresentare le informazioni rilevanti ai fini
delle successive fasi di progettazione logica e fisica. In particolare,
verranno studiate tecniche per la costruzione semi-automatica dello schema
concettuale a partire dagli schemi concettuali o logici della base di dati
transazionale sottostante. Verra' definito un linguaggio per esprimere il
carico di lavoro sullo schema concettuale. Verra' infine messa a punto una
metodologia per tradurre lo schema concettuale prodotto in uno schema
logico di data warehouse, sulla base del carico di lavoro e del volume dati
previsti.




TEMA 6: "Metodologie di progettazione di siti WWW"





Compito dell'unita` sara` estendere al WWW concetti e tecniche delle basi
di dati temporali, integrando le dimensioni temporali nel WWW: il tempo di
transazione (per la gestione di versioni successive di risorse WWW) e il
tempo di validita` (per gestire documenti WWW contenenti informazione
storicizzata).
Si studieranno, per il tempo di transazione, l'estensione temporale
dei protocolli di negoziazione dei dati e delle funzionalita` di sistemi
server e client WWW e, per il tempo di validita', il problema
del "timestamping" di singoli oggetti all'interno di un documento
con estensione dei formati di codifica.
Verranno realizzati prototipi di server Web in grado di gestire
versioni di risorse sul tempo di transazione e di client Web in grado
di permettere la navigazione temporale su entrambe le dimensioni.




Principali prodotti previsti sono:




- rapporto sul modello dei dati e sul linguaggio di interrogazione




- rapporto sull'architettura software di WaDer




- rapporto sulle tecniche di ottimizzazione nel sistema WaDer




- prototipo del sistema WaDer




- rapporto sulla progettazione concettuale di DW




- rapporto sulla progettazione logica di DW




- prototipo di un tool per la progettazione automatica di DW




- rapporto sulle estensioni del Web per il tempo di transazione




- rapporto sulle estensioni del Web per il tempo di validita`




- prototipo di server WWW temporale




- prototipo di client WWW temporale





8]  Unità di       Universita' degli Studi di VERONA
 
     Responsabile LETIZIA TANCA  
 
     Rd+Ra      52,000 (dichiarata) 47,000 (certificata)
 
     Finanziamento   47,530
 
     Compito
     


L'unita' e' coinvolta nel tema 2 (Estrazione di informazioni distribuite
sul WWW) e propone l'uso del linguaggio WG-Log
per mantenere una rappresentazione astratta delle
informazioni dei siti WEB. WG-log rappresenta in modo sintetico tale
informazione mediante schemi basati su grafi,
permettendo di specificare interrogazioni e viste su questi schemi
sempre in forma di grafi.
Lo schema e le interrogazioni si possono riferire alla natura logica o
navigazionale dei concetti e dei legami presenti nel sito.
introducendo elementi lessicali
tipici dei linguaggi di progettazione ipermediali.



L'interazione con il WEB
mediante il linguaggio WG-log prevede che dei programmi
chiamati Schema Robots gestiscano gli schemi dei siti di struttura nota,
e forniscano all'utente un'interfaccia basata su parole chiave
attraverso le quali e' facile identificare lo schema del sito
che contiene le informazioni desiderate. A questo punto, noti gli
schemi dei siti da interrogare, l'utente, mediante
un'interfaccia grafica fornita dal sistema, formula una query visuale
che viene spedita ai siti di interesse, presso i quali risiede un
modulo di gestione delle interrogazioni detto Query Manager. La
risposta alla query avra' a sua volta struttura ipermediale,
organizzata secondo modalita' che e' possibile specificare attraverso
la query stessa. Si definiranno quindi le architetture dello Schema
Robot e del Query Manager.



Si definira' inoltre l'architettura generale del sistema
basato su WG-log, e si produrra' un primo prototipo di tale sistema.
Si studieranno le query "interessanti", cioe' quelle piu' frequenti,
per poter progettare algoritmi di accesso piu' efficaci per questi
particolari tipi di query.



9]  Unità di       Politecnico di MILANO
 
     Responsabile BARBARA PERNICI  
 
     Rd+Ra      192,000 (dichiarata) 192,000 (certificata)
 
     Finanziamento   174,600
 
     Compito
     


L'unita` e' coinvolta
nei temi 1 e 6.



Tema 1: Specifica di applicazioni per basi di dati su Internet e
Intranet



"Internet e Intranet per la pubblica Amministrazione"



Si studiera` la realizzazione di Intranet per
enti della P.A. e le modalita` di collegamento fra queste Intranet per
fornire a cittadini, enti e imprese l'accesso a un insieme di servizi
integrati sul territorio (per esempio servizi di Anagrafi Integrate).
Le macro funzionalita` del prototipo faranno uso di diversi tipi di dati:



- Dati operazionali relativi all'ente; sono costituiti da basi di dati
operazionali dei vari settori e sono patrimonio del sistema
informativo dell'Ente.



- Dati di sintesi relativi all'Ente; sono dati predisposti per fornire
informazioni al Cittadino.



- Registro Direttorio; e` uno strumento in grado di concentrare i
caratteri identificativi di ogni soggetto che possa agire come
utente dei servizi integrati.



- Dati di controllo e monitoraggio dei servizi integrati; dati e
strumenti per il controllo degli accessi, inteso sia come
abilitazione che rispetta la privacy dei cittadini che come dati
storico-cronologici.



- Strutture di comunicazione ocn gli Enti integrati; questo e`
software in cui e` contenuta la conoscenza dei servizi attivabili
presso un certo server, nel rispetto della normativa AIPA su
interfacce e servizi integrati.



Verranno anche studiate le problematiche di formazione su rete,
utilizzando sistemi che integrino basi di dati e Web.



"Network Computing: Tecnologia, metodologie e applicazioni"



La ricerca mira a
consolidare tecniche e metodi innovativi per lo sviluppo e la gestione
di sistemi basati sulla mobilita` del codice. Si lavorera` in tre
direzioni:



1) Si arricchiranno i fondamenti concettuali e metodologici che
definiscono le proprieta` e caratteristiche di tecnologia
(linguaggi e sistemi), paradigmi e applicazioni.



2) Si studieranno le architetture event-driven in ambiente "network
computing".



3) Si sviluppera` un ambiente per la progettazione, la distribuzione e
la gestione di applicazioni e servizi orientati alla rete.



Tema 6: Metodologie di progettazione di siti WWW



In questo ambito si svilupperanno metodologie e strumenti che
supportino la progettazione di siti Web e delle relative basi di dati.



Si definiranno opportuni modelli per la descrizione concettuale e
logica di ipertesti Web, che consentano di progettare lo schema di un
sito, mettendo in evidenza elementi di regolarita` assai utili
nell'interazione, quali, ad esempio, tipologie di pagine Web e
relazioni logiche e collegamenti tra tipi di pagine.



Si realizzeranno poi degli strumenti per la generazione automatica di
pagine HTML a partire dal contenuto della base di dati; questi
strumenti consentiranno al progettista di concentrarsi sulle scelte
fondamentali di progetto, disinteressandosi dei dettagli relativi alla
generazione delle pagine, e garantiranno la consistenza del sito anche
in presenza di aggiornamenti e riorganizzazioni.



L'uso di una metodologia di progettazione per siti Web basata su
modelli e strumenti del genere offre notevoli vantaggi; il principale
e` la semplificazione dell'accesso da parte dell'utente, in quanto il
sito Web risultante ha tipicamente una struttura piu` regolare che
riduce il disorientamento e garantisce una miglior visione d'insieme.
Inoltre, un approccio metodologico strutturato consente di ridurre
sensibilmente i tempi di progettazione e di manutenzione del sito.
Infine, la presenza di informazione strutturata consente di rispondere
in modo efficace a interrogazioni circa il contenuto del sito Web.




10]  Unità di       Universita' degli Studi di PISA
 
     Responsabile ANTONIO ALBANO  
 
     Rd+Ra      30,000 (dichiarata) 20,000 (certificata)
 
     Finanziamento   27,160
 
     Compito
     


L'unita` e` coinvolta
nel tema 1 (applicazioni per basi di dati su Internet e Intranet) con
l'obiettivo di definire e studiare costrutti
per la programmazione di applicazioni per basi di dati ad oggetti in
ambiente internet nel contesto di un linguaggio per basi di dati ad
oggetti, con tipizzazione forte. In particolare saranno affrontati
i seguenti aspetti.




- Meccanismi di comunicazione: lo studio iniziera' con la sperimentazione
di meccanismi per la comunicazione tra un linguaggio per basi di dati ad
oggetti e componenti scritti in altri linguaggi. La sperimentazione
verra' condotta nell'ambito dello standard industriale CORBA. In questo
contesto
l'attenzione sara' rivolta all'integrazione di costrutti per
l'integrazione
di componenti all'interno di un linguaggio per basi di dati con
tipizzazione forte. Un altro aspetto che sara' studiato riguarda la
definizione di sistemi di tipi che permettano la comunicazione di
oggetti
multiruolo tra componenti diverse, evitando in particolare il ricorso a
meccanismi di tipi generativi, i quali perdono di significato quando si
esce dal contesto in cui il tipo e' stato definito.




- Proprieta' dei sistemi di tipi: si studieranno le proprieta' di sistemi di
tipi per linguaggi a oggetti con ruoli staticamente tipizzati che
integrano
(a) polimorfismo parametrico e di inclusione, (b) definizione di tipi
parametrizzati rispetto a variabili di tipo (operatori di tipo), (c)
definizione di tipi all'interno di ennuple (tipi dipendenti) per
trattare
moduli come valori di prima classe, (d) definizione di tipi
parametrizzati
rispetto a valori, (e) tipi ricorsivi, (f) meccanismi per la
programmazione
del WWW e (f) meccanismi per la riflessione.




- Meccanismi di modularizzazione: verra' affrontato il problema di
definire
meccanismi di moduli basati su valori di prima classe e che
possano essere definiti in modo parametrico rispetto ad altri moduli.
Un meccanismo di moduli con queste caratteristiche consente la
strutturazione di basi di dati complesse in unita' interrelate
generalizzando le possibilta' offerte dagli attuali DBMS con i meccanismi
degli schemi e schemi esterni.




- Programmazione del World Wide Web: verra' affrontato il problema di
individuare astrazioni ed operazioni adatte ad operare sui dati
contenuti
nel World Wide Web. In questo contesto, sara' affrontato in particolare il
problema della manipolazione di dati persistenti e di riferimenti con
caratteristiche di tipizzazione dinamica e di significato non
determinabile a priori, quali gli URL.




Prodotti principali previsti:




Un rapporto scientifico sui
meccanismi di comunicazione tra linguaggi diversi e prima versione del
sistema Fibonacci esteso con meccanismi di comunicazione tra il
linguaggio
per basi di dati ad oggetti e componenti esterne scritte in altri
linguaggi.




Un rapporto scientifico sui
meccanismi di comunicazione di oggetti sulla rete e seconda versione del
sistema Fibonacci con meccanismi di comunicazione tra il linguaggio e
componenti esterne scritte secondo lo standard CORBA.




Un rapporto scientifico sui
meccanismi di modularizzazione per linguaggi per basi di dati e prima
versione del sistema Fibonacci con meccanismi di modularizzazione basati
su valori di prima classe.




Un rapporto scientifico sulla
programmazione del WWW e prima versione del Fibonacci, o di un
prototipo di un nuovo linguaggio, con meccanismi per la programmazione
del WWW.





11]  Unità di       Universita' degli Studi di TORINO
 
     Responsabile ANTONIO DI LEVA  
 
     Rd+Ra      33,800 (dichiarata) 24,000 (certificata)
 
     Finanziamento   34,920
 
     Compito
     


L'unita` e' coinvolta
nel tema 1 (applicazioni per basi di dati su Internet e Intranet).



Verra' affrontato il problema dell'analisi,
del progetto e dell'implementazione di
processi strutturati, come possono essere - ad esempio - gli iter di
pratiche amministrative, in particolare nelle Pubbliche Amministrazioni.
Tale problema deve essere affrontato sotto gli aspetti metodologico,
modellistico, implementativo e dal punto di vista degli strumenti di
supporto, distinguendo in questo caso fra strumenti da usare in fase di
specifica/progetto e in fase di gestione della pratica. L'attività verrà
strutturata come segue:



Sviluppo del modello del processo amministrativo:
Si intende definire un modello, basato su più viste del processo, che
dovrebbe comprendere almeno una vista comportamentale, una vista di tipo
funzionale (specifica del processo), e una vista organizzativa. Per la
vista organizzativa si partirà dalla descrizione delle componenti aziendali
e dei posti di lavoro in cui vengono svolte le attività operative, e quindi
verranno presi in considerazione i ruoli responsabili ed esecutori di tali
e gli attori in grado di ricoprire tali ruoli sulla base di qualifiche
funzionali. La vista comportamentale deve descrivere "cosa" viene fatto
dalle componenti aziendali, per cui si useranno modelli del tipo SADT/IDEF0
integrati da schede di rilevamento. Per la vista funzionale (che descrive
"come" operano le componenti aziendali) si prevede di partire da modelli
del tipo IDEF3 in modo da rappresentare specifiche di controllo comunque
complesse.



Sviluppo di un primo prototipo di progetto del processo
amministrativo: Basandosi su strumenti già presenti presso l'unità di
ricerca (in particolare, il sistema Extend4.0) si intende sviluppare una
serie di linee guida, delle librerie contenenti dei "building blocks" per
la definizione delle reti comportamentali e di processo, e una libreria di
blocchi di conversione delle specifiche di processo (nel modello dei
processi proposto) in blocchi Extend simulabili con caratteristiche
specificate in termini di tempi di attesa e di lavoro.



Completamento del modello dei processi: Sulla base dei risultati
del primo prototipo si intende raffinare il modello dei processi e
introdurre una vista che consenta la gestione delle risorse messe a
disposizione dall'organizzazione per lo svolgimento della pratica
amministrativa. Contemporaneamente dovrebbe essere sviluppata una prima
versione di una libreria di blocchi "amministrativi" espressamente
progettati per la rappresentazione e la costruzione dei sotto-processi più
comuni che si incontrano nel trattamento delle pratiche per la Pubblica
Amministrazione.



Sviluppo del prototipo finale: il prototipo finale dovrebbe
integrare delle funzionalità di supporto allo sviluppo del processo a
partire da blocchi riusabili con un modulo di schedulazione delle risorse
fornite dall'amministrazione. L'ambiente di sperimentazione del prototipo
dovrebbe essere fornito dal Comune di Torino con cui e' gia in atto un
rapporto di collaborazione.



Per quanto riguarda infine gli aspetti implementativi di controllo del
processo reale tramite strumenti di gestione del workflow, si intende
predisporre dei convertitori che, a partire dalle specifiche del processo
usate nella analisi, progettazione e validazione del processo stesso,
generino delle specifiche secondo modelli standard come quello in sviluppo
presso la Workflow Management Coalition. Sarà inoltre cura dell'Unità di
Torino il coordinamento costante con le proposte delle altre unità del
progetto, di sviluppo di applicazioni distribuite, in particolare per
quanto riguarda la sperimentazione dei modelli sviluppati su prototipi di
sistemi di gestione di workflow su reti Internet/Intranet.




12]  Unità di       Universita' degli Studi di CATANIA
 
     Responsabile ANTONELLA DI STEFANO  
 
     Rd+Ra      38,400 (dichiarata) 38,400 (certificata)
 
     Finanziamento   31,040
 
     Compito
     


L'unita` e' coinvolta
nel tema 1 (applicazioni per basi di dati su Internet e Intranet) con
l'obiettivo di sviluppare modelli di gestione di basi di
dati distribuite su
diverse topologie di reti di comunicazione Internet e Intranet.




Il primo argomento trattato concerne la gestione delle transazioni nelle basi
di dati real-time distribuite in Intranet. La ricerca mira alla specifica di
un Database Repository in grado di coordinare e gestire le attività di
singoli Management Information Base distribuiti su un'Intranet mantenendo la
consistenza spaziale, logica e temporale dei dati. I vincoli di tempo-reale
impongono la scelta di meccanismi di controllo di concorrenza e
schedulazione omogenei per i singoli nodi in Intranet.
Il programma di ricerca prevede la specifica di un'architettura distribuita
e di un modello transazionale in grado di supportare i vincoli delle
transazioni real-time.




Il secondo argomento riguarda l'utilizzo degli agenti mobili per l'integrazione
di basi di dati eterogenee distribuite in Internet. La ricerca è finalizzata
alla definizione di un modello transazionale ad agenti mobili ed alla
realizzazione di un framework ad agenti mobili in grado di supportarlo. Per
definire lo strato di interfaccia in grado di uniformare le differenze di
rappresentazione tra i dati dei vari database ed i meccanismi di controllo
di concorrenza verrà adottato un approccio object-oriented tipico dei
linguaggi per il Remote Programming.




Prodotti previsti:




identificazione dei vincoli di consistenza spaziale, logica e
temporale che condizionano le transazioni real-time distribuite;




specifica dei moduli di un'architettura distribuita
object-oriented in grado di supportare transazioni real-time distribuite su
un'Intranet;



specifica di un modello transazionale real-time per
l'architettura definita in precedenza;



definizione di alcuni algoritmi di scheduling di transazioni
real-time distribuite.



uno studio di una metodologia ad agenti mobili per
l'integrazione di basi di dati eterogenee in Internet.



definizione di un modello di transazione distribuita ad agenti
mobili.



prima versione del prototipo di un ambiente ad agenti mobili in
grado di supportare le transazioni distribuite su basi di dati eterogenee.



versione finale del prototipo per l'integrazione di basi di
dati eterogenee.




13]  Unità di       Universita' degli Studi di BARI
 
     Responsabile MARIA COSTABILE  
 
     Rd+Ra      29,000 (dichiarata) 24,000 (certificata)
 
     Finanziamento   26,190
 
     Compito
     


L'unita' e' coinvolta nel tema 5
(visualizzazione di informazioni provenienti dal WWW).



Allo scopo di rendere piu' efficace il processo di ritrovamento e di
assimilazione delle informazioni su WWW bisogna rappresentarle in una forma
adatta alle capacita' percettive (soprattutto visuali) degli utenti e ai
requisiti specifici del problema. Si identificheranno appropriate forme di
visualizzazione di dati da utilizzare in un'interfaccia adattiva, capace
cioe' di modificare il suo comportamento sulla base del modello utente e di
mutate condizioni di contesto, e si studieranno criteri di usabilita'
specifici per le interfacce ipermediali tipiche del WWW, in modo da
produrre utili linee guida per il progetto di interfacce per WWW usabili
con soddisfazione degli utenti. Un ulteriore obiettivo consiste nella
valutazione empirica dell'usabilita' dell'interfaccia progettata.
Inizialmente si prevede l'approfondimento dello stato dell'arte nel
settore della visualizzazione di grandi quantita' di dati, specializzando i
vari approcci ad applicazioni su WWW. Si studieranno i problemi di
usabilita dei sistemi informativi su rete.



Successivamente l'attivita' di ricerca si concentrera' sull'analisi e la
definizione dell'architettura dell'interfaccia in cui si integrera' il
modulo di visualizzazione. Verranno studiate le possibilita' di
adattamento all'utente di tale interfaccia, sfruttando tecniche di
apprendimento automatico sia per costruire il modello dell'utente durante
l'interazione col sistema, sia per l'analisi delle sequenze delle azioni
dell'utente al fine di identificare comportamenti ricorrenti o azioni
correlate.



Sulla base dei risultati teorici ottenuti, si procedera'
nella terza fase alla implementazione di un primo prototipo
dell'interfaccia proposta. Si analizzeranno le tipologie di dati e di
utenti per una specifica applicazione presa in esame da altre unita'
operative, in modo da definire i modelli necessari per garantire
l'adattivita' dell'interfaccia.



L'ultima fase e' relativa alla sperimentazione e validazione di
un nuovo prototipo, che rappresenta l'evoluzione di quello prodotto nella
terza fase ed e' integrato con i moduli produttori dei dati, sviluppati da
altre unita'. In tale prototipo evoluto sono presenti i principali aspetti
del sistema, dall'estrazione dei dati dal WWW alla loro successiva
visualizzazione e manipolazione.




14]  Unità di       Universita' degli Studi di PADOVA
 
     Responsabile MARISTELLA AGOSTI  
 
     Rd+Ra      28,000 (dichiarata) 22,285 (certificata)
 
     Finanziamento   31,040
 
     Compito
     


L'unita` e' coinvolta
nel tema 2 (estrazione di informazioni distribuite sul WWW).



Obiettivi:



- definire una metodologia innovativa
per la costruzione automatica di basi di dati ipertestuali in ambito Web.



- progettare un prototipo che dimostri la validita' della metodologia.



Gli aspetti innovativi della metodologia riguardano metodi e strumenti:



- per l'individuazione e l'estrazione di frammenti di documenti testuali
eterogenei e di grandi dimensioni contenuti in basi di dati consultabili
in ambito Internet;



- per la costruzione automatica di basi di dati ipertestuali usando come
nodi frammenti estratti da documenti di grandi dimensioni;



- di "relevance feedback" applicato a basi di dati ipertestuali con
l'obiettivo di sviluppare funzionalita' per realizzare una "digital
library".



In particolare, viene affrontata la definizione di una metodologia di
costruzione automatica di ipertesti per il reperimento semantico di
informazioni basata su tecniche di estrazione di frammenti da documenti
di dimensioni relativamente grandi e disponibili anche in ambiente Web.
I metodi di estrazione devono essere tali che i frammenti siano di
dimensione ottimale e con un contenuto informativo omogeneo affinche`
soddisfino le esigenze informative dell'utente finale al fine di ridurre
il "rumore" rappresentato dalla massa di informazioni non pertinenti
contenute nei documenti di grande dimensione.



L'efficacia di un sistema di consultazione in ambito Internet
puo' essere aumentata se questi frammenti vengono collegati
mediante dei "links" ipertestuali che vengono realizzati a seguito
dell'analisi del loro contenuto informativo.



Di conseguenza lo studio si concentra su nuovi metodi di
costruzione automatica di basi di dati ipertestuali, in cui i nodi siano
documenti o frammenti tra loro collegati mediante dei "links" che
evidenzino le relazioni semantiche esistenti tra i contenuti
informativi. Nella seconda parte del progetto, si condurra' uno studio
per arrivare a definire uno strumento metodologico di combinazione di
metodi di "relevance feedback" e costruzione automatica di basi di dati
ipertestuali.



Il risultato di un meccanismo combinato di "relevance feedback" e
"links" ipertestuali e' quindi una rete di documenti estratti dalla base
di dati ipertestuale e collegati tra loro in modo da essere aderenti
alle esigenze informative dell'utente.



Prodotti previsti:



- rapporto sulla metodologia per l'estrazione di frammenti da documenti
di grandi dimensioni;



- prima versione del prototipo per la costruzione automatica di basi di
dati ipertestuali a partire da frammenti



- rapporto tecnico sulla metodologia combinata di estrazione di
frammenti e relevance feedback;



- prototipo finale operante in ambito Web




15]  Unità di       Politecnico di TORINO
 
     Responsabile ELENA BARALIS  
 
     Rd+Ra      40,000 (dichiarata) 40,000 (certificata)
 
     Finanziamento   34,920
 
     Compito
     


L'unita` e` coinvolta
nel tema 4 (analisi delle informazioni estratte dal WWW).



A causa della mole rilevante di dati che puo` essere estratta dal Web
si rende necessaria un'analisi successiva dei dati (data mining) che
permetta di individuare le informazioni effettivamente rilevanti per
un utente o un'applicazione specifica.



Gli obiettivi principali sono:



1) la definizione di una metodologia per specificare le operazioni di
estrazione di informazione "nascosta" sotto forma di regolarita` ricorrenti
(data mining) dai dati



2) la definizione di un linguaggio per specificare le operazioni di
estrazione di alcune tipologie di regole, quali le regole di associazione



3) l'ideazione, la realizzazione e la verifica sperimentale di un insieme
di algoritmi che permettano di implementare gli operatori
del linguaggio proposto.



Principali prodotti del progetto saranno un prototipo e vari rapporti
scientifici che riassumono i risultati ottenuti:



- rapporto tecnico che descriva le diverse tipologie di metodi di
estrazione di conoscenza presenti in letteratura



- rapporto tecnico che descriva il modello logico di riferimento
per i dati estratti da Web, che sara` usato come riferimento per la
definizione di un linguaggio per l'estrazione di conoscenza



- rapporto tecnico che descriva gli algoritmi per la realizzazione
degli operatori di estrazione della conoscenza proposti



- rapporto tecnico che descriva la metodologia di
specifica delle operazioni di estrazione di conoscenza



- rapporto tecnico che descriva il linguaggio di analisi dei dati per
data warehouse su Web



- prototipo per l'analisi dei dati mediante tecniche di data mining




16]  Unità di       Universita' degli Studi di BRESCIA
 
     Responsabile VALERIA DE ANTONELLIS  
 
     Rd+Ra      28,000 (dichiarata) 22,000 (certificata)
 
     Finanziamento   31,040
 
     Compito
     


L'unita` e` coinvolta
nei temi 3 e 4.




Tema 3: Integrazione di
informazioni da sorgenti multiple eterogenee;




Obiettivo della ricerca e' lo sviluppo di metodi e
strumenti per l'analisi di schemi eterogenei di sorgenti di dati
strutturati e semistrutturati, e per la creazione di viste globali di
informazioni, al fine di supportare interrogazioni frequenti su siti di
interesse e per guidare attivita' di navigazione tra siti eterogenei.
Vengono studiate tecniche di analisi di sorgenti di dati, modelli
concettuali per la descrizione di viste globali, e viene proposta
un'architettura basata su mediatori e dizionari semantici che consenta di
esplicitare relazioni semantiche che sussistono fra gli elementi delle
viste, al fine di facilitare la gestione degli accessi e delle interrogazioni.




Tema 4: Estrazione di informazioni da sorgenti multiple
eterogenee.




Obiettivo della ricerca e' la definizione di strumenti per
l'applicazione di tecniche di estrazione di informazioni. In particolare,
si propone un caso applicativo basato sul problema della diagnosi
model-based di sistemi dinamici ad eventi discreti (sistemi attivi),
orientato alla generazione di nuovi requisiti per la tecnologia di
estrazione della conoscenza, ed alla loro validazione. Si sviluppera' un
prototipo di macchina diagnostica per la diagnosi e la simulazione di
sistemi attivi, orientato alla istanziazione di una base di dati
diagnostica che verra' successivamente analizzata con le tecniche estese di
estrazione della conoscenza.




Prodotti previsti:




Rapporto tecnico di estensione del modello di integrazione sviluppato in
ambito basi di dati, per poter considerare informazioni semi-strutturate.
Rapporto tecnico di specifica del problema diagnostico di sistemi attivi.




Rapporto tecnico di specifica dell'architettura di riferimento basata su
mediatori e dizionari semantici. Rapporto tecnico di specifica delle
tecniche di estrazione di conoscenza associativa dal modello di un sistema
attivo per i casi di dimensioni trattabili con le tecniche model-based.




Rapporto tecnico di descrizione della metodologia di integrazione di
informazioni strutturate e semistrutturate, e specifica funzionale degli
strumenti di supporto. Progetto di macchina diagnostica e simulazione di
sistemi attivi.




Sviluppo di un'applicazione prototipale di dizionario semantico per
l'integrazione di informazioni eterogenee. Prototipo di macchina
diagnostica e base di dati diagnostica generata con il prototipo.




17]  Unità di       Universita' degli Studi di ANCONA
 
     Responsabile MAURIZIO PANTI  
 
     Rd+Ra      19,000 (dichiarata) 19,000 (certificata)
 
     Finanziamento   21,340
 
     Compito
     


L'unita` e` coinvolta
nel tema 1 (applicazioni per basi di dati su Internet e Intranet).



L'obiettivo consiste nell'adattamento di
una variante a collaborazione "spontanea" del modello di sistema ad agenti
a conoscenza distribuita per fondare e realizzare un prototipo di sistema
multiagente per la riduzione delle eterogeneita' semantiche di schemi di
basi di dati federate, con particolare riferimento al problema della
determinazione di somiglianze semantiche fra attributi a partire da
informazioni contenute sia nella struttura della relazione che nel
contesto d'uso degli attributi stessi (transazioni).
Tale sistema puo' essere ricondotto alla classe dei supporti automatici e
collaborativi per lo svolgimento delle attività di integrazione di schemi.



L'attivita' sara' articolata in quattro fasi:



  1. Studio e rappresentazione della conoscenza rilevante in uno specifico
    dominio applicativo (al momento ipotizzato un singolo sottosistema
    informativo in due o tre enti pubblici ). La finalità e' di verificare, ed eventualmente adattare, i metodi di
    elicitazione e le strutture di rappresentazione necessarie al modello
    negoziale ad agenti. Identificazione delle informazioni per l'individuazione di somiglianze
    semantiche fra attributi attraverso l'utilizzo di metodi formali. Verra' prodotto un rapporto tecnico.
  2. Estrazione di informazioni per l'individuazione di somiglianze semantiche
    fra attributi mediante l'analisi delle transazioni e del contesto di
    utilizzo. Adattamento del paradigma collaborativo del modello ad agenti
    alla esecuzione di transazioni distribuite in una rete di data base
    eterogenei. Verranno prodotti un rapporto tecnico e un prototipo per
    la rappresentazione della conoscenza di
    dominio.
  3. Realizzazione di un primo prototipo funzionante del gestore del protocollo
    negoziale sul quale testare l'integrazione delle informazioni ricavate dal
    Data Dictionary e dall'analisi delle transazioni.
    Verranno prodotti un rapporto tecnico e un prototipo per del gestore del protocollo negoziale.
  4. Definizione del pianificatore e sperimentazione, in un ambiente "di
    produzione". Verranno prodotti un rapporto tecnico e un prototipo software.