3.Rendiconto scientifico delle attivitą presso le sedi partecipanti
Unità di Universita' degli Studi di ANCONA |
Responsabile MAURIZIO PANTI |
Quota Cofinanziamento Murst 21.340.000 |
Quota Cofinanziamento Ateneo 19.000.000 (RD+RA certificata) |
Fondi complessivi utilizzati il primo anno 15.945.000 |
Illustrazione dell'attivita' svolta |
La tematica e la conseguente attività dell'Unità di Ancona si è sviluppata all'interno
dei temi 1 e 3. Gli obiettivi del primo anno di ricerca erano lo studio di un un singolo sottosistema informativo in due o tre enti pubblici; l'estrazione di informazioni per l'individuazione di somiglianze semantiche; l'adattamento del paradigma collaborativo del modello ad agenti alla esecuzione di transazioni distribuite in una rete di data base eterogenei. Questi obiettivi sono stati raggiunti, così come descritto nei rapporti [T1-R10,T3-R05,T1-R12,T3-R11]. Sono stati prodotti, inoltre, due prototipi [T1-S04,T3-S14]. L'analisi del dominio applicativo svolta durante il primo semestre ha evidenziato come, nell'ottica di sistemi aperti e su larga scala, sia utile definire sistemi di integrazione a più mediatori, in grado di gestire in modo autonomo e flessibile le proprie viste globali [T1-R10,T3-R05]. Da una parte, l'autonomia dei mediatori permette di definire viste globali differenti a seconda delle esigenze dei diversi tipi di utenze, dall'altra la flessibilità risulta necessaria affinchè i mediatori siano in grado di condividere le loro viste globali e comunicare tra loro. La problematica è stata affrontata da due punti di vista, uno relativo alla modellazione del sistema a mediatore come sistema multi agente (sviluppato nell'ambito del tema 1) e uno relativo all'integrazione di viste (sviluppato nell'ambito del tema 3). Tema 1 - Applicazioni per basi di dati su Internet e Intranet In fase di progetto del sistema si è tenuto conto delle conseguenze di quanto emerso dall'analisi del caso di studio. In particolare: - Molteplicità di sistemi informativi. - Autonomia degli attori. Ogni attore è completamente autonomo sia nei suoi fabbisogni informativi, sia nelle informazioni che intende rendere pubbliche, sia nelle scelte progettuali ed implementative. - Dinamicità della federazione. Gli attori che partecipano alla federazione possono cambiare nel tempo. - Dinamicità dei sistemi informativi. Ogni sistema informativo può cambiare nel tempo (sia a livello concettuale sia a livello logico e fisico). Tali caratteristiche hanno quindi orientato la scelta verso un sistema multi-agente dotato di mediatori multipli e wrappers [T1-R10,T1-R12]. Nel progettare il sistema si è, inoltre, deciso di adeguarsi alle specifiche FIPA e CORBA. Si è quindi passati a definire l'architettura generale di un agente. Un agente può essere visto come una macchina a stati in grado di lavorare in parallelo. Ogni stato descrive la situazione in cui si trova l'agente ad un dato istante. L'agente decide l'azione da compiere in base allo stato in cui si trova. L'esecuzione dell'azione causa una transizione di stato. L'agente deve, infine, essere in grado di lavorare in parallelo perchè ad esempio può trovarsi nella necessità di scambiare messaggi con più agenti contemporaneamente. Lo stato di un agente è costituito dalle sue attitudini mentali: le credenze (beliefs), i desideri (desires) e le intenzioni (intentions). In particolare un agente mediatore può essere modellato come: - autonomo: in grado di risolvere autonomamente i problemi derivanti dalla eterogeneità; - statico: non un agente mobile; - intelligente: dotato di conoscenza (la sua vista globale eventualmente incompleta e dinamica), desideri (ad esempio le richieste che provengono da utenti), e intenzioni (i piani da eseguire per soddisfare i desideri - ad esempio per giungere all'integrazione). Attività complementare è stata la definizione dei protocolli di comunicazione, con particolare riguardo alla comunicazione tra agenti mediatori e agenti wrapper. In linea di massima il protocollo è il seguente. Quando un agente mediatore riceve una query da un utente, esegue una operazione di query plan formulation, invia agli opportuni agenti wrapper le query così come sono state riformulate e attende una loro risposta. Quando la query plan formulation fallisce, l'agente mediatore deve aggiornare la sua vista globale interagendo con gli altri agenti mediatori e con gli agenti wrapper. Per fare ciò, richiede al Domain Facilitator gli indirizzi di tutti gli agenti wrapper e mediatore, invia loro la richiesta di schemi e viste globali e una volta ottenute le integra nella propria vista globale. In questo modo la vista di un agente mediatore si modifica dinamicamente mano a mano che l'utente sottopone all'agente delle query. Tema 3 - Tema 3: Integrazione di informazioni estratte da siti WWW Nell'ambito dei sistemi a mediatore per l'integrazione, tecniche di clustering sono utilizzate per determinare in modo automatico o semi-automatico gruppi di oggetti, provenienti dalle diverse sorgenti, considerati semanticamente simili, in modo da definire esplicitamente i mapping di corrispondenza tra un concetto a livello globale (livello della formulazione delle query utente) e le corrispondenti rappresentazioni a livello locale, necessari per la fase di query plan formulation. Problemi generali dell'utilizzo di tecniche di clustering, sono la definizione del criterio di clustering e del numero di cluster più opportuno per la particolare applicazione. Nell'ambito in cui ci muoviamo, essi influenzano la valutazione delle corrispondenze semantiche e la conseguente definizione dei mapping, e quindi le prestazioni del sistema sia in termini di costo (numero di sorgenti interrogate) che in termini di qualità della risposta alle interrogazioni. La ricerca di questo primo anno si muove in questo contesto, studiando il problema della definizione e gestione di gerarchie di cluster per la riformulazione di interrogazioni in sistemi a mediatore. In particolare, la visione del sistema come sistema basato su agenti software dotati di una propria base di conoscenza e capacità di comunicazione (si veda la sezione 1), ci ha portato a definire un particolare criterio di clustering, basato su misure di carattere entropico, in grado di rispecchiare le proprietà di concetti e ontologie, ed in grado quindi di rappresentare la base di conoscenza di un agente [T3-R05]. Ci siamo quindi posti il problema della definizione di criteri per la selezione, all'interno della gerarchia, del/dei cluster al livello di specificità ottimale per la riformulazione di una specifica query. Per far ciò, il problema della riformulazione ed esecuzione di interrogazioni è stato riformulato come problema di Information Retrieval. Questo consente di adottare principi e criteri di valutazione ivi sviluppati e di mettere in relazione questi ultimi con le proprietà statistiche di gerarchie di cluster generate attraverso il criterio entropico. E' stato introdotto un primo nucleo di un formalismo dichiarativo per la definizione di diverse modalità di interazione con il sistema riflettenti le diverse esigenze soggettive degli utenti (il grado di precisione, la completezza della risposta, i tempi di attesa), e formulato le diverse strategie di visita dell'albero per la realizzazione di tali modalità [T3-R11]. Nell'ambito dei temi del progetto, sono stati pubblicati 2 articoli su riviste internazionali, 2 articoli su atti di convegni internazionali con revisione. Prodotti [T1-R10] "Architettura di sistemi informativi federati della PA locale", C. Diamantini, M. Panti, L. Spalazzi. [T3-R05] "Integrazione di informazioni in sistemi informativi federati della PA locale", C. Diamantini, M. Panti, L. Spalazzi. [T1-R12] "Sistema ad agenti per la federazione di sistemi informativi", C. Diamantini, M. Panti, L. Spalazzi. [T3-R11] "Strategie di ricerca in gerarchie di concetti per la riformulazione di query", C. Diamantini, M. Panti, L. Spalazzi. [T1-S04] "AgentProlog", A.F. Dragoni, A. Pasquini. [T3-S14] "EC3 Tool", C. Diamantini, M. Panti. |
Schema riassuntivo dei fondi utilizzati (cifre spese o impegnate)
Voce di spesa | Cifra spesa o impegnata | Descrizione |
---|---|---|
Materiale inventariabile | 0.000 | 0.000 |
Grandi Attrezzature | 0.000 | |
Materiale di consumo | 0.000 | |
Spese per calcolo ed elaborazione dati | 0.000 | |
Personale a contratto | 0.000 | |
Servizi esterni | 628.000 | Seminari |
Missioni | 9.752.000 | Riunioni e convegni internazionali |
Altro | 5.565.000 | Atti |