3.Rendiconto scientifico delle attivitą presso le sedi partecipanti
Unità di Universita' degli Studi di PADOVA |
Responsabile MARISTELLA AGOSTI |
Quota Cofinanziamento Murst 31.040.000 |
Quota Cofinanziamento Ateneo 22.285.000 (RD+RA certificata) |
Fondi complessivi utilizzati il primo anno 7.765.680 |
Illustrazione dell'attivita' svolta |
L'unita' e' coinvolta nel Tema 2, "Estrazione di informazioni distribuite sul WWW".
L'attivita' del primo anno e' stata caratterizzata da una prima parte di studio metodologico e da una seconda di progettazione e realizzazione di un prototito. Lo studio metodologico ha riguardato le tecniche e le problematiche di estrazione di frammenti con un contenuto informativo omogeneo e una dimensione 'ottimale'. I risultati dello studio si sono concretizzati in una rassegna. Lo scopo principale dello studio e' stato quello di trovare metodi per ridurre il 'rumore' rappresentato dalla massa di informazioni non pertinenti contenute nei documenti di grande dimensione. Il prototipo progettato ha la struttura di un motore di ricerca costituito, quindi, da un robot e da un sistema di information retrieval (IR). La funzione del prototipo e' di: - raccogliere, mediante il robot, frammenti di documenti in formato HTML distribuiti sul Web, - indicizzare, mediante il sistema di IR, i frammenti raccolti e organizzare gli indici secondo la tipologia dei frammenti, - combinare gli indici relativi ai frammenti di tipo diverso per ottenere, a seconda delle esigenze, diversi indici relativi ai documenti a seconda delle specifiche informazioni contenute a cui si vuole dare peso, - rispondere alle interrogazioni espresse dall'utente finale in forma non-strutturata presentando in ordine di importanza i documenti Web piu' pertinenti sulla base delle informazioni contenute negli indici, - generare automaticamente dei collegamenti ipertestuali tra i documenti recuperati allo scopo di integrare le funzionalita' di interrogazione con quelle di navigazione. La fase di costruzione automatica dei collegamenti ipertestuali e' ancora in una fase di studio e raffinamento, riguardando la Fase 2 del progetto e come specificato nel programma di ricerca (si veda Descrizione della Fase 2, Tema 2). La gran parte della strumentazione utilizzata era gia' disponibile all'Unita' della Universita' degli studi di Padova. Sono stati solo acquisiti alcuni componenti periferici che hanno migliorato le possibilita' di interazione con la strumentazione presente (un monitor, un HD, una stampante, unita'"zip"). I prodotti della ricerca sono stati: T2-R03 M. Melucci, "Approcci per l'estrazione di frammenti o passaggi da documenti di grandi dimensioni", rapporto tecnico, agosto 1998. T2-S12 F. Crivellari, M. Melucci, "AWIR: Prototipo di un motore di ricerca per la raccolta, indicizzazione e recupero di documenti Web sulla base dei loro frammenti", rapporto tecnico e software, febbraio 1999. Per quel che riguarda le pubblicazioni relative a questa ricerca: 1 su rivista a diffusione internazionale 3 su atti di conferenze internazionali con revisione. |
Schema riassuntivo dei fondi utilizzati (cifre spese o impegnate)
Voce di spesa | Cifra spesa o impegnata | Descrizione |
---|---|---|
Materiale inventariabile | 1.797.000 | Monitor e stampante |
Grandi Attrezzature | 0.000 | |
Materiale di consumo | 1.113.475 | |
Spese per calcolo ed elaborazione dati | 1.886.525 | |
Personale a contratto | 0.000 | |
Servizi esterni | 0.000 | |
Missioni | 2.796.147 | Partecipazione a convegni |
Altro | 172.533 |