Ministero dell'Universita' e della Ricerca scientifica e tecnologica
Dipartimento Affari Economici
Programmi di Ricerca scientifica - richiesta di cofinanziamento
(DM del 23 aprile 1997)
PROGETTO DI UNA UNITA' DI RICERCA - MODELLO B
Anno 1997 - prot. 9709A77351_014


1. Programma di Ricerca di tipo: interuniversitario


Area Scientifico Disciplinare: Ingegneria industriale dell'informazione
Per programmi inter-area:
Area: Scienze matematiche (35%)

2. Coordinatore Scientifico del Programma di Ricerca
ATZENI
(Cognome)
PAOLO
(Nome)

(Cognome acquisito - facoltativo)
IIIa Università
(Università)
INGEGNERIA
(Facoltà)
DIP INFORMATICA E AUTOMAZIONE
(Dipartimento/Istituto)

3. Titolo del Programma di Ricerca Metodologie e tecnologie per la gestione di dati e processi su reti Internet e Intranet


4. Responsabile Scientifico dell'Unità di Ricerca
AGOSTI
(Cognome)
MARISTELLA
(Nome)

(Cognome acquisito - facoltativo)
Professore Associato
(Qualifica)
07/05/50
(Data di nascita)
GSTMST50E47F257J
(Codice di identificazione personale)
PADOVA
(Università)
SCIENZE STATISTICHE
(Facoltà)
Dipartimento di Elettronica e Informatica
(Dipartimento/Istituto)
37174
(Codice conto Tesoreria Unica del Dip/Ist.)
049/8277650
(Prefisso e telefono)
049/8277699
(Numero fax)
agosti@dei.unipd.it
(Indirizzo di posta elettronica)


5. Settori disciplinari interessati dal Programma di Ricerca
K05A K05B


6. Titolo specifico del programma svolto dall'Unità di Ricerca
METODOLOGIE E TECNOLOGIE PER LA COSTRUZIONE AUTOMATICA DI RETI IPERTESTUALI IN AMBITO WEB


7. Descrizione del Programma dell'Unità di Ricerca
Inizialmente verra' affrontata la definizione di una metodologia di costruzione automatica di ipertesti per il reperimento semantico di informazioni basata su tecniche di estrazione di frammenti da documenti di dimensioni relativamente grandi e disponibili anche in ambiente Web. I metodi di estrazione devono essere tali che i frammenti siano di dimensione ottimale e con un contenuto informativo omogeneo affinche` soddisfino le esigenze informative dell'utente finale al fine di ridurre il "rumore" rappresentato dalla massa di informazioni non pertinenti contenute nei documenti di grande dimensione. Deve essere sottolineato che un insieme di frammenti e' di scarsa utilita' per l'utente se essi vengono considerati come unita' atomiche indipendenti. L'efficacia di un sistema puo' essere aumentata se questi frammenti vengono collegati mediante dei "links" ipertestuali basati sull'analisi del loro contenuto informativo. Spesso i motori di ricerca recuperano documenti Web che sono fortemente collegati tra loro, se non addirittura uno clone dell'altro: in questo caso il "rumore" apportato e' talmente alto da ridurre l'efficacia del recupero. Di conseguenza si intende avviare uno studio di nuovi metodi di costruzione automatica di basi di dati ipertestuali, in cui i nodi siano documenti o frammenti tra loro collegati mediante dei "links" che evidenzino le relazioni semantiche esistenti tra i contenuti informativi. Nella seconda parte del progetto, si condurra' uno studio per arrivare a definire uno strumento metodologico di combinazione di metodi di "relevance feedback" e costruzione automatica di basi di dati ipertestuali. Questo strumento metodologico consentira' di realizzare un sistema in grado di fornire all'utente finale la possibilita' di esprimire, sui documenti presentati, dei giudizi di pertinenza che successivamente il sistema propaghera' per individuare altri documenti pertinenti non ancora estratti. Il risultato di un meccanismo combinato di "relevance feedback" e "links" ipertestuali e' quindi una rete di documenti estratti dalla base di dati ipertestuale e collegati tra loro in modo da essere aderenti alle esigenze informative dell'utente.


8. Obiettivo del programma dell'Unità di Ricerca
Definizione di una metodologia innovativa e progettazione di un prototipo che dimostri la validita' della metodologia nella costruzione automatica di basi di dati ipertestuali in ambito Web. Gli aspetti innovativi della metodologia saranno in particolare relativi a metodi e strumenti:
- per l'individuazione e l'estrazione di frammenti di documenti testuali eterogenei e di grandi dimensioni contenuti in basi di dati consultabili in ambito Internet;
- per la costruzione automatica di basi di dati ipertestuali usando come nodi frammenti estratti da documenti di grandi dimensioni;
- di "relevance feedback" applicato a basi di dati ipertestuali con l'obiettivo di sviluppare funzionalita' per realizzare una "digital library".


9. Base di partenza scientifica
L'unita' di ricerca ha studiato una metodologia e ha realizzato un prototipo, denominato OFAHIR, per la costruzione di basi di dati ipertestuali orientate agli oggetti. Il prototipo riceve in ingresso una collezione non strutturata di documenti testuali "piatti" e produce in uscita una base di dati ipertestuale strutturata secondo il modello EXPLICIT (Agosti 1991, Agosti 1992a, Agosti 1992b). L'estensione di OFAHIR, rispetto alla versione precedente chiamata TACHIR (Agosti 1995, Melucci 1996), ha riguardato le funzionalita' di gestione dell'aggiornamento incrementale dei nodi e dei collegamenti della base di dati, cioe' degli oggetti che la base di dati ipertestuale gestisce. A seguito di cio', si e' realizzata una architettura in cui tre diverse componenti, OFAHIR, il sistema di gestione di basi di dati orientate agli oggetti e un "Web server", interagiscono secondo uno schema "client/server". Un'altra estensione di OFAHIR rispetto a TACHIR e' stata relativa alla realizzazione di un meccanismo di interrogazione da affiancare a quello di navigazione. La disponibilita' di un meccanismo di interrogazione consente all'utente finale di accedere direttamente a nodi della base di dati ipertestuale come punti di accesso efficaci per la successiva navigazione, e quindi permette all'utente di raggiungere con maggiore facilita' e piu' velocemente nodi pertinenti alle sue esigenze informative. La metodologia e il prototipo sono stati valutati per grandi raccolte di documenti testuali di dimensione relativamente piccola redatti in lingua inglese. Sono stati effettuati studi sistematici di valutazione che sono stati condotti su prototipi e realizzazioni basate sul modello EXPLICIT; gli studi di valutazione piu' rilevanti sono stati quelli del sistema Hyperline reso disponibile dalla ESA di Frascati a tutta la sua utenza, del sistema HyperLaw2 per la consultazione di documenti legali, e del sistema realizzato nell'ambito del progetto Irides della Rete di Eccellenza IDOMENEUS ESPRIT n. 6606.
(Agosti 1991) M. Agosti, R. Colotti, G. Gradenigo. A two-level hypertext retrieval model for legal data. In: A. Bookstein, Y. Chiaramella, G. Salton, V.V. Raghavan (Eds), Proc. of the 14th Int. ACM-SIGIR Conf. on Research and Development in Information Retrieval, Chicago, USA, 1991, 316-325.
(Agosti 1992a) M. Agosti, G. Gradenigo, P.G. Marchetti. A Hypertext Environment for Interacting with Large Textual Databases. Information Processing and Management, 1992, 28(3), 371-387. (Agosti 1992b) M. Agosti, P.G. Marchetti. User navigation in the IRS conceptual structure through a semantic association function. The Computer Journal, 1992, 35(3), 194-199.
(Agosti 1993) M. Agosti, F. Crestani. A methodology for the automatic construction of a hypertext for information retrieval. In: E. Deaton et al (Eds), Proc. of the 1993 ACM/SIGAPP Symposium on Applied Computing, Feb. 1993, 745-753.
(Agosti 1994) M. Agosti, F. Crivellari, M. Melucci. The virtual object as a representation tool of complex data. Proc. of the 17th European Urban Data Management Symposium (U.D.M.S.), Helsinki-Espoo, Finland, Sept. 1994, 48-57.
(Agosti 1995) M. Agosti, F. Crestani, M. Melucci. Automatic authoring and construction of hypertext for Information Retrieval. ACM Multimedia Systems, 3(1), 15-24.
(Agosti 1996) M. Agosti, F. Crestani, M. Melucci. Design and Implementation of a Tool for the Automatic Construction of Hypertexts for Information Retrieval. Information Processing & Management, 32(4),459-476.
(Agosti 1997a) M. Agosti, J. Allan (Guest Eds). Special Issue: Methods and Tools for the Automatic Construction of Hypertext. Information Processing & Management, 33(2).
(Agosti 1997b) M. Agosti, F. Crestani, M. Melucci. On the Use of Information Retrieval Techniques for the Automatic Construction of Hypertext. Information Processing & Management, 33(2), 133-144.
(Melucci 1996) M. Melucci. Costruzione automatica di ipertesti. PhD thesis, Universita' di Padova, Dipartimento di Elettronica e Informatica, 1996.


10. Durata del Programma di Ricerca 24 (mesi)


11. Pubblicazioni scientifiche più significative del Responsabile dell'Unità di Ricerca
  1. M. Agosti, A. Smeaton (Eds). Information Retrieval and Hypertext. Kluwer Academic Publishers, Boston, 1996, pp.xviii+279.
  2. M. Agosti. An Overview of Hypertext. In: M. Agosti, A. Smeaton (Eds). Information Retrieval and Hypertext. Kluwer Academic Publishers, Boston, 1996, pp.27-47.
  3. M. Agosti, F. Crestani, M. Melucci. Design and Implementation of a Tool for the Automatic Construction of Hypertexts for Information Retrieval. Information Processing & Management, 32(4),459-476.
  4. M. Agosti, J. Allan (Eds). Introduction to the Special Issue on Methods and Tools for the Automatic Construction of Hypertext. Information Processing & Management, 1997, 33(2), 129-131.
  5. M. Agosti, F. Crestani, M. Melucci. Automatic authoring and construction of hypertext for Information Retrieval. ACM Multimedia Systems, 3(1), 15-24.


12. Risultati ottenibili con fondi propri
Nel corso del primo anno si partecipera' alla elaborazione del rapporto tecnico contenente le specifiche di progetto del prototipo nella sua versione alfa. Nel corso del secondo anno del progetto si partecipera' alla definizione delle specifiche della versione beta del prototipo e verranno valutate possibili estensioni di utilita'.


13. Risorse umane impegnabili nel Programma dell'Unità di Ricerca
(un docente-ricercatore può far parte di una sola Unità di Ricerca)

13.1 Personale universitario dell'Università sede dell'Unità di Ricerca


No. Cognome Nome Dipart./Istituto Qualifica Mesi uomo
1. AGOSTI MARISTELLA Elettronica e Informatica Professore Associato 6
2. CRIVELLARI FRANCO Elettronica e Informatica Professore Associato 6
3. GRADENIGO GIROLAMO Elettronica e Informatica Professore Associato 2
4. DEAMBROSIS GRAZIANO Elettronica e Informatica Assistente 2

13.2 Personale universitario di altre Università:

No. Cognome Nome Università Dipart./Istituto Qualifica Mesi uomo

13.3 Titolari di borse ex L. 398/89 art. 4 (post-dottorato e specializzazioni)

No. Cognome Nome Dipart./Istituto Mesi uomo
1. MELUCCI MASSIMO Elettronica e Informatica 12

13.4 Titolari di borse per dottorato di ricerca

No. Cognome Nome Università sede amm. Dipart./Istituto Ciclo Mesi uomo

13.5 Personale extrauniversitario - aggregabile al programma senza oneri aggiuntivi

No. Cognome Nome Ente Qualifica Mesi uomo

13.6 Personale a contratto

No. Cognome Nome Qualifica Costo previsto Mesi uomo
1. BENFANTE LUCIO BORSISTA 22 Milioni 12


14. Risorse finanziarie a sostegno del Programma già disponibili all'atto della domanda
(tutte le cifre sono espresse in milioni)

QUADRO RD

Provenienza anno di assegnazione importo disponibile nome Resp. Naz.
Universita'  1997  11,000
Dipartimento    
MURST (ex 40%)  antecedente 1995  
MURST (ex 40%)  1995  2,000  PAOLO ATZENI
MURST (ex 40%)  1996  9,500  PAOLO ATZENI
CNR    
Unione Europea  1996  5,500
Altro    
TOTALE    28,000

14.1 Altro (origine e importi dettagliati):


15. Risorse finanziarie acquisibili in data successiva a quella della domanda e utilizzabili a sostegno del Programma
(tutte le cifre sono espresse in milioni)

QUADRO RA

Provenienza anno della domanda o stipula del contratto stato di approvazione disponibilità per il programma
Università      
Dipartimento      
CNR      
Unione Europea      
Altro      
TOTALE      

15.1 Disponibilità per il programma(articolare negli anni di durata del programma)

15.2 Altro (origine e importi dettagliati)


16. Apparecchiature o grandi attrezzature

16.1 Disponibili ed utilizzabili per la ricerca proposta
(tutte le cifre sono espresse in milioni)

descrizione anno di acquisizione valore all'acquisto finanziamenti ottenuti dal MURST % di utilizzo per la ricerca proposta
 SUN ULTRA  1996  18 milioni  0  50
 X-terminal  1995  6 milioni  0  50
 Pentium 200  1997  5 milioni  0  50

L'uso delle attrezzature disponibili richiede, per la ricerca proposta, interventi di adeguamento? no

Quota necessaria per l'adeguamento:


16.2 Descrizione sintetica dell'adeguamento richiesto


16.3 Richiesta di grandi attrezzature (GA)
(tutte le cifre sono espresse in milioni)
  1. Descrizione:


    Valore presunto (milioni):    

  2. Descrizione:


    Valore presunto (milioni):    

  3. Descrizione:


    Valore presunto (milioni):    


17. Certifico la disponibilità e l'utilizzabilità dei fondi si



Firma ________________________________ (per la copia da depositare presso l'Ateneo)


18. Costo complessivo del Programma dell'Unità di Ricerca (in milioni di lire)

Costo complessivo

di cui:
 70,000

Voce importo
Materiale inventariabile - (Voce A)  0,000
Spese generali - (Voce B)  70,000
Grandi attrezzature - (Voce GA)  


Risorse disponibili all'atto della domanda (RD)  28,000
Risorse acquisibili (RA)  
Cofinanziamento richiesto al MURST  42,000
Costo minimo per garantire
la possibilità di verifica dei risultati
 22,000

Occorre precisare che la quota di cofinanziamento massimo del Programma di Ricerca deve essere pari a:
(Totale RD + Totale RA) x 1.5 per progetti Interuniversitari e
(Totale RD + Totale RA) x 0.66 per progetti Intrauniversitari

(per la copia da depositare presso l'Ateneo e per l'assenso alla divulgazione via Internet delle informazioni riguardanti i programmi finanziati; legge del 31.12.96 n° 675 sulla "Tutela dei dati personali")



Firma ____________________________________ Data 16/7/97
Ora  13:42:9