Vai al contenuto principale

IBM rende disponibile tecnologie avanzate di ricerca e "business insight" alla comunità Open Source

UIMA fornisce la base per nuove applicazioni in grado di estrarre significato da informazioni non strutturate

Milano - 03 Feb 2006: IBM ha reso disponibile una nuova tecnologia Open Source, in grado di potenziare le capacità di “knowledge discovery”  tra diversi settori e applicazioni e di fornire agli sviluppatori gli strumenti per supportare una nuova classe di software per l’analisi delle informazioni.  La società ha completato la prima fase dell’offerta della Unstructured Information Management Architecture (UIMA) alla comunità Open Source, pubblicando il codice sorgente UIMA su SourceForge.net, il più grande sito di sviluppo Open Source del mondo.

UIMA è un’architettura software aperta, già utilizzata dall’industria e dal mondo accademico, che favorisce la creazione, lo sviluppo e la messa a punto di  tecnologie per scoprire la conoscenza presente nelle fonti di informazioni a più alti tassi di crescita:  il contenuto non strutturato presente nell’impresa e nel Web, comprendente documenti, immagini, commenti e campi di note,  video e audio.  Nel corso di quest’anno, IBM intende trasformare questo progetto in un modello di sviluppo pienamente Open Source.

“Le aziende vogliono estrarre valore da tutte le loro informazioni, ma nessun fornitore è in grado, da solo, di soddisfare tutte le esigenze di ricerca, analisi del testo e “business insight”, tra tutti i tipi di informazioni e per tutti i settori”, spiega Nelson Mattos, vice president Information and Interaction, IBM Research. “Stiamo mettendo UIMA a disposizione della comunità Open Source per favorire  l’innovazione e per consentire a strumenti software di analisi eterogenei  di lavorare insieme e sfruttare i reciproci punti di forza”.

Da quando il codice di UIMA è stato reso pubblico nel dicembre 2004, un ecosistema attivo di partner, clienti e sviluppatori Open Source ha accelerato l’innovazione e la fornitura di soluzioni create intorno a UIMA.

La International Federation of Pharmaceutical Manufacturers & Associations, l’organismo mondiale che rappresenta le aziende farmaceutiche, lancerà in febbraio un portale di informazioni sugli studi clinici, che utilizza l’architettura UIMA nell’ambito di IBM WebSphere Information Integrator OmniFind Edition per consentire la ricerca per area di patologia, nome del farmaco o sede dello studio, riconoscendo sinonimi medici e geografici tra diverse lingue, senza indicizzazione manuale. Il portale sarà utilizzato per raccogliere il contenuto proveniente da una serie di registri e database di studi clinici esistenti, consentendo ai medici e ai pazienti di riesaminare i risultati riepilogati e trovare gli studi clinici a cui partecipare.

Anche la Mayo Clinic ha adottato l’architettura UIMA nelle prime fasi del suo ciclo di sviluppo, nell’ambito della più ampia collaborazione con IBM nell’area dell’elaborazione di testo non strutturato.  La Mayo Clinic si è servita di UIMA come base per creare un sistema in grado di estrarre conoscenza dai suoi circa 20 milioni di note cliniche. Ciò ha offerto la flessibilità di combinare una serie di annotatori della Mayo Clinic, della IBM e della comunità Open Source in modo “plug-and-play”, per creare rapidamente una potente soluzione di analisi con capacità avanzate.

Il Memorial Sloan-Kettering Cancer Center collabora con IBM per sviluppare un data warehouse accessibile via Web, conforme ai requisiti HIPAA. Questo data warehouse consentirà ai clinici e ai ricercatori del Memorial Sloan-Kettering Cancer Center di usare in modo efficiente i dati, facilitando la ricerca su una nuova tassonomia dei tumori. Un aspetto importante del data warehouse è l’inserimento di concetti ricercabili dai referti patologici basati su testo del Memorial Sloan-Kettering Cancer Center. Questi concetti vengono automaticamente estratti da una soluzione di analisi del testo IBM, costruita sull’architettura UIMA.

Oltre al crescente ecosistema UIMA, il team General Architecture for Text Engineering Engineering (GATE - gate.ac.uk) presso l’Università di Sheffield ha di recente annunciato la fornitura di uno strato di interoperabilità con UIMA. Il nuovo strato offre agli utenti GATE l’accesso alle opzioni di deployment flessibili di UIMA e agli utenti UIMA l’accesso ai molti plug-in utili già disponibili in GATE per il text mining, l’estrazione delle informazioni e l’elaborazione in linguaggio naturale per la ricerca e l’uso commerciale.

UIMA ha ricevuto inoltre il sostegno della Defense Advanced Research Projects Agency (DARPA) ed è attualmente utilizzata nell’ambito del nuovo programma DARPA di ricerca e sviluppo sul linguaggio naturale denominato GALE (Global Autonomous Language Exploitation). Il Programma GALE è un programma quinquennale che coinvolge il mondo dell’industria e delle università, con l’obiettivo di sviluppare e applicare tecnologie software per assorbire, analizzare e interpretare enormi volumi di discorsi e testo in varie lingue e per fornire informazioni distillate rilevanti e immediatamente utilizzabili in lingua inglese. UIMA è stato adottato come architettura di integrazione di base, per costruire applicazioni di gestione delle informazioni non strutturate multimodale su larga scala.

Inoltre, diversi dei fornitori di software che avevano precedentemente annunciato piani per supportare UIMA hanno già reso disponibile le loro prime soluzioni “UIMA-compliant”, tra queste società quali ClearForest, Cognos, Factiva e nStein Technologies.

Disponibilità

Il codice sorgente di riferimento IBM di UIMA è attualmente disponibile e può essere scaricato dal sito http://uima-framework.sourceforge.net/. Inoltre, è possibile scaricare gratuitamente IBM UIMA SDK, con strutture e componenti supplementari, dal sito http://www.alphaworks.ibm.com/tech/uima.

UIMA è parte integrante del portafoglio IBM Content Discovery, che combina integrazione di contenuto, enterprise search, analisi del testo e contextual delivery. UIMA è incorporato in numerosi prodotti IBM, tra i quali IBM WebSphere Information Integrator OmniFind Edition, che offre una piattaforma completa per l’elaborazione di informazioni non strutturate, nell’ambito di soluzioni di enterprise search e business intelligence.  

Contatti

Alessandra Apicella
IBM Media Relations
+39 02 5962.5460
ale_apicella@it.ibm.com

XML feed collegati
Argomenti XML feed
Sanità
Nessuna descrizione specifica attualmente