Bibliopolis News

24.1.05

Googlizers e resistors: buoni e cattivi ricercatori on line

Il tam tam pubblicitario sulle più recenti novità di Google ha fatto il giro del mondo ed è arrivato in AIB-CUR (la lista di discussione dei bibliotecari italiani) oltre che sulle pagine dei nostri quotidiani nazionali: molti bibliotecari, ricercatori e documentalisti, e giornalisti, non solo negli Stati Uniti, vedono prevalere negli utenti la soddisfazione per i grandi motori di ricerca gratuiti e la meraviglia per le loro gesta (digitalizzazione collezioni bibliotecarie, Google Scholar, nuove funzionalità e così via) .

Al contrario, gli addetti ai lavori e in particolare coloro che si occupano di servizi di reference, trovano sempre più difficile e impegnativo spiegare i vantaggi e le caratteristiche di altre modalità di accesso all'informazione elettronica, dagli OPAC alle banche dati, specie se sono a pagamento.

Un articolo sul numero di dicembre di 'Library Journal' (Kenney, B. Googlizers vs. Resistors: Library leaders debate our relationship with search engines, in 'Library Journal', 12/15/2004, http://www.libraryjournal.com/article/CA485756) offre l'interessante sintesi di un dibattito sul ruolo dei bibliotecari in un mondo googlizzato, organizzato in Pennsylvania un paio di mesi fa: i relatori e il pubblico si sono divisi in due schieramenti, i googlizers e i resistors.

Tre dilemmi sono stati al centro di questo dibattito. Tre dilemmi che condensano le riflessioni diffuse un po' ovunque nei progetti di educazione alla ricerca on line e di information literacy (tema molto trattato durante l'ultimo congresso IFLA, tra l'altro):
  1. complessità d'uso dei sistemi informativi bibliotecari rispetto ai motori di ricerca e alle librerie virtuali come Amazon. Occorre ridurre il carico cognitivo e il disorientamento provocati da tante interfacce diverse ed è auspicabile lo sviluppo di sistemi di ricerca integrati, che non richiedano apprendimento delle funzionalità;
  2. difficoltà degli utenti a comprendere differenze tra i sistemi di information retrieval Web e i sistemi catalografici, per cui è abbastanza frequente che vadano sul sito della biblioteca e cerchino gli orari di apertura nei box di ricerca degli OPAC;
  3. priorità nel trasferimento di conoscenze e capacità di valutazione dell'informazione e non solo addestramento sulle funzionalità dei sistemi di ricerca (di cui tra l'altro gli utenti non avvertono nemmeno il bisogno).

Più sfaccettata e controversa, è una quarta faccenda, ovvero il dilemma della presunta pericolosità della 'googlizzazione' della ricerca, cioè la tendenza a rendere e a presentare come immediata e facilmente disponibile l'efficacia dei motori di ricerca (la filosofia dell' I'm feeling lucky di Google) .

Secondo un certo modo di vedere le cose, tipico dei resistors, il fenomeno avrebbe valenze diseducative perchè renderebbe gli utenti incapaci di usare funzionalità avanzate degli strumenti e, di conseguenza, di ottenere migliori risultati. Offrendo risposte percepite immediatamente come rilevanti, senza che sia avvertito il bisogno di compiere ulteriori indagini e valutazioni, la googlizzazione renderebbe inetto anche il più intelligente dei ricercatori. La tesi dei resistors approda a una sorta di difesa d'ufficio delle banche dati a pagamento e delle modalità di gestione dell'informazione classificata e alza barricate per preservare gli OPAC e le consuete pratiche di indicizzazione semantica utilizzate dai bibliotecari, che sono tra l'altro in affanno ovunque.

Al contrario, i fanatici di Google, i googlizers, sventolano le bandiere dei casi di successo in ambito persino scientifico: condotte con i motori di ricerca e gli archivi open access molte ricerche portano a esiti straordinariamente efficaci in pochissimo tempo e, soprattutto, gratis.

A dire il vero gli esempi di successo non mancano neppure ai resistors. I due partiti portano insomma acqua ai rispettivi mulini in modo che mi pare piuttosto prevedibile, basato sull'evidenza, e facilmente 'smontabile':

  1. una ricerca di articoli di un autore è meno efficace in Wilson Omnifile e Abi/Inform rispetto a Google - ma solo se l'autore ha deciso di pubblicare il proprio materiale sul Web!
  2. Al contrario, banche dati come Abi/Inform sono il mezzo più veloce ed economico per raccogliere articoli e preparare un dossier in qualche settore economico, grazie all'uso di descrittori di soggetto e codici dell'industry classification system - ma quando oggetto della ricerca è qualche segmento di mercato innovativo, si resta facilmente con le pive nel sacco e il conto della spesa, per giunta, salato!

La pericolosità di Google a fini educativi, affermata dai resistors, è a mio parere implicita nell'uso di qualsiasi fonte o strumento di informazione, anche nella più elementare delle directory, come vediamo continuamente durante i corsi in questa materia.

In questa contrapposizione ci si dimentica infatti totalmente dei livelli di conoscenze richieste in relazione alla funzione e al ruolo di chi compie ricerche di informazioni, argomento molto poco presente nel dibattitto tra i due schieramenti.

E' dunque proprio il fattore tempo, la curva di esperienza delle persone nell'uso degli strumenti per la ricerca, il fattore critico sul quale tutti i bibliotecari e i professionisti dell'informazione in genere dovrebbero a mio avviso concentrarsi. Altro tema poco presente nel dibattito americano è l'importanza dei linguaggi specialistici nel determinare la rilevanza percepita, argomento che i googlizers tendono semplicemente a ignorare e i resistors a enfatizzare in modo acritico: la scelta dei termini usati è la prima condizione di successo sia con Google sia con le banche dati a pagamento, ma prescinde sia dalle tecnicalità dell'information retrieval sia dagli strumenti di indicizzazione 'classici': la precisione della terminologia usata in ambito medico, chimico o di altri contesti tecnico scientifici è un fatto, un ingrediente essenziale del successo di molte ricerche che gli utenti compiono usando tanto Google quanto altri strumenti e archivi gratuiti o a pagamento in questi settori. Nell'ambito delle scienze sociali, dell'economia e della business information, la competenza linguistica e disciplinare è cruciale solo se si sposa ad altre capacità, come saper vagliare e valutare i controlli editoriali sui contenuti e selezionare tra le opzioni di indicizzazione disponibili, in una prospettiva più discrezionale anche riguardo alla gestione del tempo impiegato per le ricerche e ai loro scopi. Proprio questo è il punto chiave delle opinioni dei googlezers che non convince: la possibilità che l'utente finale privo di formazione sulle metodologie dell'information retrieval sia in grado di valutare la qualità del processo di ricerca. Molti considerano abbastanza buono quello che ottengono con Google e, semplicemente, si accontentano. Questa percezione di ciò che sembra abbastanza buono dovrebbe diventare oggetto specifico di addestramento, anche per i googlezers, per prevenire fenomeni di distorsione e disinformazione e in generale per poter affermare la 'bontà' di qualsiasi percorso di ricerca in modo documentabile e replicabile.

Quanto ai luoghi comuni invocati dai resistors, dobbiamo dire che la maggior parte dei sistemi di information retrieval usati in ambiente Web oggi non ha nulla da invidiare alle funzionalità di costose banche dati: molte ricerche non hanno semplicemente più senso in ABI/inform di quante ne abbiano in Google.

Si possono fare ricerche con i metadati all'interno di collezioni e archivi gratuiti e si hanno gli stessi contenuti dei vendors a pagamento accessibili anche attraverso più sistemi, compresi quelli gratuiti. Tutte queste alternative sono pero' realmente disponibili solo a chi conosce come è strutturato il mercato dell'informazione, a chi ha basi bibliografiche e conoscenze specialistiche. La pericolosità della googlizzazione non è nello strumento, a mio parere, anzi ben venga la googlizzazione di tutte le collezioni bibliotecarie del mondo. Ma e' l'uso che le persone e le organizzazioni ne fanno a lasciare perplessi.

Contrapporre googlizers a resistors, in conclusione, è un buon modo per aumentare il livello di sensibilizzazione sul tema dell'information literacy, così come per fare tanta pubblicità a Google e ad altri strumenti e soluzioni per la ricerca on line. Ma sul terreno dell'educazione degli utenti, della formazione e dell'aggiornamento di compentenze specialistiche, e del rinnovamento e dello sviluppo dell'industria dell'informazione non ha senso.


16.12.04

La Cina debutta nei motori di ricerca con Accoona

Senza pensieri
La tua vita sarà...
Chi vorrà
vivrà...
In libertà....
Hakuna Matata
Ah, ah, ah
The Lion King - Disney

La notizia

Quest'anno la Cina ha dominato le cronache economiche. Sei mesi fa la decisione del governo cinese di investire anche nel settore dei motori di ricerca. Il 6 dicembre, quasi contemporaneamente alla notizia della acquisizione della divisione PC dell'IMB da parte del gruppo cinese Lenovo, è arrivato l'annuncio del debutto di Accoona. La velocità dei cinesi nel fare ciò che dicono di voler fare è impressionante.
Dal prossimo 1 gennaio 2005 cadranno le restrizioni all'export dei prodotti cinesi fissate quarant'anni fa: il tempismo del lancio di Accoona è stato perfetto.

Notizie nella notizia

Un testimonial come Bill Clinton (alla cui Fondazione l'Accoona Corporation pare abbia fatto una donazione dal valore non dichiarato) ha assicurato buona copertura mediatica all'evento.


Diversi esperti americani del settore, tra cui il bibliotecario Gary Price (vedi l'articolo in Search Engine Watch), si sono precipitati a recensirne i difetti e a contrapporgli la maggiore affidabilità "degli altri" grandi protagonisti della scena (Google, Microsoft e Yahoo!).


Così il lancio del primo motore di ricerca (di fatto) cinese non poteva riuscire meglio. Ma la notizia nella notizia, dal mio punto di vista, è che nessuno ha posto l'accento sul fatto che la Cina (la Cina!) entra così nel settore dei motori di ricerca internet.

Il debutto del... Re Leone?

With the blessing of the People's Republic of China, we offer this
as a way of opening up Chinese enterprises to the outside world.

Zhang Ping,
Chief executive of Chinadaily.com.cn, in occasione della presentazione di Accoona.com

Accoona vuole facilitare gli scambi e gli accordi internazionali delle imprese cinesi. Non disdegna, nel frattempo, di entrare anche nel business dei grandi motori di ricerca internazionali, la pubblicità on line. Ha perciò stretto accordi con Yahoo! Overture. Le inserzioni saranno visibili per gli utenti americani ed europei mentre i cinesi avranno accesso, come è d'uso dalle loro parti, ad una versione opportunamente censurata del database.

Con sede nel New Jersey, dove può operare senza le restrizioni dell'internet cinese (vedi oltre), la Accoona Corporation è controllata dalla China Daily Information Company, agenzia stampa di Stato e maggiore editore cinese in lingua inglese.

Il Governo cinese gli ha assicurato finanziamenti esclusivi per vent'anni (20 anni! per il management di ogni altro operatore in questo settore è una fortuna avere business plan che valgano per 2!) nonchè dati ufficiali su circa 5 milioni di imprese.

A luglio 2004, Zhao Qizheng (direttore dell'Ufficio stampa del Consiglio di Stato, Ministro della Comunicazione, portavoce ufficiale del Governo) aveva spiegato che lo scopo del motore di ricerca è anzitutto quello di promuovere le imprese cinesi nel Mondo. Perciò sarà integrata al database di pagine Web anche una business directory la cui consistenza dovrebbe aggirarsi - dicono - intorno ai 32 milioni di imprese. Fonti dei dati? Non si conoscono. Chi li editerà? Non si sa. Forse la agenzia China Business Information o forse Yahoo! China.

Dotato di un database proprietario di dimensioni per ora sconosciute, il motore dichiara capacità innovative di recupero dell'informazione, grazie alla applicazione di una tecnologia di "intelligenza artificiale" che può interpretare (nientepopodimeno che) i significati dei termini usati dagli utenti. Il motore apprenderà dall'uso (cioè dalle selezioni tra i risultati che gli utenti faranno) come riuscire ad essere via via più efficace.

Queste dichiarazioni sono state criticate all'unanimità dalla stampa, e giustamente: sembrano più una trovata pubblicitaria che altro dato che le modalità di costruzione dell'indice, la consistenza e la provenienza dei dati e via discorrendo non si conoscono. Ma... proviamo a ipotizzare che la tecnologia di Accoona sia veramente ciò che sostiene. Questa ipotesi ci porta a considerare l'idea che il motore possa differenziarsi da ogni altro sistema di information retrieval sviluppato nel corso dell'ultimo mezzo secolo. Anzichè basarsi sulla nozione di rilevanza, la sua tecnologia potrebbe basarsi sulla nozione di incertezza, che è fondamentale per ogni applicazione di intelligenza artificiale. E così diventa verosimile la promessa di Accoona, cioè che i termini di ricerca usati dagli utenti possano anche non essere presenti nelle pagine dei risultati ma... fidatevi, i risultati saranno "giusti", cioè percepiti dall'utente come i più utili e convenienti. Parola di Re Leone!

Quale posto per la "potenza cinese" nel settore dell'information retrieval?

Ecco che il nome "Accoona" (dallo swahili "accoona matata", "don't worry", "nessun problema", "non ti preoccupare", come recita il ritornello della canzone del noto film Disney) assume immediatamente un'altra valenza. E'... una promessa potente!

Un paio di elementi di riflessione a riguardo:

  1. Moltissime intelligenze attive da anni nell'information retrieval e nella scienza dell'informazione sono di madrelingua, cultura, nazionalità cinese. Si tratta di specialisti che hanno competenze eccellenti.
    La loro lingua impone a questi scienziati la segmentazione delle parole prima della fase di indicizzazione (nella lingua cinese scritta non esistono, infatti, spazi bianchi che delimitano le parole), difficoltà che li ha portati a sviluppare algoritmi e conoscenze più sofisticate di molti colleghi occidentali.
    Questa forza lavoro così qualificata può dare vantaggi alle organizzazioni cinesi in fase di espansione internazionale (come la Lenovo) e contribuire a creare nuovi strumenti di information retrieval competitivi rispetto a quelli conosciuti.


  2. La "potenza cinese" nel campo dell'informazione e di internet è già molto forte nel controllo e nella censura preventiva sui contenuti e sulle interazioni, un ambito dove la Cina ha una esperienza assolutamente unica al Mondo.
    Le risorse informative controllate dalla Cina sono oggetto non solo di un efficiente sistema di repressione in tutto il Paese, come è noto, ma anche e soprattutto di misure di censura preventiva raffinate, sviluppate con l'aiuto di grandi imprese occidentali (Sun, Microsoft, Cisco, Bay Networks, News Corporation, tra le altre) che hanno lavorato nella seconda metà degli anni Novanta per creare, su commessa statale, una specie di infrastruttura internet cinese "parallela" a quella auto-regolamentata occidentale. In pratica, è come se oggi esistessero due internet di dimensioni entrambe planetarie, la cui estensione ed i cui confini sono invisibili per gli utenti, cinesi e non.

    Una ulteriore "contromisura" che la Cina ha intrapreso a partire dal 2000 per prevenire contaminazioni con l'internet occidentale è consistita nella aggressiva promozione di contenuti propri, spesso mimando modelli di successo occidentali, nonchè avvalendosi delle consolidate esperienze di altre organizzazioni che hanno come finalità principale lo sviluppo di partnership economiche e commerciali internazionali.

    La massiccia operazione di "educazione ideologica" dell'internet cinese è riuscita in ciò che ritenevamo fino a qualche anno fa impossibile: coniugare censura e interessi economici oltre ogni immaginazione di noi occidentali. (Su questi temi a chi è interessato a saperne di più raccomando l'articolo di Robert J. Deibert, Dark Guests and Great Firewalls: The Internet and Chinese Security Police, apparso in "Journal of social issues" vol. 58 (2002), n.1, p. 143-160).

L'investimento diretto della Cina nel campo dei motori di ricerca non si fermerà ad Accoona. Questo può anche essere un mega specchietto per le allodole affamate di nuovi scambi commerciali Cina-Resto del Mondo ma in ogni caso assisteremo a delle straordinarie innovazioni nelle applicazioni delle tecnologie di intelligenza artificiale ai sistemi di ricupero dell'informazione nei prossimi anni. Coniugate con la politica di controllo e censura preventiva dell'internet cinese queste innovazioni renderanno sempre più indistinto il confine tra informazione e publicity.


Intelligence literacy?

I fautori della potenza cinese potranno cantare "Hakuna Matata, ah, ah, ah!". Gli altri, quelli che vorranno competere con i cinesi nei prossimi anni, avranno bisogno di qualche altro motivetto per trattare informazioni!

Nell'internet "alla cinese" dovremo avere capacità di valutare l'informazione pubblicamente disponibile, di discernere il grano dal sale, più forti e più diffuse.

Tutti coloro che fanno anche il più modesto uso di informazioni, specie se provenienti dalla Cina, dovranno saper compiere eccellenti verifiche sulle fonti in ingresso nei processi di presa di decisioni (e non solo, pensiamo anche alle risorse educative, al training, e all'e-learning). Questi processi spesso iniziano attraverso l'esecuzione di compiti banali e la cui portata informazionale è di solito sottovalutata, come la ricerca di semplici dati anagrafici e fattuali... un nome, un indirizzo internet, un numero di telefono.

Il pensiero critico e una sorta di peer reviewing costante delle fonti di informazioni e di documentazione utilizzate in ogni attività dovrebbero cucire un abito mentale permanente e su misura per tutti i "lavoratori della conoscenza" occidentali.

Esplorare la disponibilità di fonti per risolvere dei problemi, per mettere a fuoco ciò che serve sapere, significa smettere di "sentirsi fortunati" perchè esiste Google! Abbiamo bisogno, oltre a Google, anche di strumenti a valore aggiunto, a pagamento, non finanziate da pubblicità e di capacità di intelligence diffuse.

Le alternative esistenti per procacciarsi, filtrare e analizzare informazioni su clienti, fornitori, persone, prodotti e tecnologie potranno essere sempre piu' alla portata di chiunque. Molte grandi aziende americane hanno da tempo avviato programmi di training dei manager sulla valutazione delle fonti. L'Italia industriale e soprattutto del commercio e dei servizi sono lontane da questa prospettiva: ci penalizzano non solo ragioni dimensionali delle PMI italiane come spesso si sostiene ma anche il fatto che nelle imprese italiane di ogni dimensione prevale spontaneamente una straordinaria sopravvalutazione delle fonti umane su quelle documentarie, oltre ogni ragionevole e consapevole proporzione che ci deve essere tra le due tipologie, attribuendo alle valutazioni dei professionisti della consulenza (commercialisti, fiscalisti, legali) la totale responsabilità nell'approvvigionamento di informazioni. Io non credo in tutta onestà che chi ha maturato una esperienza specialistica in questo campo abbia la bacchetta magica ma forse il know how dei "professionisti dell'informazione", documentalisti, esperti di fonti e risorse e di ricerca on line puo' aiutare.