Scovare il tesoro sepolto nei dati dell’impresa: la semantica come strumento competitivo
I motori di ricerca semantici non sono un argomento nuovo ma, grazie all’evoluzione del web e alla maturazione della potenzialità di alcune tecnologie, oggi meritano un’attenzione speciale.
Le tecniche semantiche nascono dall’esigenza di superare la semplice ricerca per parole chiave, ritrovando le informazioni con interrogazioni che non prevedano l’esatta corrispondenza dei termini ricercati.
Cos’è in pratica un motore di ricerca semantico?
Sia su Internet che negli archivi di aziende ed Enti, la maggior parte delle informazioni utili è contenuta in pagine di testo e il modo più comune per ritrovarle è utilizzare le esatte sequenze di caratteri contenute nel testo. Se su un motore di ricerca tradizionale (online o in azienda) digito la parola ‘titolo’ troverò tutti i testi che contengono questo termine, a prescindere dal fatto che io stia cercando un titolo finanziario o il titolo di un romanzo.
Il problema maggiore che incontrano le ricerche per semplici parole chiave è proprio che, quando si passa dal mero dato (la parola chiave) al significato della stessa, non si può prescindere dal contesto di riferimento.
Facciamo l’esempio di un utente che cerchi la parola topolino: anche limitandoci al contesto culturale italiano, può rappresentare un personaggio di un fumetto, il fumetto stesso, il nome di un trofeo di minirugby italiano, un modello di auto o il topolino che porta i soldi in cambio dei dentini dei bambini.
Come distinguere un significato dall’altro? Normalmente noi capiamo subito che, se si scrive “leggo topolino” si tratta dell’oggetto fisico su cui sono stampati i fumetti e se invece scriviamo “Topolino e Paperino” intendiamo il personaggio. I motori di ricerca semantici lavorano sul contesto per capire quello che capirebbe un uomo rispetto alla semplice parola chiave.
Può darsi che io abbia bisogno di tutti i documenti che hanno argomento finanziario che sono arrivati in azienda stamattina? Anche se nei documenti non c’è esplicitamente scritta la parola ‘finanza‘, la ricerca raccoglierà i documenti di investimenti e indebitamento, i bilanci e le indicazioni monetarie, guidato dall’area semantica in cui sono espressi questi contenuti. Questo un normale motore di ricerca non lo riesce a fare.
Non è normale utilizzare motori semantici di ricerca nella vita di ogni giorno proprio per la difficoltà ad elaborare un contesto predefinito, la semantica è comunque già entrata nella nostra interazione con i dispositivi elettronici.
Una spolverata di semantica qua e là è stata introdotta dal nuovo algoritmo di Google Hummingbird, chiacchieriamo con gli assistenti digitali sul nostro smartphone e la cosa che ci stupisce di più è proprio la loro capacità di individuare il contesto a prescindere dal contenuto.
Il cuore di Siri, di Google Now o del più recente Cortana di Microsoft, è un motore di ricerca semantica personalizzato, in cui il contesto sei tu e le tue abitudini, la tua rubrica, i tuoi spostamenti e le informazioni che vengono acquisite costantemente in modo dinamico, per migliorare nel tempo i risultati e darti l’impressione di avere a che fare con un’autentica intelligenza artificiale.
Possono dunque le aziende usufruire della semantica per abbattere i propri costi e migliorare i processi? Sicuramente, si, e a diversi livelli.
Un ambito applicativo già di grande successo per l’analisi semantica si delinea con la possibilità di elaborare di informazioni provenienti da social network, blog e in generale da testi pubblicati sul web.
Le applicazioni sono tantissime: nel turismo, ad esempio, l’analisi di Twitter è servita per capire cosa apprezzano di più e cosa si aspettano dall’Italia gli ospiti di lingua inglese. Si è così scoperto che il gradimento maggiore, in senso assoluto, è per le pasticcerie e il cibo in generale, mentre i commenti riguardanti musei e monumenti risultano meno presenti e il giudizio sui nostri mezzi di trasporto è mediamente negativo.
Si tratta della cosiddetta ‘sentiment analysis’, le cui applicazioni sono importanti in molteplici settori: viene applicata tanto per studiare il gradimento delle canzoni di Sanremo che per analizzare l’andamento dei candidati in periodo elettorale. Uno tra gli ambiti applicativi di maggior successo è sul fronte del marketing delle grandi aziende, le quali, con costi e tempi una volta impensabili, oggi sono in grado di capire le sfumature positive e negative associate al loro brand, potendo eventualmente intervenire con rapidità per rettificare elementi della loro comunicazione pubblica.
Non è diversa in sostanza l’applicazione delle tecniche semantiche nei sistemi di Question&Answers, in cui domande fatte in linguaggio naturale (“Chi ha inventato Topolino?”, “Consigliami un buon ristorante in zona”) vengono elaborate in modo tale da riuscire a proporre risposte ‘intelligenti’. Sempre Hummingbird, il nuovo algoritmo di Google, ha fatto notevoli passi in questa direzione, alzando lo standard a cui tendere sia nei motori di ricerca delle intranet che nei portali aziendali.
Le potenzialità della ricerca semantica possono produrre valore anche per aziende più tradizionali? Le tanto diffuse ed importanti PMI italiane?
Pensiamo in generale a tutto quanto nelle nostra aziende è “testo”. Documenti, manuali, fatture, contratti, mail, lettere, curriculum vitae ma anche trascrizioni dei testi delle telefonate del customer care o appunti presi durante le riunioni. Quanto tempo passato ad archiviare, magari anche con estrema precisione e l’ausilio di database sofisticati ma senza la certezza di ritrovare quanto cercato a distanza di tempo e poterne estrarre delle informazioni utili quali la soddisfazione media dei clienti, le competenze presenti in azienda o le prassi operative corrette per affrontare un certo problema tecnico.
Il più delle volte infatti la catalogazione non può tenere conto di tutti i criteri di ricerca adottati, che spesso cambiano nel tempo e richiedono complessi aggiornamenti e integrazioni.
Per fare un esempio tra tanti, si possono applicare tutte le tecniche già elencate di elaborazione del testo e classificazione semantica alle candidature spontanee che arrivano in ogni azienda.
I curriculum vitae possono essere letti dal software per estrarne informazioni salienti come i profili professionali del candidato, le sue competenze, le lingue conosciute, il livello di studio, domicilio/residenza e le patenti di guida possedute. Unite ad una ricerca di tipo semantico per le posizioni aperte il software permette quindi di evitare il lavoro meccanico delle risorse umane che devono pre-classificare tutti i profili in entrata e poi revisionarli nel momento in cui si apre una selezione.
I vari tipi di funzionalità semantiche possono poi essere combinate insieme per motori di ricerca e di classificazione per il trattamento della documentazione capaci di restituire vere e proprie risposte (how to) a domande tecniche, magari proposte in linguaggio naturale, attraverso la selezione di tutte le sezioni di documenti che trattano l’argomento.
Più complessi perché aperti ad un pubblico di varia origine sono i sistemi di interazione con gli utenti di portali web capaci di interpretare richieste scritte in forma libera e di restituire indicazioni su procedure, documenti e moduli per rispondere alle esigenze dell’utente in modo pro-attivo. Soluzioni di questo tipo potrebbero, ad esempio, contribuire al miglioramento di portali di eGoverment.
La prospettiva è sempre quella di fare trovare, all’interno di una poderosa massa di informazioni, quella che realmente corrisponde alla richiesta effettuata e dare la sensazione di creare un autentico dialogo tra l’utente e l’azienda/Ente che si apre al pubblico e vuole fornirgli servizi facilmente utilizzabili ed efficaci.
NEXT Software Solutions e Nemoris hanno recentemente inaugurato una collaborazione sinergica per poter tradurre le prospettive descritte in concrete opportunità per tutte le aziende ed Enti interessati. Contattateci per approfondire.