Servizi one-click nella cloud federata GARR
Automatizzare la gestione dei servizi, semplificare la vita agli utenti e puntare su servizi specifici per ricerca e formazione: ecco la ricetta cloud del GARR
In meno di un mese oltre 200 risposte. Questo è stato il risultato di una consultazione pubblica lanciata da GARR nel luglio scorso per capire i bisogni della comunità della ricerca e l’interesse verso le tecnologie cloud
Oggi è difficile trovare qualcuno che sottovaluti il potenziale dei Big Data accumulati a livello globale dalla comunità scientifica, eppure siamo ancora molto lontani dallo sfruttare adeguatamente questo enorme patrimonio che si arricchisce di giorno in giorno, a causa della frammentazione o a volte di vere e proprie carenze a livello di infrastrutture di ricerca.
Un’occasione mancata, insomma, a cui la Commissione Europea intende porre rimedio attraverso azioni a sostegno di una cloud europea per la “open science”, un ambiente federato accessibile globalmente, in cui ricercatori, innovatori, aziende e cittadini possano pubblicare, trovare e riutilizzare dati e strumenti per scopi di ricerca, innovazione e formazione. L’iniziativa intende agevolare l’accesso fiduciario a servizi e sistemi per l’utilizzo di dati scientifici condivisi abbattendo confini disciplinari, sociali e geografici. Entro il 2020, questa cloud europea permetterà a circa 1,7 milioni di ricercatori e a 70 milioni di professionisti della scienza e della tecnologia in Europa di archiviare, condividere e riutilizzare i dati a livello interdisciplinare e internazionale.
GARR
Coordinatore Dipartimento Calcolo e Storage Distribuito
Tante le risposte arrivate, in gran parte dal mondo universitario (circa il 62%) è altissima l’attenzione verso quella che ormai è esigenza quotidiana per gli amministratori di reti e gli utenti, visto che il 49% di essi già usa cloud pubbliche (Google, Microsoft e Amazon, su tutte) e circa il 55% utilizza risorse su cloud privata, in particolare per servizi Infrastructure as a Service (IaaS) e Platform as a Service (PaaS). Tra i servizi che interessano maggiormente troviamo macchine virtuali (per il 64% degli utenti), servizi PaaS per la ricerca come Hadoop o Spark (55%), virtual data centre (49%) e servizi PaaS per la didattica come Moodle (45%).
Ma quali sono gli aspetti dell’offerta GARR che sono più apprezzati dalla comunità? Primo su tutti, la qualità dei servizi mirati per esigenze specifiche della ricerca (molto o abbastanza importante per il 77% degli utenti), successivamente la maggiore efficienza della rete GARR in termini di banda e latenza (molto o abbastanza importante per il 69% delle persone), la possibilità di condividere e quindi ridurre i costi dei servizi (69%) e la garanzia di riservatezza dei dati (59%). Ugualmente importante, ma meno rispetto agli altri aspetti, è la garanzia offerta da GARR di ospitare i dati su proprie macchine in Italia (49%). Circa i modelli di pagamento di servizi, la formula preferita è quella per quota complessiva di risorse pagate dall’ente o dall’università. Meno apprezzate le formule a consumo per gruppi di ricerca o a pacchetti di risorse ricaricabili dall’ente.
Dalle risposte si registra un’elevata disponibilità a partecipare alla federazione cloud GARR. Su 180 risposte, l’85% si è dichiarato favorevole a contribuire in vario modo: con risorse di calcolo o storage (33%), con personale per lo sviluppo di nuovi servizi (23%), con personale per la gestione e manutenzione dei servizi (22%) o con pacchetti applicativi da erogare in modalità PaaS (12%). Abbiamo chiesto un commento a questi dati al coordinatore del Dipartimento Calcolo e Storage Distribuito, Giuseppe Attardi.
Qual è il dato più interessante che emerge dalle risposte alla consultazione?
L’attenzione al questionario e il numero di risposte ottenute in breve tempo, mostrano un interesse diffuso da parte della comunità dell’istruzione e della ricerca. Si avverte l’esigenza di avere soluzioni personalizzate pensate per le attività di ricerca che nascano proprio dagli stessi ambienti della ricerca. Si tratta di mettere insieme una spinta che viene dal basso per dare un servizio concreto ai nostri utenti. Notiamo come ci sia un maggiore interesse per i servizi preconfigurati, quindi non soltanto per l’infrastruttura o le risorse hardware. C’è grande richiesta per le macchine virtuali, ma per gestirle è richiesto uno sforzo ulteriore e continuativo oltre a quello di predisporre la macchina. Poiché le risorse di personale tecnico scarseggiano, è conveniente poter disporre di VM managed o ancor meglio di servizi PaaS. Per esempio, in molte attività di ricerca ci sarà sempre più l’esigenza di trattare Big Data.
SI AVVERTE L'ESIGENZA DI AVERE SOLUZIONI PERSONALIZZATE PER LE ATTIVITÀ DI RICERCA CHE NASCANO PROPRIO DALLA COMUNITÀ
È naturale allora che emerga un alto interesse verso un’offerta di servizi PaaS che permettano di effettuare Big Data Analytics, riducendo l’onere sui ricercatori di impostare i cluster di VM e il software di analisi.
La risposta sulla disponibilità a partecipare alla federazione GARR è incoraggiante.
Sì. La nostra comunità sta rispondendo bene all’invito fatto da GARR per mettere in comune le proprie risorse. Noi abbiamo già un nucleo iniziale molto significativo che sono le risorse GARR acquisite nell’ambito del progetto GARR-X Progress. Si tratta di 5 data centre distribuiti con circa 10 PB di storage e 8448 virtual CPU. Ma ovviamente da soli non si va da nessuna parte. I grandi player del settore hanno risorse enormi, ma non per questo la comunità accademica e della ricerca deve derogare alla sua missione di continuare ad essere pioniera in ambito di innovazione tecnologica.
È un compito molto arduo, in che modo si pensa di procedere?
L’obiettivo è quello di facilitare la transizione al cloud computing. È una trasformazione che sta già avvenendo sotto i nostri occhi. Altre transizioni le abbiamo già vissute: ad esempio dai mainframe ai PC, 40 anni fa, dai PC alle reti 20 anni fa. Abbiamo imparato a usare i computer e siamo diventati esperti di reti in maniera autonoma. Oggi invece l’offerta dei servizi cloud è pilotata da fuori, dai grandi operatori privati. È un peccato perché è tra i compiti fondamentali della ricerca sviluppare competenze in tutti i settori strategici. Scopo della federazione è di costruire una piattaforma comune, dove i ricercatori italiani possono sperimentare ed essere protagonisti del cambiamento anziché subirlo nella forma che ci viene proposta da altri. Si tratta di un obiettivo ambizioso e difficile e per questo è necessario uno sforzo congiunto da parte di tutti per fare massa critica. La cloud federata intende mettere insieme sia risorse fisiche che competenze. Non solo infrastruttura, ma veri e propri servizi. Come abbiamo visto l’interesse è molto alto perché nell’offerta commerciale non ci sono le stesse garanzie che può offrire un soggetto istituzionale come GARR in termini di riservatezza, protezione dei dati, trasparenza dei vincoli contrattuali nel tempo.
Come è pensata l’architettura cloud federata?
È organizzata in varie regioni, che raggruppano le risorse che ciascun membro della federazione mette a disposizione. C’è una regione master e altre regioni che si federano. Nella master cisono alcune applicazioni centralizzate per consentire la gestione comune. Gli utenti fanno parte di tutta la federazione e non delle singole regioni e possono operare su qualunque servizio venga loro messo a disposizione. Chi gestisce una singola regione però mantiene autonomia e responsabilità sulle proprie risorse e può gestire e decidere quali risorse tenere per sé e quali condividere anche ad altri.
Non c’è chiusura verso le cloud degli operatori e dei fornitori privati, che vengono viste però come fornitori di risorse e non come venditori di servizi. Saranno gli utenti a scegliere quali applicazioni attivare e su quale cloud appoggiarle, mantenendo autonomia rispetto ai fornitori e riducendo i rischi di lock-in. In altre parole, i servizi sviluppati per la cloud federata potranno essere caricati e spostati su una qualunque delle cloud della federazione.
Si tratta di un’architettura complessa. Per il singolo ricercatore sarà di facile utilizzo?
LA FEDERAZIONE MIRA A COSTRUIRE UNA PIATTAFORMA COMUNE DOVE I RICERCATORI POSSANO ESSERE PROTAGONISTI DEL CAMBIAMENTO
Per l’utente finale i servizi saranno, quanto più possibile, attivabili con un solo click. Abbiamo fatto un grande sforzo per rendere possibile l’automazione delle installazioni di tutti i servizi, partendo da zero. Abbiamo un repository pubblico, un GitHub dove ci sono codici e documentazione. L’utente può scaricarli e metterli in esercizio da zero, ad esempio sopra delle macchine virtuali create appositamente. Dalla piattaforma cloud stessa (basata su OpenStack) ai servizi applicativi tutto può venire messo in esercizio con pochi passi semplici e veloci. Questo stesso meccanismo consente di creare e attivare in modo agevole una regione della federazione, seguendo le indicazioni presenti alla pagina: cloud.garr.it/doc/federation.
Quali servizi sono già disponibili?
L’attuale offerta di servizi cloud GARR comprende tre tipologie: Macchine virtuali classiche, Virtual data centre, ovvero una raccolta di risorse che un amministratore può gestire come se fosse un proprio data centre dove creare macchine virtuali e assegnare risorse agli utenti, e servizi PaaS, cioè la possibilità di utilizzare applicazioni one-click. Sui servizi PaaS c’è un catalogo pronto di circa 200 servizi che siamo in grado di erogare in questo modo. Tra questi, i CMS (come WordPress o Joomla!), sistemi per l’analisi Big Data (Hadoop, Spark), sistemi per gestire Identity Provider o piattaforme per l’e-learning come Moodle.
Moodle as a Service è il primo componente sviluppato direttamente dal GARR, ma speriamo che si crei una comunità di sviluppatori, per arricchire il catalogo e condividere soluzioni. Penso ad esempio a pacchetti applicativi destinati a creare laboratori virtuali per i corsi di formazione, comprendenti tutto il software necessario affinché gli studenti possano svolgere le loro esercitazioni.
Riuscire a fare tutto con un semplice click è davvero un bel vantaggio per gli utenti...
Certamente, soprattutto se pensiamo a servizi molto articolati che finora richiedono un grande impegno di risorse hardware e di personale. Ad esempio, installare un cluster Hadoop è piuttosto complesso perché vanno installati e configurati diversi applicativi e pacchetti su macchine diverse. La cloud GARR adotta un approccio di tipo application modelling, che utilizza un modello per descrivere quali sono le componenti necessarie per realizzare un determinato servizio applicativo e come tali componenti interagiscono tra loro. Il modello viene passato alla piattaforma, che attiva automaticamente il numero di macchine virtuali necessarie, le distribuisce in modo ottimale e installa su di esse le applicazioni richieste. Con un click si lancia il processo e si procede alla creazione e all’installazione. Per l’utente tutto è trasparente, e non deve necessariamente sapere come funziona OpenStack o dove si trovino le risorse che utilizza.
Per saperne di più
La sintesi delle risposte della consultazione pubblica si può leggere qui: goo.gl/iDzLFK
Ulteriori informazioni e documentazione tecnica sui servizi cloud GARR sono disponibili su https://cloud.garr.it, dove è presente anche un forum di discussione in cui scambiarsi idee, suggerimenti ed esperienze.