Il futuro del cloud è nella condivisione
Verso un approccio federato per ottimizzare le risorse già disponibili
all'interno della comunità GARR
Le tecnologie cloud sono ormai mature per gli obiettivi della comunità della ricerca. È questo uno dei risultati emersi da un’indagine svolta tra gli esperti ICT del mondo universitario e della ricerca che hanno partecipato alla sessione Cloud del Workshop GARR 2016. Tra i circa 50 specialisti intervistati, il 78% usa quotidianamente i servizi cloud, in particolare per lo storage, la mail e i servizi collaborativi.
Le soluzioni adottate da chi usa cloud sono varie: cloud privato (33%), cloud pubblico (17%), entrambe in modo indipendente (36%) o in modo ibrido (14%). Le tecnologie usate per i sistemi cloud pubblici sono per lo più un misto tra OpenStack (66,7%), VMware (53,3%) e OpenNebula (40%). Riguardo i sistemi cloud pubblici invece la scelta del provider è sui colossi mondiali: Google, Amazon, Microsoft.
Giuseppe Attardi
GARR
Coordinatore Dipartimento Calcolo e Storage Distribuito
Se i costi non sembrano essere la preoccupazione principale, le criticità sono soprattutto la complessità di gestione di un cloud privato, l’incertezza sui costi di lunga durata, la sicurezza e la privacy. Sopra ogni altra cosa, ciò che spaventa di più è il cosiddetto vendor lock, ovvero il timore di rimanere vincolati ad un operatore senza avere la disponibilità di spostare agevolmente e senza spendere una fortuna i propri dati e applicazioni su un’altra piattaforma.
Per capire di più cosa si sta muovendo nell’ambiente cloud per la ricerca e quale direzione stia seguendo GARR per venire incontro alle esigenze della propria comunità, abbiamo parlato con Giuseppe Attardi, professore all’Università di Pisa e coordinatore del Dipartimento Cloud e Storage Distribuito (CSD) del GARR.
Semplificazione ed economicità: sono le grandi promesse del cloud computing
Prof. Attardi le soluzioni cloud sono ormai irrinunciabili?
Quella del cloud non è soltanto una moda. In passato, nella lunga tradizione di ricerca e sperimentazione sull’High Performance Computing, tra cui si può inserire anche la Grid, i cicli erano tali che nel momento in cui si arrivava a padroneggiare una tecnologia si assisteva ad un salto tecnologico che rimetteva tutto in discussione, costringendo alla riscrittura di molte righe di codice. Il cloud invece, oltre ad orientarsi a un pubblico molto più vasto, non impone di cambiare il proprio modo di sviluppare applicazioni. La grande promessa del cloud computing risiede nel fatto che si possono utilizzare risorse condivise e flessibili in base alle esigenze riducendo i costi. Semplificazione ed economicità sono i principali benefici.
Quali sono le attività finora svolte dal GARR in ambito cloud?
Negli ultimi anni, le attività condotte nell’ambito del progetto GARR-X Progress, finanziato dal MIUR con fondi europei, hanno consentito di realizzare un’infrastruttura di data centre dislocati in cinque diverse località, interconnessi fra loro fino a 40 Gbps, che dispongono di 8448 core virtuali, 66 TB di memoria RAM e 10,3 PB di spazio disco.
Abbiamo seguito due direzioni: servizi di storage da una parte e servizi di calcolo dall’altra. Abbiamo realizzato il servizio di storage GARRbox e abbiamo studiato soluzioni per erogare servizi IaaS e PaaS.
Dal punto di vista delle scelte tecnologiche, è stata utilissima la condivisione delle esperienze della nostra comunità. Sono state considerate diverse possibilità sia open source (OpenNebula) che commerciali (VMware) e alla fine l’attenzione è stata posta su OpenStack, un sistema open source che è ormai divenuto uno standard industriale sostenuto da numerose aziende e sviluppatori di tutto il mondo. I vantaggi principali di OpenStack sono il supporto di una comunità molto ampia di utilizzatori, la capacità di soddisfare esigenze di un vasto spettro di applicazioni e la sua natura open source.
Stiamo adottando un approccio devops, combinando in parallelo lo sviluppo e il rilascio di servizi
Quest’ultimo aspetto risponde inoltre a un’esigenza molto diffusa tra i nostri utenti: quella di evitare di legarsi ad un unico operatore commerciale. Ovviamente non si tratta di un prodotto chiavi in mano, ma di un sistema articolato che richiede competenze specifiche per utilizzarlo al meglio. Nell’ultimo anno GARR ha potuto fare molta esperienza con l’installazione in versione pre-produzione nei siti di Palermo e Bari.
Come può essere sfruttata questa esperienza?
L’impegno che GARR vuole prendersi è quello di fare da punto di incontro per la propria comunità. Vorremmo definire un'architettura di riferimento per l'uso di OpenStack che sia facilmente amministrabile e replicabile. L’obiettivo è predisporre una soluzione architetturale che sfrutti tecniche di automazione e orchestrazione avanzate per fare in modo che l'installazione possa essere mantenuta e replicata su larga scala.
In che modo state lavorando?
Stiamo adottando un approccio DevOps, ovvero combiniamo le competenze degli sviluppatori con le esperienze del gruppo Operations che si occupa di far funzionare i servizi, in modo tale da avere la capacità di progettare soluzioni ed eseguire l'installazione allo stesso tempo. In questo modo, chi sviluppa si rende immediatamente conto delle difficoltà della gestione e viceversa. Stiamo facendo esperienza usando una varietà di strumenti come Ansible, Juju e TOSCA che dovrebbero consentirci di amministrare i servizi su larga scale in modo efficace. Le attività sono svolte in collaborazione con i membri della task force Cloud con i quali stiamo studiando una soluzione condivisa e replicabile.
Non tenere per sé esperienze e risorse ma condividerle risorse con la comunità diventa fondamentale…
Abbiamo una posizione forte per negoziare perché aggreghiamo la domanda delle università britanniche e siamo connessi alla rete europea GÉANT
Assolutamente sì. Quando c'è una soluzione soddisfacente è importante che questa possa essere condivisa con gli altri enti. L’idea è quella di costruire una comunità di sviluppatori e amministratori di sistemi OpenStack in modo da trovare soluzioni compatibili e integrabili fra loro e poter arrivare alla realizzazione di una federazione di Cloud. Per ora, al GARR abbiamo iniziato a fare un’esperienza in questo senso federando due piattaforme diverse a Bari e Palermo.
Qual è il panorama italiano, quali i servizi più richiesti?
Tramite un questionario online (www.garr.it/surveycloud), abbiamo avviato un’indagine rivolta a tutti i ricercatori e utilizzatori di risorse ICT per conoscere in modo approfondito quali siano le effettive esigenze e richieste in questo ambito. Nei prossimi mesi avremo un quadro più definito. Finora, come GARR, abbiamo ricevuto principalmente richieste di due tipi:
- Servizi Platform as a Service, ad esempio piattaforme di web hosting
- Servizi Infrastructure as a Service, o virtual data centre.
Circa il panorama italiano, dall’esperienza finora raccolta sappiamo che ci sono alcuni enti con esigenze di calcolo massiccio (ad esempio, INFN o ENEA) che investono in risorse hardware e personale per il calcolo ad alte prestazioni. Si tratta di una fascia alta come tipologia di servizio: grandi quantità di risorse e alte prestazioni.
C'è poi la cosiddetta coda lunga (long tail), composta da un numero elevatissimo di utenti che non possiede grandi risorse ma necessita di svariati servizi. Con la situazione attuale, in linea di massima, gli utenti hanno due opzioni: non usare il cloud (e quindi acquisire risorse locali e amministrarle in proprio) oppure rivolgersi al mercato.
Come superare questa situazione?
Penso ci sia lo spazio per soluzioni che vadano incontro alle esigenze della ricerca. Ad esempio, un problema sono le forme di pagamento dei servizi cloud con carta di credito, non sempre facilmente gestibili dalle amministrazioni. I gruppi di ricerca, inoltre, spesso hanno requisiti che non sono soddisfatti esattamente dalle soluzioni commerciali anche in aspetti rilevanti come la protezione dei dati, la disponibilità di accesso con prestazioni elevate o il trasferimento di grandi quantità di dati. Nei servizi commerciali, la banda utilizzata per trasferire materiali dentro il cloud pubblico è gratuita, mentre si paga il traffico per portar fuori i dati. Questo rende complicato e costoso trasferire l'attività da un fornitore a un altro e lega gli utenti ad un solo operatore. Alcuni enti, inoltre, hanno una propria infrastruttura ma si trovano di fronte al problema dei costi per il personale di supporto.
La nostra opinione è che mettendo in comune le competenze si possano ridurre i costi facendo un investimento condiviso in figure professionali in grado di coordinare e orchestrare una serie di servizi cloud. In questo modo, ogni ente potrebbe investire minori risorse ottenendo di più. GARR potrebbe svolgere il ruolo di armonizzatore, un po’ come ha fatto storicamente per la rete. Oggi, infatti, in ogni sede c'è un referente locale con un team limitato che si coordina con lo staff GARR. Essere parte della comunità fa sì che ognuno abbia il supporto dai colleghi attraverso lo scambio di competenze e esperienze.
Quindi si parte dal basso?
Sì, come è sempre stato nella storia del GARR. Una volta che la direzione è diventata chiara e condivisa si cerca di avere un sostegno superiore, anche attraverso finanziamenti europei per supportare le attività. GARR-X Progress è un esempio virtuoso di uso delle risorse pubbliche a beneficio dell’intera comunità che ha consentito di realizzare un’infrastruttura di ultima generazione nel sud dell'Italia.
A livello europeo, GARR nell’ambito di GÉANT si sta impegnando a partecipare a progetti come European Open Science Cloud. Solo pochi giorni fa è stato presentato un progetto finalizzato alla definizione di un framework regolativo su norme sulla proprietà, i diritti e la condivisione dei dati.