Cloud Storage SaaS e on-premise: tipologie, modalità e caratteristiche Cos'è il Cloud Storage, quali sono le sue caratteristiche principali e che differenze ci sono tra le due modalità di erogazione del servizio più diffuse: SaaS e on-premise

Cloud Storage SaaS e on-premise: tipologie, modalità e caratteristiche

Con il termine cloud storage si fa riferimento a un modello di conservazione dati su infrastrutture di rete fisiche e/o virtualizzate, idealmente dotate delle seguenti caratteristiche:

  • Ridondanza dei dati memorizzati, ottenuta grazie all’utilizzo di tecniche moderne di memorizzazione logica che assicurano la presenza simultanea e distribuita di ciascun singolo dato su più server.
  • Disponibilità di accesso, ottenuta grazie all’impiego di molteplici server che svolgono il ruolo di entry-point, ovvero di “punti di accesso” mediante i quali l’utente può autenticarsi e accedere al proprio archivio di dati memorizzati.
  • Compatibilità con sistemi diversi, ottenuta grazie al supporto di molteplici modalità di connessione per garantire la compatibilità con la maggior parte dei dispositivi server, desktop, mobile e web, nonché con le principali tipologie di accesso: client web, utility di sincronizzazione con il file-system, API per l’utilizzo tramite web service ovvero l’interfacciamento con sistemi di terze parti, e così via.
  • Versatilità nell’utilizzo, ottenuta grazie all’implementazione di una serie di funzionalità: indicizzazione; ricerca full-text all’interno dell’archivio, con o senza filtri; catalogazione tramite cartelle, categorie e tag; condivisione dei file basata su permessi, ruoli, link univoci e password; e così via.

Vi sono poi una serie di caratteristiche aggiuntive, estremamente importanti (sicurezza, data encryption, privacy compliance, etc.) che, per ragioni di spazio, tratteremo separatamente in un articolo successivo.

In questo articolo, dopo un breve accenno alle origini storiche del cloud storage, ovvero dell’evoluzione delle varie tecniche di memorizzazione dati dagli anni ’60 ad oggi, ci dedicheremo ad approfondire le due principali tipologie di cloud storage utilizzabili ad oggi:

  • Cloud Storage SaaS, ovvero reso disponibile dal provider mediante un modello Software as a Service.
  • Cloud Storage on-premise, ovvero installato presso una infrastruttura sotto il controllo del proprietario dei dati: la modalità on-premise, come avremo modo di vedere, può inoltre essere configurata per consentire l’accesso soltanto dal network interno aziendale oppure anche dall’esterno.

Cenni storici

La storia del cloud storage è strettamente collegata a quella dell’evoluzione dei sistemi di trasmissione dei dati in formato elettronico su reti informatiche: si ritiene infatti che il concetto di cloud computing, ovvero della possibilità di consentire l’elaborazione degli stessi dati da una pluralità di computer, sia stato teorizzato dallo psicologo e ricercatore informatico Joseph Carl Robnett Licklider negli anni ’60 durante il periodo in cui stava lavorando a un progetto estremamente importante: ARPANET, il primo network ad implementare il protocollo TCP/IP nonché, per molti aspetti, il precursore di Internet.

Per vedere la prima implementazione commerciale di un cloud storage occorre aspettare il 1983, anno in cui CompuServe – uno dei primi provider americani ad offrire servizi online su larga scala (insieme a Prodigy and America Online) – lanciò sul mercato un servizio di remote storage accessibile ai propri utenti tramite upload su protocollo FTP. Ovviamente, all’epoca i sistemi di memorizzazione logica dei dati erano ancora in fase sperimentale, quindi i file inviati dagli utenti CompuServe venivano fisicamente memorizzati all’interno degli hard-disk. Questi ultimi erano comunque sottoposti a una procedura di backup regolare e continuativa, cosa che garantiva un certo livello di sicurezza in caso di problemi ai server principali, benché molto distante dai moderni concetti di ridondanza che prevedono una disponibilità pressoché immediata dei dati in caso di guasto (no single point of failure).

Tra gli anni ’80 e ’90 si verifica una diffusione capillare di harware e infrastrutture di rete, che cominciano a entrare nelle aziende e negli ambienti domestici in modo sempre più pervasivo: allo storage remoto si favorisce il concetto di File Server e hard-disk di rete (NAS, acronimo per Network-Attached Storage), principalmente per ragioni di costi, ma soprattutto di performance: siamo ancora in un periodo in cui non soltanto lo spazio su hard-disk è ancora piuttosto costoso, ma le connessioni TCP/IP sono estremamente lente, al punto di rendere poco desiderabile e “monetizzabile” qualsiasi spazio di archiviazione remoto che non contenga dati puramente testuali.

Un passaggio successivo avviene nel 1994, anno in cui la AT&T lancia PersonaLink Services, una piattaforma online pensata per utenti di qualsivoglia tipo (dai clienti domestici alle aziende enterprise). Si tratta del primo modello di file storage remoto, interamente accessibile dal web: non a caso, lo slogan con cui fu presentato era il seguente: “you can think of our electronic meeting place as the cloud.” Da quel momento i servizi di online storage cominciano finalmente a diffondersi, anche se la velocità ridotta dei modem li rende utilizzabili soltanto da quei pochi che possono già permettersi le (all’epoca) costosissime connessioni ad alta velocità.

L’ultima evoluzione significativa avviene nel 2006, nel cuore della diffusione della classe di tecnologie ADSL, quando Amazon presenta il prodotto AWS (Amazon Web Services) e il proprio servizio di online storage, denominato S3. Questo immenso “contenitore” di spazio presenta fin da subito tre delle quattro caratteristiche principali del cloud storage: Ridondanza, Disponibilità e Compatibilità. Per attendere la Versatilità occorrerà aspettare l’anno successivo: nel giugno del 2007 Drew Houston e Arash Ferdowsi fondano una startup con l’intento di rendere l’online storage di Amazon S3 più fruibile agli utenti finali. Il nome progetto è destinato a diventare estremamente famoso: Dropbox, il primo servizio di cloud storage SaaS completo di tutte le caratteristiche funzionali determinanti: indicizzazione, full-text search, sistema di permessi e condivisioni, possibilità di inviare file a utenti “anonimi” attraverso la creazione di link pubblici (ma protetti da ID univoci), e così via.

Cloud Storage SaaS

SaaS è l’acronimo di Software as a Service, ovvero software come servizio: si tratta di una tipologia di distribuzione del software dove l’applicativo è interamente installato sull’infrastruttura del provider, il quale mette lo mette disposizione dei propri clienti tramite un servizio. Questo servizio è solitamente erogato per mezzo di una piattaforma web o di un web service: la modalità di utilizzo può essere gratuita e/o richiedere un abbonamento, che solitamente prevede una serie di piani incrementali a seconda delle esigenze (free, personal, business, enterprise). Esempi di Cloud Storage erogato in modalità SaaS includono Google Drive, Dropbox, Onedrive, Amazon Cloud Storage, e praticamente tutti i servizi cloud storage comunemente noti e utilizzati.

Per estensione, anche servizi molto diversi come WeTransfer, 4Shared, SendAnywhere, GitHub e Flickr potrebbero essere astrattamente definiti Cloud Storage: la differenza è quasi sempre nella compatibilità e nella versatilità: Flickr, ad esempio, è un servizio che consente il solo caricamento di immagini; WeTransfer, che pure accetta qualsiasi tipo di file, è limitato alla sola funzionalità di file sharing, per giunta limitata nel corso del tempo (ogni file condiviso ha una “scadenza”, superata la quale viene cancellato senza lasciare traccia): non è dunque possibile effettuare ricerche, indicizzazioni e così via. Al fine di sgombrare il campo da equivoci, è dunque più corretto definire questi servizi come degli strumenti che utilizzano un meccanismo di Cloud Storage in modo strumentale allo svolgimento delle loro funzioni, anziché dei Cloud Storage veri e propri. Viceversa, è consigliabile definire Cloud Storage unicamente quei servizi che, come Google Drive, Dropbox e gli altri menzionati poco fa, ci consentono di utilizzare uno “spazio remoto” in modo grossomodo affine a come potremmo utilizzare un hard-disk esterno.

Cloud Storage on-premise

On-premise significa, letteralmente, in sede, ed è un termine che nella maggior parte dei casi viene usato in aperta contrapposizione di Cloud, che identifica convenzionalmente una infrastruttura esterna accessibile in modalità SaaS. Effettivamente, la definizione di storage on-premise è utilizzata per riferirsi ai sistemi di memorizzazione “locali”: il PC dell’utente, un file server, un hard-disk di rete, una cartella condivisa, e così via.

Da alcuni anni a questa parte, però, hanno fatto la loro comparsa una serie di software che consentono di installare su server proprietari un sistema di online storage avente funzionalità di  indicizzazione, ricerca e condivisione del tutto analoghe a quelle offerte da servizi come Dropbox e Google Drive, ovvero:

  • indicizzazione;
  • ricerca full-text all’interno dell’archivio, con o senza filtri;
  • catalogazione tramite cartelle, categorie e tag;
  • condivisione dei file basata su permessi, ruoli, link univoci e password;
  • data-encryption in-transit, at-rest e end-to-end (per approfondire questi aspetti, leggi qui);

Come abbiamo chiarito nei paragrafi precedenti, queste funzionalità consentono di soddisfare una delle quattro caratteristiche che dovremmo aspettarci da un cloud storage: la Versatilità. Inoltre, questi servizi  – se si accetta di aprire all’esterno il server fisico o virtuale presso cui li si installa – possono essere configurati per consentire l’accesso dall’esterno, ovvero dal web: questo, unito alle molteplici modalità di connessione supportate – web client, API, e così via – garantisce anche la Compatibilità. Per quanto riguarda la Ridondanza e la Disponibilità, queste dipendono principalmente dalle caratteristiche dell’infrastruttura on-premise e/o dall’investimento economico che il proprietario intende dedicare al progetto: si tratta infatti di software che spesso consentono di essere installati in modalità cluster, high-availability e/o cloud computing, così da poter garantire – sia pure su piccola scala – caratteristiche di ridondanza dei dati e di disponibilità del servizio in caso di crash (failure) di uno dei server su cui sono installati.

Tra le principali soluzioni di Cloud Storage on-premise oggi presenti sul mercato, segnaliamo:

La maggior parte di questi servizi hanno server che possono essere installati solo su macchine Linux: per installarli su ambienti Windows Server tramite Virtual Machine o Docker Image.

Tra i servizi sopra elencati, quello che ci ha convinto maggiormente – e che abbiamo deciso di adottare su Ryadel – è NextCloud per via delle sue elevate caratteristiche di sicurezza e conformità al GDPR (il Regolamento Europeo sulla Protezione dei Dati). Per maggiori informazioni, consigliamo di dare un’occhiata alla nostra guida all’installazione e all’utilizzo di NextCloud e al nostro corso di formazione sull’utilizzo di NextCloud.

Conclusioni

Per il momento è tutto: spero che questo articolo abbia aiutato a fare chiarezza sulle principali caratteristiche che ci si aspetta di trovare in un servizio di Cloud Storage e sulle principali soluzioni che è possibile adottare. Alla prossima, e… felice condivisione!

Ti interessa approfondire ulteriormente questo argomento? Partecipa ai nostri corsi di formazione sul Cloud Storage e ottieni il tuo attestato digitale!

About Ryan

IT Project Manager, Web Interface Architect e Lead Developer di numerosi siti e servizi web ad alto traffico in Italia e in Europa. Dal 2010 si occupa anche della progettazione di App e giochi per dispositivi Android, iOS e Mobile Phone per conto di numerose società italiane. Microsoft MVP for Development Technologies dal 2018.

View all posts by Ryan

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.