Come convertire file MS Word DOC e DOCX in PDF con ASP.NET e C#

Convertire file Word DOC e DOCX in sintassi Wiki MediaWiki con un Add-In ufficiale Microsoft

Chi non ha mai avuto bisogno di convertire uno o più file DOC e/o DOCX da Word in PDF almeno una volta nella vita? Niente di più facile, direte voi: è sufficiente selezionare il formato .PDF nell'apposita casella a discesa che appare subito dopo aver fatto click sul pulsante "Salva Come...". A dire la verità, non era così facile in passato: questo metodo è infatti disponibile solo a partire da Office 2010; prima di allora, l'unico modo per ottenere questo risultato era utilizzare software appositi - solitamente basati su Ghostscript - o installare driver di stampa PDF come Bullzip, CutePDF e altri.

Office 2010 ha risolto il problema per l'utente medio, ma soltanto a condizione che abbia una valida licenza MS Office e il software installato sulla propria macchina. Chiunque non sia provvisto di queste cose non può far altro che ricorrere alle alternative di cui sopra, o procedere all'acquisto di un software - non necessariamente MS Office - che lo metta in condizione di fare altrettanto.

Il discorso si fa leggermente diverso - e certamente più complicato - per gli sviluppatori che vogliono ottenere lo stesso risultato a livello di codice: esiste un modo semplice e gratuito per convertire file DOC o DOCX in formato PDF all'interno di una applicazione ASP.NET o .NET Core sviluppata in linguaggio C#, possibilmente senza consentire agli utenti il download del file DOC/DOCX originario? E soprattutto, nel caso in cui si tratti di una applicazione web, senza dover acquistare una licenza di MS Office sul server di pubblicazione?

La risposta, anch'essa targata Microsoft, arriva sotto froma di libreria: il suo nome è Microsoft Office primary interop assemblies (PIAs), nota anche come Microsoft.Office.Interop.Word.dll. Se utilizzate Visual Studio potete recuperarla agevolmente tramite NuGet e aggiungerla come reference della vostra applicazione con il Package Explorer: in alternativa, potete scaricarla e installarla sul vostro sistema tramite il suo pacchetto di distribuzione ufficiale.

Una volta fatto questo, sarete in grado di aprire e modificare qualsiasi documento MS Word leggendolo direttamente da FileSystem (o anche da Byte Array, seguendo le istruzioni contenute in questo articolo). Ecco un rapido esempio che mostra cosa è possibile fare:

In alternativa al metodo SaveAs2() è possibile utilizzare anche il metodo ExportAsFixedFormat() e ottenere un risultato del tutto analogo:

E' fondamentale sottolineare come tutto quello che si può ottenere con i formati MS Word può essere realizzato anche con gli altri formati di file MS Office, come ad esempio MS Excel, MS Powerpoint e altri: ovviamente, sarà necessario importare all'inizio del file i vari riferimenti alle librerie relativi.

IMPORTANTE: Fate particolare attenzione all'utilizzo del metodo  app.Quit() ! Se evitate di chiamarlo, una istanza del worker di MS Word resterà aperta sul vostro server (cfr. questo thread su StackOverflow per maggiori informazioni su questa problematica), con un dispendio di risorse notevole. Per essere assolutamente certi che l'istanza MS Word venga chiusa correttamente al termine del processo di conversione, consigliamo di aggiungere una strategia basata su un blocco try/catch in linea con il codice mostrato di seguito:

E' un vero peccato che questi oggetti non implementino la classe IDisposable , altrimenti avremmo potuto gestire la cosa mediante un blocco using e avere un codice ancora più leggibile e pulito.

Per il momento è tutto: felice conversione!

UPDATE: nel caso in cui abbiate problemi a utilizzare efficacemente Office.Interop e/o gli oggetti DCOM relativi agli Interop Assemblies sul vostro server di produzione Windows Server + IIS (permessi, autorizzazioni et al.), date un'occhiata a questo articolo!

About Ryan

IT Project Manager, Web Interface Architect e Lead Developer di numerosi siti e servizi web ad alto traffico in Italia e in Europa. Dal 2010 si occupa anche della progettazione di App e giochi per dispositivi Android, iOS e Mobile Phone per conto di numerose società italiane. Microsoft MVP for Development Technologies dal 2018.

View all posts by Ryan

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *


The reCAPTCHA verification period has expired. Please reload the page.

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.