Formati per libri digitali: pdf, epub, AZW

Formati per libri digitali: pdf, epub, AZW

tratta da www.comtec-italia.org

Nel campo dell’editoria, gli e-book sono stati l’argomento più discusso almeno dal 2009, anche se i  multimedia vengono ora collettivamente indicati con la parola chiave “e-book avanzati”. Negli USA, i dati delle vendite mostrano che i libri digitali sono in forte aumento. Anche la documentazione tecnica si affaccia alle possibilità offerte dagli e-book. Gli e-book “tecnici” non sono in vendita come accade per l’editoria convenzionale, ma in questo settore esiste ormai da tempo la “tradizione” dell’aiuto online. Dunque, gli e-book e i loro formati ampliano la gamma di quelli già esistenti.

Se prendiamo in considerazione l’aiuto online, sorge una domanda: cosa sono gli e-book? Fondamentalmente, il termine si riferisce a qualsiasi contenuto preparato per essere reso e letto su uno schermo. In questa accezione, il libro potrebbe contenere qualsiasi tipo di testo con lettura progressiva lineare, preferibilmente con aggiunta di illustrazioni e formule in base all’attuale definizione dell’industria editoriale.
Una diversa definizione potrebbe essere: un contenuto da leggere su uno speciale dispositivo tecnico. Forse ciò ci porta più vicini alla definizione di documentazione tecnica. Tuttavia tale definizione non tiene conto del fatto che è possible leggere gli e-book sia sui PC che sui Notebook, naturalmente. Gli ultimi dispositivi di lettura appartengono alla categoria di tablet, smartphone e dei cosiddetti e-reader. Su questi dispositivi è possibile leggere dati in diversi formati. Tutti rendono il PDF e la maggior parte anche file in TXT, HTML e Word. Inoltre, quasi ovunque è possible leggere un e-book in formato EPUB.
Al momento in Germania i formati più utilizzati per gli e-book sono PDF, EPUB, AZW/Mobipocket e Apps, o relative applicazioni. Tutti questi formati possono essere protetti contro copie non autorizzate: l’utente o il lettore non possono modificarli né interferirvi.

Formato PDF

Il PDF è uno di quei formati che quasi tutti conoscono e utilizzano. Praticamente chiunque utilizzi un PC ha installato l’applicazione Acrobat Reader e può visualizzare, leggere e modificare i PDF. I documenti in PDF hanno un layout definito e rappresentano pagine. È questa la differenza principale rispetto ad altri formati di e-book.
La maggior parte dei PDF commercializzati come e-book si basano sulla stampa PDF della pubblicazione. Il vantaggio è la loro facile reperibilità. Ma ci sono anche alcuni svantaggi: ad esempio, il layout prevede pagine doppie, giustapposte come nel formato cartaceo. Di solito, però, sullo schermo viene visualizzata una sola pagina del PDF. Altra questione, il formato verticale, normalmente utilizzato nelle pubblicazioni stampate. Il formato verticale è disponibile sugli schermi di molti dispositivi mobili di lettura, ma è notevolmente ridotto rispetto a quello delle pubblicazioni stampate. Gli schermi di PC e notebook hanno dimensioni adeguate, ma sono in formato orizzontale, con rapporto 16:9 o 4:3, che non è comodissimo per leggere PDF in formato verticale. Inoltre la tipografia, perfetta per la stampa, non ha lo stesso effetto su uno schermo.
L’ideale sarebbe che ogni libro in PDF avesse link attivi e preferiti. Una stampa PDF non ne contiene. Se degli speciali e-book in PDF avessero layout e tipografia basati sui principi del web-design e se fossero ideati preferibilmente per dispositivi di lettura personali, si raggiungerebbe un diverso livello di qualità. In aggiunta a ciò e in base al contenuto, potrebbe risultare utile includere contenuti audio e video nei PDF per e-book.
Un aspetto che viene spesso ignorato quando si tratta di decidere a favore del formato PDF per gli e-book è che, in diverse situazioni, anche i documenti in PDF possono perdere il loro layout ed essere riconfezionati di nuovo. Ciò avviene completamente in automatico negli e-reader Sony, ad esempio, quando il lettore utilizza l’ingrandimento frontale. In altri e-reader, come i dispositivi PocketBook, il lettore può scegliere di selezionare lo zoom per ingrandire o di impaginare di nuovo.
Riconfezionare un file PDF risulterebbe catastrofico, specialmente in caso di documentazione tecnica. Soprattutto quando ci sono delle tabelle, la griglia viene eliminata e i contenuti si mischiano. Anche i titoli delle colonne e i numeri di pagina vengono incorporati nel resto del testo.

Fig. 2:Documento PDF con preferiti e link attivi nel testo che scorre Formato EPUB

Formato EPUB

Il secondo formato, che potrebbe essere il più importante in termini di prospettive future, è l’EPUB. Si tratta di uno standard aperto e basato su XML che è stato sviluppato e standardizzato dall’International Digital Publishing Forum, o IDPF [1]. L’IDPF sta all’EPUB come il World Wide Web Consortium sta agli standard tecninici di Internet [2]. In sintesi, l’IDPF è costituito da case editrici, software provider e service provider attivi nel campo dell’editoria.
EPUB è un formato “reflowable”. Ovvero, senza layout fisso, a differenza del PDF, ma la dimensione frontale, ad esempio, può variare in base alle impostazioni dell’utente o all’impaginazione del testo e quindi l’impaginazione potrebbe anche variare in base alla dimensione dello schermo. Tuttavia nella maggior parte dei sistemi per EPUB-reader viene utilizzata una numerazione fittizia per le pagine; dunque è più appropriato parlare di “visualizzazioni” piuttosto che di pagine.
Un file EPUB è una pagina web a pacchetto nel senso più ampio del termine. Ciò significa che è possible fare quasi tutto quello che si può fare con un HTML o CSS per quando riguarda il design, ossia, anche le tabelle possono cambiare correttamente con i diversi schermi o finsestre.

Una nuova versione da pubblicare a breve

Al momento è in uso la versione EPUB 2.0.1. Funziona con XHTML, ma senza JavaScript. Quest’anno dovrebbe essere pubblicata la Versione 3.0 di EPUB Standard, che consentirà di utilizzare HTML 5 e JavaScript, con alcune limitazioni. Un EPUB-Container, che è praticamente un archivio zippato, contiene anche file XML specifici di EPUB:
• in primo luogo, la directory dei file è NCX, che proviene dallo standard DAISY e solitamente viene utilizzato solo come indice;
• in secondo luogo, c’è il file OPF, che contiene i metadata delle pubblicazioni, descrive tutti i componenti dell’EPUB come elementi e la sequenza di lettura lineare di tali componenti in una sezione chiamata dorso. Il dorso è quella parte del libro in cui sono rilegate le pagine.

Poiché il contenuto testuale nei file EPUB è strutturato in HTML tramite CSS (Cascading Style Sheets), per poter presentare gli EPUB in maniera semplice per il lettore, sarà necessario un software di interpretazione simile a un web-browser. Questo causa un problema fondamentale nella creazione di EPUB, perché la rappresentazione varia da dispositivo a dispositivo, e da software a software. I produttori di EPUB si trovano di fronte agli stessi problemi che avevano gli sviluppatori web fino a poco fa, nonostante gli standard per i browser siano stati ormai più o meno armonizzati. Lo stesso è auspicabile per EPUB.

Test con software di lettura

Fino ad allora, durante la progettazione e la creazione di EPUB bisogna prendere in considerazione tali differenze, come la rappresentazione su schermi di diverse dimensioni. Per questo risulta inevitabile provare il documento EPUB completo con diversi software di lettura.
I software di lettura EPUB sono disponibili su diverse piattaforme. Quello più utilizzato è Adobe Digital Editions (ADE), gratuito. Funziona su tutte le piattaforme PC e sulla maggior parte degli e-reader; mentre sui dispositivi Apple, è installato il software di lettura della Apple, chiamato iBook. L’iBook è l’applicazione e-book standard su iPhone, iPad e iPod.

Tipo Dispositivo
Software Lettura

PC/Notebook
ADE, Stanza, lettore FB o Firefox con AddIn epubreader

E-Reader
Di solito ADE

Tablet-PC/Smartphone (iPhone OS)
iBook, txtr, Stanza

Tablet-PC/Smartphone (Android)
Adiko, FBreader

Tablet-PC/Smartphone (webOS)
Popelli

Tablet-PC/Smartphone (Blackberry)
BePub-App (Beta-Version)

Software di lettura EPUB per diversi dispositivi

Meglio i caratteri senza licenza

Altra questione importante e allo stesso tempo difficile è la rappresentazione di lettere e caratteri nel formato EPUB – nello specifico, in caso di testi in lingue straniere; infatti i caratteri standard includono una serie relativamente piccola di lettere, almeno nel caso del software di lettura ADE. Dal punto di vista tecnico, qualsiasi carattere OpenType può essere implementato nel container EPUB e può essere assegnato agli elementi HTML tramite il CSS. In questo caso, comunque, tutto il file del carattere dovrà essere integrato con l’EPUB e quindi consegnato all’utente. Ciò comporterebbe problemi con le clausole di licenza nella maggior parte dei caratteri con licenza. Dunque, è necessario cercare caratteri freeware o con condizioni di licenza che contengono le lettere e soddisfano i requisiti di design.
Nel software iBooks della Apple e in qualche altro programma interprete di EPUB con accesso a migliori caratteri standard, al testo di base non può essere assegnato alcun carattere specifico per motivi “ideologici”. L’assegnazione CSS corrispondente verrà semplicemente ignorata, poiché la selezione dei caratteri é prerogativa dell’utente.

Fig. 3: Diverse fasi di ingrandimento di un file EPUB in ADE

Formato file Mobipocket/AZW

Mobipocket non é un formato molto importante nel mercato dei Paesi di lingua tedesca. tuttavia, se il dispositivo su cui verrà riprodotto l’e-book è un Blackberry, ad esempio, che non costituisce un ottimo supporto per EPUB, ma che ha un Mobipocket-Reader eccellente, questo formato può risultare utilissimo. Naturalmente le applicazioni originali o i PDF ottimizzati ad hoc per Blackberry sono la scelta migliore per questa piattaforma.
Oltre a ciò, il formato Mobipocket é alla base del formato AZW, utilizzato da Amazon per  Kindle, il suo dispositivo di lettura. Il formato AZW é considerato leader nel mercato americano. Nei Paesi di lingua tedesca il mercato non é stato ancora avviato.
Anche Mobipocket e AZW sono formati basati su HTML, precisamente su HTML 4 con CSS. Come nel caso del formato EPUB, anche il file OPF viene utilizzato per la consegna di metadata o per definire la sequenza di lettura. Se sono presenti tutti i file di contenuto e le directory dei file, viene creato un Mobipocket binario con l’aiuto del programma Mobipocket Generator. Per generare un file AZW, sono necessari gli stessi file di contenuto e il programma “Kindlegen”. Entrambi sono formati di proprietà di Amazon.
Oltre a Kindle-E-Reader, i documenti AZW possono essere utilizzati su quasi tutte le piattaforme, essendo disponibili programmi o applicazioni per questo scopo. I file AZW sono commercializzati esclusivamente tramite la Piattaforma Amazon.

Fig. 4: Mobipocket-e-book con Mobipocket-Reader (su PC)

Fig. 5: AZW-e-book su Kindle-for-PC-Reader

Applicazioni

Con i formati e­book non si possono realizzare design speciali né funzionalità aggiuntive. Al contrario, Apps o le applicazioni servono proprio a questo. In quanto forma di pubblicazione, Apps é stato originariamente creato per l’iPhone, preparando così il mercato. Le applicazioni sono ora disponibili andche per i tablet e per sistemi operativi come Android. Si potrebbe sperare in un-ampliamento dell’offerta, attualmente dominata da Apple, anche da parte di altri produttori di software.
Fondamentalmente, Apps nasce come un’applicazione creata con una lingua di programmazione orientata su obiettivi quali Objective C (per SO iPhone) o Java (per Android, ad esempio).
I modelli Apps sono scritti soprattutto per il settore degli e-book. Posseggono tutte le proprietà tipiche degli e-book e costituiscono un’interfaccia per il contenuto effettivo del libro, che normalmente dovrebbe essere in HTML con un semplice CSS. Dunque l’applicazione va programmata una sola volta per poter successivamente pubblicare più libri in formato HTML.
Sunto
Il mercato degli e-book è molto dinamico. Il suo sviluppo é alimentato da un lato dalle aspettative del mercato dei lettori, che desiderano il massimo livello di comfort, e dall’utilizzo, nei documenti EPUB, di caratteristiche appartenenti al familiare mondo online. I miglioramenti apportati a EPUB (nella Versione 3) rendono giustizia a tali aspettative e desideri. Il mercato della tecnologia costituisce un’altra forza motrice. L’hardware viene migliorato continuamente, soprattutto per indebolire il leader del mercato, Apple, e ridistriburlo. Dispositivi quali Samsung Galaxy o WePad, sono buone alternative già disponibili sul mercato.

Abbreviazioni importanti

ADE = Adobe Digital Editions; software di lettura gratuito per PDF e EPUB
AZW = Formato file per Amazon Kindle
DAISY = Standard per la preparazione di contenuti senza barriere
HTML 5 = Sviluppo dell’HTML (integrazione diretta di elementi semantici quali una data ed elementi multimediali)
IDPF = International Digital Publishing Forum
NCX = File contenente il sommario di EPUB-Container
OPF = Open Packaging format; file contenente la descrizione della struttura interna a EPUB-Container

Link relativi all’articolo

[1]    International Digital Publishing Forum: www.idpf.org
[2]    World Wide Web Consortium: www.w3.org
Link e letteratura per approfondimenti
• Meinike, T. (2010): EPUB – Anatomie eines elektronischen Buchformats. Presentazione della Lezione, www.iks.hs-merseburg.de/~meinike/PDF/tekom2010_OTS2_Meinike.pdf
• Matrisch, U.; Welsch, U. (2011): E-Books konzipieren und produzieren. MedienEdition. Taching am See.
• Matrisch, U.; Welsch, U. (2010): E-Books für die Technische Dokumentation – Entwicklungen und sinnvolle Einsatzszenarien. Lezione tenuta in occasione della Conferenza Annuale Tekom 2010. www.tekom.de/artikel/artikel_3138.html.

Da oltre dieci anni Ursula Welsch lavora come consulente e formatrice freelance per pubblicazioni XML. Nella XML-Schule (Scuola XML) offre corsi pratici e workshop alle aziende. La sua  newsletter tedesca “Crossmediales Publizieren” viene pubblicata regolarmente. Inoltre insegna presso la Akademie des Deutschen Buchhandels (Accademia Tedesca dell’Artigianato Librario) e nei college di Monaco e Leipzig.

ursula.welsch[at]welschmedien.de
www.welschmedien.de

Uwe Matrisch ha studiato produzione dell’editoria a Leipzig, dove lavora come editore di produzione per la “Le-tex publishing services GmbH”. Qui, organizza la produzione globale di pubblicazioni soprattutto nel campo scientifico. Negli ultimi anni si è occupato della concettualizzazione degli e-book e del flusso di lavoro per la loro produzione. È consulente specialista in questa materia presso la XML-Schule.

uwe.matrisch[at]le-tex.de
www.le-tex.de

Potrebbe interessarti anche

Alessandro Pratelli

Perito aeronautico, calsse '72. Lavora come redattore tecnico dal 1995 poi fonda AP Publishing. Appassionato di Direttive e norme tecniche. La frase che preferisce? "Se non alzi mai gli occhi, ti sembrerà di essere nel punto più in alto".