DITA PDF

Wstęp

Niezależnie od galopującego postępu technologicznego, smartfonów, mikrokomputerów i planowanych podróży na Marsa, papier wciąż jest podstawowym, docelowym nośnikiem większości treści. Trudno przewidzieć, jak będzie się kształtować jego rynkowa pozycja w przyszłości, ale niemal pewne jest, że zawsze pozostanie stała, zapewne niemała, grupa odbiorców, która po prostu lubi czytać trzymając  papierową książkę w rękach. Dlatego warto omówić temat, jak DITA przekształca się do postaci PDF.

Przekształcenie automatyczne

Pierwszym rozwiązaniem będzie to najszybsze, ale jednocześnie najmniej eleganckie. Istnieje szereg rozwiązań (w tym darmowych) pozwalających z bazy danych DITA wyeksportować treść bezpośrednio do formatu PDF. Przy ich zastosowaniu można praktycznie natychmiastowo uzyskać PDF spełniający określone założenia wejściowe – poszczególne elementy są konwertowane według arkusza stylów, całość jest dzielona na strony, numerowana i opatrywana spisem treści. Wytworzony PDF jest zgodny ze wszelkimi standardami i właściwie gotowy do przekazania do drukarni.

Niestety każdy automatyczny proces ma swoje ograniczenia i tak też jest w tym przypadku. Wyeksportowany PDF na pewno nie będzie tak elegancko przygotowany i miły dla oka jak projekt stworzony i wykonany manualnie. Szczególnie wyraźnie widać to w skomplikowanych projektach, na przykład bogatych w ilustracje lub opatrzonych znaczną liczbą przypisów. Łamanie nie jest idealne, niektóre strony potrafią być prawie puste, bo program ogranicza się do bezmyślnego stosowania reguł w określonej kolejności.

Nie oznacza to, że proces automatyczny nie ma swoich zastosowań. Można go wykorzystać w produkcji prostszych projektów, ale też na przykład do wygenerowania podglądu dla redakcji lub autora do korekty. Nie wszystkie elementy da się lub powinno pokazywać w trakcie tworzenia publikacji i redakcji – niektóre z nich można ocenić tylko widząc je w gotowym layoucie i właśnie w tym przypadku proces automatyczny jest szczególnie przydatny.

Innym przykładem, w którym taki proces może być bardzo przydatny, są publikacje tworzone w czasie rzeczywistym na zamówienie odbiorcy z różnych fragmentów treści. Ze względu na zasadnicze różnice w poszczególnych projektach, choćby formacie czy stylu paginacji, lepszym rozwiązaniem jest generowanie plików na zamówienie każdego czytelnika tak, żeby efekt końcowy wyglądał jak jednorodna publikacja.

Przetworzenie z zachowaniem formatu

Istnieją programy DTP umożliwiające pracę bezpośrednio z plikami wyeksportowanymi w standardzie XML, na przykład PTC Arbortext. Nie każde studio graficzne go używa, bo jest to rozwiązanie o wiele droższe od powszechnie stosowanych, nie tylko z powodu ceny oprogramowania, ale także niezbędnych i kosztownych szkoleń. Przewagą takich programów jest to, że po drodze nie występuje żadna konwersja – kod XML jest importowany bezpośrednio z zachowaniem całej struktury. Wraz z plikiem XML można zaimportować DTD lub Schemę, dzięki czemu, nawet jeśli zajdzie konieczność dodania jakichś elementów, program zapewni spójność kodu ze strukturą bazy danych. Dzięki temu, po zakończeniu pracy strukturę można wyeksportować i wczytać z powrotem do bazy danych tak, by w bazie zostały uwzględniane wszystkie poprawki naniesione na etapie składu i łamania.

W przypadku oprogramowania PTC Arbortext w ręce operatora trafia nie tyle program do składu i łamania, co kompletne narzędzie do obsługi struktur bazodanowych i przetwarzania ich do postaci PDF. Program umożliwia całkowitą automatyzację właściwie wszystkich procesów i tworzenie skomplikowanych, warunkowych i wielopoziomowych struktur. Niestety do skutecznej pracy wymagana jest nie tylko znajomość samego programu, ale też dwóch języków programowania i kilku języków skryptowych jak np. stworzonego na potrzeby programu języka ShowStrings czy uwielbianego przez wszystkich programistów Perla. Jednakże zastosowanie tego typu oprogramowania, choć może drogie i pracochłonne na etapie wdrażania, wznosi proces produkcyjny wydawnictwa o kilkanaście kroków do przodu w porównaniu do powszechnie stosowanych systemów. W dłuższej perspektywie, ze względu na tempo, precyzję i bezbłędność przetwarzania, wydawnictwo czerpie ogromne korzyści z przyspieszenia procesów i otwarcia treści na nowe formaty. Od dwudziestu lat wykorzystujemy w naszej pracy w studiu DTP system Arbortext znamy jego możliwości i potencjał, jakie niesie korzyści oraz oszczędności w przygotowaniu publikacji w dowolnym standardzie dystrybucji – papierowej i elektronicznej. Poza naszym sztandarowym dziełem, czyli 30-tomowej encyklopedii PWN, w której oddawaliśmy do druku tom co dwa miesiące, przygotowaliśmy w trzy miesiące ze wszystkimi korektami Wielki Słownik Polsko-Angielski PWN-Oxford liczący przeszło 1500 kolumn. Wszystko to dzięki zastosowaniu między innymi skryptów automatyzujących. Po zakończeniu pracy materiał źródłowy został wyeksportowany i zwrócony wydawnictwu do bazy danych.
W przeciwieństwie do standardowych programów graficznych operator pracuje bezpośrednio na kodzie źródłowym publikacji i definiuje znaczenie poszczególnych tagów. Tworzy struktury warunkowe, które formatują i układają tekst automatycznie na bieżąco bez ingerowania w materiał źródłowy. Program umożliwia np. zmianę miejsca wyświetlania poszczególnych elementów, formatowanie treści w zależności od jej pozycji w strukturze lub stronie czy wyświetlanie dodatkowych elementów. Kluczowym elementem jest jednak to, że żadna z tych operacji nie wymusza na operatorze wprowadzania zmian w kodzie źródłowym publikacji, dzięki czemu można na każdym etapie procesu funkcjonować w jednorodnym środowisku.

Przetworzenie bez zachowania formatu

Najpopularniejszym i prawdopodobnie najprostszym, z punktu widzenia wydawnictwa, procesem jest eksport treści z bazy danych XML do dowolnego formatu typograficznego, np. xHTML. Tak wyeksportowany dokument można wczytać do praktycznie dowolnego programu do dalszej obróbki – do niektórych bezpośrednio, do innych za pośrednictwem np. Microsoft Word. Ewidentne braki funkcjonalności programów do składu nie grają w tym miejscu żadnej roli, ponieważ z założenia wyeksportowana treść nigdy nie trafi z powrotem do bazy danych. Rodzi to oczywiście szereg problemów, które już poruszaliśmy, ale ma też kilka bardzo ważnych zalet – jest prostsze z punktu widzenia składu i daje szerokie możliwości, ponieważ materiał źródłowy można psuć właściwie dowolnie, byle końcowy efekt był zadowalający.

Nie jest to jednak rozwiązanie idealne. Choćby nieodzowność wprowadzania korekt w dwóch miejscach rodzi szereg problemów logistycznych i kosztów ze względu na konieczność utrzymania jednorodnego materiału po obu stronach barykady. O ile w przypadku przetwarzania z zachowaniem formatu nie ma z tym problemu – poprawki naniesione w bazie danych można wyeksportować i przekazać do studia, ponieważ formatowanie opiera się na makrach i znakowaniu zapisanym w definicjach struktury a nie w samej treści, o tyle w przypadku konwersji np. do xHTML nie jest to już takie oczywiste. Znakowanie w standardowych programach do składu i łamania jest wprost powiązane z treścią, której dotyczy, więc każda taka operacja rodzi konieczność ponownego stylowania materiałów, które stanowi jeden z najbardziej czasochłonnych i ulubionych procesów operatorów DTP. Tak samo poprawki naniesione przez studio można wyeksportować i wczytać z powrotem do bazy. Niestety konwersja do xHTML czy .doc jest bezpowrotna.

Podsumowanie

Przeniesienie bazy publikacji do neutralnego formatu, jakim jest DITA XML nie rodzi w gruncie rzeczy żadnych problemów na dalszych etapach produkcji plików PDF. W każdej chwili można zrezygnować ze skomplikowanej struktury i przetworzyć treść do formatu zgodnego z właściwie dowolnym programem do składu. Daje jednak szereg możliwości w zakresie pracy z profesjonalnym oprogramowaniem DTP przystosowanym do pracy z XML.

Każdą z tych metod można stosować do różnych publikacji. Te proste, które dadzą się przetworzyć do postaci PDF, którą czytelnik jest w stanie strawić, można wyeksportować automatycznie, bez potrzeby angażowania DTP w proces publikacji w ogóle. Te, które zawierają kluczowe dla wydawnictwa treści, można przetworzyć z zachowaniem formatu, żeby po dokonaniu wszystkich korekt można je było wczytać z powrotem do bazy danych. Z kolei te, których przeznaczeniem jest jednorazowa publikacja, a treść w nich zawarta nie ma żadnej dalszej wartości, można natychmiast przekonwertować do postaci graficznej i przetworzyć w dowolnym programie do składu i łamania.
Najważniejsze jest jednak to, że zastosowanie nawet tak skomplikowanego ale i postępowego formatu jak DITA XML w gruncie rzeczy nie ogranicza w żaden sposób możliwości wydawnictwa w zakresie współpracy z różnymi podmiotami na dowolnych zasadach i w dowolnych programach nawet w przypadku pracy nad publikacją przeznaczoną wyłącznie do druku.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *