Czy wdrożenie XML musi być bolesne? cz. 4

XML w praktyce

W czasach galopującego postępu tworzenia, przechowywania i odbierania treści warto zadać sobie pytanie o to, jak długo pozostają one żywe i dostępne. Warto też poszukać uniwersalnego źródła, z którego treści można czerpać jak najdłużej i publikować je w możliwie największej liczbie formatów.

W ciągu ostatnich dwóch dekad nastąpił zasadniczy postęp w zakresie przechowywania treści. Metody znakowania w języku GML stworzonego przez IBM w latach sześćdziesiątych ubiegłego wieku ewoluowały najpierw w SGML, a później HTML, XML i tuzin innych języków odpowiadających na wciąż rosnące potrzeby użytkowników. Wśród nich warto wyróżnić Adobe XML stworzony dla programu InDesign, w którym istnieje możliwość płynnego przechodzenia z XML do PDF, czy też zaawansowane języki pozwalające odbierać treść za pośrednictwem Internetu na wciąż to nowe sposoby.

Każda firma, niezależnie od prowadzonej działalności, zarządza treścią. Cyfryzacja dotknęła niemal wszystkie pola działalności każdego przedsiębiorstwa, w tym księgowość, kadry, obieg dokumentów czy marketing. Płynny przepływ informacji między poszczególnymi działami stał się kluczowym czynnikiem optymalizacji funkcjonowania przedsiębiorstwa, a producenci oprogramowania prześcigają się w tworzeniu rozwiązań pozwalających na coraz skuteczniejsze i szybsze wykorzystywanie tej samej treści w wielu obszarach działania.
Prostym przykładem ilustrującym dzisiejsze potrzeby przedsiębiorstw jest postępowanie przetargowe. W założeniu wszystkie dokumenty, zapytania oraz elementy dodawane później (np. pytania konkurentów) powinny ukazywać się w tej samej formie jednocześnie w kilku mediach, np. w postaci papierowej w siedzibie firmy, dokumentacji dla działu przetargów, w postaci plików PDF oraz w postaci tekstu zamieszczonego bezpośrednio na stronie internetowej. Niezależne tworzenie każdej z tych treści wymaga nie tylko wiele pracy, ale przede wszystkim idealnej koordynacji i uwagi, by wszystkie materiały były identyczne. Wprowadzenie zmian w którymkolwiek z formatów rodzi potrzebę ich propagacji, czyli sprawdzenia i poprawienia wszystkich pozostałych formatów.
Standardowym sposobem przeprowadzenia takiej operacji byłoby stworzenie dokumentów za pośrednictwem oprogramowania biurowego, np. Microsoft Word, zapisanie ich do plików PDF i przesłanie treści do działu informatycznego w celu umieszczenia na stronie internetowej. Nowoczesne strony internetowe bazują na parze rozwiązań – kodzie xHTML, który określa, co oznaczają poszczególne elementy oraz arkuszu stylów CSS, który interpretuje ich wygląd graficzny na potrzeby przeglądarki internetowej. O ile dokument CSS jest gotowy i powszechnie obowiązujący dla wszystkich elementów strony internetowej, o tyle przygotowanie kodu xHTML z dokumentu Microsoft Word jest procesem czasochłonnym, ręcznym i podatnym na błędy. Prawdziwe problemy zaczynają się później, kiedy do treści trzeba wprowadzić korektę. Można stworzyć kod od zera albo ręcznie przepisać poprawki do odpowiednich plików… oczywiście o ile da się je wyszukać.
Firmy profesjonalnie zajmujące się tworzeniem, obróbką i sprzedażą treści są narażone na wielokrotnie większe i bardziej złożone problemy. Przygotowanie podręcznika wraz z płytą, e-bookiem, treścią zamieszczoną na stronie internetowej i interaktywnym zeszytem ćwiczeń wymaga wielokrotnych konwersji formatów i utrzymywania nieskazitelnego porządku w wersjach, formatach i archiwach. Każdy z tych formatów ma inną żywotność i podatność na zmiany. Wprowadzenie korekt w zadaniach na stronie internetowej zajmuje chwilę i może zostać wykonane w każdym momencie. Wprowadzenie tych samych korekt w wydrukowanym i już sprzedanym egzemplarzu jest zwyczajnie niemożliwe.

Te i wiele innych, nowych wyzwań czeka na wydawców dziś i za każdym zakrętem w przewidywalnej przyszłości. Dlatego już dziś warto zacząć szukać rozwiązań pozwalających na uniwersalizację treści tak, aby uniknąć problemów np. z konwersją porzuconych formatów czy unifikacją treści w różnych źródłach. Odkładanie tej decyzji wiąże się nierozerwalnie z rosnącym archiwum treści w formatach, które mogą się okazać w przyszłości niekompatybilne z wymaganiami klientów.

Wprowadzenie nowych formatów, szczególnie w specyficznej branży wydawniczej, wiąże się z szeregiem problemów. Wdrażanie nowego oprogramowania, jeśli zasadniczo różni się od dotychczas stosowanego, generuje koszty i ryzyko konwersji treści do formatu, który może się zdezaktualizować lub podlega zbyt gwałtownym zmianom. Wybór nietypowego lub niszowego formatu może uzależnić odbiorcę od jednej firmy. Specyfika rynku wydawniczego i wymogów stojących przed zbiorami treści generowanych na potrzeby wydawnictw, właściwie eliminują całą gamę oprogramowania uniwersalnego. Na rynku pojawiają się jednak powoli rozwiązania dedykowane wydawcom. Przeanalizujmy kryteria wyboru edytora XML.

Kryteria wyboru edytora XML

Edytor XML powinien spełniać wymagania specyfiki produkcji wydawniczej zarówno ze względu na nietypowy profil działalności, jak również model sprzedaży. Tworzona za jego pomocą baza treści powinna dawać możliwość skalowania funkcjonalności i kosztów systemu do potrzeb odbiorców – zarówno dużych domów wydawniczych, jak i małych wydawców oferujących kilka tytułów rocznie.

Głównym założeniem edytora XML powinno być oparcie go na możliwie uniwersalnym i otwartym języku – najlepszy, ale nie jedyny wybór to standard XML. Edytor powinien dawać możliwość oddzielenia funkcji wprowadzania tekstu od poprawnego znakowania tworzonych treści, aby użytkownik nie musiał poznawać elementów struktury i przechodzić czasochłonnego szkolenia. Dla większości użytkwoników poznawanie obsługi strukturyzowanego dokumentu to zapora nie do pokonania. Jego powszechne wykorzystanie w pracy jest dla niego możliwe do przyswojenia, jeśli interfejs edytora będzie dla niego przyjazny (np. będzie przypominać Microsoft Word) i skutecznie oddzieli go od tworzonego w tle kodu.

Podobnie jak większość nowoczesnego oprogramowania, edytor XML powinien być oferowany w postaci chmury, czyli oprogramowania sieciowego. Wszystkie tworzone treści są wtedy przechowywane na bieżąco w centralnym serwerze aplikacji, z którym użytkownicy łączą się za pośrednictwem przeglądarki internetowej, co pozwala odciążyć ich własne komputery. Wiąże się to jednak z ryzykiem przechowywania treści on-line. Wychodząc naprzeciw wydawcom, którzy nie koniecznie stawiają całkowicie na „chmurę”, edytor powinien dawać możliwość zainstalowania oprogramowania na lokalnym, wskazanym przez użytkownika, serwerze, jak również posiadać obszerny panel administracyjny z możliwością tworzenia lokalnych kopii zapasowych w dowolnym momencie.

Edytor XML nie powinien być powiązany w żaden sposób z późniejszą wizualizacją, ponieważ wydawca musi mieć dowolność w wyborze oprogramowania wykorzystanego na późniejszych etapach produkcyjnego przygotowania publikacji. Edytor, opierając się na powszechnie stosowanych językach, powinien umożliwić wyeksportowanie tekstu do różnych standardów, np. xHTML, XML, PDF, epub. Kluczowym elementem tworzonej za pomocą edytora XML bazy treści powinna być możliwość eksportu tekstu do standardu zgodnego z wymogami różnych formatów prezentacji.
Niezwykle przydatną funkcjonalnością edytora XML w dalszej obróbce treści powinna być możliwość eksportu tekstu z bazy w strumieniach, co w praktyce oznacza, że można wyeksportować oznaczone elementy w jeden strumień (np. tytuły i treść główną), a inne w drugi (np. ilustracje, podpisy i tabele). Nie trzeba byłoby wtedy eksportować wszystkich elementów zawartych w bazie do jednego pliku, można byłoby pominąć te, które są zbędne dla danego formatu. Ułatwiłoby to znacznie pracę w późniejszym etapach procesu produkcyjnego, ograniczyło konieczność wprowadzania zmian w już wyeksportowanych zbiorach i ułatwiło wczytanie ich z powrotem do bazy danych programu.

Przykłady wykorzystania tekstów w standardzie XML

Jako przykład można podać słownikową bazę haseł. Utworzenie kieszonkowego słownika tematycznego z dobrze przygotowanej bazy opiera się właściwie na kilku kliknięciach. Wystarczy podczas eksportu ograniczyć hasła do odpowiedniej kategorii, np. „sport” i wybrać najkrótszy wariant haseł. Z tego samego zbioru można chwilę później stworzyć znacznie szerszy, internetowy słownik o tematyce sportowej lub dowolnej innej, która została odpowiednio oznakowana podczas tworzenia bazy.

Podobnych zastosowań można sobie wyobrazić wiele, np. interaktywny zestaw ćwiczeń do podręcznika akademickiego. W wersji drukowanej można pominąć np. podpowiedzi, klucz wyeksportować na końcu zbioru i ograniczyć liczbę pytań, a do wersji internetowej wyeksportować wszystkie wraz z podpowiedziami i kluczem podłączonym do każdego pytania.

Treść powinna być elementem plastycznym, odpowiadającym na zapotrzebowania czytelników. Każdy zbiór tekstu jest tylko przykładowym zestawem zawartości, ale przy zastosowaniu odpowiednich systemów czytelnik powinien mieć możliwość tworzenia własnych, unikalnych zbiorów złożonych i posegregowanych według jego preferencji. Komplet kodeksów prawnych może posłużyć odbiorcy jako podstawa stworzenia nowego zestawu artykułów o określonej tematyce. Fragmenty kilku kodeksów mogą trafić do nowego zbioru na podstawie kwerend czytelnika i w czasie rzeczywistym zostać zamieniona na kompletny zbiór opatrzony wszystkimi niezbędnymi elementami: spisem treści, indeksem czy numeracją stron. Podobne działanie można sobie wyobrazić na niemal dowolnych zbiorach zapisanych w standardzie XML – podręcznikach, zbiorach opowiadań czy przepisach kulinarnych.

Podsumowanie

Trudno dziś przewidzieć sposób, w jaki czytelnik będzie za kilka lat konsumować treści. Trend wskazuje na coraz szersze wykorzystanie urządzeń przenośnych czyli treści wirtualnej. Wymogi stojące przed takimi zbiorami są coraz większe i wynikają z rosnących możliwości urządzeń. Sortowanie, kolekcjonowanie elementów różnych zbiorów czy zaawansowane wyszukiwanie to tylko niektóre z możliwości, które mają dziś do dyspozycji czytelnicy. Aby zbiór w pełni odpowiadał na te potrzeby, konieczne jest ich odpowiednie ustrukturyzowanie i uzbrojenie w zestaw metadanych. Jest niemal pewne, że wymogi stojące przed zbiorami treści będą rosnąć wraz ze wzrostem apetytów czytelników. Warto zatem już dzisiaj przemyśleć strategię tworzenia, archiwizowania i opracowywania treści tak, by w przyszłości móc ten apetyt zaspokoić.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *