News

20-01-2018

Tysiące unikatowych pozycji naukowych w zasobach AZON-u

1800 pozycji – druków zwartych, czasopism, rękopisów, broszur związanych z rozwojem medycyny i kształceniem medycznym w XIX i na początku XX w. zostanie zdigitalizowanych na potrzeby Atlasu Zasobów Otwartej Nauki (AZON),  internetowej platformy informacyjnej. Projekt realizuje Uniwersytet Medyczny we Wrocławiu.


– Szacowaliśmy, że na potrzeby AZON-u zdigitalizujemy ok. 300 tys. stron różnych pozycji. Rzeczywistość jednak mocno weryfikuje to nasze zamierzenie – mówi kustosz Renata Sławińska, dyrektor Biblioteki Głównej Uniwersytetu Medycznego we Wrocławiu.


Pracą nad digitalizacją uczelnianych zasobów zajmuje się 9-osobowy zespół. – Mamy wiele pozycji z tego okresu w naszych zbiorach. Każdą książkę, broszurę itp., którą kwalifikujemy do projektu, sprawdzamy pod kątem unikalności jej wersji elektronicznej, tzn. sprawdzamy, czy nie jest dostępna w innych zasobach cyfrowych. Chcemy, by nasze zasoby były unikatowe – opowiada dyrektor Sławińska.


– Nie chcemy dublować czegoś, co jest już zdigitalizowane. Zależy nam, żeby to były pozycje niedostępne w internecie – opowiada Dominika Sidorska, która również pracuje przy projekcie.


Dyrektor Sławińska tłumaczy: – Mamy na przykład bardzo wiele pozycji niemieckojęzycznych z XIX i początku XX w. Od nich zaczynaliśmy pracę. Okazało się jednak, że tamtejsze biblioteki czy instytucje wiele już zrobiły w tym kierunku i mają duży zasób zdigitalizowanych pozycji. Musieliśmy zrezygnować z wielu tytułów wybranych wstępnie do projektu.


– Czasopisma sprawdzamy w kolekcjach innych bibliotek. Okazuje się, że brakuje tam pewnych ciągów, pojedynczych numerów wydania, które z kolei są w naszych zasobach magazynowych. I to staramy się zdigitalizować, aby użytkownicy mieli dostęp do pełnego zasobu – mówi Dominika Sidorska.


Kiedy książka do digitalizacji zostanie już wybrana, w Dolnośląskiej Bibliotece Cyfrowej zespół wprowadza informację „publikacja planowana do digitalizacji”. – Chodzi o to, żeby było wiadomo, że my się tym zajmujemy i żeby ktoś inny nie robił tego samego – wyjaśnia kustosz. –Zdarza się, że ludzie już pytają nas o te rzeczy przeznaczone do digitalizacji. Pojawia się już w sieci zainteresowanie tymi pozycjami – dodaje.


Każde dzieło przeznaczone do digitalizacji, oprócz unikalności w wersji elektronicznej, należy sprawdzić pod kątem praw autorskich. – To bardzo czasochłonne zajęcie – mówi dyrektor Sławińska.


Dominika Sidorska: – Przeszukujemy różne bazy, staramy się zweryfikować autora, czy faktycznie minęło 70 lat od jego śmierci. Jeżeli mamy już noty biograficzne, to dopiero wtedy bierzemy tę pozycję do digitalizacji. Pilnujemy tej granicy 70 lat, żeby to były pozycje bezpieczne pod kątem praw autorskich dostępne w publicznej domenie.


Do tej pory zespół dyrektor Sławińskiej zakwalifikował do digitalizacji 997 pozycji. – To są zbiory, które udało się sprawdzić pod względem unikalności elektronicznej i praw autorskich. Dało nam to na razie 66 tys. stron – mówi kustosz. Pozycji zeskanowanych i z wykonanym OCR (Optical Character Recognition) jest już  442. – Założyliśmy, że do końca roku zeskanujemy 450 książek, jesteśmy już blisko tej liczby – mówi dyrektor Sławińska.


Wybrane prace są bardzo różne, ale wszystkie niezwykle ciekawe. – Digitalizujemy pozycje z dziedziny medycyny i nauk pokrewnych. Wiele z nich jest pięknie wydanych, oprawionych, ilustrowanych. Są np. porady, jak uprawiać gimnastykę pokojową, z 1892 r. – „Gimnastyka pokojowa jako środek leczniczy przeciw dolegliwościom pochodzącym ze złego trawienia i złego krążenia krwi dotyczących pacjentów”. Mamy dzieje medycyny w życiorysach, aforyzmach i anegdotach. Hrabiego Mattei elektrohomeopatyczna metoda leczenia z 1878 r., jest pozycja o Krzeszowicach jako zakładzie lekarsko-zdrojowym wód siarczanych, również z XIX w. – wylicza kustosz. – Niektóre są naprawdę bardzo ciekawe i żałuję, że mam za mało czasu, aby je wszystkie przeczytać – ubolewa.


– Trafiło nam się też kilka interesujących doktoratów z końca XIX i początku XX w. Wszystkie powstały we Wrocławiu, napisane są po łacinie lub w języku niemieckim. Pojawiają się też pamiętniki czy materiały o uzdrowiskach na Dolnym Śląsku. Część z nich pisana jest gotykiem – dodaje Dominika Sidorska. – Do każdej zdigitalizowanej pozycji przygotowujemy opisy metadanowe oraz streszczenie w języku polskim i angielskim.


Żmudną pracą przygotowania publikacji na platformę AZON zajmuje się m.in. Michał Olczyk. – Książki skanujemy strona po stronie. Czasami program do skanowania „nie widzi” poszczególnych wyrazów, bo są słabiej wydrukowane lub zamazane, zaznacza je wtedy na niebiesko i mówiąc obrazowo, trzeba te słowa wpisać na nowo. Nie ma innego wyjścia, musimy przejrzeć każdą pozycję strona po stronie. Czasami do wpisania są całe kolumny tekstu – opowiada Olczyk. – Zdarza się, że program próbuje przerobić pieczęć na tekst. Jeżeli w książce są podkreślenia, zapiski na marginesach, to program zaczyna tworzyć z tego własne wyrazy. Musimy tego wszystkiego przypilnować. Pracochłonne jest przetwarzanie tabel, zwłaszcza kiedy ułożone są odwrotnie w stosunku do kierunku tekstu.


Renata Sławińska: – A kiedy już to wszystko poprawimy, musimy jeszcze przygotować plik w wersji wymaganej na platformie AZON, na piątym poziomie otwartości. Z tym też jest wiele pracy. Bo do każdej książki, broszury trzeba przygotować np. aktywny spis treści, który odsyłać będzie czytelnika na konkretną stronę. Trzeba uporządkować rysunki, jeżeli autor książki umieścił je na jednej stronie, a często tak bywało. W wersji otwartej każdy taki rysunek musi być umieszczony osobno. – Oglądamy kartkę po kartce, poprawiamy co trzeba, dodajemy ruchome treści. Uzyskanie tego ostatniego stopnia otwartości jest bardzo czasochłonne i nawet trudno wyliczyć, ile czasu potrzeba na realizację jednej książki, bo każda jest inna – mówi Michał Olczyk.


Renata Sławińska jest jednak pełna optymizmu: – Doświadczenia teraz dobyte zaprocentują nam przy kolejnych projektach – zapewnia.


Atlas Zasobów Otwartej Nauki (AZON) to internetowa platforma informacyjna, która ma gromadzić, przetwarzać i bezpłatnie udostępniać zasoby nauki w otwartej formie wszystkim zainteresowanym. Powstaje w ramach projektu Aktywna Platforma Informacyjna e-scienceplus.pl w Centrum Wiedzy i Nauki Technicznej (CWiNT) Politechniki Wrocławskiej. Uczelnia ta jest koordynatorem przedsięwzięcia, a jego partnerami są: Akademia Wychowania Fizycznego we Wrocławiu, Uniwersytet Przyrodniczy we Wrocławiu, Uniwersytet Medyczny we Wrocławiu i Instytut Badań Systemowych Polskiej Akademii Nauk z Warszawy.