Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Электронные услуги библиотек

..pdf
Скачиваний:
4
Добавлен:
20.11.2023
Размер:
12.33 Mб
Скачать

3.2.Доступ к электронным документам из фондов библиотеки и ресурсам Интернета

2.Выборочное сохранение (по определенным критериям) ресурсов Интернета открытого доступа и использования

сопределенной периодичностью с помощью поисковых роботов.

3.Выборочное сохранение (по определенным критериям),

сопределенной периодичностью, с помощью поисковых роботов, дополненное сохранением тех сайтов, которые,

сточки зрения библиотекарей, необходимо сохранить (как правило, сайты СМИ и научных журналов), с той перио­

дичностью, с которой меняется информация на этих сай­ тах, а также «событийное сохранение», т. е. сохранениевсех сайтов, посвященных тому или иному важномудля страны событию, за определенный период времени.

Примером сплошного архивирования, в результате которого собирается огромное количество веб-страниц без отбора по со­ держанию, является интернет-архив, расположенный в СанФранциско и начавший свою деятельность в 1996 г. как частная некоммерческая инициатива с участием Библиотеки Конгресса США (http://web.archive.org). Архив собирает свободно доступные веб-страницы по всему миру и в настоящее время уже накопил более 100 терабайт данных, что в десятки раз больше, чем объем всей информации, хранящейся в Библиотеке Конгресса США, и растет со скоростью 12терабайт в месяц. Он содержит 150млрд веб-страниц, а также 1 млн электронных книг, 100 тыс. видео- и 200 тыс. аудиозаписей. В 2002 г. Интернет-архив реализовал проект Wayback Machine («Машина с задним ходом»), который призван дать свободный доступ к всемирному сетевому архиву. Архивируется, в частности, и значительная часть российского сегмента Сети.

Выборочный отбор предполагает анализ содержания ресурсов, и высокий приоритет при отборе дается авторитетным публика­ циям, имеющим научную ценность. Несколько библиотек раз­ работали стратегию отбора и сохранности сайтов на основе кон­ цепции публикации. Самый известный пример — Национальная библиотека Австралии, создавшая проект «Пандора». Здесьтер­ мин публикация используется в расширительном понимании: все, что находится в Интернете, является публикацией; из этого понятия совершенно определенно исключаются документы ор­ ганизационно-управленческие (organisational records). В центре

151

Глава 3. Услуги, предоставляемые библиотекой р электронной среде

этой стратегии — идея национальной продукции, составляющей национальное культурное наследие: отобранные сайты должны быть об Австралии, иметь непосредственное отношение к Авст­ ралии или быть написаны австралийцами. Некоторые нацио­ нальные архивы, например Национальный архив Великобрита­ нии (.Public Record Office) и Национальный архив Австралии, распространили политику управления электронными докумен­ тами на сайты правительственных агентств (как общедоступные, так и интранетовские) [30].

Примерами архивирования веб-сайтов, связанных с важней­ шими общественными и политическими событиями, являются созданные Библиотекой Конгресса США архивные коллекции сайтов, посвященных президентским выборам 2002 г. в США {Election 2002 Web Archive ) и событиям 11 сентября 2001 г. {September 11 Web Archive)', архив сайтов, посвященных цунами 2004 г. в Индийском океане, собранных Британской библиоте­ кой. Впланы этой библиотеки входит реализация самого полно­ го архива всех печатных и цифровых СМИ, посвященных гря­ дущим Олимпийским играм 2012 г. в Лондоне. Сотрудники проекта InternetArchiveдля того, чтобы сформировать архив, по­ священный Урагану «Катрина», самому разрушительному ура­ гану в истории США, произошедшему в конце августа 2005 г., обратилась с просьбой к интернет-пользователям присылать URL сайтов и блогов по этой тематике.

К формированию архивов веб-ресурсов в рамках обязатель­ ного экземпляра документов приступили Норвегия, Франция, Великобритания, Германия и многие другие страны. Законода­ тельное закрепление права библиотек на сбор сетевых докумен­ тов необходимо, потому что интернет-сайты защищены автор­ ским правом. Получить разрешение на копирование каждого документа невозможно, следовательно деятельность библиотек в этой области требует правового санкционирования, которое перевешивает защиту, предоставленную законодательством об авторском праве.

Так как производители мало заинтересованы в рассылке обя­ зательного экземпляра, учреждения, ведущие его сбор (прежде всего национальные библиотеки), используют так называемый «харвестинг» {harvesting — англ, «сбор урожая»), то есть автома­ тическое копирование документов с целью архивации и долго­

152

3.2. Доступ к электронным документам из фондов библиотеки и ресурсам Интернета

срочного хранения. Такой метод технологически осуществим с помощью любой поисковой машины. Существует серьезная проблема сбора обязательного экземпляра в «невидимом» вебе (iinvisible web). Под таким условным названием имеются в виду ресурсы, не достижимые путем обычного поиска (а следователь­ но, недоступные и для поисковых роботов). К таковым причис­ ляют: сайты, к которым отсутствуетсвободныйдоступ (например, платные и защищенные паролем); страницы HTML, генерируе­ мые при обращении к базе данных, имеющей собственный по­ исковый интерфейс, например, электронные каталоги библио­ тек. В первом случае автоматический сбор документов может осуществляться, только если сайт «откроет двери» программероботу (например, если учреждению, выполняющемусбор, будет предоставлен пароль). Во втором случае нужно ставить вопрос о представлении обязательного экземпляра в стандартном фор­ мате, для чего необходимо тесное, юридически оформленное сотрудничество между производителем информации и библио­ текой-депозитарием. Например, во Франции и Австралии про­ водились эксперименты, когда в библиотеку-депозитарий запи­ си, экспортированные из базданных, образующих в «глубинной» сети, пересылались в формате XML.

По мнению итальянских исследователей, специальными со­ глашениями можно также сбалансировать требования обеспече­ ния сохранности и доступности документов библиотекой с по­ требностью владельца информации освобождаться отдокументов, утративших актуальность. Депозитарное хранение различных версий документов гарантировало бы их целостность и досто­ верность, а также контролируемое использование [102].

Норвегия одной из первых стран в мире включила в Закон об обязательном экземпляре обязательный экземпляр электронных документов. Сбор сетевых публикаций в тестовом режиме вы­ полнялся с середины 1990-х гг., а первый тотальный отбор всего норвежского сектора веба был выполнен вдекабре 2002 г. Одна­ ко только в 2005 г. Норвежская национальная библиотека нача­ ла регулярный сбор норвежских сетевыхпубликаций. Стратегия отбора основана на собирании всех общедоступныхдокументов норвежского веб-пространства, т. е. документов домена «по» (опубликованные норвежскими издательствами), а также доме­ нов orgи сот (собираются документы, предназначенные для нор­

153

Глава 3. Услуги, предоставляемые библиотекой в электронной среде

вежских пользователей). Сбор веб-страниц выполняется с помощью Heritrix — пршраммы-сборщика4 раза в год. Сбор веб­ страниц всего норвежского домена обеспечивает сохранение «снимков», фиксирующих состояние норвежского Интернета в определенный момент времени. Для обеспечения полного со­ хранения отдельныхдокументов, например, всех выпусков жур­ налов, ежедневных номеров газет, применяется селективный подход, т. е. отобранные виды издания сохраняются полностью. Каталогизация сетевого архива будет выполнена лишь для не­ большой части документов (1%). Все документы архива будут индексироваться, это позволяет пользователям вести поиск по полным текстамдокументов. Все сетевые публикации, помещен­ ные в архив на законных основаниях, предоставляются в доступ конечным пользователям в целях научной, исследовательской деятельности. В случае, если документ защищен копирайтом, доступ конкретного пользователя ограничен частью архива, ре­ левантной его потребностям. Национальная библиотека может оформить договоры или лицензии с держателями копирайта, которые позволят библиотеке открыть свободный доступ к сете­ вым публикациям, например через организацию выставки на сайте библиотеки. Для документов, не подпадающих под дейст­ вие Закона об авторском праве, таких как законодательные акты, административные документы и другие документы властных структур, никаких ограничений доступа не предусмотрено [95].

В2006 г. обязательный экземпляр была распространен на фран­ цузский сегмент веба, и миссию по его сбору и сохранению разде­ лили между собой Французская национальная библиотека и Национальный аудиовизуальный институт (Institut national de I’audiovisuel, INA). Институтпризван собиратьв качестве обязатель­ ногоэкземпляра все французские сайты, относящиеся к индустрии и экономике вещания, например, веб-сайты всех французских теле- и радиостанций, сайты, предлагающие интернет-радио и интернет-телевидение, платформыпубликации видеоонлайн (типа YouTube) и многоедругое. Вянваре 2009 г. начата архивация сайтов, связанных с аудиовизуальными средствамимассовой информации. Для этого были отобраны около 4000 веб-сайтов, каждый из них регулярно сохраняется с имеющимися обновлениями. Интерфейс позволяетосуществлять последовательнуюнавигацию в заархиви­ рованных на определенную дату веб-сайтах. Доступ осуществля­

154

3.2. Доступ к электронным документам из фондов библиотеки и ресурсам Интернета

ется только в помещении консультационного центра института, который размещен в основном книгохранилище НБ Франции, носящем имя Франсуа Миттерана.

С вступлением в силу Закона о Немецкой национальной биб­ лиотеке от 22 июня 2006 г. в функции Немецкой национальной библиотеки входит комплектование, каталогизация, индексиро­ вание и архивирование сетевых средств массовой информации (интернет-изданий). Расширение видовдокументов, подлежащих сбору, привело к новой редакции Правил обязательного экзем­ пляра и Руководящих принципов комплектования.

К области сбора сетевыхпубликаций относятся всетекстовые, изобразительные и аудиальные документы, которые доступны в сетях общего пользования. Комплектованию подлежаткак ин­ тернет-издания, имеющие печатную версию, так и те средства массовой информации, которые распространяютсятолько через веб. Примерами интернет-изданий являются электронные жур­ налы, электронные книги, экзаменационные работы высшей школы, цифровые изображения, музыкальные файлы или веб­ страницы.

Не подлежат сбору бета-версии интернет-проектов, ограни­ ченные во времени, чисто программные или прикладные сред­ ства, а также теле- и радиопередачи. Кроме того, не собираются сетевые публикации, которые служат сугубо частным или ком­ мерческим целям. Обычно это относится к веб-сайтам, собираю­ щим, к примеру, личные фотографии и описания отпуска или предложения компаний, которые предоставляют частный кон­ тент только для своих клиентов. Однако, если тематика сайта или содержащаяся на нем частная, персональная информация пред­ ставляют общественный интерес, например, на сайтах общест­ венных деятелей или на сайтах о разведении мелких домашних животных, они подлежат сбору для Немецкой национальной библиотеки. Развитие соответствующих методов для массового сбора сетевых документов, их раскрытие и архивирование будет осуществляться поэтапно. В настоящее время ведется отбор от­ дельных сетевых публикаций, при этом Немецкая национальная библиотека каждый документ каталогизируеткак самостоятель­ ное произведение. На следующем этапе будут применены авто­ матизированные методы (харвестинг) сбора целых групп объек­ тов, таких как веб-сайты.

155

Глава 3. Услуги, предоставляемые библиотекой в электронной среде

В Канаде электронные публикации вошли в состав обязатель­ ного экземпляра в январе 2007 г. на основе Закона об обязатель­ ном экземпляре. НБ Канады, одна из предшественниц Библио­ теки и Архивов Канады (LAQ, собирала электронные публикации с 1994 г., и эта небольшая, но интересная коллекция насчитыва­ ет около 30 тыс. названий или 405 гигабайтов данных. Часть до­ кументов находится под защитой авторского права, часть — нет. Они доступны для всех на веб-сайте. Все электронные публика­ ции отражены в национальной библиографии. По закону, в со­ став ОЭ входят веб-сайты, базы данных, картографические дан­ ные и многие другие цифровые материалы, попадающие под определение «публикация». Но на практике LAC ограничила состав обязательного экземпляра только цифровыми публика­ циями, аналогичными традиционным, которые имеют форму и внешнее сходство с печатными книгами и сериальными изда­ ниями. По закону, издатели должны присылать в LAC какие бы то ни было метаданные, необходимыедля описания их публика­ ций [73, с. 1-2].

СотрудникДатской государственной и университетской биб­ лиотеки в своем докладе на 74-й сессии ИФЛА дал достаточно неожиданную оценку того, что является наиболее трудным при сетевом архивировании: «Харвестинг не представлял большой проблемы, за исключением того факта, что парламент был вы­ нужден принять закон, регулирующий эти вопросы, что было нелегким делом. Трудным вопросом является то, как регулиро­ вать доступ к информации, на основе которой проведен харве­ стинг» [149, с. 7].

Харвестинг подразумевает охват и глубинного веба для полу­ чения статей, отчетов, любыхдругих публикаций, которые могут представлять интерес в течение большого периода времени, яв­ ляясь важным источником для научных исследований. Пробле­ ма предоставления полноценного доступа к архиву, содержаще­ му такие материалы, заключается в том, что этот доступ будет конкурировать с коммерческим использованием этого материа­ ла, что противоречит одной из статей Бернской конвенции. Во избежании нарушений Бернской конвеции в Дании было реше­ но установить на доступ к интернет-архивам следующие ограни­ чения: доступ пользователям предоставляется только в помеще­ ниях учреждений-получателей обязательного экземпляра

156

3.2. Доступ к электронным документам из фондов библиотеки и ресурсам Интернета

электронных документов; исследователи могутполучитьудален­ ный доступ к материалам архива при условии, что эти материалы не являются коммерческими.

Вмае 2004 г. в сети Интернет появился веб-сайт Международ­ ного консорциума сохранности Интернета (International Internet Preservation Consortium, IIPQ 1. В настоящее время в консорциум входят национальные библиотеки Австралии, Австрии, Герма­ нии, Израиля, Исландии, Канады, Нидерландов, Новой Зелан­ дии, Норвегии, Китая, Кореи, Польши, Сингапура, Словении, Франции, Чехии, Хорватии, Швейцарии, Швеции, Британская библиотека, Библиотека Конгресса США, Центральная нацио­ нальная библиотека во Флоренции (Италия), Национальная парламентская библиотека Японии. Членом консорциума явля­ ется также и интернет-архив, и ряд другихучреждений. Участие большого количества стран в консорциуме по сохранности веба демонстрирует важность и актуальность этих проблем, осозна­ ваемую мировым библиотечным сообществом.

Консорциум ставит перед собой следующие задачи:

сделать возможным сохранение (понимаемое как обеспе­ чение долговременной сохранности и доступности) бо­ гатств содержания Интернета, поставляемых в него со всех концов света;

способствовать развитию и применению средств, приемов

истандартов, используемыхдля создания международных архивов;

обеспечивать международную поддержку инициатив и за­ конодательства, способствующих сбору, сохранению ин­ тернет-контента и обеспечению к нему доступа;

поддерживать национальные библиотеки, архивы, музеи

идругие институты, которые намерены заниматься архи­ вированием Интернета.

В России имеется опыт архивирования не всего российского сегмента веба, а электронных периодический изданий. Проект «Создание архива российских научных полнотекстовых журна­ лов, опубликованных в Интернет», был инициирован в 2004 г. сотрудниками РГБ и получил поддержку РФФИ. Главным итогом проекта стала общедоступная база данных структурированных

1http://www.netpreserve.org.

157

Глава 3. Услуги, предоставляемые библиотекой в электронной среде

описаний российских научных журналов, доступных через Ин­ тернет (http://resource.rsl.ru/index.php?doc=31). Выполена была и задача адаптации программного обеспечения, распространяе­ мого бесплатно, с помощью которого можно создать архив ре­ сурсов Интернета. Была создана система, состоявшая их трех модулей: каталог ресурсов, архив ресурсов, полнотекстовый по­ иск в архиве (около 800 журналов, общий объем архива составлял 300 Гб.). Однако из-за нерешенности проблем авторского права архив не мог быть предоставлен в доступ [122].

Попытки расширить действие Федерального закона «Об обя­ зательном экземпляре документов» на электронные документы, распространяемые в сетевом режиме в Российской Федерации, предпринимались в 2006 г., но успехом они не увенчались. Тогда

вГосударственнуюДуму Комитетом по информационной поли­ тике, информационным технологиям и связи был внесен проект Федерального закона «О внесении изменений в Федеральный закон „Об обязательном экземпляре документов"» (в части по­ ставки обязательного экземпляра электронных документов) № 308890-4.

Всостав обязательного бесплатного экземпляра предлагалось ввестидокументы электронного происхождения — электронные документы, не имеющие печатного аналога и распространяемые через сети общего пользования (Интернет). Ст. 7, определяющую правила доставки обязательного бесплатного экземпляра печат­ ных изданий и количество таких экземпляров по отдельным ви­ дам документов, предлагалось дополнить следующим пунктом: «Один экземпляр изданий... доставляется в виде электронной версии в формате, согласованном с получателем. По согласова­ нию с получателем электронная версия может поставляться вме­ сто большего количества или всех обязательных экземпляров изданий». Документы электронного происхождения, законно обнародованные в Интернете, было предложено доставлять

вРоссийскую государственную библиотеку по электронной поч­ те в порядке и форматах, установленных получателем.

Вфинансово-экономическом обосновании к проекту указы­ валось, что предлагаемые изменения не потребует дополнитель­ ных расходов из федерального бюджета.

Однако Правовое управление Госдумы в заключении на про­ ект отметило, что в финансово-экономическом обосновании

158

3.2. Доступ к электронным документам из фондов библиотеки и ресурсам Интернета

требуется привести расчет расходов, необходимыхдля хранения и поддержания «банка» электронных документов, в т. ч. на при­ обретение вычислительной техники, привлечение специалистов, создание специальных условий содержания такой техники, и по­ лучить на законопроект заключение Правительства Российской Федерации. Отмечалось, что в законопроекте не проработаны вопросы эквивалентности (достоверности и надежности) «доку­ ментов электронного происхождения»; что использование элек­ тронного оригинал-макета печатного издания и цифровой версии аудиовизуальных документов в качестве равноценной замены традиционному «обязательному экземпляру» может повлечь на­ рушения авторских прав издателей и авторов, поскольку увели­ чивается возможность изготовления контрафактной продукции; ряддругих «нарушений правил юридической техники предусмот­ ренных Методическими рекомендациями по юридико-техниче­ скому оформлению законопроектов».

Законопроект получил отрицательный отзыв Правительства Российской Федерации, в котором отмечалось, что, оценивая положительно предложение о комплектовании национального библиотечно-информационного фонда в электронном виде в целом, ряд существенных замечаний по представленному про­ екту не позволяет его поддержать.

Необходимо отметить, что заключение на проект от Комите­ та по культуре получено 16 апреля 2008 г., т. е. спустя почти два года после внесения законопроекта, поэтому в тексте появилось упоминание о Президентской библиотеке им. Б. Н. Ельцина1.

Так подробно на этом законопроекте мы останавливаемся потому, что он был первым документом, предлагающим законо­ дательно разрешить сбор сетевых электронныхдокументов в Рос­ сии. «Методические решения» по тому, какие виды документов надо собирать, какие учреждения должны быть получателями обязательного экземпляра, способы сбора, особенности доступа и использования, предложенные в законопроекте, выглядят не слишком проработанными. Но и сам законопроект, и отзывы

1Заключение Комитета по культуре приведено полностью в Приложении 7. Стекстами всехдокументов можно ознакомиться на портале «Законодательная Деятельность» ГосударственнойДумы Российской Федерации http://asozd2.duma. gov.ru (№ 308890-4).

159

Глава 3. Услуги, предоставляемые библиотекой в электронной среде

на него, дают богатый материал для дальнейшей работы в этом направлении. Нет сомнений в том, чтодеятельность по сохране­ нию сетевого электронного контента рано или поздно будет на­ чата в России с использованием опыта, накопленного в развитых странах, но на условиях корпоративного взаимодействия всех национальных библиотек, возможно, и архивов, и учреждений, являющихся получателями обязательного экземпляра аналоговых документов и электронных документов на оптических компактдисках.

Подтверждение этим словам было найдено в справке к Кол­ легии Министерства культуры РФ от 29 октября 2009 г., которая распространялась на совещании директоров библиотек 2009 г. В этой справке впервые задача сохранения электронной инфор­ мации прозвучала как новая задача, но, к сожалению, не вошед­ шая в карту проекта 15 «Развитие библиотечного дела», создан­ ную в соответствии с постановлением Правительства Российской Федерации от 10 марта 2009 г. № 215 «О порядке организации исполнения проектов по реализации Основных направлений деятельности Правительства Российской Федерации на период до 2012 года», не имеющая финансирования из федерального бюджета. «Необходимы осознанные целенаправленные действия по сохранению той электронной информации, которая остается за пределами внимания библиотек и архивов. Речь идет о чисто виртуальной информации, рождающейся и существующей толь­ ко в Интернете, — социально-значимых сайтах, на которых накапливается важная для общества информация, наиболее ин­ тересных блогах, в том числе тех, которые ведут известные по­ литические и общественные деятели, их электронные архивы, в том числе их электронная переписка и т. п. Если не предпри­ нимать срочных мер, то в скором времени мы обнаружим, что у нас нет огромного количества информации, связанной с исто­ рией России, в том числе с историей российской культуры и науки. Необходимо уже в ближайшее время сформировать рабо­ чую группудля подготовки Национального аналитического док­ лада о многочисленных и разнообразных проблемах сохранения электронной информации и на его основе приступить к разра­ ботке концепции Национальной программы сохранения элек­ тронной информации, причем это будет касаться не только биб­ лиотек, но и архивов и музеев» [100, с. 24-25].

160