Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Сетевой информационный поиск

..pdf
Скачиваний:
1
Добавлен:
12.11.2023
Размер:
15.52 Mб
Скачать

ГЛАВА 2

ПРИНЦИПЫ ХРАНЕНИЯ И ОСОБЕННОСТИ ХРАНЕНИЯ ДОКУМЕНТОВ В ЭЛЕКТРОННЫХ СЕТЯХ

Условия правильного хранения документов

Со времен первобытного человека работа с информацией включа­ ла в себя несколько основных задач. За многотысячелетнюю историю че­ ловечества роль этих задач в социальной жизни и методы их решения претерпели существенные изменения, однако главные информацион­ ные задачи оставались неизменными. Перечислим эти задачи:

создание или продуцирование новой информации — важнейшая творческая задача; практически каждый индивидуум в той или иной форме всегда участвует хотя бы в частичном продуцирова­ нии новой информации;

поиск уже имеющейся информации;

анализ, упорядочение и, наконец, хранение вновь полученной и найденной информации; при хранении различают коллектив­ ное, то есть общее, и индивидуальное хранение, в понятие кото­ рого входит и хранение информации небольшими группами пользователей;

распространение известной и вновь полученной информации.

Наша основная цель — разобраться в том, как искать информацию в элeктpoнньfx сетях. Тем не менее для ее выполнения необходимо пред­ ставлять (хотя бы в самом общем виде), как распространяется новая информация и, главное, какие принципы используются при хранении информации (точнее, при хранении документов и электронных ресур­ сов). Еще пять тысяч лет тому назад, когда возникли первые библиоте­ ки и архивы, возникло понимание того, что простое собрание докумен­ тов (книг, глиняных табличек, папирусов) должно быть определенным образом упорядочено. Недаром говорят, что для того чтобы собрание книг стало библиотекой, должно быть указано, где и как хранится та или иная книга, должно быть создано описание хранимой документации. Это описание является путеводителем по хранилищу документов и на­ зывается оно каталогом.

Развитие библиотечной технологии выработало не только несколь­ ко основных форм каталогов, но и создало целую отрасль знаний, на­ зываемую каталогизация. Сам термин каталог восходит к латинскому catalogus, который, в свою очередь, происходит от греческого слова «катоЛоу» (список). Каталоги используются в различных сферах ж из­ ни — существуют каталоги запчастей к машинам, каталоги услуг фирм, каталоги цен и т. п. Тем не менее смысл разных каталогов всегда один и тот же: описание каких-то объектов и установление связи этих объек­ тов с определенными их параметрами. Так, например, в каталоге зап­

Принципы хранения и особенности хранения документов в электронных сетях 43

частей название части и ее характеристики связаны с некоторым номе­ ром, с помощью которого деталь и запрашивается.

Итак, при хранении любого документа требуются, как минимум, две характеристики. Первая — это место хранения документа, скажем зал, номер шкафа, место на полке (полочный индекс). По существу эта ха­ рактеристика аналогична URL-адресу ресурса электронного докумен­ та. Вторая характеристика — это каталог. Он связывает документ с его адресом. Существуют различные типы каталогов, приводящие доку­ мент в соответствие с именами авторов, названиями документов и их содержанием. Иными словами, каталог является той структурой, с помощью которой пользователь преобразует свой запрос в конкрет­ ный адрес документа.

В классической библиотеке каталоги создаются на специальных бу­ мажных карточках. Форма этих карточек была предложена еще в кон­ це XIX в. знаменитым американским библиотечным деятелем Мелвилом Дьюи. В небиблиотечной практике встречаются и другие типы каталогов на бумажных носителях, нередко имеющие книжную фор­ му. Практически нет человека, который хотя бы раз в жизни не видел карточного каталога и не пользовался бы им. Этот тип каталога при­ вычен, пользоваться им достаточно удобно.

Сравнительно недавно появились электронные библиотечные катало­ ги. Они не требуют дубликатов карточек, перебор записей в них произво­ дится машиной и поэтому выполняется с огромной быстротой. Главная же особенность электронного каталога, которая обеспечивает его решающее преимущество, состоит в том, что разные типы карточных каталогов мож­ но заменить одним. В этом едином каталоге поиск электронного ресурса (документа) может быть осуществлен по разным основаниям. Электрон­ ные библиотечные каталоги сначала применялись параллельно с традици­ онными карточными каталогами, однако их удобство привело к тому, что постепенно электронные каталоги, имеющие еще много дополнительных преимуществ, стали вытеснять из жизни каталоги карточные. Так, в ряде библиотек, начиная с той или иной даты, карточные каталоги перестают вестись, и все данные о вновь поступающих документах вносятся только в электронные каталоги. Предполагается постепенный отказ от карточных каталогов и в ведущих российских библиотеках. Такой переход—дело не простое. По существу, необходимо перевести в электронную форму все имеющиеся записи, а это большая и трудоемкая работа. Поэтому ещедол­ гое время во многих библиотеках карточные каталоги будут сосущество­ вать с электронными.

Поскольку большинство электронных каталогов доступно для уда­ ленного пользователя в режиме on-line, постольку только часть сведе­

44 Глава 2

ний о фондах таких библиотек будет доступна в режиме свободного доступа. Даже самые богатые библиотеки мира не могут себе позволить легко менять тип каталогов. Так, в крупнейшей библиотеке мира, Биб­ лиотеке конгресса США, несколько лет тому назад была изменена фор­ ма записи электронного каталога. В то же время переделывать старый электронный каталог не сочли целесообразным из-за больших затрат времени и труда. Так и существуют в этой библиотеке два электронных каталога: старый (old. catalog) и новый.

Трудности создания электронного каталога связаны, в частности, с необходимостью ручного вводаданных в память компьютерной систе­ мы, однако есть и другой способ, более быстрый. Так, в Швейцарии фир­ ма Eurospiderпри создании электронных версий каталогов Цюрихского университета, Архива Бенедиктинского монастыря и ряда других орга­ низаций (всего 7 адресов хранения) просто отсканировала старые ката­ ложные карточки. Известны и другие сканированные каталоги, которые можно встретить и в России. Сканированные каталоги не всегда удоб­ ны, но зато в электронную форму быстро переводятся все карточные каталожные записи за очень большие сроки (в Швейцарии это 100 лет со времени поступления документов в места их хранения, а Российская государственная библиотека (РГБ) отсканировала все карточки своего систематического каталога, начиная с 1962 г.). То же самое сделано и в Российской национальной библиотеке (РН Б ). Сравнительно недавно эти материалы стали доступны в режиме удаленного доступа.

Огромными преимуществами электронных каталогов является воз­ можность одновременного доступа к ним из разных мест библиотеки очень большому числу пользователей, использующих локальные сети. Можно пользоваться электронными каталогами и «извне», из разных городов и стран. Ограничения на число одновременно работающих пользователей определяются только пропускными способностями ка­ налов связи и проявляются в реальной практике они очень редко. Эти возможности позволяют объединять каталоги ряда библиотек, созда­ вая так называемые корпоративные сети (корпоративные сети — это скорее российский термин, за рубежом предпочитают говорить об ин­ тегрированных библиотечных системах (IntegtatedLibrary Systems)).

Итак, электронные каталоги обладают огромными преимуществами перед традиционными формами каталогов. Отмечая преимущества электронных каталогов, мы говорили о том, что разные типы каталогов, то есть разные принципы группировки материала, физически реализу­ ются в одном каталоге. Это, тем не менее, совсем не значит, что в таком каталоге сведения о документах расположены бессистемно, без какойлибо внутренней логики. И система, и логика в расположении докумен­

Принципы хранения и особенности хранения документов в электронных сетях

45

тов в электронных каталогах существуют, просто в отличие от катало­ гов традиционной формы эта логика не бросается в глаза пользовате­ лю. Тем не менее для квалифицированного поиска, особенно в элект­ ронных каталогах крупных библиотек, иметь представления об этой структуре необходимо, чтобы более правильно сформулировать поис­ ковые запросы. Для этого требуется иметь представления о системах классификации документов, которые будут коротко описаны в следу­ ющем разделе.

Системы классификации документов

/и электронных ресурсов

Мы будем говорить о библиотечных или, точнее, о библиотеч­ но-библиографических классификациях вне зависимости от того, в электронной или в традиционной форме представлены документы и электронные ресурсы. Заранее отметим также, что термин «библио­ течно-библиографическая классификация» означает не только все типы библиотечных классификаций, но и является специальным на­ званием той системы классификации, которая используется для рас­ становки книг и создания каталогов в подавляющем большинстве российских библиотек. Если принципы создания алфавитных ката­ логов понятны и очевидны, то создание каталогов, отражающих со­ держание документов и ресурсов, является сложной задачей.

Наиболее удобная система библиотечно-библиографической клас­ сификации была предложена американским библиотечным деятелем Мелвилом Дьюи (1851-1931). Эта классификационная система ис­ пользуется в настоящее время более чем в 200 тыс. библиотек в 135 странах мира и называется Десятичная классификация Дъюи — ДКД {Dewey Decimal Classification — ДОС). Весь круг мировых знаний раз­ делен в Д КД на 10 основных разделов, имеющих номера от 0 до 9. Каж­ дый раздел вновь делится на 10 подразделов, имеющих номера от 00 до 99 и т. д. Именно поэтому система и получила название десятич­ ной или децимальной. В ДКД предложены специальные цифровые определители к основным индексам, которые позволяют указать тип документа (книга, статья и т. д.), его язык и ряд других характери­ стик. Классификация дополняется алфавитно-предметным указате­ лем, в значительной мере облегчающим пользование системой. Пер­ вое издание таблиц Дьюи было осуществлено в 1876 г . , и тогда это была небольшая книжечка. Сейчас вышло в свет уже 21-е издание таблиц в 4-х томах, а в 2003 г. ожидается выход в свет нового, 22-го издания. Как всегда, в него будут внесены некоторые изменения и до­

46

Глава 2

полнения, которые на этот раз будут, в частности, касаться и вопросов, связанных с компьютерной техникой.

Хотя ДКД в России применяется только в исключительных случа­ ях, недавно был выполнен перевод ее 21 издания на русский язык, с которым можно ознакомиться в Государственной публичной научнотехнической библиотеке России (ГПНТБ). Это можно спокойно сде­ лать, используя URL-адрес http://www.gpntb.ru/. С главной страни­ цы библиотеки можно перейти к классификации, пользуясь кнопкой Dewey. Можно также просто воспользоваться липком http://gpntb.ru/ win/dewey. На этом сайте приводятся основные 10 делений класси­ фикации, или 10 основных классов (по-английски они называются Summaries). Названия всех классов приводятся на русском языке. Н о­ мера классов можно использовать в качестве гиперссылок, переходя таким образом на следующую ступень деления. Операцию можно повторить еще один раз. Таким образом, в распоряжении внешнего пользователя оказываются 1000 основных индексов. Никаких пояс­ нений и дополнений в этом материале нет, но тем не менее он доста­ точен для основных задач поиска информации в электронных сетях. Приводимый материал является официальным разрешенным пере­ водом данных, размещенных на сайте: http://oclc.org/fp/, который при­ надлежит организации, поддерживающей Всемирный сводный каталог

(она называется Online Computer Library Center OCLC). Последние изменения в этот сайт вносились 2 октября 1997 г.

В России даже английские издания Классификации Дьюи являют­ ся большой редкостью. Строго говоря, раньше в них практической нужды не было, однако в связи с развитием сетевого поиска информа­ ции необходимость в практическом использовании соответствующих определителей возросла. Таким образом, русский вариант классифи­ кационных таблиц Дьюи, предоставляемый ГПНТБ РФ в сети, явля­ ется весьма ценным подспорьем в поисковой работе. Печатный рус­ скоязычный перевод 21 издания Д КД распространяется в настоящее время по ведущим библиотекам страны.

Англоязычных вариантов ДКД, как и ее вариантов на других язы ­ ках, в Интернете можно найти достаточно много. Практически все они ограничиваются приведением только 1000 делений основных таблиц без каких-либо пояснений и правил пользования. Чаще всего эти дан­ ные располагаются на сайтах тех западных университетов, где есть биб­ лиотечные факультеты или колледжи. Отыскать эти адреса можно, пользуясь описанными далее приемами расширенного бытового поис­ ка с помощью поисковых машин. В случае необходимости можно при­ обрести C D -диск с материалами всех томов классификации. Эти дис­

Принципы хранения и особенности хранения документов в электронных сетях

47

ки на английском языке ежегодно обновляются. Можно также заклю­ чить годовой договор с OCLC на пользование этими дисками в режи­ ме он-лайн (все условия и цены можно найти, например, на сайте OCLC). В табл. 2 представлены основные деления Классификации Дьюи. Эту таблицу легко найти не только в Интернете, но и во многих русскоязычных книгах и учебниках, но мы рекомендуем внимательно ознакомиться с делением 500 (это деление отражает ту особенность английской разговорной практики, что математика не относится к ес­ тественным наукам, и поэтому, когда англичане говорят Science, они математику и статистику их этого понятия исключают. Особых слож­ ностей в разговорной практике это не вызывает, однако в автоматизи­ рованных поисковых системах ожидать появления данных о матема­ тических трудах при поиске по терминам: Science, Natural Sciencies — абсолютно безнадежное дело).

Система Дьюи послужила отправной точкой для создания хорошо известной и применяемой в России Универсальной десятичной класси­ фикации УДК(иИС), которая была создана в 1905-1907 гг. двумя бель­ гийскими учеными (Полем Отле и Анри Лафонтеном) в тесном кон­ такте с М елвилом Дьюи. В ней использованы и развиты многие идеи и приемы, предложенные в классификации Дьюи.

Как и Десятичная классификация Дьюи, УДК получила всемирное распространение. Соответствующие классификационные таблицы пе­ реведены на многие языки, в том числе и на русский. УДК использует­ ся во множестве библиотек в огромном числе стран мира и наиболее широко — в Европе. Поэтому о ней иногда говорят как о преимуще-

ДЕСЯТИЧНАЯ КЛАССИФИКАЦИЯ ДЬЮИ

Таблица 2

 

Основные деления

Первый уровень деления

Десять основных классов

000

-

Общий класс

100

-

Философия и психология

200

-

Религия

300

-

Общественные науки

400

-

Язык

500

-

Естественные науки

 

 

и математика

600

-

Техника (Прикладные науки)

700

 

Искусство. Изобразительное

 

 

и декоративное искусство

800

-

Литература и риторика

900

-

География и история

Примечание. Использован перевод 21 издания классификационных таблиц. Вместо трех цифр, например, 000, можно писать одну цифру —0. Так часто и поступают.

48

Глава 2

ственно европейской системе библиотечной классификации. Имеются машиночитаемые версии этой системы на английском языке, и, воз­ можно, они скоро появятся на русском языке. В Интернете имеются и таблицы УДК, которые могут включать в себя только несколько первых делений, но могут быть и более полными. В последнем случае обычно речь идет о каких-либо больших разделах УДК, например, о разделе, связанном с химией. Желающие взглянуть на эти материалы могут об­ ратиться, например, к:

http://www.lb.demokritos.gr/udctable.htm,

http://www.ualberta.ca/-plambeck/UDC/UG2.htm,

http://cosmu.com/mtp/udccodes.html и др.,

которые несложно отыскать в Интернете. Наличие хорошей и доступ­ ной русскоязычной литературы по этой системе позволяет при необ­ ходимости решить все поисковые проблемы, с ней связанные, посред­ ством обычной библиотечной работы. Эту систему хорош о знают библиографы многих, даже не очень крупных, библиотек, и получить необходимые консультации по использованию У ДК не представляет особого труда. В течение длительного периода библиотеки бывшего

СССР широко пользовались УДК, но затем она была вытеснена разра­ ботанной в СССР системой ББК. Тем не менее УДК до сих пор широ­ ко используется в нашей стране (главным образом в научно-техниче­ ских библиотеках). Иногда документы индексируются сразу в обеих системах: ББК и У Д К .'

Существует и третья широко распространенная в мире система биб­ лиотечно-библиографической классификации —Классификация Биб­ лиотеки Конгресса США (КБК) (.Library o f Congress Classification — LCC). Хотя она и была разработана Библиотекой конгресса, эта клас­ сификация используется в рабочей практике и ряда других известных библиотек. Тем не менее такого широкого распространения, как Д К Д и УДК, она не получила. В СССР и в России с этой системой сталкива­ лись ранее только специалисты-библиографы. Практического значе­ ния для простых российских пользователей она не имела.

В настоящее время развитие электронных сетей открыло россий­ ским пользователям доступ к каталогам почти всех библиотек мира, а Библиотека Конгресса не только самая большая библиотека в мире, но и обладательница самого полного собрание русскоязычных доку­ ментов вне территории СНГ. В этом собрании содержится множество ценных и полезных для российского пользователя материалов, в связи с чем знакомство с КБК стало желательным для россиян, занимающих­ ся поиском профессионально ориентированной информации в элект­ ронных сетях.

Принципы хранения и особенности хранения документов в электронных сетях 49

В КБК используется смешанная индексация: в начальных делениях используется 21 буква латинского алфавита. После этого на следующем уровне деления прибавляется еще одна буква. Вслед за этим появляют­ ся цифры. Объем таблиц КБК огромен и составляют 48 томов. И ДКД, и УДК являются типичными иерархическими системами, в которых не­ сколько (десять) основных понятий-вершин последовательно дробятся на все более мелкие и детальные понятия. КБК же представляет из себя перечислительную систему. Ее структура понятна из названия, и этим объясняется столь большой объем ее справочных таблиц.

Таблицы КБК приобрести можно. Часть из них в настоящее время доступна через знаменитый Интернет-магазин Amazon.com, имеются и C D -диски с нужными материалами. Однако все это крайне дорого и вряд ли необходимо дюке крупным российским библиотекам. Описа­ ние КБК также можно найти а Интернете. Первые ступени деления расположены также на сайтах разных университетов, кое-что о КБК можно найти в материалах самой Библиотеки Конгресса США, напри­ мер, по адресу http://lcweb.loc.gov/catdir/. В разделе FAQэтого линка вы также сможете узнать, что.библиотека пока что не планирует открытого он-лайнового доступа к своей классификационной системе. Наиболее полные данные о КБК имеются на сайте http://geography.miningco.com/ library/congress/bllchtm (это самый полный из известных нам материа­ лов Интернета, посвященных КБК). В нем приводятся 21 основное де­ ление КБК, а все буквы первого дробления на этом сайте являются ги­ пертекстовыми входами к дальнейшим материалам. Щелкнув по ним мышью, вы выходите на двухбуквенные таблицы, которые также явля­ ются гипертекстовыми входами. Далее вы попадаете на таблицы из двух букв и на указания о том, какие группы цифр, скажем от 500 до 650, относятся к тому или иному разделу КБК.

Для настоящей классификационной работы эти таблицы использо­ вать, конечно, нельзя, но чтобы разобраться в уже поставленных кемто классификационных индексах КБК этого вполне достаточно. Строго говоря, для сетевых поисковых задач большего и не требуется. Кстати, изменив последние звенья упомянутого выше линка, на class, htm вы сможете узнать, что можно выполнить полную классификацию по КБК с помощью Интернета, для чего следует воспользоваться протоколом Z39.50gateway. Вход по этому протоколу доступен через серверы ряда ведущих российских библиотек. Аналогичную информацию по КБК можно найти и на сайте библиотеки одного из колледжей Университе­ та штата Нью-Йорк (SUNY) в г. Потсдам http://www.potsdamwedu/ library/Ноте/L C /Outline.htm. Проще всего войти на эту страницу, на­ брав только http://www.potsdam.edu/libraiy, а затем последовательно активизировать вполне очевидные кнопки-надписи.

5 0

Глава 2

Менее подробная информация о структуре КБК может быть получена на сайте Longwood Colledge университета штата Вирджиния h ttp :// web.lwc.edu/administratoe/library/lcsum.htm. Внимательно всмотритесь в приводимый линк. Из него вы заметите, что библиотека {Library) нахо­ дится в директории административных подразделений университета.

Это обстоятельство характерно для многих западных университетов,

иего обязательно следует учитывать при реальной поисковой работе. Для российских пользователей особой нужды в знании КБК нет,

ипоэтому мы не будем более подробно описывать пути нахождения в Интернете сведений об этой системе. КБК используется для практи­ ческой работы в ряде библиотек мира, однако, в самой Библиотеке кон­ гресса уже в течение многих лет по просьбе американской библиотеч­ ной ассоциации одновременно с КБК используется и ДКД, то есть классификация Дьюи.

Три кратко описанные выше классификационные системы охваты­ вают огромное число библиотек мира. В то же время в практической работе некоторых библиотек используются и другие библиотечные классификационные системы. Так, например, в Славянской библиоте­ ке Хельсинского университета для классификации русских книг до сих пор использовалась классификационная система Санкт-Петербургско­ го императорского университета, восходящая своими корнями к доре­ волюционной классификации Синода Русской православной церкви.

ВРоссии эта система уже давно забыта. Только в последние годы начал­ ся перевод соответствующего фонда Славянской библиотеки на УДК.

Прежде чем переходить к объяснению того, зачем нужны сведения

обиблиотечных классификационных системах для задач сетевого по­ иска информации, нам необходимо кратко остановиться еще на одной классификационной системе, а именно Библиотечно-библиографичес­ кой классификации или ББК, которая является национальной библио­

течной классификационной системой России. Эта система уж е около 30 лет применяется в качестве основной в подавляющем числе россий­ ских универсальных и публичных библиотек. ББК, как и КБК, постро­ ена на сочетании буквенных и цифровых обозначений, но в отличие от последней является системой иерархической. Система эта достаточно сложная и до известной степени политизированная. У нее имеются разные варианты — для научных библиотек, для массовых библиотек и пр. Главным препятствием для более широкого распространения этой системы является использование в ней букв кириллического ал­ фавита, что сразу же ограничивает возможности применения ББК за рубежом, а также перспективы сетевого ее использования. Тем не ме­ нее ББК обладает и определенными достоинствами. Ж елающие про­