книги / Сетевой информационный поиск
..pdfГЛАВА 2
ПРИНЦИПЫ ХРАНЕНИЯ И ОСОБЕННОСТИ ХРАНЕНИЯ ДОКУМЕНТОВ В ЭЛЕКТРОННЫХ СЕТЯХ
Условия правильного хранения документов
Со времен первобытного человека работа с информацией включа ла в себя несколько основных задач. За многотысячелетнюю историю че ловечества роль этих задач в социальной жизни и методы их решения претерпели существенные изменения, однако главные информацион ные задачи оставались неизменными. Перечислим эти задачи:
♦создание или продуцирование новой информации — важнейшая творческая задача; практически каждый индивидуум в той или иной форме всегда участвует хотя бы в частичном продуцирова нии новой информации;
♦поиск уже имеющейся информации;
♦анализ, упорядочение и, наконец, хранение вновь полученной и найденной информации; при хранении различают коллектив ное, то есть общее, и индивидуальное хранение, в понятие кото рого входит и хранение информации небольшими группами пользователей;
♦распространение известной и вновь полученной информации.
Наша основная цель — разобраться в том, как искать информацию в элeктpoнньfx сетях. Тем не менее для ее выполнения необходимо пред ставлять (хотя бы в самом общем виде), как распространяется новая информация и, главное, какие принципы используются при хранении информации (точнее, при хранении документов и электронных ресур сов). Еще пять тысяч лет тому назад, когда возникли первые библиоте ки и архивы, возникло понимание того, что простое собрание докумен тов (книг, глиняных табличек, папирусов) должно быть определенным образом упорядочено. Недаром говорят, что для того чтобы собрание книг стало библиотекой, должно быть указано, где и как хранится та или иная книга, должно быть создано описание хранимой документации. Это описание является путеводителем по хранилищу документов и на зывается оно каталогом.
Развитие библиотечной технологии выработало не только несколь ко основных форм каталогов, но и создало целую отрасль знаний, на зываемую каталогизация. Сам термин каталог восходит к латинскому catalogus, который, в свою очередь, происходит от греческого слова «катоЛоу» (список). Каталоги используются в различных сферах ж из ни — существуют каталоги запчастей к машинам, каталоги услуг фирм, каталоги цен и т. п. Тем не менее смысл разных каталогов всегда один и тот же: описание каких-то объектов и установление связи этих объек тов с определенными их параметрами. Так, например, в каталоге зап
Принципы хранения и особенности хранения документов в электронных сетях 43
частей название части и ее характеристики связаны с некоторым номе ром, с помощью которого деталь и запрашивается.
Итак, при хранении любого документа требуются, как минимум, две характеристики. Первая — это место хранения документа, скажем зал, номер шкафа, место на полке (полочный индекс). По существу эта ха рактеристика аналогична URL-адресу ресурса электронного докумен та. Вторая характеристика — это каталог. Он связывает документ с его адресом. Существуют различные типы каталогов, приводящие доку мент в соответствие с именами авторов, названиями документов и их содержанием. Иными словами, каталог является той структурой, с помощью которой пользователь преобразует свой запрос в конкрет ный адрес документа.
В классической библиотеке каталоги создаются на специальных бу мажных карточках. Форма этих карточек была предложена еще в кон це XIX в. знаменитым американским библиотечным деятелем Мелвилом Дьюи. В небиблиотечной практике встречаются и другие типы каталогов на бумажных носителях, нередко имеющие книжную фор му. Практически нет человека, который хотя бы раз в жизни не видел карточного каталога и не пользовался бы им. Этот тип каталога при вычен, пользоваться им достаточно удобно.
Сравнительно недавно появились электронные библиотечные катало ги. Они не требуют дубликатов карточек, перебор записей в них произво дится машиной и поэтому выполняется с огромной быстротой. Главная же особенность электронного каталога, которая обеспечивает его решающее преимущество, состоит в том, что разные типы карточных каталогов мож но заменить одним. В этом едином каталоге поиск электронного ресурса (документа) может быть осуществлен по разным основаниям. Электрон ные библиотечные каталоги сначала применялись параллельно с традици онными карточными каталогами, однако их удобство привело к тому, что постепенно электронные каталоги, имеющие еще много дополнительных преимуществ, стали вытеснять из жизни каталоги карточные. Так, в ряде библиотек, начиная с той или иной даты, карточные каталоги перестают вестись, и все данные о вновь поступающих документах вносятся только в электронные каталоги. Предполагается постепенный отказ от карточных каталогов и в ведущих российских библиотеках. Такой переход—дело не простое. По существу, необходимо перевести в электронную форму все имеющиеся записи, а это большая и трудоемкая работа. Поэтому ещедол гое время во многих библиотеках карточные каталоги будут сосущество вать с электронными.
Поскольку большинство электронных каталогов доступно для уда ленного пользователя в режиме on-line, постольку только часть сведе
44 Глава 2
ний о фондах таких библиотек будет доступна в режиме свободного доступа. Даже самые богатые библиотеки мира не могут себе позволить легко менять тип каталогов. Так, в крупнейшей библиотеке мира, Биб лиотеке конгресса США, несколько лет тому назад была изменена фор ма записи электронного каталога. В то же время переделывать старый электронный каталог не сочли целесообразным из-за больших затрат времени и труда. Так и существуют в этой библиотеке два электронных каталога: старый (old. catalog) и новый.
Трудности создания электронного каталога связаны, в частности, с необходимостью ручного вводаданных в память компьютерной систе мы, однако есть и другой способ, более быстрый. Так, в Швейцарии фир ма Eurospiderпри создании электронных версий каталогов Цюрихского университета, Архива Бенедиктинского монастыря и ряда других орга низаций (всего 7 адресов хранения) просто отсканировала старые ката ложные карточки. Известны и другие сканированные каталоги, которые можно встретить и в России. Сканированные каталоги не всегда удоб ны, но зато в электронную форму быстро переводятся все карточные каталожные записи за очень большие сроки (в Швейцарии это 100 лет со времени поступления документов в места их хранения, а Российская государственная библиотека (РГБ) отсканировала все карточки своего систематического каталога, начиная с 1962 г.). То же самое сделано и в Российской национальной библиотеке (РН Б ). Сравнительно недавно эти материалы стали доступны в режиме удаленного доступа.
Огромными преимуществами электронных каталогов является воз можность одновременного доступа к ним из разных мест библиотеки очень большому числу пользователей, использующих локальные сети. Можно пользоваться электронными каталогами и «извне», из разных городов и стран. Ограничения на число одновременно работающих пользователей определяются только пропускными способностями ка налов связи и проявляются в реальной практике они очень редко. Эти возможности позволяют объединять каталоги ряда библиотек, созда вая так называемые корпоративные сети (корпоративные сети — это скорее российский термин, за рубежом предпочитают говорить об ин тегрированных библиотечных системах (IntegtatedLibrary Systems)).
Итак, электронные каталоги обладают огромными преимуществами перед традиционными формами каталогов. Отмечая преимущества электронных каталогов, мы говорили о том, что разные типы каталогов, то есть разные принципы группировки материала, физически реализу ются в одном каталоге. Это, тем не менее, совсем не значит, что в таком каталоге сведения о документах расположены бессистемно, без какойлибо внутренней логики. И система, и логика в расположении докумен
Принципы хранения и особенности хранения документов в электронных сетях |
45 |
тов в электронных каталогах существуют, просто в отличие от катало гов традиционной формы эта логика не бросается в глаза пользовате лю. Тем не менее для квалифицированного поиска, особенно в элект ронных каталогах крупных библиотек, иметь представления об этой структуре необходимо, чтобы более правильно сформулировать поис ковые запросы. Для этого требуется иметь представления о системах классификации документов, которые будут коротко описаны в следу ющем разделе.
Системы классификации документов
/и электронных ресурсов
Мы будем говорить о библиотечных или, точнее, о библиотеч но-библиографических классификациях вне зависимости от того, в электронной или в традиционной форме представлены документы и электронные ресурсы. Заранее отметим также, что термин «библио течно-библиографическая классификация» означает не только все типы библиотечных классификаций, но и является специальным на званием той системы классификации, которая используется для рас становки книг и создания каталогов в подавляющем большинстве российских библиотек. Если принципы создания алфавитных ката логов понятны и очевидны, то создание каталогов, отражающих со держание документов и ресурсов, является сложной задачей.
Наиболее удобная система библиотечно-библиографической клас сификации была предложена американским библиотечным деятелем Мелвилом Дьюи (1851-1931). Эта классификационная система ис пользуется в настоящее время более чем в 200 тыс. библиотек в 135 странах мира и называется Десятичная классификация Дъюи — ДКД {Dewey Decimal Classification — ДОС). Весь круг мировых знаний раз делен в Д КД на 10 основных разделов, имеющих номера от 0 до 9. Каж дый раздел вновь делится на 10 подразделов, имеющих номера от 00 до 99 и т. д. Именно поэтому система и получила название десятич ной или децимальной. В ДКД предложены специальные цифровые определители к основным индексам, которые позволяют указать тип документа (книга, статья и т. д.), его язык и ряд других характери стик. Классификация дополняется алфавитно-предметным указате лем, в значительной мере облегчающим пользование системой. Пер вое издание таблиц Дьюи было осуществлено в 1876 г . , и тогда это была небольшая книжечка. Сейчас вышло в свет уже 21-е издание таблиц в 4-х томах, а в 2003 г. ожидается выход в свет нового, 22-го издания. Как всегда, в него будут внесены некоторые изменения и до
46 |
Глава 2 |
полнения, которые на этот раз будут, в частности, касаться и вопросов, связанных с компьютерной техникой.
Хотя ДКД в России применяется только в исключительных случа ях, недавно был выполнен перевод ее 21 издания на русский язык, с которым можно ознакомиться в Государственной публичной научнотехнической библиотеке России (ГПНТБ). Это можно спокойно сде лать, используя URL-адрес http://www.gpntb.ru/. С главной страни цы библиотеки можно перейти к классификации, пользуясь кнопкой Dewey. Можно также просто воспользоваться липком http://gpntb.ru/ win/dewey. На этом сайте приводятся основные 10 делений класси фикации, или 10 основных классов (по-английски они называются Summaries). Названия всех классов приводятся на русском языке. Н о мера классов можно использовать в качестве гиперссылок, переходя таким образом на следующую ступень деления. Операцию можно повторить еще один раз. Таким образом, в распоряжении внешнего пользователя оказываются 1000 основных индексов. Никаких пояс нений и дополнений в этом материале нет, но тем не менее он доста точен для основных задач поиска информации в электронных сетях. Приводимый материал является официальным разрешенным пере водом данных, размещенных на сайте: http://oclc.org/fp/, который при надлежит организации, поддерживающей Всемирный сводный каталог
(она называется Online Computer Library Center — OCLC). Последние изменения в этот сайт вносились 2 октября 1997 г.
В России даже английские издания Классификации Дьюи являют ся большой редкостью. Строго говоря, раньше в них практической нужды не было, однако в связи с развитием сетевого поиска информа ции необходимость в практическом использовании соответствующих определителей возросла. Таким образом, русский вариант классифи кационных таблиц Дьюи, предоставляемый ГПНТБ РФ в сети, явля ется весьма ценным подспорьем в поисковой работе. Печатный рус скоязычный перевод 21 издания Д КД распространяется в настоящее время по ведущим библиотекам страны.
Англоязычных вариантов ДКД, как и ее вариантов на других язы ках, в Интернете можно найти достаточно много. Практически все они ограничиваются приведением только 1000 делений основных таблиц без каких-либо пояснений и правил пользования. Чаще всего эти дан ные располагаются на сайтах тех западных университетов, где есть биб лиотечные факультеты или колледжи. Отыскать эти адреса можно, пользуясь описанными далее приемами расширенного бытового поис ка с помощью поисковых машин. В случае необходимости можно при обрести C D -диск с материалами всех томов классификации. Эти дис
Принципы хранения и особенности хранения документов в электронных сетях |
47 |
ки на английском языке ежегодно обновляются. Можно также заклю чить годовой договор с OCLC на пользование этими дисками в режи ме он-лайн (все условия и цены можно найти, например, на сайте OCLC). В табл. 2 представлены основные деления Классификации Дьюи. Эту таблицу легко найти не только в Интернете, но и во многих русскоязычных книгах и учебниках, но мы рекомендуем внимательно ознакомиться с делением 500 (это деление отражает ту особенность английской разговорной практики, что математика не относится к ес тественным наукам, и поэтому, когда англичане говорят Science, они математику и статистику их этого понятия исключают. Особых слож ностей в разговорной практике это не вызывает, однако в автоматизи рованных поисковых системах ожидать появления данных о матема тических трудах при поиске по терминам: Science, Natural Sciencies — абсолютно безнадежное дело).
Система Дьюи послужила отправной точкой для создания хорошо известной и применяемой в России Универсальной десятичной класси фикации УДК(иИС), которая была создана в 1905-1907 гг. двумя бель гийскими учеными (Полем Отле и Анри Лафонтеном) в тесном кон такте с М елвилом Дьюи. В ней использованы и развиты многие идеи и приемы, предложенные в классификации Дьюи.
Как и Десятичная классификация Дьюи, УДК получила всемирное распространение. Соответствующие классификационные таблицы пе реведены на многие языки, в том числе и на русский. УДК использует ся во множестве библиотек в огромном числе стран мира и наиболее широко — в Европе. Поэтому о ней иногда говорят как о преимуще-
ДЕСЯТИЧНАЯ КЛАССИФИКАЦИЯ ДЬЮИ |
Таблица 2 |
|
|
||
Основные деления |
Первый уровень деления |
Десять основных классов |
000 |
- |
Общий класс |
100 |
- |
Философия и психология |
200 |
- |
Религия |
300 |
- |
Общественные науки |
400 |
- |
Язык |
500 |
- |
Естественные науки |
|
|
и математика |
600 |
- |
Техника (Прикладные науки) |
700 |
|
Искусство. Изобразительное |
|
|
и декоративное искусство |
800 |
- |
Литература и риторика |
900 |
- |
География и история |
Примечание. Использован перевод 21 издания классификационных таблиц. Вместо трех цифр, например, 000, можно писать одну цифру —0. Так часто и поступают.
48 |
Глава 2 |
ственно европейской системе библиотечной классификации. Имеются машиночитаемые версии этой системы на английском языке, и, воз можно, они скоро появятся на русском языке. В Интернете имеются и таблицы УДК, которые могут включать в себя только несколько первых делений, но могут быть и более полными. В последнем случае обычно речь идет о каких-либо больших разделах УДК, например, о разделе, связанном с химией. Желающие взглянуть на эти материалы могут об ратиться, например, к:
http://www.lb.demokritos.gr/udctable.htm,
http://www.ualberta.ca/-plambeck/UDC/UG2.htm,
http://cosmu.com/mtp/udccodes.html и др.,
которые несложно отыскать в Интернете. Наличие хорошей и доступ ной русскоязычной литературы по этой системе позволяет при необ ходимости решить все поисковые проблемы, с ней связанные, посред ством обычной библиотечной работы. Эту систему хорош о знают библиографы многих, даже не очень крупных, библиотек, и получить необходимые консультации по использованию У ДК не представляет особого труда. В течение длительного периода библиотеки бывшего
СССР широко пользовались УДК, но затем она была вытеснена разра ботанной в СССР системой ББК. Тем не менее УДК до сих пор широ ко используется в нашей стране (главным образом в научно-техниче ских библиотеках). Иногда документы индексируются сразу в обеих системах: ББК и У Д К .'
Существует и третья широко распространенная в мире система биб лиотечно-библиографической классификации —Классификация Биб лиотеки Конгресса США (КБК) (.Library o f Congress Classification — LCC). Хотя она и была разработана Библиотекой конгресса, эта клас сификация используется в рабочей практике и ряда других известных библиотек. Тем не менее такого широкого распространения, как Д К Д и УДК, она не получила. В СССР и в России с этой системой сталкива лись ранее только специалисты-библиографы. Практического значе ния для простых российских пользователей она не имела.
В настоящее время развитие электронных сетей открыло россий ским пользователям доступ к каталогам почти всех библиотек мира, а Библиотека Конгресса не только самая большая библиотека в мире, но и обладательница самого полного собрание русскоязычных доку ментов вне территории СНГ. В этом собрании содержится множество ценных и полезных для российского пользователя материалов, в связи с чем знакомство с КБК стало желательным для россиян, занимающих ся поиском профессионально ориентированной информации в элект ронных сетях.
Принципы хранения и особенности хранения документов в электронных сетях 49
В КБК используется смешанная индексация: в начальных делениях используется 21 буква латинского алфавита. После этого на следующем уровне деления прибавляется еще одна буква. Вслед за этим появляют ся цифры. Объем таблиц КБК огромен и составляют 48 томов. И ДКД, и УДК являются типичными иерархическими системами, в которых не сколько (десять) основных понятий-вершин последовательно дробятся на все более мелкие и детальные понятия. КБК же представляет из себя перечислительную систему. Ее структура понятна из названия, и этим объясняется столь большой объем ее справочных таблиц.
Таблицы КБК приобрести можно. Часть из них в настоящее время доступна через знаменитый Интернет-магазин Amazon.com, имеются и C D -диски с нужными материалами. Однако все это крайне дорого и вряд ли необходимо дюке крупным российским библиотекам. Описа ние КБК также можно найти а Интернете. Первые ступени деления расположены также на сайтах разных университетов, кое-что о КБК можно найти в материалах самой Библиотеки Конгресса США, напри мер, по адресу http://lcweb.loc.gov/catdir/. В разделе FAQэтого линка вы также сможете узнать, что.библиотека пока что не планирует открытого он-лайнового доступа к своей классификационной системе. Наиболее полные данные о КБК имеются на сайте http://geography.miningco.com/ library/congress/bllchtm (это самый полный из известных нам материа лов Интернета, посвященных КБК). В нем приводятся 21 основное де ление КБК, а все буквы первого дробления на этом сайте являются ги пертекстовыми входами к дальнейшим материалам. Щелкнув по ним мышью, вы выходите на двухбуквенные таблицы, которые также явля ются гипертекстовыми входами. Далее вы попадаете на таблицы из двух букв и на указания о том, какие группы цифр, скажем от 500 до 650, относятся к тому или иному разделу КБК.
Для настоящей классификационной работы эти таблицы использо вать, конечно, нельзя, но чтобы разобраться в уже поставленных кемто классификационных индексах КБК этого вполне достаточно. Строго говоря, для сетевых поисковых задач большего и не требуется. Кстати, изменив последние звенья упомянутого выше линка, на class, htm вы сможете узнать, что можно выполнить полную классификацию по КБК с помощью Интернета, для чего следует воспользоваться протоколом Z39.50gateway. Вход по этому протоколу доступен через серверы ряда ведущих российских библиотек. Аналогичную информацию по КБК можно найти и на сайте библиотеки одного из колледжей Университе та штата Нью-Йорк (SUNY) в г. Потсдам http://www.potsdamwedu/ library/Ноте/L C /Outline.htm. Проще всего войти на эту страницу, на брав только http://www.potsdam.edu/libraiy, а затем последовательно активизировать вполне очевидные кнопки-надписи.
5 0 |
Глава 2 |
Менее подробная информация о структуре КБК может быть получена на сайте Longwood Colledge университета штата Вирджиния h ttp :// web.lwc.edu/administratoe/library/lcsum.htm. Внимательно всмотритесь в приводимый линк. Из него вы заметите, что библиотека {Library) нахо дится в директории административных подразделений университета.
Это обстоятельство характерно для многих западных университетов,
иего обязательно следует учитывать при реальной поисковой работе. Для российских пользователей особой нужды в знании КБК нет,
ипоэтому мы не будем более подробно описывать пути нахождения в Интернете сведений об этой системе. КБК используется для практи ческой работы в ряде библиотек мира, однако, в самой Библиотеке кон гресса уже в течение многих лет по просьбе американской библиотеч ной ассоциации одновременно с КБК используется и ДКД, то есть классификация Дьюи.
Три кратко описанные выше классификационные системы охваты вают огромное число библиотек мира. В то же время в практической работе некоторых библиотек используются и другие библиотечные классификационные системы. Так, например, в Славянской библиоте ке Хельсинского университета для классификации русских книг до сих пор использовалась классификационная система Санкт-Петербургско го императорского университета, восходящая своими корнями к доре волюционной классификации Синода Русской православной церкви.
ВРоссии эта система уже давно забыта. Только в последние годы начал ся перевод соответствующего фонда Славянской библиотеки на УДК.
Прежде чем переходить к объяснению того, зачем нужны сведения
обиблиотечных классификационных системах для задач сетевого по иска информации, нам необходимо кратко остановиться еще на одной классификационной системе, а именно Библиотечно-библиографичес кой классификации или ББК, которая является национальной библио
течной классификационной системой России. Эта система уж е около 30 лет применяется в качестве основной в подавляющем числе россий ских универсальных и публичных библиотек. ББК, как и КБК, постро ена на сочетании буквенных и цифровых обозначений, но в отличие от последней является системой иерархической. Система эта достаточно сложная и до известной степени политизированная. У нее имеются разные варианты — для научных библиотек, для массовых библиотек и пр. Главным препятствием для более широкого распространения этой системы является использование в ней букв кириллического ал фавита, что сразу же ограничивает возможности применения ББК за рубежом, а также перспективы сетевого ее использования. Тем не ме нее ББК обладает и определенными достоинствами. Ж елающие про