книги / Электронная информация и электронные ресурсы
..pdfТипология электронных документов
ки — системы поиска документов и квалификации интеллекту альных помощников — библиотекарей, то просто такое сравне ние детально не проведешь, можно в первом приближении считать требования ко всем видам документов примерно экви валентными.
4.2.6.Офлайновые и онлайновые (сетевые) документы
Следует заметить, что термин «электронные документы» мо жет оказаться чрезмерно расширенным при анализе практиче ского применения в библиотеках.
Как показывает практика, внутри этого понятия в настоя щее время существует заметная разница между офлайновыми документами, записанными на физически ощущаемом и пере носимом носителе, например на CD-ROM, гибких дисках, кас сетах и картриджах цифровых магнитофонов и т. п. (хранящих ся в библиотеке), и онлайновыми (сетевыми) ресурсами. Биб лиотекари вполне освоили обращение с офлайновыми ресурсами — в службах комплектования, библиографической обработки, хранения и обслуживания.
Совсем другие технологии используются в работе с сетевы ми ресурсами, доступными через локальную сеть или через Ин тернет, и предстоит еще многое сделать по развитию навыков практической работы с ними.
Заметим, кстати, что никакой особой или дополнительной виртуальности или эфемерности в сетевых ресурсах нет. В со стоянии «покоя» (хранения — просмотра — поиска) они записа ны (зафиксированы) на тех же самых носителях информации, что и локальные электронные ресурсы (жесткий диск компью тера, компактные диски, магнитные ленты и т. п.). В момент пе редачи по линиям телекоммуникаций (просмотра — выгрузки — распечатки) они также вполне физически «осязаемы»: это либо изменения амплитуды напряжения электрического сигнала, его фазы или частоты (если речь идет о передаче информации по проводам), либо изменения параметров оптического сигнала (радиочастотного сигнала) — частоты, амплитуды, сдвига фазы и т. п. при передаче по оптоволоконной линии или по радио каналам. Пока они, образно выражаясь, «на лету», их можно
151
Глава 4. Электронные документы
украсть, подсмотреть, перенаправить и вообще делать все то же самое, что и с «покоящимися» документами.
Вообще понятие «документ “на лету”» очень условное, ибо даже внутри одного компьютера непрерывно или очень часто происходит перезаписывание, передача из одного вида компь ютерной памяти в другой, передача из памяти на экран дисплея или на принтер и т. п., то есть смена носителя в компьютер но-информационных технологиях происходит часто.
Сетевые документы, будучи однажды выложенными на сер вер, после регистрации и индексирования на больших поиско вых машинах становятся в полном смысле слова «обществен ным достоянием». Вы предоставляете их в пользование, но не контролируете посещения пользователями, пришедшими с дру гих сайтов.
4.2.7. Вицы электронных документов по общественному назначению
Сколько в мире существует обычных и электронных доку ментов и насколько ежегодно их количество пополняется? Не простой вопрос, поскольку нужно разобраться в том, что подле жит учету.
Как отмечается в уже упоминавшемся последнем издании Национального доклада «Информационные ресурсы России» за 2001 г.: «Основная часть информационных ресурсов (по ряду оценок не менее 90%), создающихся на предприятиях, в орга низациях и органах управления, используется исключительно или в основном для обеспечения их собственной деятельности. Информационные ресурсы, создаваемые для предоставления информационных продуктов и услуг неопределенному заранее множеству потребителей, условно можно назвать ресурсами “массового” использования. Они составляют не более 5% обще го количества информационных массивов, фондов, баз данных и т. д.»
Эти же оценки подтверждаются и другими источниками, на пример, из доклада г-жи Клэр Харт (Clare Hart), президента компании «Фактива» (Factiva) на конференции O NLINE Information, Лондон, 2005 г. (табл. 15).
152
Типология электронных документов
Таблица 15
Годовой объем информации, содержащейся в различного вида документах
Вид информации |
Годовой объем производства Тбайтов |
Газеты |
25 |
Журналы |
10 |
Книги |
2 |
Внутриофисная информация |
195 |
и технологическая переписка |
|
Из данной таблицы видно, что значительная, подавляющая часть производимой в мире документации не может быть строго учтена или подсчитана. Мы займемся тем, что известно стати стике. Полезно знать расход бумаги, ибо значительная ее часть идет на изготовление документов. В мире в 2000 г. израсходова но 315 млн тонн бумаги (в том числе в США 108 млн тонн).
В мировом каталоге OCLC 67 млн наименований, что при среднем объеме 300 страниц на титул дает более 20 млрд печат ных страниц! Несмотря на то что в целом объемы книгопечата ния растут уверенно (в 10 раз за сто лет), книга — это заметная, но отнюдь не решающая часть огромного бизнеса. По объему потребления бумаги и фиксируемой информации книга не яв ляется лидером (по разным оценкам в 2005 г. в мире было изда но 1,7—1,9 млн названий книг).
Что касается сетевых документов, то ситуация столь же не ясная. Известно, что в сети около 30 млн сайтов и что крупней шие поисковые машины регистрируют от сотен миллионов до 4 млрд единиц того, что они называют сетевыми страницами. Если согласиться (или предположить), что в данном случае под сетевыми страницами понимаются отдельные, тематически связанные и, быть может, составные сетевые документы, то это и есть оценка их количества, по крайней мере нижняя граница. Профессиональные источники указывают, что регистрацию проходят не более 18% всех имеющихся в сети документов, ос тальные невидимы для большинства пользователей. Тогда верх
153
Глава 4. Электронные документы
няя граница оценок составляет порядка 20 млрд отдельных сете вых документов.
Достаточно произвольная классификация документов по их общественному назначению могла бы выглядеть следующим образом:
•правовые и официальные;
•технологические и производственные;
•финансовые и расчетные;
•СМИ (новости, ТВ);
•образовательные;
•развлекательные;
•художественная и научно-техническая информация;
•объявления;
•реклама, пропаганда;
•системы автоматизации экспериментов, проектных работ, автоматизации производства;
•другое.
4.3. Свойства документов
Рассмотрим некоторые пространственно-временные и иные свойства документов, имеющие непосредственное отношение к библиотечному делу, в том числе:
•размерность,
•рукотворность,
•этапы жизненного цикла.
Эти свойства во многом определяют доступность и область применения документа.
4.3.1. Размерность документа
Прежде всего несколько слов о размерности документа, ко торая имеет самое непосредственное отношение к раскрытию сути определения. Поняв размерность документа, можно будет
154
Свойства документов
уточнить границы применимости имеющихся определений и типологию. При этом поп. размерностью правильнее понимать не
столько форму документа, сколько его содержательную часть, иными словами, количество степеней свободы. Тем, кто забыл или не знал о степенях свободы, напомним, что в физике двухатом ная молекула имеет три степени свободы, связанные с переме щением ее центра масс в пространстве, еще одну, вибрацион ную, связанную со взаимным сближением, — удалением атомов в молекуле, и еще одну — вращательную (ротационную), всего в сумме пять степеней свободы.
Возьмем для примера какую-то надпись, высеченную в кам не или выгравированную. По форме она трехмерна, то есть име ет длину, ширину и глубину. Однако по содержанию она кажет ся двухмерной, ибо состоит их плоскостных символов — букв и цифр. Ее легко перевести в одномерный массив, если символы сопоставить с цифрами, использовав для этого, например, таб лицу кодировок ASCII. Оригиналы традиционных документов различаются размерностью (одномерные — как текст телеграм мы, двухмерные — как изображение на плоскости, трехмерные (объемные) — как скульптура). Одномерный (линейный) доку мент (телеграмма, записанная азбукой Морзе) или двухмерный документ (текст, черно-белое изображение) легко вписываются в житейское обыденное сознание, воспринимаются легко. Чаще всего при слове «документ» мы представляем себе текст. Как вы видели из анализа многих определений, этим может и ограни читься. В то же время если обратиться к книге, то ясно, что и текст, и иллюстрации к тексту составляют единое целое. Если это принимается, то и отдельно взятые изображения —литогра фия, рисунок, живописное полотно — также являются доку ментами. При небольшом усилии воли и воображении легко согласиться с тем, что возможна трехмерная размерность доку мента. Например, профессор Ю. Н. Столяров относит к доку ментам и трехмерную скульптуру. Однако такое расширение необходимо как-то остановить, ибо вслед за скульптурой нужно будет к документам относить и архитектуру, что вызывает ин туитивный протест.
Тем не менее в голове укладывается не так просто, что по форме двухмерный документ, например листы партитуры орке
155
Глава 4. Электронные документы
стровой пьесы, по сути своей и по содержанию являются много мерной системой, со многими степенями свободы, в данном случае — партиями отдельных инструментов. Столь же много мерной системой можно считать и живописное полотно, каж дая точка которого, помимо пространственных координат на плоскости, имеет и цветовую гамму. Еще большей размерно стью обладают переменные во времени документы, например видеодокументы, мультимедийные системы, в которых в каче стве дополнительной переменной появляется время.
Все это имеет значение при организации записи, то есть при составлении документа. Многомерные оригиналы требуют не сравненно больших объемов машинной памяти и мощностей машинной обработки, чем одномерные или двухмерные. Дело в том, что бинарная машиночитаемая запись имеет невысокую размерность, поэтому необходима конверсия многомерных до кументов в одномерные. Там, где художник или композитор су мел создать произведения, пользуясь очень ограниченным на бором исходных средств (набор нот или набор красок), машине приходится компенсировать недостаток выразительных средств множественностью их описания. Как результат — видовой со став электронных документов в принципе намного более одно роден по сравнению с оригиналами. В любом случае физиче ски — это машиночитаемые файлы, которые лиш ь различаются кодировкой, то есть приказом о том, как понимать и распозна вать последующие цифровые бинарные данные (текст, изобра жения, аудио, видео и т. д.).
Итак, порядок размерности не может как-то жестко соотно ситься с понятием «документ». Мы показали, что документ мо жет быть многомерным и что при его оцифровке размерность снижается. Возможным ограничивающим фактором в понятии «документ» является не размерность как таковая, а отсутствие у документа какой-либо иной, кроме информативной, функции. Тогда скульптура — действительно документ, а архитектура — нет, ибо несет утилитарную функцию, помимо информативной. Набор конструкторской, технологической и нормативной доку ментации по созданию космического аппарата является набо ром документов, а сам аппарат документом не является и т. п.
156
Свойства документов
Структурная схема микрочипа, состоящего из сотен миллионов элементов, — это документ, а сам микрочип документом не яв ляется.
4.3.2.Рукотворность документа
Нужно еще раз подчеркнуть тезис о рукотворном и созна тельном подходе к составлению документа. Привязка докумен та к человеческой деятельности (творческой, художественной, информационно-справочной, нормативной, руководящей и т. д.) нам представляется принципиальной и важнейшей для понимания сути трактовки.
Может ли документ быть создан природой? Нет, это обяза тельно должен быть артефакт, то есть искусственно созданный объект. Однако же описание природного феномена — будь это научное описание, художественный текст, живописная или му зыкальная рефлексия, безусловно является рукотворно создан ным документом. Пример: шум моря — не документ; а вот за пись шума моря (неважно какая — научная: регистраций ам плитуды и периода волн, текстовая, описательная: эпическая или поэтическая, нотная, аудиомагнитофонная, видеоклиповая, кинематографическая, живописная и т. д.) за конкретный промежуток времени (за последние дни, часы или века) — это документ. Точно также само по себе концертное исполнение — не документ; а вот запись концерта (либо отдельного произве дения из программы концерта, отрывка музыкального произве дения или отдельной инструментальной партии) — это доку мент. След динозавра сам по себе — не документ. Но его фото графия, научное описание и т. п. — конечно, является примером документа.
Наличие творца — создателя документа: автора, исполните ля или коллективного лица, отвечающего за создание, — это очень важный момент, отражаемый в специальном поле (поле creator) во всех современных системах формирования метадан ных, будь это Dublin Core, METS или ГОСТ 7.1—2003, что отве чает потребности знать интеллектуально ответственное лицо или коллектив.
157
Глава 4. Электронные документы
Еще один важнейший аспект рукотворности документа —• проблема возникновения и защиты авторского права. Авторское право возникает в момент создания (исполнения) произведения, в том числе и документа. Оно не нуждается в регистрации или публикации, это имманентное свойство документа и это еще один аспект неразрывной связи документа с его творцом.
Поделимся нашими наблюдениями о сравнительной роли пользователя при работе с печатными и сетевыми документами. Традиционно библиотеки отводят посетителю только функцию читателя (либо переписчика фрагментов текстов вручную), все остальное делает профессиональный библиотекарь — даже ксе рокопирование российские библиотекари берут на себя. В зару бежных библиотеках роль посетителя значительно шире — как за счет большей доли полок открытого доступа в читальных залах, так и за счет расширенного самообслуживания, в том числе и при копировании библиотечных документов. С сетевы ми документами все иначе: пользователь, выгрузив себе на ком пьютер копию электронного сетевого документа, может легко вторгаться в текст, вносить поправки, дополнения, структури ровать по-своему, делать выдержки и подборки и т. д. Столь же активной предполагается роль автора при каталогизации и со ставлении поискового образа сетевых документов, все новые системы (Dublin Core, METS, GILS) сознательно избегают лю бых сложностей, требующих профессиональных знаний или специальной подготовки, — ведь сетевой пользователь чаше всего работает в одиночку и рядом с ним нет советчика — биб лиотекаря. В этом же ряду стоят идеи самоархивации, формиро вания электронного архива самим автором, и где-то близко — идея формирования открытых университетских архивов. По этому привязанность сетевого документа к пользователю очень заметна.
Если говорить о практической стороне создания электрон ных документов, то пока что все электронные документы созда ются при помощи компьютера: набором на клавиатуре, работой со сканером, выгрузкой из Интернета, перезаписью с дискеты и т. п. Системы непосредственного ввода от человека — с распо знаванием рукописного текста или с распознаванием и конвер
158
Свойства документов
сией голоса — пока еще не очень совершенны, надежны и тре буют очень больших вычислительных мощностей.
4.3.3.Жизненный цикл документа
Документ создается людьми и для людей, и его существова ние ограничено во времени. Ключевые этапы жизненного цик ла документа — создание, восприятие и гибель. В главе 2 мы уже упоминали о наличии так называемого первого уровня инфор мации, связанного с передачей наследственных признаков от родителей потомству. Неявно при этом подразумевалось естест венное обновление всех объектов живой природы — растений, одноклеточных и многоклеточных организмов. Другими слова ми, обновление живых объектов означает неизбежность их ги бели. Это великий закон живой природы — взаимно связанные обновление и гибель. В предыдущем разделе, посвященном рас смотрению свойств документов, мы отметили его неразрывную связь с человеком, с человеческой деятельностью. Из этого можно бы предположить (доказывать мы не беремся) естествен ность гибели документа или, по крайней мере, подавляющего количества созданных данной эпохой документов (глупо соби рать все подряд). Помпеи интересны, потому что они единич ны. Тащить сквозь века мусор ежедневного проживания бес смысленно. Надо все оставить природе, не пытаться ее перебо роть, искусственно придавая ложное значение простым вещам.
Пример массовой чистки документов — смена политическо го режима в какой-то стране: из-за выбрасывания искусственно накопленных политических книг никакой катастрофы не про изошло и не происходило ранее. И для нашего времени — все эти пособия по бизнесу, учебники маркетинга или детективные измышления, как правило, малоценны, они характеризуют эпо ху и должны уйти вместе с ней. Библиотеки — не кладбища и не обязаны хранить все, за исключением депозитариев, функции которых часто предписываются национальным библиотекам.
Для библиотекаря одной из важнейших задач является се лекция (отбор), и не только при комплектовании, но и при ре визии фонда для оптимизации хранения.
159
Глава 4. Электронные документы
Подобно ископаемым остаткам, скелетам мамонтов и брон тозавров, отпечаткам рыб и моллюсков, мумифицированным останкам грибных и растительных спор, к нам доходят сквозь века и ценнейшие свидетельства былых времен — редкие доку менты. Гибель, исчезновение или безвозвратная утеря докумен та — это типичный процесс, и его предотвращение, обеспече ние сохранности составляет одну из ключевых задач библиоте карей. Процент сохранившихся документов очень невелик, и это повышает их ценность как исторических, научных и куль турных памятников. Гибель документов общего плана — житей ских, деловых, производственных — неизбежный и даже в чем-то позитивный процесс. Берестяные грамоты, клинопис ные таблички, иероглифические надписи в египетских гробни цах и другие античные документы так важны именно потому, что их сохранилось немного (см. главу 3).
Если от каждой эпохи сохранилось бы все без исключения или даже какая-то существенная часть произведенных данной эпохой документов, мир задохнулся бы. Можно сравнить про цесс естественной утраты документов с апоптозом — отмирани ем в здоровом организме клеток по мере их старения. Без апоп тоза развитие клеток становится неуправляемым и развивается рак. С этой точки зрения попытки некоторых современных биб лиотек «сохранить все документы эпохи» свидетельствуют об излишестве, абсолютном недоверии к технике и, по сути, тащат библиотеку по пути не прогресса, а регресса.
Конечно, каждая эпоха создает и воистину вечные, бесцен ные документальные шедевры, утрата которых обеднила бы на шу жизнь. Умение предвидеть будущее, понять историческую значимость артефакта и проявить волю в обеспечении сохран ности ценных документов — величайшая заслуга библиотеч ных, музейных и архивных работников. Они пытаются по мере сил противостоять неизбежному, и это предельно важный с точ ки зрения человечества в целом процесс.
Для довольно многочисленного класса научно-технической документации оригинальный документ как основа ее информа ционной деятельности может оказаться ее началом и после ка кого-то жизненного цикла — концом. В результате информаци онной деятельности (в широком смысле слова) документы соз даются, компонуются, разыскиваются и т. д. Важно заметить,
160