книги / Электронная информация и электронные ресурсы
..pdfТипология электронных документов
зившая многие общественные места и перегрузившая ненужной информацией почтовые ящики электронной почты.
Несмотря на все разговоры о безбумажном делопроизводст ве, которые ведутся с конца 1960-х гг., потребление бумаги в офисах с начала 1980-х гг. и до наших дней удвоилось. Бумага изобретена более 2000 лет тому назад, но и до сих пор некото рые параметры писчей бумаги остаются технологически непре взойденными. Суть дела в структуре бумаги, волокна которой многократно преобразуют падающий свет таким образом, что создается эффект равномерного отражения света во всех на правлениях. Этот эффект называется слабой оптической лока лизацией, и он обеспечивает превосходную белизну бумаги.
Как видно из сравнения, выполненного компанией «Ксе рокс» (Xerox) (рис. 24), несмотря на бурный рост электронного документооборота, печатное делопроизводство также растет в абсолютных цифрах, хотя и медленнее, чем электронное. Так что говорить о вытеснении или замене одной технологии другой пока не приходится.
Еще примечательнее выглядит ситуация с обновлением се тевых страниц: по данным журнала Portals (рис. 25), из компа ний, имеющих свой веб-сайт и располагающих автоматизиро ванной системой актуализации и пополнения его содержания, 61% делают это фактически вручную!
—» —i бумажные документы
■ электронные документы
Рис. 24. Сравнительный рост документооборота печатных и
электронных документов в офисах за 10лет (данные компании Xerox)
141
Глава 4. Электронные документы
другие
| файлы p d f цифр, изображ. печат. док-тов
■ ■ ■ э л е к т р о н , док-ты
данные из БД бумага
0% |
5% |
10% |
15% |
20% |
25% |
Рис. 25. Основные форматы, в которых ведутся важные деловые записи (по данным журанла Portals, v. 4, issue 28, Aug/Sept. 2004)
В целом пока наблюдается скорее сотрудничество, а не со перничество печатных и электронных документов. Например, Интернет заметно помогает продвижению на рынок печатных книг: за рубежом до 40%, у нас до 2% книг продается через Интернет. Для библиотеки и библиотекаря это означает обеспе чение готовности работать и с теми, и с другими видами доку ментов.
4.2.3.Основные типы электронных документов
Рассмотрим сложившуюся сегодня типологию электронных документов.
1. Полнотекстовые документы с широкими возможностями форматирования текста в произвольном по размеру и по типу шрифте, включения каких-то дополнительных компонентов (иллюстрации, звук, видео и т. д.), возможностями поиска по всему тексту, наличием гиперсвязей (отсылок к сетевым доку ментам), возможностью автоматического агрегирования, то есть составления персонально ориентированных подборок. Особое место в этом ряду занимают полнотекстовые электронные жур налы, которые незаметно, понемногу идут на смену традицион ным печатным журналам. Основа нелинейности электронных материалов — так называемые гиперсвязи (другие названия —
142
Типология электронных документов
гиперотсылки или гиперссылки). Сетевые ресурсы, как прави ло, снабжены гипертекстовыми ссылками, но вы вольны их ис пользовать или не использовать по своему усмотрению и жела нию. Огромное значение имеет возможность быстро перейти от ссылки на цитируемую работу к ее полному тексту. Такого рода системы уже имеются, например CrossRef, о которой мы скажем подробнее в других главах настоящей книги.
2. Таблицы с расширенными функциями обработки данных и демонстрации результатов (спрэдшиты). Если даже говорить о сравнительно простых программах, таких, как Microsoft Excel, то имеется возможность для однажды введенных данных прово дить довольно широкий функциональный набор статистиче ских, арифметических и алгебраических действий, изменять ко нечный результат автоматически с изменением входных дан ных, а итоговый продукт представлять самым разнообразным способом — таблицами, линейными или столбчатыми много мерными и многоцветными графиками, гистограммами, коль цевыми и круговыми диаграммами и т. п. Особую роль в техно логии цифровых документов играют встроенные в специальные программы вспомогательные таблицы кодировок и таблицы со ответствия. Пожалуй, главнейшая из них — Таблица Американ ского стандарта кодирования обмена информацией (American Standard Codes of Information Interchange, ASCII), которая уста навливает соответствие буквенных символов и цифр. Для рос сийских библиотекарей и русскоязычных пользователей очень важными являются также таблицы соответствия (кодировок) кириллических знаков, которые работают в драйверах клавиа туры, монитора, передачи данных через Интернет и т. д.
3. Различные базы данных — фактографические, адресные, библиографические, реферативные, полнотекстовые с возмож ностями поиска по многим точкам доступа (введенным полям или областям) и по всему тексту или содержанию. В некоторых профессиональных публикациях слова «база данных» понима ются достаточно широко. Например, не структурированную формально коллекцию полнотекстовых документов с возмож ностями поиска также называют «база данных». Формальное определение базы данных дано в ГОСТ 20886—85 «Организация данных в системах обработки данных. Термины и определения» и повторено в ГОСТ 7.70—96 «Описание баз данных и машино
143
Глава 4. Электронные документы
читаемых информационных массивов. Состав и обозначение характеристик»: «База данных — совокупность данных, органи зованных по определенным правилам, предусматривающим об щие принципы описания, хранения данных и манипулирова ния данными, независимо от прикладных программ». Там же «банк данных» определяется как «автоматизированная инфор мационная система, состоящая из одной или нескольких баз данных и системы хранения, обработки и поиска». Эти опреде ления не раскрывают основных особенностей баз данных. Мы предлагаем несколько иное: «База данных (БД) — тематически собранный и структурированный массив информации, состоящий из большого набора однотипных элементов». Число элементов («записей», в английской литературе entries или records) — от сотен до нескольких миллионов, в принципе объем БД может быть сколь угодно большим. Каждый из элементов БД имеет одинаковую структуру (состоит из одинакового набора полей или областей). Число полей — от 2 до нескольких сотен, в зави симости от характера использования базы данных. Заполнение некоторых полей может быть обязательным, а некоторых — фа культативным; поля могут делиться на подполя. Размер отдель ной записи может быть ограничен каким-то количеством зна ков или слов. Основное свойство БД — возможность проводить поиск информации и другие действия по любым выбранным полям или по их произвольной комбинации, а также по некото рым заранее определенным подполям (в английской литературе их называют иногда «точки доступа» — access points) во всем массиве базы данных. Если сравнить с поиском данных, зане сенных в таблицы, то есть на двумерном или многомерном про странстве, то наличие полей в базе данных позволяет проводить поиск необходимой информации намного точнее и быстрее. Можно представить себе некие образы, в которых поиск данных идет в искусственно суженной и заранее заданной области па раметров, «в коридоре», а не на «широкой поляне». Конечно, для нас существенно важными и интересными типами баз дан ных являются библиотечные электронные каталоги различного рода и библиографические указатели.
4. Электронные рисунки и изображения с возможностями об работки файлов по размерам, цвету, пространственным пара метрам изображения и построения многомерных изображений.
144
Типология электронных документов
По сути, в этих документах к координате пикселя (точки изо бражения) «привязываются» параметры цветности. В эту же группу можно включить и цифровые карты, и картографиче скую информацию, в которой оказывается привязанной к опре деленным координатам («к месту») информация не только гео графического характера, но и политическая, экономическая, культурологическая и т. д.
5.Аудиозаписи и музыка, видео, компьютерная анимация. Бы стро растущим направлением в производстве такого рода элек тронных документов является цифровое телевидение и цифро вые средства массовой информации. Характерный пример — перевод в цифровой формат всего архива новостей известной телевизионной компании CNN. Столь же быстро выросшим бизнесом оказалась практика заимствования из Интернета по любившихся классических и популярных мелодий, мелодиче ских образцов звонка на мобильном телефоне, картинок, по здравительных открыток и т. п. Выгрузка музыкальных произ ведений из сети становится в последние годы крупнейшим бизнесом. Например, лондонский магазин iTunes предлагает своим посетителям выбор из миллиона песен, из них некоторые доступны исключительно через Интернет. При стоимости од ной выгрузки 79 центов, магазин продает в месяц более 200 тыс. произведений. Конкурирующей (или дополняющей) является система iPod, по сути, портативное карманное устройство с объемом памяти 40 Гб, обеспечивающим запись более 10 тыс. песен. iPod превращается в США и Европе в некоторый соци альный инструмент, поклонники которого создают специаль ные клубы (MP3Jing) по коллективному прослушиванию особо популярных мелодий.
6.Компьютерные программы, в том числе программы и управляющие команды непосредственного исполнения.
7.Вирусы как особый тип компьютерных программ, способ ный к самостоятельному размножению и продвижению по Сети.
8.Мультимедийные материалы (совмещение разных видов ресурсов, например текста и звука; текста, изображения, звука; текста и анимации и т. д.). Выделение в особую группу мульти медийных материалов — это сегодня, возможно, и лишнее, дань прошлой ограниченности печатных документов и восхищение богатейшими иллюстративными возможностями данного типа
145
Глава 4. Электронные документы
электронных документов. Ясно, что вышеупомянутые цифро вые коллекции СМИ фактически и есть мультимедиа.
9. Агрегированные подборки — новый вид электронных пуб ликаций, которые пока изучены недостаточно. Ф актически, это особый вид персональных тематических публикаций, подборка из электронных журналов и других электронных ресурсов, со ставленная по вашему вкусу и потребностям, которая рассыла ется на ваш адрес. Эти подборки ничем не отличаются по содер жанию от полнотекстовых документов, с которых мы начинали классификацию документов в данном разделе, и от публикаций новостных СМИ. Для нас существенным классификационным признаком является автоматизированный характер формирова ния этой группы документов — «на лету».
4.2.4.Виды электронных документов по степени доступности
Документ создан людьми и адресован в конечном счете людям, поэтому обеспечение доступности документа является ключевым в его использовании. При этом в понятие «доступность докумен та» вкладывается достаточно широкий смысл, это и видимость документа (сведения о его существовании), и досягаемость, и ма териальная возможность его получения. Это может быть:
•навигационная доступность (важно знать, где документ находится);
•техническая доступность (как организовать его доставку пользователю); особое внимание в нашем контексте име ет доступность электронных документов через Интернет и по мобильным телефонам (смартфонам и т. п.);
•платность (которая может зависеть от категорий пользо вателей), наличие документа в коммерческой сети; неко торые виды документов — технические отчеты или труды конференций, например, попросту не продаются (эти до кументы входят в понятие «серая литература»);
•технологическая доступность (имеется в виду совмести мость с теми средствами раскрытия документа, которые у вас имеются);
•режимная или цензурная доступность и т. д.
146
Типология электронных документов
К практической доступности относится и широта использо вания документа (от уникального и особо ценного к массовому, общедоступному).
Одна из возможных классификаций по организационной доступности документов:
•бесплатные документы;
•условно бесплатные;
•платные документы;
•закрытые для публичного доступа документы, в том числе закрытая и/или конфиденциальная информация (режим но-секретная);
•коммерческая, промышленная и технологическая инфор мация, финансовые и налоговые сведения;
•документы, касающиеся частной жизни отдельных лиц.
Классификация информации, требующей своей защиты, приведена в табл. 14.
|
Таблица 14 |
Классификация защищаемой информации |
|
Виды информации конфиден |
Нормативные акты |
циального характера |
|
Персональные данные |
Федеральный закон «Об информации, инфор |
|
мационных технологиях и о защите информа |
|
ции», Федеральный закон «О персональных |
|
данных» (2006) |
Тайна усыновления |
Семейный кодекс Российской Федерации |
Личная и семейная тайна |
Гражданский кодекс Российской Федерации |
Тайна следствия и судо |
Уголовно-процессуальный кодекс Российской |
производства |
Федерации |
Служебная тайна |
Гражданский кодекс Российской Федерации |
Служебная информация |
Постановление Правительства Российской Ф е |
ограниченного распро |
дерации № 1233 от 3 ноября 1994 г. |
странения |
|
Тайна связи |
Федеральный закон «О связи» |
Служебная информация |
Федеральный закон «О рынке ценных бумаг» |
147
Глава 4. Электронные документы
|
Окончание табл. 14 |
Геологическая информа |
Закон «0 недрах» |
ция о недрах |
|
Врачебная тайна |
Основы законодательства Российской Федера |
|
ции «Об охране здоровья граждан». Закон Рос |
|
сийской Федерации « 0 трансплантации органов |
|
и (или) тканей человека» |
Нотариальная тайна |
Основы законодательства Российской Федера |
|
ции « 0 нотариате» |
Адвокатская тайна |
Федеральный закон «Об адвокатской деятель |
|
ности и адвокатуре в Российской Федерации» |
Коммерческая тайна |
Гражданский кодекс Российской Федерации |
Банковская тайна |
Гражданский кодекс Российской Федерации, |
|
Закон « 0 банках и банковской деятельности» |
Тайна страхования |
Гражданский кодекс Российской Федерации |
«Ноу-хау» |
Указ президента России «Об утверждении пе |
|
речня сведений конфиденциального характера» |
|
от 6 марта 1997 г. № 188 |
Государственная тайна |
Федеральный закон « 0 государственной тайне». |
|
Уголовный кодекс Российской Федерации |
До настоящего времени существуют различия в российском и международном толковании понятий «публичная информа ция» и «конфиденциальная информация». Позиция развитых демократических сообществ состоит в том, что должны быть за щита частной жизни индивидуально взятого гражданина и мак симальная открытость правительственных органов, поскольку они созданы и действуют на средства налогоплательщиков.
Предвыборный девиз кандидата в американский конгресс от 8-го округа штата Мэриленд г-на Стивена Бассета (Steven Basset) «Прозрачное правительство, защищенные граждане» очень точно отражает суть дела. В России, скорее, все наоборот; и нет никакой действенной защиты от несанкционированного распространения конфиденциальных персональных сведений (налоговых, милицейских, муниципальных и т. д.), во всяком случае пока новые законы еще не заработали.
Нужно особо сказать об органичной связи понятия «доступ ность документа» с библиотечным делом. Именно библиотеки
148
Типология электронных документов
призваны снимать все и всякие ограничения на доступность до кумента, в этом ключевой смысл их деятельности, и это записа но в Законе «О библиотечном деле». Поскольку одна из главных целей изложения в данной книге — электронные библиотеки, то мы подробнее остановимся на документах массового пользо вания (хотя уникальные могут быть намного дороже и ценнее).
Библиотеки предоставляют доступ:
•к особо ценным, редким изданиям, существующим в еди ничных копиях или в единственном экземпляре;
•к изданиям, уже выпущенным в свет, но распроданным или разошедшимся иным образом в настоящее время и поэтому пока недоступным;
•к широкому спектру изданий, которые неразумно или слишком дорого приобретать в собственность «на один раз»;
•к изданиям, рекомендованным для учебных курсов или для изучения конкретной специальности;
•к справочным и энциклопедическим изданиям, необхо димым для получения ответа на неожиданно возникший вопрос;
•к изданиям, которые вам хотелось бы прочитать в группе, а не в одиночку или обсудить с коллегами;
•во всех других случаях.
Через библиотеки осуществляется мультиплицирование (умножение эффекта) от изданного тиража. Фактически речь может идти о проведении испытаний на ресурс типографской прочности издания и о поддержании этого ресурса силами спе циалистов по реставрации. Показатель книговыдачи в год в ГПНТБ России составляет примерно половину от имеющегося фонда (книговыдача составляет около 4 млн при 8 млн фонда) и в 40—50 раз превосходит объем годового комплектования.
Итак, благодаря доступности мультиплицирование состав ляет несколько десятков раз и от года к году растет, накаплива ется. Для точных расчетов нужно учитывать спрашиваемость как функцию времени, прошедшего после поступления книги в библиотеку, и проводить интегрирование по соответствующему интервалу времени.
149
Глава 4. Электронные документы
Что касается роли библиотек и библиотечных работников в обеспечении доступности сетевых документов, подробнее все аспекты будут рассмотрены далее.
4.2.5. Классификация документов по видам необходимой интеллектуальной и технической поддержки
Если рассматривать технологию библиотечного обслужива ния, то все типы документов так или иначе требуют различные виды технической и интеллектуальной поддержки.
Для работы с печатными или рукописными документами нужны:
1)справочный аппарат;
2)профессиональный библиотечный коллектив;
3)система доступа (открытый доступ, отдел обслуживания для закрытого или компактного хранения, МБА для удаленных материалов);
4)пригодные рабочие места для чтения документов (читаль ные залы).
Для работы с микроформами, аудио- и видеоматериалами, документами на компактных или гибких дисках нужны:
1)справочный аппарат;
2)профессиональный библиотечный коллектив;
3)система доступа (устройство для считывания, прослуши вания, просмотра и т. п.);
4)пригодные рабочие места.
Для работы с сетевыми электронными документами нужны:
1)справочный аппарат;
2)профессиональный библиотечный коллектив;
3)система доступа (телекоммуникационные серверы, И н тернет, устройство для считывания, прослушивания, просмотра
ит. п.);
4)хорошие и надежные каналы связи;
5)пригодные рабочие места.
Как видно, в наибольшей технической поддержке нуждают ся сетевые документы; что касается интеллектуальной поддерж
150