- •Блюменау Д. И.
- •ВВЕДЕНИЕ
- •Глава 1. СВЕРТЫВАНИЕ ИНФОРМАЦИИ КАК ОДНО ИЗ УСЛОВИЙ ЧЕЛОВЕЧЕСКОГО ОБЩЕНИЯ
- •1.1.0 СУЩНОСТИ «СВЕРТЫВАНИЯ»
- •1.2. ИНФОРМАЦИОННОЕ СВЕРТЫВАНИЕ
- •1.3. СВЕРТЫВАНИЕ В СФЕРЕ ИНФОРМАЦИОННОГО ОБСЛУЖИВАНИЯ
- •2.1. ИНДЕКСИРОВАНИЕ
- •2.1.1. Индексирование — его назначение
- •2.1.2. Индексирование на основе «традиционных» ИПЯ
- •2.1.2.1. УДК как представитель ИПЯ иерархического типа
- •2.1.2.2. ИПЯ алфавитно-предметных рубрик
- •2.1.2.3. ИПЯ библиографических описаний
- •2.1.3. Режимы индексирования
- •2.1.4. Координатное индексирование на основе дескрипторных языков
- •2.1.4.1. Избыточное индексирование
- •2.1.4.2. Критерии выдачи и стратегия поиска по запросу
- •2.1.6. Автоматизация процесса индексирования
- •2.1.6.1. Индексирование в АИПС «Пусто — Непусто»
- •2.1.6.2. Индексирование в ИПС «Артефакт»
- •2.1.6.3. Индексирование в поисковой машине «Яндекс»
- •2.2. БИБЛИОГРАФИЧЕСКОЕ ОПИСАНИЕ
- •2.3. АННОТИРОВАНИЕ И РЕФЕРИРОВАНИЕ
- •2.3.1. Функции аннотаций и рефератов
- •2.3.2. Способы раскрытия содержания текстов
- •Пример аннотативной фразы:
- •Пример реферативной фразы:
- •Пример типичной аннотации:
- •2.3.4. Виды аннотаций и рефератов
- •2.4. КОНСПЕКТИРОВАНИЕ КАК РАЗНОВИДНОСТЬ РЕФЕРИРОВАНИЯ
- •2.5.1. Генезис и сущность концептографического обслуживания
- •2.5.2. Виды концептографического обслуживания
- •2.5.3. Обзорно-аналитическая деятельность
- •2.5.3.1. Виды обзоров
- •2.5.3.2. Функции обзоров в системе научных коммуникаций
- •2.5.4. Основы методики написания обзоров
- •Глава 3. НЕКОТОРЫЕ ХАРАКТЕРИСТИКИ ТЕКСТА С ТОЧКИ ЗРЕНИЯ ЕГО СВЕРТЫВАНИЯ
- •3.1. ТЕКСТ И ЕГО ОБЩАЯ ХАРАКТЕРИСТИКА
- •3.2. СТРУКТУРЫ ТЕКСТА
- •3.2.1. Синтаксическая структура текста
- •3.2.1.1. О связности текста
- •3.2.1.2. Средства внутритекстовой связности
- •Разновидности коннекторов
- •3.2.2. Коммуникативная структура текста
- •Пример
- •Пример
- •Пример
- •3.2.3. Аспектная структура текста
- •3.2.4. Семантическая структура текста
- •3.2.5. Информативная структура текста
- •4.1. ВИДЫ И СРЕДСТВА ФОРМАЛИЗОВАННОГО СВЕРТЫВАНИЯ
- •4.2. ФРАГМЕНТИРОВАНИЕ КАК ОДНО ИЗ НАПРАВЛЕНИЙ ИНФОРМАТИВНОГО СВЕРТЫВАНИЯ
- •4.2.1 • Подходы к реализации идеи фрагментирования
- •4.2.1.1. Семантический подход к проблеме фрагментирования
- •4.2.1.2. Синтаксический подход к проблеме фрагментирования
- •5.1. КВАЗИХРЕСТОМАТИЯ КАК ПОСОБИЕ ДЛЯ САМООБРАЗОВАНИЯ
- •5.1.1. О познавательной профессиональной потребности
- •5.1.2. Лексический аппарат формирования квазихрестоматии
- •5.2. ЭТАПЫ СОЗДАНИЯ КВАЗИХРЕСТОМАТИИ
- •5.2.1 • Формирование запроса и составление учебной программы (оглавления)
- •5.2.2. Составление поискового предписания и процедура поиска
- •5.2.3. Формирование и оформление хрестоматии
- •5.2.4. Пример подготовки квазихрестоматии
- •(AлБ)v[(BvИvKvЛ)л(ГvДvE)]v(BлЖ)v(BлЗ)
- •Глава 6. РАЗВИТИЕ ИНДИКАТОРНОГО МЕТОДА КОМПЬЮТЕРНОГО СВЕРТЫВАНИЯ ТЕКСТОВ
- •6.1. СРЕДСТВА И МЕТОДЫ ФОРМАЛИЗОВАННОГО СВЕРТЫВАНИЯ
- •6.2. ТЕХНОЛОГИЧЕСКАЯ ДОКУМЕНТАЦИЯ, ОБЕСПЕЧИВАЮЩАЯ ИЗБИРАТЕЛЬНОЕ СВЕРТЫВАНИЕ ТЕКСТОВ
- •6.3. ЭТАПЫ ФОРМИРОВАНИЯ ВТОРИЧНЫХ ДОКУМЕНТОВ
- •6.3.1. Формирование аннотаций и рефератов
- •6.3.2. Формирование минимальных релевантных фрагментов
- •6.3.3. Формирование квазиконспекта
- •РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
- •Вопросы для самопроверки
- •ПОСЛЕСЛОВИЕ
- •ОГЛАВЛЕНИЕ
Глава 1. СВЕРТЫВАНИЕ ИНФОРМАЦИИ КАК ОДНО ИЗ УСЛОВИЙ ЧЕЛОВЕЧЕСКОГО ОБЩЕНИЯ
Под свертыванием (развертыванием) информации понимается из менение физического объема сообщения (документа) в результате его аналитико-синтетической переработки, сопровождающееся уменьше нием (или увеличением) его информативности. Наиболее распростра ненные виды свертывания (развертывания) — аннотирование, рефе рирование, конспектирование, фактографический анализ, рецензиро вание, обзорная деятельность и др. В нашем курсе речь будет идти пре имущественно о свертывании информации и значительно меньше —о ее развертывании, что в принципе неправомерно. При этом иод развер тыванием понимают увеличение физического объема текста за счет внесения в него необходимых дополнений, уточнений, пояснений, ком ментариев, обеспечивающих лучшее его восприятие, понимание и фор мирующих у потребителя определенное отношение к сообщению.
Подобно анализу и синтезу, свертывание и развертывание —опера ции взаимозависимые и взаимонереходящие, поэтому в дальнейшем изложении, кроме случаев специально оговариваемых, употребляя тер мин «свертывание», мы будем подразумевать одновременно и понятие развертывание.
1.1.0 СУЩНОСТИ «СВЕРТЫВАНИЯ»
Термин «свертывание» имеет широкое распространение в различ ных областях знания —философии, математической теории информа ции, физике, лингвистике, информатике, библиографоведении и др. Во
многих из этих областей он нередко имеет различное значение, но во всех случаях обозначает ограничение, уменьшение определенных объ ектов или величин, выделение и концентрацию каких-то признаков, свойств.
В науке со «свертками» мы сталкиваемся постоянно; в их качестве выступают законы, теоремы, постулаты, положения, формулы и тому подобные «сгустки» знаний, концентрирующие в себе наиболее суще ственное, необходимое, являющиеся результатом обобщения, «сверты вания» подчас огромного фактического материала. С другой стороны, доказательство тех или иных положений, выведение следствий, интер претация данных и т. и. есть процедура развертывания информации, со держащейся в этих «сгустках».
Резонно при этом предположить, что свертывание в науке является отражением процессов и явлений, наблюдаемых в самой природе, об ществе, мышлении (например, ассимиляция и диссимиляция, соедине ние атомов и их диссоциация, анализ и синтез). По-видимому, вся эво люция есть не что иное, как последовательное чередование свертыва ния и развертывания. И действительно, развитие фенотипа особи есть по сути дела процесс развертывания ее генотипа (развертывание гене тической информации, заложенной в генотипе). Более того, если при держиваться гипотезы о развитии Вселенной из состояния «сингуляр ности», то весь наш мир развивается но «закону» свертывания-развер тывания в результате «заложенной» в основу мироздания информации.
Одним из первых, как нам известно, ввел в научный обиход терми ны «свертывание» и «развертывание» Николай Кузанский (1401 — 1464), который понимал, в частности, иод научным свертыванием опе рацию получения «содержательно насыщенного» знания. Однако к трактовке этих понятий Николай Кузанский подходил более широко, разъясняя их при помощи математики. Абсолютное единство он упо добляет точке, последовательные развертывания которой образуют ли нии, поверхности, объемы. Точка, таким образом, содержит в себе в свернутом виде все формы видимого мира, присутствуя в каждой из них: «Точка... так свертывает в себе линию, как и линия развертывает точку... линия развертывает то, что свернуто в точке». Подобно тому, как в числе развертывается единство, продолжает Николай Кузанский, так в движении развертывается покой, во времени —вечность, в слож ности —простота, во времени — настоящее, в величине —точка, в нера венстве — равенство, в различии — тождество и т. д. Из приведенного следует, что в чем другом, но в отсутствии диалектического взгляда на мир Николаю из Кузы отказать нельзя. Однако для нас важным являет ся другое —его мысль о том, что свертывание —не просто уменьшение
объема, а устранение несущественного и оставление всего того, что по тенциально позволяет произвести (осуществить) развертывание.
В сфере информационных коммуникаций с проблемой свертывания человечество столкнулось на самых ранних этапах развития цивилиза ции, когда впервые задумалось над тем, как коротко и ясно выражать свои мысли, чтобы «словам было тесно, а мыслям просторно». Когда еще в III веке до нашей эры в Древней Элладе появились первые ритор ские школы, одной из важнейших задач этих школ было, по сути дела, решение проблемы свертывания информации. Один из крупнейших те оретиков античной риторики Марк Тулий Цицерон писал: «Какой спо соб речи может быть лучше, чем говорить ясно, красиво, всегда в согла сии и соответствии с предметом обсуждения». Сегодня мы добавили бы: на оптимальном уровне свертывания. Потому что в принципе раци ональное общение возможно лишь на оптимальном уровне свертыва ния: ниже этого уровня (при излишнем свертывании) сообщение стано вится непонятным потребителю информации, при превышении этого уровня (излишней развернутости) — «скучным», тривиальным, в ре зультате чего степень восприятия сообщения снижается. Это, кстати, еще раз обращает наше внимание на то, что о свертывании можно гово рить, лишь подразумевая одновременно и операцию развёртывания, определяя уровень свертывания (допустим, текста); мы в то же время устанавливаем и меру его развертывания *.
Свертывание и развертывание есть два противоположно направлен ных, но неразрывно связанных друг с другом процесса, обеспечиваю щих необходимую информативность сообщений. Следует только иметь в виду, что многообразие свернутых текстов не эквивалентно многооб разию, полученному в результате развертывания: первое всегда ограни чено, второе практически безгранично.
Неразрывная связь между свертыванием и развертыванием обу словлена характером развития языка, действием в нем противополож но направленных сил. Первые стремятся обеспечить надежность кана ла коммуникации за счет повышения избыточности речи (путем пере фразировок, внесения уточнений, аргументации), вторые направлены на экономию языковых средств. Дж. Ципф на основе обработки огром ного статистического материала показал, что язык (как и многие другие аспекты человеческой деятельности) подчиняется одному простому об щему закону —«принципу наименьшего усилия». Отсюда стремление
* Из этого следует, что проблема свертывания информации отнюдь нс ограничивает ся рамками подготовки вторичных документов, нами здесь рассматриваемыми, а являет ся проблемой человеческого общения в целом.
к речевым штампам, аббревиатурам, метафоричности, эллинспости, «термииологичности» и другим разновидностям лексического сверты вания, в том числе и перевод содержания в иную знаковую систему (применение формул, схем, графиков и другой специальной символи ки) *.
Вобласти формальных способов научных коммуникаций проблема свертывания возникла также весьма давно —с появлением первых ор ганизованных хранилищ памятников письменности (библиотек и архи вов), и связано это было со стремлением изыскать наиболее адекватные формы отражения состава фондов и содержания хранимых в них источ ников информации в каком-либо «поисковом аппарате» (от списков литературы на шумерской глиняной плитке и «Таблиц» Каллимаха до современных автоматизированных банков данных). Несмотря на более чем двухтысячелетнюю историю, задача отражения (раскрытия) содер жания как организованных массивов информации, так и отдельного до кумента не только не потеряла статуса проблемы, но и приобрела осо бую остроту, став ведущим направлением в общей проблематике тео рии научных коммуникаций.
Всовременной литературе проблема свертывания информации представлена достаточно широко. Во многих источниках по вопросам информатики, лингвистики, науковедения, теории познания и др. часто для обозначения одной и той же сущности применяется не только тер мин «свертывание» информации, но и «сжатие», «компрессия», «кон денсация», «кумуляция», «уплотнение», «минимизация», «упроще ние» и т. и. С другой стороны, в это понятие (и его синонимичные вари анты) вкладывается нередко совершенно иное содержание. Все это создает значительные трудности при восприятии и интерпретации ма териалов, что уже само но себе усложняет и так далеко не простую про блему свертывания информации. В этой связи становится целесообраз ным рассмотреть перечисленные термины в трактовке некоторых авто ров, с тем чтобы более четко очертить контуры понятия, являющегося предметом нашего рассмотрения.
В.Косолапов рассматривает понятия «свертывание», «уплотнение»
и«сжатие» информации в одном синонимичном ряду, понимая иод ни ми создание форм научного знания (объяснение, общее понятие, гипо теза, научная теория), обладающих большей информационной емкос тью: «...для развития научной информации характерна не только тен денция интенсивного увеличения ее количества, но и также и столь же
*Относительно «действия» в языке принципа экономии существуют и негативные мнения.
быстрое относительное уменьшение этого количества путем повыше ния информационной емкости информационных сведений... Уплотне ние и свертывание информации — не механическая процедура, а твор ческий процесс преобразования информационных сведений, конструи рование исследователем информации, обладающей принципиальной новизной»*
Не трудно видеть, что в данной трактовке понятие «свертывание ин формации» (как и «уплотнение», и «сжатие») выведены Косолаповым за рамки понимаемой нами сферы информационного обслуживания.
А. К. Сухотин ** различает явления уплотнения (концентрации) и минимизации знаний (в качестве основных направлений, обеспечиваю щих повышение емкости знания). Первое (уплотнение) осуществляет ся путем преобразования самого содержания знания как следствие уг лубления его в связи с открытием новых инвариантов, единств, общих свойств, т. е. истин более глубокого уровня, обобщающих в себе истины частного характера; второе (минимизация) — путем преобразования языка, дающего экономию знаковых средств; содержание при этом ос тается неизменным. Сухотиным в минимизации знаний выделяются три направления: минимизация (или упрощение) «алфавита» (исход ных знаков), кодирование (или метод шифра) и стилизация. Все они преследуют цель — экономить не мысли (как в случае уплотнения), а знаковые средства для выражения мысли. Таким образом, применяе мое Сухотиным понятие «уплотнение» знаний примерно аналогично «свертыванию и уплотнению информации» по Косолапову, а «миними зация знаний» пересекается в известной степени с приведенным в нача ле данной главы толкованием свертывания информации.
Термин «упрощение знания» рассматривается А. И. Уемовым ***
как мера компенсации все возрастающей сложности знания в экстенси ональном и интенсиональном аспектах. Экстенсиональные виды упро щения, назовем их количественными, достигаются путем сокращения числа элементов упрощающей системы (например, посредством «эли минации», т. е. отбрасывания части элементов системы, либо гомо морфной редукции, при которой сокращенные элементы не исчезают из системы, а функционируют через другие, вновь образованные эле менты). Интенсиональные виды упрощения осуществляются не только
* Косолапов В. В. Информационно-логический анализ научного знания.— Киев: УкрНИИНТИ, 1968.
**Сухотин А. К. Гносеологический анализ емкости знания.— Томск: Изд-во Томского ун-та, 1969.
***Уемов А. И. и др. Информационные процессы в научном исследовании и проблема их упрощения. Новосибирск: Наука, 1972.
за счет количественного изменения системы, но и преобразования ее качественных особенностей. Один из таких способов упрощения авто ры именуют деиерархизацией субстрата, при котором достигается сни жение уровня иерархии элементов. Одним из способов деиерархизации субстрата сложных систем является широко известный метод «черного ящика», когда внутренняя структура системы рассматривается нерасчлеиенной, и о ее функциях судят по реакциям на внешние воздействия.
Таким образом, понятие «упрощение знания» в интенсиональном аспекте относится преимущественно к структуре самой науки (знания), что, как мы уже сказали выше, выходит за рамки непосредственных на ших интересов. Экстенсиональные виды упрощения, например «эли минация», затрагивают также и язык науки. Упрощение как средство понижения избыточности естественного языка, являющегося основ ным средством передачи информации, может предусматривать как по иск более простой знаковой формы (перекодирование), так и миними зацию существующей системы (например, в процессе обучения).
Некоторые авторы (А. И. Уемов, Б. В. Плесский и др.) не согласны с гем, что рост сложности знания сопровождается стихийным процессом его упрощения. Они считают, что темпы роста количества и сложности информации во многих областях науки значительно превышают темпы роста и совершенствования средств борьбы со сложностью. Необходи мость в упрощении возникает прежде всего из практических задач ос воения и использования накопленного научного материала. А посколь ку в ближайшем будущем авторы не предвидят революции в способах восприятия и обработки человеком научных знаний, которая смогла бы отодвинуть «барьер сложности» или даже ликвидировать его, выход, по их мнению, в нахождении методов борьбы со сложностью знания и ре шении проблемы оптимизации информационных процессов.
Понятие «кумулятивиость» информации А. И. Михайловым и др. трактуется как свойство уменьшения ее объема со временем путем бо лее краткого, обобщенного изложения: «Со временем все второстепен ное, частное (в системе научного знания —Д. Б.) отсеивается, а главное, основное получает простое и краткое выражение»* В данном случае понятие кумулятивное™ связано с явлением «упрощения знания» и как частный его случай —с явлением «уплотнения знания»: в процессе развития пауки некоторые элементы активного фонда пауки (суммы знания) в результате их качественного преобразования (появления по ложений более глубокого, обобщающего характера) переходят в пас-
* Михайлов А. И., Черный А. И., Гилярсвский Р. С. Научные коммуникации и ин форматика.— М.: Наука, 1970.— 436 с.
сивиый фонд (массу знания). «Часто то, указывают Михаилов и др., на изложение чего 100 лет назад требовался целый курс лекций, теперь можно объяснить за несколько минут при помощи двух-трех написан ных на доске формул». С трактуемым гак свойством кумулятивности эти авторы связывают и явление концентрации информации во време ни, т. е. переход научного знания ко все более высоким уровням абст ракции. Концентрация в таком понимании является частным случаем уплотнения знаний.
Явление в системе знаний, которое А. И. Михайловым и другими квалифицируется как кумуляция и концентрация, полностью охваты вается таким понятием, как «уплотнение» (которое имплицитно вклю чает в себя и минимизацию знаний) в трактовке А. К. Сухотина.
В данном пособии понятие «кумуляция» рассматривается в связи с кумулятивными свойствами различных видов документов, располо женных «снизу вверх» по типологической цепочке: от документов, фиксирующих результаты лабораторных экспериментов, к научно-тех ническому отчету, статьям (также различных видов), обзорам, моногра фиям, учебникам, справочникам. В каждом звене этой цепочки одна и та же информация, рожденная на этапе исследовательской деятельнос ти, представляется в более уплотненном, свернутом виде. В каждый следующий документ включается не вся созданная на этапе исследова ния информация, а только наиболее важная, актуальная, «отстоявшая ся», наиболее релевантная читательскому назначению подготавливае мого документа. По этой причине степень кумуляции информации, на пример, в статье, выше, чем в отчете, в обзоре выше, чем в статье, и т. д.
Таким образом, паше понимание явления кумуляции информации пересекается с такими явлениями, как уплотнение знаний и свертыва ние информации: что-то из полученной в результате исследовательс кой деятельности при «изучении и создании» научно-технического объекта информации еще на этапе «жизни» данного объекта переходит в «массу знаний» (как второстепенное, утратившее значение, не выдер жавшее проверки временем), что-то обобщается и опускается на чисто речевом уровне.
Такой примерно характер носит и кумуляция документального по тока в случае, например, включения ее в реферативный журнал, обзоры.
Ограничимся перечислением дефиниций, «пересекающихся» с на шим предварительным пониманием термина «свертывание информа ции». Приведенного достаточно, чтобы прийти к выводу, что в этой сфе ре имеет место изрядный терминологический «колтун», поэтому есть необходимость во избежание в последующем недоразумений более чет ко определить, «что есть что».