- •Блюменау Д. И.
- •ВВЕДЕНИЕ
- •Глава 1. СВЕРТЫВАНИЕ ИНФОРМАЦИИ КАК ОДНО ИЗ УСЛОВИЙ ЧЕЛОВЕЧЕСКОГО ОБЩЕНИЯ
- •1.1.0 СУЩНОСТИ «СВЕРТЫВАНИЯ»
- •1.2. ИНФОРМАЦИОННОЕ СВЕРТЫВАНИЕ
- •1.3. СВЕРТЫВАНИЕ В СФЕРЕ ИНФОРМАЦИОННОГО ОБСЛУЖИВАНИЯ
- •2.1. ИНДЕКСИРОВАНИЕ
- •2.1.1. Индексирование — его назначение
- •2.1.2. Индексирование на основе «традиционных» ИПЯ
- •2.1.2.1. УДК как представитель ИПЯ иерархического типа
- •2.1.2.2. ИПЯ алфавитно-предметных рубрик
- •2.1.2.3. ИПЯ библиографических описаний
- •2.1.3. Режимы индексирования
- •2.1.4. Координатное индексирование на основе дескрипторных языков
- •2.1.4.1. Избыточное индексирование
- •2.1.4.2. Критерии выдачи и стратегия поиска по запросу
- •2.1.6. Автоматизация процесса индексирования
- •2.1.6.1. Индексирование в АИПС «Пусто — Непусто»
- •2.1.6.2. Индексирование в ИПС «Артефакт»
- •2.1.6.3. Индексирование в поисковой машине «Яндекс»
- •2.2. БИБЛИОГРАФИЧЕСКОЕ ОПИСАНИЕ
- •2.3. АННОТИРОВАНИЕ И РЕФЕРИРОВАНИЕ
- •2.3.1. Функции аннотаций и рефератов
- •2.3.2. Способы раскрытия содержания текстов
- •Пример аннотативной фразы:
- •Пример реферативной фразы:
- •Пример типичной аннотации:
- •2.3.4. Виды аннотаций и рефератов
- •2.4. КОНСПЕКТИРОВАНИЕ КАК РАЗНОВИДНОСТЬ РЕФЕРИРОВАНИЯ
- •2.5.1. Генезис и сущность концептографического обслуживания
- •2.5.2. Виды концептографического обслуживания
- •2.5.3. Обзорно-аналитическая деятельность
- •2.5.3.1. Виды обзоров
- •2.5.3.2. Функции обзоров в системе научных коммуникаций
- •2.5.4. Основы методики написания обзоров
- •Глава 3. НЕКОТОРЫЕ ХАРАКТЕРИСТИКИ ТЕКСТА С ТОЧКИ ЗРЕНИЯ ЕГО СВЕРТЫВАНИЯ
- •3.1. ТЕКСТ И ЕГО ОБЩАЯ ХАРАКТЕРИСТИКА
- •3.2. СТРУКТУРЫ ТЕКСТА
- •3.2.1. Синтаксическая структура текста
- •3.2.1.1. О связности текста
- •3.2.1.2. Средства внутритекстовой связности
- •Разновидности коннекторов
- •3.2.2. Коммуникативная структура текста
- •Пример
- •Пример
- •Пример
- •3.2.3. Аспектная структура текста
- •3.2.4. Семантическая структура текста
- •3.2.5. Информативная структура текста
- •4.1. ВИДЫ И СРЕДСТВА ФОРМАЛИЗОВАННОГО СВЕРТЫВАНИЯ
- •4.2. ФРАГМЕНТИРОВАНИЕ КАК ОДНО ИЗ НАПРАВЛЕНИЙ ИНФОРМАТИВНОГО СВЕРТЫВАНИЯ
- •4.2.1 • Подходы к реализации идеи фрагментирования
- •4.2.1.1. Семантический подход к проблеме фрагментирования
- •4.2.1.2. Синтаксический подход к проблеме фрагментирования
- •5.1. КВАЗИХРЕСТОМАТИЯ КАК ПОСОБИЕ ДЛЯ САМООБРАЗОВАНИЯ
- •5.1.1. О познавательной профессиональной потребности
- •5.1.2. Лексический аппарат формирования квазихрестоматии
- •5.2. ЭТАПЫ СОЗДАНИЯ КВАЗИХРЕСТОМАТИИ
- •5.2.1 • Формирование запроса и составление учебной программы (оглавления)
- •5.2.2. Составление поискового предписания и процедура поиска
- •5.2.3. Формирование и оформление хрестоматии
- •5.2.4. Пример подготовки квазихрестоматии
- •(AлБ)v[(BvИvKvЛ)л(ГvДvE)]v(BлЖ)v(BлЗ)
- •Глава 6. РАЗВИТИЕ ИНДИКАТОРНОГО МЕТОДА КОМПЬЮТЕРНОГО СВЕРТЫВАНИЯ ТЕКСТОВ
- •6.1. СРЕДСТВА И МЕТОДЫ ФОРМАЛИЗОВАННОГО СВЕРТЫВАНИЯ
- •6.2. ТЕХНОЛОГИЧЕСКАЯ ДОКУМЕНТАЦИЯ, ОБЕСПЕЧИВАЮЩАЯ ИЗБИРАТЕЛЬНОЕ СВЕРТЫВАНИЕ ТЕКСТОВ
- •6.3. ЭТАПЫ ФОРМИРОВАНИЯ ВТОРИЧНЫХ ДОКУМЕНТОВ
- •6.3.1. Формирование аннотаций и рефератов
- •6.3.2. Формирование минимальных релевантных фрагментов
- •6.3.3. Формирование квазиконспекта
- •РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
- •Вопросы для самопроверки
- •ПОСЛЕСЛОВИЕ
- •ОГЛАВЛЕНИЕ
иимаются сведения не только фактического характера, но также и тео ретического, предположительного, оценочного. В самостоятельном фрагменте также могут быть сведения не только фактографические, но и любые иные — все это фактографическая информация. Понятие «коицеитографическая информация», напоминаем, включает сведения, интерпретированные автором вторичного документа.
Известно, что большинство действующих в настоящее время И ПС функционирует прежде всего как системы документального обслужи вания, т. е. они обеспечивают в том или ином режиме выдачу потреби телю первичных документов, необходимые сведения из которых он вы нужден извлекать сам. Создание таких систем, несомненно, имеет важ ное значение для повышения оперативности и качества обслуживания больших контингентов специалистов. Однако функционирование этих систем прежде всего в качестве средства документального обслужива ния не решает одну из серьезнейших его проблем —приведение объема релевантной информации в соответствие с физическими возможностя ми усвоения ее специалистами. Именно решению этой задачи и служит идея фрагментирования научно-технической литературы, которая рас сматривается в рамках подсистемы фактографического информацион ного обслуживания, обеспечивающей, как известно, непосредственный допуск потребителя к информации, минуя «книгу».
4.2.1 • Подходы к реализации идеи фрагментирования
Процедуру фрагментирования документов следует рассматривать с позиции трех подходов —семантического, синтаксического и прагма тического.
С семантической точки зрения, фрагмент есть микро(сегмеит)- или макро(суперсегмеит)контекст, обладающий с точки зрения информан та осмысленностью, законченностью, самостоятельностью и потенци альным соответствием (релевантностью) некоторой типовой информа ционной потребности. Такие сегменты (суперсегменты) могут совпа дать с сунерсиитаксическими целыми, а могут и не совпадать: быть частью ССЦ или включать в себя два и более ССЦ.
С точки зрения синтаксического подхода, фрагмент есть сложное синтаксическое целое (типа сверхфразового единства или линейно синтаксической цени), единство элементов (предложений) которого обеспечивается аппаратом сунерсинтаксических связей. Целостность, «осмысленность» и «самостоятельность» такой текстовой единицы оп ределяются машиной (с использованием рассмотренного выше лекси ческого аппарата) на основе заложенной в нее программы.
С прагматической точки зрения фрагмент — контекст, способный без обращения к полному тексту первичного документа удовлетворять информационные потребности определенных групп потребителей, т. е. обладать пертинеитностыо. Последний подход в той или иной степени присутствует в семантическом подходе как отношение пользователя к результатам «деятельности» машины.
Семантический и синтаксический подходы различаются мерой уча стия пользователя в процедурах компьютерного свертывания: в первом случае машина лишь размечает цветом аспекты документа; всю ответ ственность но определению релевантности фрагментов, их верхних и нижних границ, а также экстрагирование их в «Копилку» машина «пе репоручает» человеку. Во втором случае машина берет на себя большие полномочия —формирует на основе специальной программы фрагмен ты, соответствующие некоторым синтаксическим структурам —супер синтаксическим целым, сегментам и т. п. Насколько удачно у машины это получается, контролирует опять же человек.
4.2.1.1.Семантический подход к проблеме фрагментирования
Первоначально идея фрагментирования была сформулирована в форме гипотезы о возможности такой формы информационного обслу живания, при которой определенный спектр типовых информацион ных потребностей определенных групп и категорий потребителей ин формации удовлетворялся бы типовыми фрагментами первоисточни ков, имеющими самостоятельное информационное значение вне контекста документа. Массив таких типовых фрагментов, выделенных путем формализованного анализа на этапе одноразового ввода доку мента в АИС, образует самостоятельную подсистему, которую назвали подсистемой «фрагмент». Существование такой подсистемы должно в значительной степени компенсировать избыточность как отдельных документов, так и документальной подсистемы в целом.
Под типовым самостоятельным фрагментом понимается содержа тельно замкнутая часть текста (или так называемый содержательный аспект), в частном случае таблица, график, формула и т. и., понятная вне текста всего документа и способная удовлетворить типовую инфор мационную потребность без обращения к первоисточнику. В данном пособии понятия «фрагмент» и «содержательный аспект» для упроще ния рассматриваются как синонимы, хотя нередки случаи, когда фраг мент включает в себя более одного содержательного аспекта или, на оборот, является лишь частью содержательного аспекта.
Под типовой информационной потребностью понимают потреб ность, обусловленную общностью потребительской ситуации, харак терной для определенных этапов творческой деятельности определен ных категорий и групп специалистов в определенных областях знания. Считается, что типовые потребности определяются условиями кон кретной задачи.
В качестве примера разновидности содержательных аспектов текс тов (статей), способных выступать в роли самостоятельных фрагмен тов, рассмотрим сетки II типа для областей электроники и хирургии.
Сетки аспектов
по электронике |
по хирургии |
Вводная часть |
|
— состояние вопроса |
—состояние вопроса |
—перспективы и тенденции развития |
—постановка проблемы |
Основная часть |
|
—конструкция |
—этиология |
—схема (электрическая и т. д.) |
—патологическая анатомия |
—технология |
—клиническая картина |
—методы расчета |
—дифференциальная диагност. |
—методы исследования |
—показания к лечению |
—методы испытаний |
—лечение |
— принцип действия |
—отдаленные результаты |
—свойства материалов |
—послеоперационные осложн. |
—условия эксплуатации |
—профилактика заболеваний |
—параметры изделия |
—формы заболеваний |
—химический состав |
— локализация поражений |
—методы определения физич. величии —сопутствующие заболевания
— зависимость параметров |
—сопутствующий синдром |
—определение понятий |
—биологич. критерии болезни |
—технич. и экоиомич. эффективн. |
—клииико-эксперим. данные |
|
—длительность заболевания |
Заключительная часть |
|
—рекомендации |
— выводы |
—результаты
—выводы Анализ практики фрагментирования с использованием семантичес
кого подхода показывает, что подавляющая часть аспектов (фрагмен тов) и так называемых типовых запросов совпадает или близка по смыслу; некоторые аспекты не имеют эквивалента среди запросов (на
пример, «Состояние вопроса», «Зависимость параметров», «Определе ние понятий», «Рекомендации», «Результат», «Выводы») и, наоборот, ряду запросов не отвечает перечень аспектов («Формулирование ос новных тактико-технических требований к изделиям» или «Определе ние потребностей рынка в изделиях данного класса»). Последнее объ ясняется тем, что, с одной стороны, реальные типовые запросы фор мулируются обычно для документальной системы, а с другой —для удовлетворения части запросов требуется синтез информации из ряда источников, а это выходит за рамки возможностей рассматриваемого метода.
Тем не менее априори можно допустить, что фрагменты, соответст вующие этим аспектам, будут достаточно самостоятельными, чтобы удовлетворить потенциальные потребности специалистов.
К примеру, фрагмент, соответствующий аспекту «Состояние вопро са» (см. Приложение 6), выполняет функцию вступления, которое предваряет описание предмета рассмотрения статьи и содержит часто краткий обзор того, что было известно авторам до написания статьи с критическим анализом наиболее важной по проблеме литературы. Со вокупность таких фрагментов по определенной теме, выданных систе мой,— своеобразная заготовка для обзорного документа. Фрагмент «Перспективы и тенденции развития» (см. Приложение 6) часто встре чается как часть вступления или заключения. Фрагмент «Определение понятий» (см. Приложение 6) имеет особое значение, поскольку в до кументальных источниках нередко приводятся определения понятий, которых либо вообще еще нет в справочной литературе, либо которые но-иовому, с какой либо другой стороны раскрывают предмет рассмот рения. Известно, что в дефинициях фиксируется определенный уровень познания предмета или новый взгляд на него. Во вторичных докумен тах этот аспект информации, как правило, опускается, а следовательно, теряется для большинства потребителей. Накопление в памяти систе мы различных дефиниций позволит, во-первых, проследить этапы по знания, а во-вторых, выявить точки зрения на него различных авторов.
«Выводы» достаточно часто, как показал анализ вторичных доку ментов, являются составной частью реферата или реферативный анно тации, то есть «располагаются» в документальной подсистеме АИС. Поэтому вопрос о введении в подсистему фрагмента «Выводы» нужда ется в дополнительном решении. Иное дело фрагменты «Результаты» и «Рекомендации», особенно промежуточные. Они отражаются во вто ричных документах значительно реже, и потому включение их в рас сматриваемую подсистему желательно (разумеется, в случае самостоя тельности указанных фрагментов, см. Приложение 6).