книги / Сетевой информационный поиск
..pdfРоссийская академия естественных наук Северо-Западное отделение образования и развития науки
В. Н. Романенко, Г. В. Никитина
СЕТЕВОЙ ИНФОРМАЦИОННЫЙ ПОИСК
Практическое пособие
ЩШ1ШШ
Санкт-Петербург
2005
УДК 01 (075.8) ББК 73я 73 Р69
РоманенкоВ. Н., Никитина Г. В.
Р69 Сетевой информационный поиск: Практ. пособие / В. Н. Романен ко, Г. В. Никитина; Российская академия естественных наук. Севе ро-Западное отделение образования и развития науки. — СПб.: «Профессия», 2005. — 288 с.
ISBN 5-93913-044-5
Впредлагаемом пособии освещаются возможности поиска информации
идокументов в Интернете. Рассматриваются принципы и особенности хране ния документов в электронных сетях, наиболее рациональные приемы поиска различных видов документов, методика формулировки запросов и принципы выбора поисковых машин. Одна из глав посвящена характеристике электрон ных каталогов крупнейших библиотек мира, описаны их поисковые возмож
ности.
Издание предназначено для студентов высших и средних учебных заведе ний, аспирантов и преподавателей школ, колледжей и вузов. Оно может быть также полезно библиотекарям и библиографам библиотек различных типов, осуществляющим информационно-библиотечное обслуживание с использо ванием электронных сетей.
ISBN 5-93913-044-5
УДК 01 (075.8) ББК 73я 73
© Издательство «Профессия», 2005
Содержание |
|
К чи тател ю ................................................................................................................ |
5 |
ВВЕДЕНИЕ, ПОСВЯЩЕННОЕ ПОЛЕЗНЫМ СОВЕТАМ.................................. |
13 |
Как разумнее пользоваться данным учебным пособием....................... |
13 |
Как правильно транслитерировать русский текст и где и как надо |
|
учитывать различные кодировки русского алфавита........................... |
16 |
Некоторые вопросы, связанные с терминологией, применяемой |
|
в сетевых адресах............................................................................... |
25 |
Несколько замечаний, полезных в практической работе...................... |
31 |
ГЛАВА 1. ИНФОРМАЦИЯ И ДОКУМЕНТЫ.................................................. |
35 |
Понятие «информация»...................................................................... |
36 |
Связь информации с ее носителем...................................................... |
39 |
ГЛАВА 2. ПРИНЦИПЫ ХРАНЕНИЯ И ОСОБЕННОСТИ ХРАНЕНИЯ |
|
ДОКУМЕНТОВ В ЭЛЕКТРОННЫХ СЕТЯХ................................................ |
41 |
Условия правильного хранения документов........................................ |
42 |
Системы классификации документов и электронных ресурсов............. |
45 |
Каталоги поисковых систем Интернета................................................ |
54 |
Некоторые особенности ресурсов Интернета...................................... |
61 |
ГЛАВА 3. ОРГАНИЗАЦИЯ ПОИСКА ДОКУМЕНТОВ И РЕСУРСОВ................. |
67 |
Поисковый запрос и схема его исполнения......................................... |
68 |
Типы поиска, которые используются в практической работе............... |
70 |
Основные характеристики ресурса и документа, используемые |
|
при поисковых запросах..................................................................... |
73 |
Ответ на поисковый запрос................................................................. |
78 |
Оценка эффективности поиска ресурса.............................................. |
82 |
Виды сетевой информации и некоторые способы ее получения........ |
90 |
ГЛАВА 4. ПОИСКОВЫЕ СИСТЕМЫ И ВЫПОЛНЕНИЕ БЫТОВОГО ПОИСКА ... |
97 |
Работа поисковых систем................................................................... |
98 |
Как правильно приступить к поиску и какую поисковую машину |
|
лучше выбрать?................................................................................. |
101 |
Поиск при запросах на естественном языке................................. |
105 |
Проблемы, возникающие при ничем не ограниченном поиске |
|
по ключевым словам.................................................................... |
112 |
Правильное составление поискового запроса на основе |
|
ключевых слов............................................................................ |
115 |
Поиск данных в определенных зонах ресурса |
|
и элементах его адреса................................................................ |
125 |
Вывод результатов поиска............................................................ |
128 |
Несколько кратких замечаний по поводу |
|
Интернет-магазинов......................................................................... |
130 |
ГЛАВА 5. ВЫБОР ПОИСКОВЫХ МАШИН................................................. |
131 |
Русскоязычные и англоязычные поисковые машины......................... |
132 |
Поисковые машины стран СНГ и Балтии............................................. |
138 |
4 |
__________________Содержание |
|
|
Поисковые машины, работающие на немецком, французском |
|
|
и испанском языках........................................................................... |
141 |
ГЛАВА 6. ПОИСК В ОНЛАЙНОВЫХ КАТАЛОГАХ УНИВЕРСАЛЬНЫХ |
|
|
|
И СПЕЦИАЛЬНЫХ БИБЛИОТЕК.......................................................... |
147 |
|
Поисковые библиотечные системы.................................................... |
148 |
|
Как лучше всего освоить работу с каталогами различных библиотек ... |
156 |
|
Работа с электронными каталогами Библиотеки конгресса СШ А....... |
166 |
|
Работа с электронными каталогами национальных российских |
|
|
и академических библиотек............................................................... |
188 |
|
Поиск в каталогах ряда ведущих российских библиотек |
|
|
и библиотек стран СНГ....................................................................... |
200 |
|
Электронные каталоги ряда ведущих и национальных библиотек |
|
|
некоторых западных стран................................................................. |
209 |
|
Каталоги и другие материалы научных организаций и учебных |
|
|
заведений, а также общедоступных библиотек................................... |
218 |
|
Поиск URL-адресов библиотек мира................................................... |
229 |
ГЛАВА 7. ПОИСК ЖУРНАЛЬНЫХ СТАТЕЙ И ОТЧЕТОВ О НИР. |
|
|
|
РАБОТА С БАЗАМИ ДАННЫХ, ЭНЦИКЛОПЕДИЯМИ, ЭЛЕКТРОННЫМИ |
|
|
ИЗДАНИЯМИ, ЭЛЕКТРОННЫМИ БИБЛИОТЕКАМИ И НОВОСТНЫМИ |
|
|
САЙТАМИ........................................................................................... |
233 |
|
Поиск журнальных статей.................................................................. |
234 |
|
Поиск информации в специализированных базах данных.................. |
239 |
|
Сетевой поиск отчетов о НИР и депонированных рукописей.............. |
245 |
|
Сетевой поиск патентов, стандартов и строительных норм................. |
247 |
|
Поиск данных в электронных энциклопедиях, словарях |
|
|
и справочниках.................................................................................. |
252 |
|
Поиск информации в электронных журналах, архивах |
|
|
и электронных библиотеках............................................................... |
260 |
|
Поиск новостей.................................................................................. |
270 |
ГЛАВА 8. ОСОБЕННОСТИ РАБОТЫ ЭЛЕКТРОННЫХ ПОИСКОВЫХ |
|
|
|
СИСТЕМ И ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ...................................... |
273 |
|
Новые возможности сетевого поиска................................................. |
274 |
|
Автоматическое цитирование, составление личных |
|
|
библиографических каталогов и цитирование |
|
|
электронных документов.................................................................... |
276 |
|
Некоторые психологические особенности работы |
|
|
с поисковыми программами............................................................... |
281 |
|
Самопроверка степени освоения приобретенных поисковых |
|
|
навыков ............................................................................................. |
282 |
|
Рекомендуемая литература................................................................ |
284 |
|
Приложение....................................................................................... |
285 |
|
Электронные адреса крупнейших национальных библиотек мира .... |
285 |
|
Электронные адреса федеральных информационных центров |
|
|
и федеральных библиотеки России............................................... |
285 |
/К читателю
Тот фа1сг, что наше время характеризуется широким повсемест
ным распространением информационных технологий, наверняка не вызывает ни у кого сомнений. Даже люди, достаточно далекие от И н тернета или различного рода расчетов и компьютерных эксперимен тов, не раз слышали об этих технологиях или видели компьютерную графику на экране телевизора. Тем не менее ясное представление о реальных возможностях информационных технологий оставляет ж е лать лучшего. Часто те, кто овладел компьютерной техникой, не умеют пользоваться всеми возможностями, которые представляют в их рас поряжение сетевые информационные технологии. Расширение воз можностей этих технологий как бы отодвинуло на второй план многие задачи по поиску информации, которые можно назвать классически ми. Большинство активных пользователей стремится использовать се тевые технологии для очень важных и многоплановых бытовых задач: таких как приобретение авиационных и железнодорожных билетов, покупок товаров в Интернет-магазинах, оперативного знакомства с те кущими новостями и многого другого. Появилось изрядное количество литературы, часто переводной, которая уделяет внимание именно этим вопросам, наиболее широко привлекающим внимание.
Нынешний период нередко воспринимают как информационную революцию, не очень задумываясь над тем, что это на самом деле озна чает. На самом деле, следуя представлениям известнейшего ученого нашего времени Олвина Тоффлера, следует говорить о более карди нальной перестройке жизни общества. Эту перестройку нередко назы вают «третьей волной». Третья волна изменяет ценности и приорите ты всего общества, выводя на первое место владение информацией и способами ее распространения. При этом существенно меняется и роль работников, которые связаны с этими процессами.
Почти повсеместно отмечается резко изменившаяся роль библиотек и библиотекарей. Во многих западных странах библиотекарь становит ся одним из активных участников учебного процесса. Изменяется и со держание знаний и умений библиотекаря. Во многих университетах (например, в университете штата Мичиган) ведется подготовка биб лиотечных специалистов, которые напрямую ориентированы на ис пользование компьютерных технологий. И у нас в России, и за рубе жом появляются и активно обсуждаются стандарты информационной грамотности специалистов разного уровня. Иными словами, подготов ка на любом уровне знаний связана с обязательным освоением основ
6 |
К читателю |
ных приемов работы в информационных сетях. Известно, что в этой об ласти Россия заметно отстала от ведущих западных стран. Тем не менее эти проблемы уже стали существенными и для нашей страны. Обнару жилось, что в этой области практически отсутствует необходимая лите ратура. Именно эти обстоятельства и побудили нас обратиться к напи санию предлагаемого пособия. При этом отсутствие традиций в отборе материала для пособия не является главной сложностью. Сведения по поиску информации в сетях обязательно должны включать множе ство конкретных сетевых адресов. Что отбирать для этого списка, как его связывать с текстом — это все решается нами, по существу, впер вые. В этом вопросе очень трудно апеллировать и к зарубежному опы ту. За рубежом количество изданий подобного плана велико, однако в силу целого ряда хорошо известных объективных причин такого рода издания полностью отсутствуют даже в самых крупных российских библиотеках*. Естественно, авторы частично смогли познакомиться с некоторыми из этих материалов путем использования международного межбиблиотечного книгообмена, но давать ссылки на такие книги и ре комендовать к ним обратиться просто бессмысленно. Поневоле прихо дится увеличивать количество ссылок на электронные публикации.
Методы сетевой технологии во всем мире еще окончательно не сло жились. Многие термины, хорошо известные, например, в библиотеч ном деле, стали применяться в этой области в расширительном, а иногда и в не вполне правильном смысле. Короче говоря, не только научная тер минология, но и предварительное состояние терминологической базы, так называемая ЕСТ — естественно сложившаяся терминология — ре ально отсутствуют. Все это заставило нас приводить множество поясне ний и определений, которые нельзя считать до конца установившимися. Конечно, авторы стремились свести терминологические нечеткости до минимума. Насколько нам это удалось, судить читателю.
Авторы любого пособия всегда должны ответить для себя на три ос новных вопроса: для кого писать, о чем писать и как писать. Поиском информации в сетях интересуется огромное количество людей с различ ными информационными потребностями. Они относятся к разным воз растным и образовательным группам населения и обладают различной предварительной подготовкой. Пытаться писать сразу для всех таких читателей — дело практически безнадежное. Поэтому мы ориентируем ся прежде всего на школьников старших классов, студентов и молодых специалистов. Естественно, это пособие может оказаться интересным и полезным и для более искушенного читателя.
* Правда, недавно в Российской национальной библиотеке вышел справочник «WWW-стратегии эффективного поиска», предназначенный как для библиотека рей, так и для пользователей (СПб., 2001).
К читателю |
7 |
Современная российская молодежь имеет в своей массе большую тягу к компьютерной технике. Многие молодые люди обладают опы том работы в сети Интернет. Очень часто этот опыт чисто эмпириче ский. В таких случаях умея «нажимать кнопки», такой пользователь подчас не владеет терминологией, а его теоретические знания обры вочны. В то же время есть много студентов, которые еще вообще ни разу всерьез не работали на компьютере.
Многим возможным читателям старшего поколения свойственен страх перед компьютером, а новые приемы работы такие читатели час тенько осваивают с напряжением. В то же время они умеют оценить качество информации и понять ее реальную ценность. Чтобы не по вторять простейших вещей, мы исходим далее из предположения о том, что читатель уже овладел основными навыками работы с компьюте ром. Ему не надо объяснять такие простые вещи, как выбор алфавитов или смена шрифтов, сохранение файлов и прочее. Эти простейшие приемы могут быть при необходимости легко освоены самостоятель но. Казалось бы, что и объяснение основных приемов работы с Интер нетом тоже не нужно. Однако мы полагаем, что объяснение простей ших терминов все же полезно, так как далеко не везде производится систематическое обучение работе в Интернете. Кроме того, в ряде слу чаев мы будем давать пояснения достаточно простым, но не очень хо рошо известным, приемам работы.
Надо сказать, что освоение Интернета зачастую идет путем проб и ошибок. В то же время тем, кто овладел начальными навыками рабо ты в сетях и может пользоваться английским языком, мы укажем на возможность пополнить свои знания, используя группу учебных се тевых адресов, предлагаемых, в частности Британской библиотекой. Эту библиотеку можно легко найти по URL-адресу britishlibrary.net/ internet_intro_content.htm. Принято считать, что любой студент, доу чившийся до третьего курса, в той или иной мере владеет английским языком. Реальная ситуация, естественно, выглядит намного хуже, и по лагать, что все читатели этого пособия владеют английским языком, было бы в высшей степени наивным. В то же время серьезный поиск научно-технической информации в сетях невозможен без выхода на за рубежные адреса. Большинство важнейших серверов и за рубежом, и в России имеют англоязычные версии размещенных на них материалов. Именно поэтому некоторое знание английского языка необходимо для успешной сетевой работы. В то же время нам знакомы случаи, когда даже серьезные исследователи, не владея языком, пользовались для работы в сетях предварительными записями простейших английсйих выражений, необходимых в работе. Как ни странно, это позволяло им достаточно успешно справляться с практическими задачами.
8 |
К читателю |
В нашем пособии мы будем стараться, по возможности, использо вать русскоязычные примеры. К сожалению, далеко не всегда можно идти таким естественным путем. Приведем простейший пример. Пусть кто-либо захочет освоить приемы составления маршрутов личного пу тешествия, пользуясь Интернетом. В российском Интернете найти рас писания поездов и самолетов не просто. Особенно большие трудности возникают при поиске расписаний местных линий. Иногда они есть, но сообразить, где они находятся, очень трудно. Так, расписание при городного сообщения Санкт-Петербург-Гатчина находится на сайте Санкт-Петербургского института ядерной физики (П И Я Ф ) РАН (оно предназначено для посетителей Института). Только летом 2003 г. эта информация появилась на сайте http://raspisanie.narod.ru. Для многих других важных маршрутов такой информации пока еще просто нет. Можно не сомневаться, что она появится, и достаточно скоро. Пока ж е лучше изучать приемы работы с расписаниями на основе зарубежных сайтов.
Эта и другие схожие причины заставляют нас заметно увеличить количество иноязычных примеров, хотя, естественно, любой пользова тель начинает свой поиск в русскоязычном Интернете (РУ Н ЕТ Е). Мы четко представляем себе, что это просто болезнь роста, но данная книга пишется в определенное время и не считаться с особенностями этого времени нельзя. Именно поэтому без описания широкого набора дан ных об англоязычных поисковых системах обойтись нельзя. Для облег чения чтения и понимания мы, конечно, будем давать необходимые пояснения соответствующим примерам и излагать такой материал с максимальной степенью простоты. Тем не менее мы все же ориентиру емся на читателя, который обладает некоторыми простейшими навыка ми владения английским языком. Мы также прекрасно понимаем, что хотя и библиотекарь, и программист, разрабатывающий соответствую щие программы, и пользователь в процессе поиска информации решают фактически одну и ту же задачу, их методы работы и практические ин тересы заметно различаются.
Библиотекарь стремится создать правильные описания информаци онных материалов, обеспечить условия для их нахождения пользовате лем и для облегчения работы последнего. Пользователь, не очень интере суясь тем, как обеспечивается его работа, заинтересован в быстром и эффективном поиске нужной ему информации. Это как бы две головы у тела одной проблемы. Только в отличие от двуглавого герба, эти голо вы глядят навстречу друг другу. В этом общем деле программисты ори ентированы на то, чтобы обеспечить работу поисковой системы, то есть на том «как все сделать». Библиотекари заняты организацией работы,
К читателю |
9 |
а пользователь озабочен тем, как правильно и оптимально использовать программы поиска информации и достижения в области организации информации, ее хранения и выдачи.
Существует множество книг для программистов. Большинство книг, посвященных деятельности библиотек, ориентировано, в первую оче редь, на библиотечных работников. Мы же в этом пособии ориентиру емся на пользователя. Поэтому ряд теоретических и организационных вопросов (как библиотечного дела, так и программирования) мы остав ляем в стороне. Наше внимание будет сосредоточено на практических приемах поисковой работы и методах оценки ее реальной эффективно сти. Мы, по мере возможности, будем пользоваться проверенными опы том, приемами и методами. Вне всякого сомнения, предлагаемый мате риал будет полезен также и практикам библиотечного дела. Однако они не должны забывать о его принципиальной ориентированности на не- профессионала-пользователя.
Не следует забывать и о том, что переживающий бурный прогресс Интернет характеризуется достаточно частой сменой и даже исчезнове нием адресов, по которым расположена информация. Нередко происхо дят изменения настройки, а иногда и полные замены программ, которые применяются в библиотеках. Так, только в течение 2001 г. были изменены поисковые системы в электронных каталогах Российской государствен ной библиотеки (РГБ) и базы данных HELK (Хельсинский универси тет). В марте 2002 г. была серьезно изменена поисковая программа в ка талоге Библиотеки конгресса США. Соответствующий список легко продолжить. При написании пособия мы были вынуждены считаться с этим, и старались давать только надежные и стабильные, по нашему мне нию, адреса. Однако не следует удивляться и тому, что многие приводи мые далее данные, несмотря на все наши предосторожности, могут изме ниться за время издания этого пособия. Это печальная реальность и с ней надо считаться. Мы только стремились свести к минимуму возмож ные неточности и неудобства, проистекающие из указанных обстоя тельств.
Количество литературы и в традиционной, и в электронной форме огромно. Читатель должен с самого начала четко усвоить, что перед ним стоит задача не отыскать все, что только возможно, а быстро и эффективно найти то, что ему действительно необходимо. Соответ ственно и мы, авторы пособия, не стремились дать список всех воз можных адресов (это практически необозримый объем информации), а только привести важнейшие примеры и указать пути поиска нужных пользователю сведений.
10 |
К читателю |
Уже на подготовительной стадии работы над этим пособием перед авторами встал один принципиальный вопрос. Дело в том, что многие информационные услуги и в России, и за рубежом, платные. Иногда взимание платы явно не оправдано, но чаще всего оно просто необхо димо, особенно если учесть, что работа различных информационных сетей, поддержание адресов, разработка программ и т. д. требуют не малых затрат. Цены на услуги, особенно за рубежом, по российским понятиям немалые. Поэтому, рекомендуя для работы те или иные практические приемы, мы не имеем права обойти молчанием тот факт, что некоторые из них труднодоступны в силу их дороговизны. В то же время при предварительном обсуждении планов этого пособия мы столкнулись с категоричной точкой зрения ряда библиотечных работ ников, считавших, что «неприлично затрагивать экономические про блемы в учебном пособии». Мы избрали здесь компромиссное реше ние: речь о платных услугах будет идти только кратко и без каких-либо высказываний о ценовой политике и возможностях среднего пользо вателя, которые, как мы знаем, весьма ограничены. Мы также будем кратко упоминать разные электронные программы и банки данных, которые распространяются на CD. Эти программы, особенно в облас ти научной информации, где количество изготовляемых копий не ве лико, могут быть очень дорогими. Чаще всего они доступны и у нас, и за рубежом, только организациям. В то же время мы все прекрасно знаем, как широко распространен «не лицензированный» программ ный продукт в России. Соответственно и многие CD также широко распространены в нашей стране в пиратских копиях. По счастью, ос новные программные продукты с базами данных о научной информа ции пиратских копий обычно не имеют из-за ограниченного спроса. По этому, говоря об этих продуктах, мы, если и будем говорить о заказах или ценах, то только на официальную, сертифицированную продукцию. Пользоваться ли ею, или же искать обходные пути, каждый читатель должен решать самостоятельно. Это вопросы этики и мы просто не имеем права входить в их детальное обсуждение.
Наконец, последний вопрос: как писать? Мы уж е говорили о том, что в области компьютерных и особенно сетевых технологий научная терминология еще окончательно не установилась. Как во всякой но вой сфере приложения интересов, в упомянутой области работает большое количество молодых людей, многие из которых получали свое образование в других областях науки и техники. Как следствие этих двух обстоятельств, в практике современной работы с сетевыми доку ментами получил чрезмерное развитие нарочито огрубленный жаргон, часто отнюдь ничем не обоснованный. Тем не менее считается даже