книги / Сетевой информационный поиск
..pdfВыбор поисковых машин |
141 |
|
♦Internet Resources of Kirgystan (http://nmw.kg);
♦The Kyrgyzstan On-Line (http://www.online.kg)-,
♦Web-ресурсы Кыргызстана
(http://www.bishkek.su/ElCat/kyr/index.htmiy,
♦Virtual Azerbijan Republic
(http://www-scf.usc.edu/~baguirou/azeri.htm).
Теперь приводим некоторые адреса поисковых машин стран Балтии. Русский язык, как мы уже говорили, здесь присутствует, скорее, в виде исключения из правила.
♦Latvian Search System (http://www.riga.lv);
♦Search in Latvian Web (http://www.search.lv);
♦All Latvian Links (http://www.all.lv/ru/);
♦Латвийские ресурсы в Интернет
(h ttp //www.binet.lv/russian/windowns/page);
♦Index of Lithuanian Web Sites (http://www.online. lt/h_idx. htm);
♦Каталог W W W -серверов Литвы
(http://www.iae.lt/catalog_r.htm);
♦Эстонский W W W (http://www.ase.ee/~adres/index.shtmiy,
♦Эстонский Интернет-каталог (http://www.neti.ee);
♦Russian pages in Estonia WEB (http://www.netinfo.ee);
♦Estonia Wide Web (http://www.ee/www/).
/Поисковые машины, работающие на немецком, французском и испанском языках
Естественно, что все страны стремятся создавать поисковые ма шины, опирающиеся на их национальные языки, но давать обзор всех таких машин нет никакой необходимости. Конечно, тот факт, что в боль шинстве поисковых машин в качестве альтернативного (а иногда и ос новного) языка используется английский, весьма помогает в том слу чае, если есть необходимость начать поиск ресурсов, так или иначе связанных с какой-либо определенной страной или языком. В то же время необходимо учитывать, что многие поисковые машины и катало ги разноязычных библиотек зачастую используют английский язык только для работы с той частью ресурсов, которая, по мнению владель цев машины, представляет общий интерес. Ресурсы же с сугубо специ альной тематикой могут быть иногда найдены только с помощью мест ного языка. К помощи таких машин имеет смысл обращаться при вполне определенной тематике поиска, ориентированного на ту или иную стра
142 |
Глава 5 |
ну — чаще всего это будет тематика, связанная с историей, географией, литературой, специальными разделами науки, а также с определенными видами промышленной деятельности. К работе с подобными машинами имеет смысл обращаться также и в том случае, если вы владеете соот ветствующим языком.
Даже общий обзор ведущих поисковых машин разных стран мира дать в печатном издании невозможно. Мы можем предложить здесь только описание основных путей поиска соответствующих адресов, приведя несколько адресов наиболее крупных машин.
Одним из способов поиска нужных адресов является обращение к большим международным каталогам, описывающим поисковые маши ны разных стран. Мы уже упоминали об адресе http://www.searchnet. ginescolosus.com, где можно отыскать адреса поисковых машин 181 страны мира. Другим таким адресом является немецкая поисковая си стема Аладин (http://www.aladin.de). Попадая на главную страницу этой машины, вы можете в специальном окне выбрать интересующую вас страну, а в другом —удобный для вас рабочий язык. Другой способ нахождения нужных адресов — это зайти на любую известную вам «уни версальную» поисковую машину (например, Alta Vista или Yahoo), и за дать соответствующий вопрос (язык запроса определяется вами). Коли чество ресурсов, выводимых в ответ, будет очень большим, и поэтому лучше сделать свой вопрос более ограниченным.
Пусть вы интересуетесь адресами немецкоязычных поисковых ма шин. На английском языке вопрос можно задать так: « German Search Engines*. Список ресурсов в полученном ответе будет включать не сколько тысяч URL-адресов. Если же вы спросите: «List o f German Language Searching Engines*, то ответ будет более компактным — с ре сурсами, где имеются списки поисковых машин, а не адреса отдель ных машин. В средней части ответа вам начнут попадаться списки испано-, франко-, японоязычных машин, списки машин стран Афри ки и т. д., но особо совершенствовать свой запрос не следует. В на чальной его части вы легко найдете все, что вам на самом деле необ ходимо.
И з машин, использующих европейские я-^ыки, наиболее интересны ми могут оказаться машины с немецким, французским и испанским язы ками. Немецкоязычных машин в Европе очень много, а представленные на них материалы отличаются богатством и разнообразием. Многие из них позволяют работать на трех языках: немецком, английском и фран цузском. Эти машины расположены на территориях Германии, Австрии, Лихтенштейна и, частично, Швейцарии. Соответственно, списки не мецкоязычных машин иногда группируют как: Suchenmaschienen fiir
Выбор поисковых машин |
143 |
gesamten deutschen Sprachraum (поисковые машины для объединенного немецкоязычного пространства) и далее SuchenmaschienenfiirDeutsch land, Osteneich, die Schweiz, Lichtenstein (Поисковыемашины для Герма нии, Австрии, Швейцарии и Лихтенштейна) (для каждой страны спи сок отдельный).
Адреса машин Германии в каталогах зачастую делят по регионам. Удобно начинать работу на машине Entry.de (http://www.entry.de), где сначала следует выбрать конкретную федеральную землю Германии и уже затем получить адреса всех поисковых машин, расположенных на соответствующей территории. Многие известные поисковые ма шины имеют свои «филиалы» в разных странах. Так, например, ма шина Yahoo представлена в Германии как http://yahoo.de.com. Хоро ший список адресов немецких машин можно найти по адресу http:// web.de. Один из наиболее удобных каталогов немецких поисковых ма шин составлен кафедрой немецкого языка английского университета в г. Лидс: http://www.german.leeds.uk/smaschienenhtm. Каждый гипер текстовый адрес поисковой машины в нем сопровождается краткой ее характеристикой на немецком языке. Приведем еще полезный ад рес http://www.ermnw.cosarh2.htm, а также адрес http://web.uvic.ca/ german/261/sengines.html.
Для тех, кто предпочитает в своих поисковых усилиях быстро пе реходить от одной поисковой машины кдругой, мы рекомендуем обра титься к http://www.anicursor.com/suche.html. Здесь вы можете по свое му выбору работать с одной из 21 известнейших поисковых машин мира. С этой целью на экран выводятся названия машин и традицион ные окошки для ввода ключевых слов, которые можно вводить как на немецком, так и на английском языках. Кроме того, здесь же приво дятся два дополнительных списка адресов наиболее известных меж дународных поисковых систем. На швейцарском адресе http://wwwch.lycos.com главная страница высвечивает карту Швейцарии и дает кнопки трех государственных языков Швейцарии: немецкого, фран цузского и итальянского (ретророманский язык отсутствует). В ряде случаев гипертекстовые адреса поисковых машин выводятся в виде со ответствующих иконок, которые нужно активизировать (рис. 18).
Франкоязычные поисковые машины используются в четырех стра нах Европы — во Франции, Бельгии, Швейцарии и Люксембурге. Очень много франкоязычных машин в Канаде, где два государствен ных языка — английский и французский, и практически все поисковые системы используют оба языка. Разница в машинах лишь в том, какой язык является в них основным, а какой альтернативным. Кроме того, французский язык используется в качестве основного в поисковых ма-
Выбор поисковых машин |
145 |
в качестве основного и открывающие доступ ко множеству оригиналь ных ресурсов. Большой список адресов этих машин, структурирован ный в соответствии со страной их расположения, можно найти на
Spanish-Language Search Engines and WebDirectories (.Испаноязычные по исковыемашины и Web справочники) — http://lonestar.utsa.edu/jbamett/ engines.html. Там же даются приведенные ниже адреса испаноязычных
поисковых машин, которые имеют всемирное значение.
♦Alta Vista Espan (http://www.es-es.altavista.com)
♦Alta Vista Magellanes (http://www.altavista.magellanes.net)
♦Elcano (http://www.elcano.com)
♦Terra (http://www.terra.es) (Новый адрес Elcano)
♦Infoseek en Espanol (http://www.infoseek.com)
♦Lycos Espan {http://www.es.lycos.de).
Как нетрудно видеть, последняя из машин расположена на террито рии Германии. Описанных каталогов машин на основных европейских языках более чем достаточно для самой широкой поисковой работы. В тех случаях, когда возникает необходимость в более углубленных сведениях, опыт пользователя бывает уже настолько велик, что он мо жет самостоятельно выполнить необходимый поиск. Во всех каталогах наряду с адресами поисковых машин имеются и сведения об адресах различных конференций, рассылок и т. п. Мы сознательно не уделяли внимание этим проблемам. Тем же, кто хочет найти список адресов различных зарубежных рассылок, мы советуем обратиться к адресу
Usenetgroups — http://www.liszt.com.
Приведем еще один полезный URL-адрес, по которому расположен материал, тесно связанный с содержанием и этой, и предыдущей глав — http://searchingenginewatch.com. На соответствующем сайте приведены адреса многих поисковых машин и число охватываемых ими ресурсов. На сайте приводится большое количество вспомогательных учебных материалов (на английском языке) по булевой логике, различным опе раторам и многим другим вопросам нахождения информации с приме нением поисковых машин. Имеется и словарь, разъясняющий основные компьютерные термины. Короче говоря, это неплохое англоязычное пособие, знакомящее читателя с обширным перечнем проблем, связан ных с работой поисковых машин.
Данное в этой главе перечисление большого количества адресов раз личных поисковых машин желательно было бы дополнить некоторыми ориентирами, касающимися некоторых характеристик их работы. Ав торы пособия относятся к написанию таких характеристик весьма на стороженно, что объясняется не только тем, что оценка работы поиско-
146 Глава 5
вых машин во многом индивидуальна и зависит от интересов пользова теля. Дело еще и в том, что предлагая свои личные оценки, авторы поне воле включаются в действия по рекламе, чего они ни в коей мере не желают.
Поэтому мы позволим себе только заметить, что в РУНЕТе наибо лее универсальными поисковыми машинами, с которых обычно реко мендуют начинать работу, являются Яндекс и Рамблер. М ежду ними есть небольшие различия, которые на первых этапах работы не очень бросаются в глаза. К этим двум машинам приближается переживаю щая период окончательного становления машина Апорт. И менно эти три машины являются стартовыми при пользовании РУНЕТом.
В англоязычной сфере также выделяются две наиболее универсаль ные поисковые машины — Yahoo и Alta Vista. Практически все российс кие пользователи начинают свою работу с обращения именно к ним. Достоинством машины Alta Vista является возможность запросов, фор мулируемых на русском языке, но к сожалению, в этом случае машина обрабатывает сведения не обо всех доступных ей ресурсах.
При большом выборе достаточно равноценных машин значительно интереснее знать, к какой из них целесообразнее обращаться при том или ином типе поисковых задач. Для РУНЕТа с его ограниченным ко личеством универсальных поисковых машин эта задача не актуальна — серьезного выбора здесь нет, однако в англоязычном Интернете подоб ная проблема довольно важна. Интересующимся мы советуем обра титься к уже не раз упоминавшемуся сайту Колледжа университета штата Нью-Йорк в г. Олбани. На этом сайте приводятся таблицы, со поставляющие тип запроса с адресами поисковых маши, оптимальных для поиска в соответствующей ситуации.
ГЛАВА б
ПОИСК В ОНЛАЙНОВЫХ КАТАЛОГАХ УНИВЕРСАЛЬНЫХ И СПЕЦИАЛЬНЫХ БИБЛИОТЕК
/Поисковые библиотечные системы
~Работа с библиотеками и БД — одна из наиболее широко распро страненных форм профессиональной работы с электронными ресурса ми. Для любого пользователя желательно получать интересующую его полнотекстовую информацию непосредственно на экран персонально го компьютера, и в этом направлении сделано уж е очень много. Боль шое количество книг и журналов уж е доступно в полнотекстовой фор ме, причем зачастую такие материалы можно получить совершенно бесплатно. Тем не менее пройдет еще немало времени до тех пор, когда большинство документов станет доступным именно в таком виде. Пока же достижения в этой области могут лишь служить демонстрацией по тенциальных возможностей сетевых технологий. В этом разделе мы ог раничимся только теми вопросами, которые решены если и не повсеме стно, то в большей части библиотек мира и в различных архивах.
Кначалу XX в. стало понятно, что каталоги библиотек имеют само стоятельную и научную, и коммерческую ценность. Уже в 1901 г. Биб лиотека конгресса США начала распространять по другим библиоте кам копии своих карточных каталогов. Публикация и распространение содержания библиотечных каталогов развивались в течение всего XX в.,
ас развитием вычислительной техники прогресс в этой области стал весьма бурным.
Возможности сетевого обмена привели к стандартизации многих элементов каталожных описаний, и библиотеки стали постепеннно переходить на электронную форму каталогов. Сначала эти каталоги использовались только в локальных сетях библиотек, а затем началось объединение электронных каталогов отдельных библиотек в единые системы, охватывающие регионы, страны и даже весь мир. Естествен но, создание единого мирового каталога всех мировых документов и ресурсов является пока только мечтой, однако на этом пути сделано уже очень многое.
Появление электронных каталогов потребовало создания специаль ных программных средств, которые бы обеспечивали совместимость разных каталогов и возможности быстрого обмена между ними ин формацией. Кроме того, возникла необходимость в создании программ, которые обеспечивали бы простой и надежный доступ к библиотечным каталогам с .удаленных персональных компьютеров. Эта задача реали зуется с помощью специальных интерфейсных программ доступа к элек тронному каталогу, называемых ОРАС — On-line Public Access Computer: Если отвлечься от стремления к дословному переводу, то такие програм
Поиск в онлайновых каталогах универсальных и специализированных библиотек 149
мы можно назвать, например, программами непосредственного (или прямого) компьютерного доступа (нам попадалось и выражение «элект ронный каталог с обеспечением открытого поиска*). Строго установ ленного, постоянного и общепризнанного русскоязычного термина для таких программ мы не знаем.
Стандартный поисковый модуль ОРЛСимеет разные реализации — в частности, российская реализация называется OPAC-R. Для работы с ОРАС могут применяться специальные поисковые программы, кото рые нередко называются СЛГ-программами. О смысле аббревиатуры CAT мы уже говорили. Хорошо известна программа World & CAT, ис пользуемая, в частности, в Научной библиотеке им. Горького СанктПетербургского государственного универитета. Имеется достаточно много материалов, которые посвящены описанию программного обес печения электронных хранилищ информации, систем ОРАС, CAT-про грамм и т. д. и предназначены в основном для программистов и биб лиотекарей. Рядовой пользователь может не углубляться в существо дела и пользоваться только внешними интерфейсами, которые доста точно просты и понятны. Эта ситуация полностью повторяет ситуа цию с поисковыми машинами, которые широко применяют, отнюдь не вникая в используемое программное обеспечение.
Большинство стран стремится создать собственное программное обес печение для работы электронных каталогов библиотек. В нашей же стра не для этой цели используется несколько зарубежных программ. Рядо вой пользователь должен знать лишь основные понятия и термины — больше ему для работы ничего не потребуется. Знакомство с пользо вательскими интерфейсами разных систем говорит не только об их простоте, но и сходстве. Мы будем знакомить вас с особенностями пользования этими интерфейсами при описаниях методов работы с конкретными электронными' каталогами ведущих библиотек мира. Имеются и специальные русскоязычные пояснения по работе с поис ковыми системами ОРАС. Их не очень много, но они все же есть.
Один из наиболее простых и удобных текстов, знакомящих с ОРАСи Wold & CAT, расположен на сайте научной библиотеки Санкт-Петербур гского Государственного университета. Войти в этот материал, назывемый Самоучитель, можно через главный вход на сайт университета — http://www.spbu.ru, переходя затем к страницам библиотеки, однако на много удобнее сразу же войти на сайт научной-библиотеки — http:// www.lib.pu.ru/. Вслед за этим надо пройти путь Домашняя страница>- Каталоги>Самоучитель. Самоучитель состоит из нескольких предназ наченных для начинающих последовательных страниц и снабжен про стейшими упражнениями. Их полезно выполнить, даже если вам все
1 5 0 |
Глава 6 |
понятно. С другим поясняющим, но рассчитанным на более подготов ленного читателя материалом можно ознакомится на сайте РН Б h ttp :// r0ww.nlr.ru:81O1/wdb/SearchHelp.html.
Общая структура работы электронных библиотечных систем пред ставлена на рис. 19. Материал для основного хранилища информации (то есть поступающие ресурсы) готовится работниками библиотеки, то есть каталогизируется по стандартным правилам. Эти правила соответ ствуют формату представления данных MARC (российский вариант это го формата называется RUSMARC). Подготовленные данные вводятся в
систему специальными работниками с помощью автоматизированного рабочего места—АРМ (АРМ каталогизатора). Конечно, все эти опера ции заметно удорожают стоимость подготовки каждой библиотечной записи. Отметим также, что библиотеки приобретают у других библио тек электронные материалы (зачастую в виде CD -дисков). Естественно, что пользователь даже не представляет, каким путем получены или со зданы материалы каталога — ему это, в конечном итоге, безразлично, как и то, какие аппаратные средства используются библиотекой.
Вся подготовка материалов для электронного каталога совершается в пределах так называемой Системы автоматизации деятельности биб лиотек — АБИС (автоматизированные библиотечно-информационные системы). АБИС передают данные в основное хранилище информации,
Другие
библиотеки
~Тъ ~
РИС. 19. Общая структура работы библиотечных систем