Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспекты тем.docx
Скачиваний:
6
Добавлен:
30.05.2023
Размер:
72.64 Кб
Скачать

Тема 2: Информационный поиск

2.1 Информационный поиск - умение задавать себе вопросы о теме и предмете перевода отличает хорошего переводчика от новичка.

Для качественного перевода нужно искать необходимую информацию:

Незнакомые термины, например, по нефтехимии, могут привести в замешательство, одного словаря будет мало.

Есть много вариантов перевода терминов в разных тех.сферах:

Начинающие переводчики выбирают либо наиболее понравившийся вариант, без анализа и понимания, но нужно искать в поисковике дополнительную информацию и проверять правильность перевода.

Для этого подойдут энциклопедии, глоссарии, официальные сайты производителей тех. оборудования, такие сайты как :

Wikipedia.org

Academic.ru

Wiki.unitechbase.com

Dictionary.com

Multitran.ru

Основные этапы поиска информации

1. Определить, что в тексте является новой информации

2. Сформулировать запрос в поисковую систему (название оборудования, сферу применения, материалы)

3. Поиск на языке оригинала. После того, как поняли, о чем речь, поиск на языке перевода

4. Когда нашли эквивалент, проверить сочетаемость отдельных фраз и правильность перевода с помошью поисковике. Целую фразу можно содержать в кавычки

5. Оценить достоверность информации (предпочтение энциклопедий)

2.2 Сбор данных поисковым роботом пауком

Обычно делится на 2 этапа – скачивание веб-страницы и анализ ссылок. Первый этап выполняет Spider (быстрый поисковый паук) – программа для последовательного перебора и скачивания веб-страниц для анализа. Она получает веб-страницы с сайтов по определенному алгоритму и отдает их другой программе Crawler-у. После этого в дело вступает Crawler (медленный паук анализатор), который находит все ссылки и составляет дальнейший маршрут для spider-а. У spider-а есть определенный список сайтов для посещения, заранее подготовленный другими подсистемами поиска. Из этого списка spider получает все необходимые данные.

2.3 Индексация найденных данных

После того, как проходит первый этап, в дело вступает вторая подсистема – подсистема индексации. Она размещает найденную пауками информацию так, чтобы было удобно в дальнейшем к ней обращаться. Для этого программа Индексатор разбирает страницу на различные ее части и анализирует их. Из страницы выделяются заголовки страниц, ссылки, текст, структурные элементы и т.д. Все полученные данные структурируются по определенному алгоритму и затем полученные данные заносятся в базу данных.

Поиск по индексированным данным

Эта подсистема выдачи результатов, которая использует сформированную индексатором базу данных. Она определяет, какие страницы удовлетворяют запросу пользователя и показывает результаты поиска. Когда вы вводите ключевое слово и делаете поиск, поисковая система отбирает результаты на основании следующих критериев:

1. Title (заголовок): Есть ли ключевое слово в заголовке?

2. Domain/URL (Домен/адрес): Есть ли ключевое слово в имени домена или в адресе страницы?

3. Style (стиль): Анализ стиля текста на страницы. Используется ли Жирный текст или Курсив, используются ли заголовки H1, H2 и т.д.

4. Density (плотность): Как часто употреблено ключевое слово на странице? Какова величина плотности ключевого слова?

5. MetaInformation (мета данные) – поиск совпадений в метаданных.

6. Outbound Links (ссылки наружу): Есть ли ссылки на странице и на кого они ведут, а также встречается ли ключевое слово в тексте ссылки?

7. Inbound Links (внешние ссылки): Кто ссылается на искомую страницу? Каков текст ссылки?

8. Insite Links (ссылки внутри страницы): На какие страницы данного сайта содержит ссылки эта страница?

В результате этого сравнения подсистема поиска выбирает нужные веб-страницы и показывает их пользователю, который осуществляет поиск.

Что можно найти через поисковики

Технически найти можно любую информацию, которая проиндексирована поисковиком, находиться в общем доступе в сети интернет и не запрещена политикой поисковой системы. При поиске в интернете имейте ввиду следующее:

· Большая часть информации в интернете не контролируется и любой человек с компьютером и доступом в интернет может публиковать информацию. Поэтому нужно понимать, что данные могут быть недостоверными.

· Не всегда легко узнать кто автор найденной информации.

· Вы не всегда знаете откуда приходит информация.

· Информация может быть предвзятой, специально вводящей в заблуждение или просто неверной.

· Дата публикации данных может быть не указано и будет трудно понять, является ли информация актуальной.