2.2. Алгоритми роботи документально-інформаційнї системи

Автоматичні інформаційні системи виконують всі операції з переробки інформації без участі людини.

Автоматизовані інформаційні системи передбачають участь в процесі обробки інформації і людини, і технічних засобів, причому головна роль відводиться комп'ютера. У сучасному тлумаченні в термін «інформаційна система» обов'язково вкладається поняття автоматизируемой системи. Автоматизовані інформаційні системи, враховуючи їх широке використання в організації процесів управління, мають різні модифікації і можуть бути класифіковані, наприклад, за характером використання інформації і за сферою застосування.

Автоматичні системи інформаційного пошуку використовують для зменшення так званого «інформаційного перевантаження». Багато університетів та публічних бібліотек використовують системи ІП для полегшення доступу до книжок, журналів та інших документів. Найвідомішим прикладом систем ІП можна назвати пошукові системи в Інтернеті.

Алгоритми прийняття рішень використовуються для визначення імовірності того, що документ буде відповідним до пошукового запиту. Алгоритми прийняття рішень застосовуються як доповнення до імовірнісного пошуку, для отримання додаткових доказів того, що документ може відповідати пошуковому запиту. Метод основано на виокристанні відомих залежностей для побудови невідомих. Це дозволяє кардинально знизити обсяг обчислень, які необхідні для визначення імовірності тої чи іншої події.

Мовні моделі використовуються для передбачення появи того чи іншого слова у тексті. В інформаційному пошуку використовуються статистичні мовні моделі для передбачення чи з’явиться потрібне слово (пошуковий термін) в документі. Для кожного документу зі збірки обчислюється імовірність появи в документі пошукових термінів. Згідно з цим документом упорядковуються у пошуковому списку. Ще один підхід пропонує побудову імовірнісної моделі пошуковго запиту. Тобто будується імовірнісна модель появи тих чи інших пошукових термінів у запиті Далі будується імовірнісна модель запиту як сукупності незалежних подій, де кожна подія – це поява того чи іншого терміну у пошуковому запиті. В цій моделі ми можемо врахувати навіть імовірності непояви певних термінів.

Коефіцієнт відповідності документу пошуковому запитові визначається на основі імовірності того, що документ є відповідним пошуковому запитові. Присутність чи відсутність пошукового терміну в документі використовується для визначення імовірності того, що документ відповідає інформаційному запитові. Визначення імовірності базується на попередніх статистичних даних, про те, наскільки імовірно, що документ який містить пошуковий термін A, відповідатиме пошуковому запитові, що містить термін A. Припускаючи, що пошукові терміни в пошуковому запиті є незалежні, можна обчислювати таку імовірність для кожного пошукового терміну з пошукового запиту. Загальна імовірність відповідності документу обчислюється як добуток ймовірностей відповідності для кожного терміну. Незалежність пошукових термінів в пошуковому запиті рідко спостерігається в дійсності, тому обчислення сумарної відповідності значно ускладнюється, що збільшує час інформаційного пошуку. Крім того, необхідно мати попередні дані про входження термінів у відповідні до запиту документи а також і у невідповідні до запиту документи.

<<< < Предыдущая 1 2 3 4 56 / 106 7 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
19.02.2016537.6 Кб86курсова (ГЕФ).docx
#
19.02.2016717.31 Кб29Курсова (електроніка).doc
#
19.02.20164.81 Mб63курсова гк 2014 final.doc
#
20.09.2019232.96 Кб7Курсова Кан.docx
#
19.02.20163.1 Mб66курсова робота (сама чётка).doc
#
19.02.2016411.65 Кб198Курсова робота (Сугоняк І.І.).doc
#
25.11.2018115.2 Кб5курсова робота Організація праці.doc
#
19.02.2016229.89 Кб9Курсовая.doc
#
28.10.2018440.83 Кб5Курсовая2.doc
#
18.07.2019336.38 Кб1курсоваяработа.doc
#
23.12.2018210.35 Кб3Л.Р.№2.docx