![]() 978 63 62 |
![]() |
Сочинения Доклады Контрольные Рефераты Курсовые Дипломы |
РАСПРОДАЖА |
все разделы | раздел: | Компьютеры, Программирование | подраздел: | Программное обеспечение |
Информационно-поисковые тезаурусы | ![]() найти еще |
![]() Молочный гриб необходим в каждом доме как источник здоровья и красоты + книга в подарок |
ТЕЗАВРАЦИЯ ЗОЛОТА (от греч. thesauros - сокровище) - накопление золота (слитков и монет) в качестве сокровища. Обычно относится к частному накоплению. В широком смысле - включает также создание золотого запаса центральными банками, казначействами и специальными фондами. ТЕЗАН - в этрусской мифологии богиня утренней зари. ТЕЗАУРУС (от греч. thesauros - сокровище) -..1) словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте (в полном объеме осуществим лишь для мертвых языков)...2) Словарь, в котором слова, относящиеся к каким-либо области знания, расположены по тематическому принципу и показаны семантические отношения (родо-видовые, синонимические и др.) между лексическими единицами. В информационно-поисковых тезаурусах лексические единицы текста заменяются дескрипторами. ТЕЗЕЙ - см. Тесей. ТЕЗИС - гравюра нач. 18 в. с богословским или философским текстом, сопровождающимся изображениями святых или исторических лиц. ТЕЗИС (греч. thesis - положение - утверждение),..1) в широком смысле любое утверждение в споре или изложении некоторой теории; в узком смысле основополагающие утверждения - принципы...2) В логике - утверждение, требующее доказательства. ТЕИЗМ (от греч. theos - бог) - религиозное мировоззрение, исходящее из понимания Бога как абсолютной личности, пребывающей вне мира, свободно создавшей его и действующей в нем
В своей работе, посвященной анализу политического дискурса35, авторы указывают на недостатки контент-анализа при тематическом мониторинге политического дискурса: «. необходимость “отслеживания” множества тем и их сочетаний делает использование стандартного контент-анализа практически невозможным»36. Авторы разработали новую методологию мониторинга тематики политического дискурса, основной особенностью которой является широкое использование компьютерных методов обработки языковых данных. Контент-анализ соединяется с методами, используемыми в области информационного поиска, – информационно-поисковым тезаурусом. Краткий обзор подходов к исследованию политического дискурса демонстрирует отсутствие единых терминологии и методологии. При этом очевидно, что на основе трех базовых подходов (риторического, когнитивного и дискурсивного) и ряда дополнительных методов формируется новая, современная методологическая система. В качестве интегрирующего элемента разных подходов к политическому дискурс-анализу представляется возможным принять следующий тезис: «. политическая реальность осуществляется и конструируется в дискурсе и через дискурс (политические процессы конституируются и осуществляются через текст)»37, т.е., изучая язык власти, необходимо методы структурного анализа (риторические тактики и стратегии, стилистические приемы, анализ языковых единиц разных уровней) вписать в социокультурный политический контекст.
Должность - секьюрити". Соответственно и запросом в первом случае будет служить часть письма клиента с пожеланиями относительно его партнера: "Невесту хочу моложе меня, но премудрую и чтоб хозяйством домашним интересовалась", а во втором - составленная по ней таблица: "Возраст вІ33, интеллект - высокий, интересы - домашнее хозяйство". В настоящее время фактографические ИПС (как специальный класс поисковых систем) практически не разрабатываются, выполняемые ими действия реализуются с помощью штатных СУБД. Далее, говоря ИПС, будем иметь в виду документальную информационно-поисковую систему. Одним из популярных способов перевода документа на внутренний язык системы является координатное индексирование - присвоение документу набора ключевых слов или кодов, определяющих его содержание. Возможны два способа индексирования: свободное, когда непосредственно из текста документа извлекаются ключевые слова без учета всех видоизменений их форм и отношений между ними; и контролируемое, когда в поисковый образ документа включаются только те слова, которые зафиксированы в информационно-поисковом тезаурусе, где указаны их синонимические, морфологические и ассоциативные отношения. 4.2
Однако такой режим индексирования обладает рядом недостатков: возможна синонимия; нельзя отразить парадигматические отношения. При индексировании с тезаурусным контролем лексики для выражения содержания документа и запроса используют только дескрипторы, входящие в информационно-поисковый тезаурус, что позволяет исключить синонимию и учесть парадигматические связи, и, в конечном счете, повышает эффективность поиска. Таким образом, информационно-поисковые тезаурусы используются для: - перевода текста с ЕЯ на дескрипторный ИПЯ путем замены ключевых слов соответствующими дескрипторами, при этом исключается многозначность; - отображения парадигматических связей между дескрипторами. 4. Структура информационно-поискового тезауруса Тезаурус имеет вид словаря, в котором в определенном порядке расположены термины и зафиксированы связи между ними. Как правило, тезаурус состоит из введения, алфавитного указателя (словарная часть) и систематического указателя. Введение содержит общие характеристики тезауруса - область применения, правила использования, число дескрипторов, ключевых слов и другую справочную информацию.
В информационно-поисковых тезаурусах лексические единицы текста заменяются дескрипторами. ТЕЗИС (греческое thesis — положение, утверждение), 1) в широком смысле — любое утверждение в споре или изложении некоторой теории; в узком смысле — основополагающее утверждение, принцип. 2) В логике — утверждение, требующее доказательства. ТЕИЗМ (от греческого theos — бог), религиозное мировоззрение, исходящее из понимания Бога как абсолютной личности, пребывающей вне мира, свободно создавшей его и действующей в нем. Признание потусторонности Бога отличает теизм от пантеизма, признание непрерывной активности Бога — от деизма. Наиболее характерен для генетически связанных между собой религий — иудаизма, христианства, ислама. ТЕЙЛЕР (theiler) Макс (1899–1972), врач и микробиолог. Родился и жил в ЮАР, с 1922 в США. Труды по этиологии инфекционных заболеваний. Открыл возбудителя желтой лихорадки и создал вакцины против нее. Нобелевская премия (1951). ТЕЙЛОРИЗМ, система организации труда, основанная на глубокой специализации и рационализации трудовых операций, направленная на интенсификацию труда
Однако общим местом речи во всех видах словесности стало доверие к науке как истинному знанию, и ссылка на научный авторитет и авторитет науки стала применяться как общее место. В риторике, начиная с XVII – XVIII вв., укрепились и стали как бы обязательными общие места, взятые из пословиц гносеологического характера, такие как ум – знание, явление – признаки, целое – части, единое – неединое и т.д. В условиях рукописной речи эти общие места применялись главным образом в юридических доказательствах, теперь они приобрели силу общих мест для любого текста, в том числе художественного. Авторитет пророческих текстов как источник общих мест был забыт. Массовая коммуникация в отношении общих мест поделилась на общие места информатики – рубрикацию информационно-поисковых тезаурусов и так называемый «символический зонтик» массовой информации. Под «символическим зонтиком» понимается система символов, служащая для отбора сообщений, и формирование рубрик выпусков массовой информации. То и другое составляет только предпосылку общих мест, т.к. рубрикация информационно-поисковых тезаурусов различна в разных информационных системах и заменяется время от времени, а «символические зонтики» также постоянно эволюционируют под воздействием групповых и политических интересов.
Запросы к системе формулируются также с помощью тезауруса по определенным правилам. Совокупность правил перевода с естественного языка на язык системы, и тезаурус образуют информационно-поисковый язык системы. Совокупность документов в памяти ЭВМ образует последовательный массив (файл). Поиск информации в системе осуществляется путем сравнения понятий поискового образа документа и понятий запроса. При их полном или частичном совпадении (в зависимости от критерия выдачи) документ считается релевантным, т. е. соответствующим запросу. Но при такой последовательной организации информации поиск и сравнение со всеми поисковыми образами заняли бы много времени. Для более эффективной организации информации в систему вводят инверсный (поисковый) массив, в котором каждому понятию тезауруса поставлен в соответствие набор номеров документов, в которых это понятие встречается. К функциям ППП для ИПС относятся: . ведение и использование информационно-поискового языка; . ввод, накопление и изменение информации; . поддержка инверсного массива; . поиск и выдача информации по запросам.
Универсальными структурами дескрипторного языка являются лексические единицы, парадигматические и синтагматические отношения. Лексическая единица – наименьшая смысловая единица, задаваемая при построении языка. В большинстве автоматизированных информационных систем при индексировании документов и запросов применяется контроль с помощью тезауруса. Контроль может осуществляться в автоматизированном или ручном режиме. По сути дела тезаурус представляет собой словарь – справочник, в котором присутствуют все лексические единицы дескрипторного информационно поискового языка с введенными парадигматическими отношениями. Парадигматические отношения могут задаваться как: Отношения вид – род (вышестоящий дескриптор); Отношения род – вид (нижестоящие дескрипторы); Синонимы; Ассоциативные связи В тезаурусы помещаются дескрипторы и недескрипторы, хотя существуют тезаурусы только из дескрипторов. Как дескрипторы, так и недескрипторы приводят к единой грамматической форме. Как правило, дескрипторы употребляются в форме существительных или именных словосочетаний.
Как в тех, так и в других системах необходимо формировать информацию по определенным признакам, то есть информация должна подвергаться формализации. Формализация в фактографических системах достаточно проста. Рассмотрим формализацию в библиографических информационно- поисковых системах. Самым важным в этой системе является семантический или смысловой аспект. При хранении документов и поиске нужных необходимо создавать поисковые образы. Для построения поиского образа используется классификаторы, словарь ключевых слов, тезаурусы ( словарь ключевых понятий ). 29. Системы управления базами данных (СУБД).Организация данных и управление ими. База данных - это совокупность взаимосвязанных данных, хранящихся совместно в памяти ЭВМ. Каждая БД состоит из записей.Система управления базами данных – это комплекс программных средств, предназначенный для использования и создания баз данных с помощью прикладных программ пользователей. Прикладные программы могут быть на разных языках. Поэтому организация базы данных должна быть независимо от программ пользователя. С появлением сетевых технологий вопрос организации баз данных, как больших хранилищ информации приобретают очень важное значение.
В механизированных ИПС наиболее перспективными следует признать применение классификационных систем в сочетании с дескрипторными языками и составление отраслевых и многоотраслевых тезаурусов, над чем работают и российские специалисты. Хотя координатное индексирование практически трудноосуществимо без участия человека, методы математической лингвистики дают возможность применять автоматическое индексирование при составлении тезаурусов. В решении проблемы информационного поиска все большее значение приобретают семантико-лингвистические исследования как важнейшее условие построения достаточно эффективных информационно-поисковых языков. Из всех участников информационной деятельности самый низкий уровень механизации поисков информации – в архивах. Здесь механизация и автоматизация информационных поисков целесообразна по наиболее интенсивно используемым фондам. При небольшом объеме информационной и справочной работы правильнее решать вопросы поиска сведений путем применения “малой” механизации, а в некоторых случаях и путем составления традиционных архивных справочников. в то же время и внедрение механизации и автоматизации ни в коей мере не снижает значения составляемых к архивным документам описей, каталогов, путеводителей и т.п., равно как и публикации документальных материалов, являющихся не только средством учета и охраны документации, но и средством широкого общения архивов как научных учреждений с общественностью, учеными, учреждениями и организациями, использующими документальные материалы как в центре, где расположены архивные учреждения, так и вне его.
В ведении персонала системы находятся технические и програмные средства АИПС «Розыск». Руководство АИПС «Розыск» осуществляет отдел оперативного реагирования ГУ ГИБДД МВД России. Основной задачей персонала Автоматизированной информационно-поисковой системы «Розыск» (сокращенно АИПС) является обеспечение розыска транспортных средств путем постоянной актуализации и поддержания федеральной, межрегиональной, региональной базы данных, программно- технических средств системы в работоспособном состоянии. Вдаваться в подробности организации этой информационной системы я не буду. Отмечу следующий момент. Данная система не позволяет входить в нее оперативно, например из автомобиля ГИБДД и получать исчерпывающую информацию в короткий промежуток времени. Я думаю, такое положение снижает эффективность применения этой системы. Не позволяет работать с нею во время патрулирования инспектора ГИБДД. Технически, данная проблема давно уже с успехом разрешена (например в США, ФРГ и некоторых других странах). 2. Особенности расследования преступлений по делам об угонах транспортных средств Тактика и методика проведения первоначальных следственных действий по делам об угонах во многом зависит от конкретно сложившейся ситуации.
Благодаря контекстным определениям образуются синонимы первичных, вторичных и терми- нированных имен. Терминирование представляет собой использование результатов первич- ного и вторичного именования для установления фиксированного значения лек- сических единиц. Фиксированное значение предполагает устранение синонимии с помощью социальной фиксации значения лексических единиц для называния опре- деленного предмета мысли. В терминировании применяются, главным образом, родо-видовые и функциональные определения. Соотношение между тремя родами именований может быть представлено так. Фигура 29. ? ? Признаки ? ? ? Роды ?Название нового?Создание синонимов?Использование уже? ? именований ?предмета мысли ? ?существующих ? ?Первичное ? ? ? - ? ?Вторичное ? - ? ? ? ?Терминирующее? ? - ? ? В ИПС (информационно-поисковых системах) (и их аналогах - каталожных именованиях) и терминах, используемых в дидактических текстах, применяются только первичные имена и термины. Вторичные имена, напротив, устраняются. Создание первичных имен предполагает действие трех функционально различенных деятелей: ономатотета, диалектика и пользователя.
IRC – одна из разновидностей телеконференций, иначе ее называют «болтовней» в реальном времени. Эта телеконференция позволяет осуществлять в режиме реального времени текстовое общение между совершенно незнакомыми людьми с возможностью графических вставок. Служит в основном для проведения досугов, поскольку здесь, как правило, не решаются такие серьезные вопросы, как, например, в Use e . IP-телефония – голосовая связь. Человеческая речь преобразуется в звуковой файл и передается по сети в реальном времени. Единственное преимущество перед обычной телефонной связью состоит в необычайной дешевизне в расчете на минуту разговора. WWW (World Wide Web или «Всемирная паутина») - гипертекстовая информационно-поисковая система I er e . Блоки данных WWW размещаются на отдельных компьютерах, называемых WWW-серверами (Web-серверами) и принадлежат отдельным организациям или частным лицам. С помощью гипертекстовых ссылок, встроенных в документы WWW, пользователь может переходить от одного документа к другому. В основе WWW лежит протокол передачи гипертекстовых сообщений H P (Hyper ex ra sfer Pro ocol), а сами страницы формируются с помощью специального гипертекстового языка описания документов H ML (Hyper ex Markup La guage).
КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ КУЛЬТУРЫ И ИСКУССТВКафедра информатикиВступительный реферат по теме:Стратегия поиска в Автоматизированных информационно-поисковых системах Выполнил: Султанов Ильнур ИльдусовичКазань, 2004 Содержание Введение4 Проблемы поиска информации6 Поисковые алгоритмы8 Оценка качества17 Дополнительные возможности предоставляемые поисковыми машинами19 Лингвистика21 Заключение23 Список литературы24 Глоссарий:25 Введение Проблема поиска и сбора информации одна из важнейших проблем информационно поисковых систем. Конечно, нельзя сравнивать в этом отношении, скажем, средние века, когда поиск информации был проблемой потому, что этой информации было мало, и требовались усилия только для того, чтобы найти хоть что-то по более или менее значительному интересующему вопросу. Проблема поиска информации приобрела новый характер в 20-м столетии, с началом развития века информационных технологий. Теперь она заключается не в том, что информации мало и поэтому ее трудно найти, а в том, что ее теперь наоборот становится все больше и больше, и от этого найти ответ на интересующий вопрос может оказаться тоже довольно сложной задачей .
Автоматизированные системы оперативно-розыскного назначения 1. Автоматизированный Банк Данных -АБД Центр обеспечивает сбор, обработку и выдачу сведений о следующих объектах учета: особо опасных рецидивистах, ворах в законе, авторитетах преступного мира и др. (установочные данные, приметы, место работы, жительства); тяжкие нераскрытые преступления (место, время, способ совершения, предмет посягательства); изъятые, утраченные и выявленные номерные вещи. Запросы проверочного характера отрабатываются в течение суток, аналитического - в течение недели с момента получения. Для направления запроса в АБД-Центр необходимо воспользоваться телетайпом или почтой. 2. Автоматизированная информационно-поисковая система "Автопоиск" предназначена для сбора, систематизации, хранения и обработки информации о всех угнанных, задержанных, похищенных и бесхозяйных автотранспортных средствах. АИПС выдает сведения по следующим установочным данным: госномер номер двигателя номер кузова номер шасси 3. Автоматизированная информационно-поисковая система "Оружие" обеспечивает автоматизированный учет утраченного, похищенного и выявленного нарезного огнестрельного оружия, в том числе: легкого стрелкового вооружения, гранатометов,огнеметов, артиллерийских систем (ствольных и реактивных), боевых машин, имеющих вооружение.
Алгоритм здесь - последовательность информационно - поисковых процедур, а база данных - набор декларативных знаний. Задачи АСУ принятия решений - когда на основании определенного набора критериев из множества альтернатив выбирается наиболее подходящая для достижения поставленных целей. Цели и критерии могут быть как постоянными, так и изменяться в процессе решения задачи. Логические задачи, в которых по описанию начальной и целевой ситуаций из имеющегося набора действий синтезируется алгоритм достижения цели. Для решения двух последних типов задач могут применяться методы искусственного интеллекта, основанные на знаниях. Одной из разновидностей систем, использующих эти методы, являются экспертные системы (ЭС). Они представляют собой попытку создания человеко-машинных комплексов для решения слабо формализуемых задач или задач вообще не имеющих алгоритмического решения. Можно дать следующее определение экспертной системе: Экспертная система - это компьютерная программа, содержащая накопленные знания специалистов в определенной предметной области, Эта программа способна вырабатывать рекомендации, какие бы дал эксперт-человек, запрашивая при необходимости дополнительную информацию.
Наведение справок — получение фактической информации, значимой для решения конкретных задач оперативно-розыскной деятельности, путем направления запроса соответствующему юридическому или физическому лицу, располагающему или могущему располагать таковой, а равно ее получение путем непосредственного ознакомления с соответствующим материальным носителем. В частности, о лице-объекте оперативной заинтересованности интерес может представлять следующая информация: биографические данные, образование, место проживания, совершенные в прошлом преступления (иные правонарушения и др.), родственные и иные связи и т.п. Предмет наведения справок — оперативные, криминалистические и иные базы данных (учеты), информационные системы (местные, региональные и общероссийские информационно-поисковые системы) и архивы, другие документальные источники, включая натурные коллекции, редкие коллекции и т.п. Сбор образцов для сравнительного исследования -- обнаружение и изъятие материальных носителей информации (предметов, веществ и т.д.) с целью их сравнения с материалами, которыми уже располагает оперативное подразделение (сотрудник оперативного подразделения и др.) для решения конкретной задачи оперативно-розыскной деятельности.
На основе анализа осуществляется кодирование конструкторско-технологических признаков. Кодирование необходимо для создания на предприятии информационно-поисковой системы (ИПС) на базе ЭВМ. Информационно-поисковая система позволяет из многотысячной номенклатуры деталей предприятия выбрать детали с необходимыми конструкторско-технологическими признаками. Подбор деталей с одинаковыми конструкторско-технологическими признаками позволяет применить групповые технологические процессы в условиях серийного и единичного производства Для группирования деталей по их конструкторско-технологическому подобию используется конструкторско-технологический код детали, который имеет следующую структуру ХХХХХX.XXX ХХХХХХ.ХХХХХХХХ Обозначение детали Технологический по конструкторскому код документу детали рис.3.3.2 Таким образом, создание полного конструкторско-технологического кода детали состоит из двух этапов: 1-й этап – классификация и кодирование конструкторских признаков детали; 2-й этап классификация и кодирование технологических признаков детали.
![]() | 978 63 62 |