2024 Autor: Howard Calhoun | [email protected]. Última modificação: 2023-12-17 10:38
É difícil para uma pessoa moderna imaginar a vida sem a Internet e acesso quase instantâneo às fontes de informação. O usuário raramente pensa em como é realizada a busca do conteúdo desejado na rede. Mas isso é muito interessante.
Um sistema de recuperação de informações (IPS) é um sistema complexo de software e hardware que seleciona informações a pedido do usuário. As informações são armazenadas em servidores em formato digital, como os livros costumavam estar nas prateleiras das bibliotecas. O sistema consiste em muitos subsistemas. Cada um desempenha sua tarefa no processo de processar a solicitação do usuário e fornecer a ele informações em forma de texto ou som. A multiplicidade de tarefas a serem resolvidas determina a complexidade da arquitetura dos modernos sistemas de recuperação de informação (abreviação de sistema de recuperação de informação). Uma espécie de "caixa preta": na entrada - o texto da solicitação, o que está dentro - é desconhecido, na saída - informações abrangentes.
Fluxos de entrada
Solicitações de informações que uma pessoa forma em forma de texto na tela de seu gadget,constituem uma pequena parte dos pedidos processados pelo motor de busca. As principais matrizes de consultas de pesquisa são formadas por robôs que aceitam uma solicitação humana e realizam uma pesquisa em várias etapas e feedback com o usuário. Os sistemas de recuperação de informações incluem o conhecido Google, Yandex e outros, processando milhões de solicitações diariamente.
Objetos de pesquisa de origem
O conjunto de objetos iniciais de interesse para a busca são documentos, registros, vídeos, imagens e muito mais. Eles são criados fora do IPS. O sistema de armazenamento e recuperação de informações gerais deve ter um sistema bibliográfico embutido - uma espécie de catálogo que permite pesquisar qualquer tipo de objeto.
Objetos ou suas transformações digitais tornam-se um "recurso de entrada" no IPS. É entre eles que se seleciona a informação que o usuário precisa.
Fontes externas
A visualização de seleção de informações usa fontes externas de conhecimento. Esta é a informação que o usuário está procurando. O título do filme, uma citação do livro e muito mais. Para uma pesquisa no computador, essas informações devem ser traduzidas em uma consulta em uma linguagem algorítmica. No IPS, isso é feito usando o bloco de criação, indexação e desenvolvimento de consultas.
Idealmente, esses três processos-representação, indexação e desenvolvimento de consultas-devem contar com fontes idênticas de conhecimento, mas, na prática, isso não é possível.
As fontes de conhecimento devem ser constantemente revisadas e atualizadas, e a atualização deve ser idêntica esincronizado. E uma fonte externa de conhecimento sempre precede cronologicamente seu uso nos mecanismos de busca para uma consulta, às vezes por vários anos.
Desempenhos
As representações dos objetos originais são compostas de dados de entrada em alguma combinação ou transformados de acordo com as regras e algoritmos de um determinado sistema de recuperação de informações.
As visualizações são cópias mais ou menos transformadas do objeto de pesquisa original. Na coleção de textos completos não editados, cada texto é sua própria representação. Na coleção de objetos de exposições e artefatos de museu, a representação pode ser uma descrição transformada do objeto com sua imagem. Em alguns casos, a representação pode ser parcialmente derivada do objeto original e parcialmente da descrição: nos motores de busca bibliográfica, as representações são derivadas do objeto - por exemplo, título, nome do autor serão combinados com a anotação da obra.
Índice pesquisável
Como a informação nos sistemas de recuperação da informação é armazenada na forma de representação, é lógico supor que a busca é realizada de acordo com a representação e, após a seleção, é entregue ao usuário. Na prática, este não é o caso. Por exemplo, os catálogos de bibliotecas online atuais normalmente restringem as pesquisas a alguns campos: autor, título e legendas em uma exibição que contém outros campos que não são pesquisados. Esta é razão suficiente para que seja necessário distinguiruma exibição e um índice pesquisável, que é a parte de pesquisa da exibição. Ele define tudo o que deve ser pesquisável. Um índice pesquisável, como a visualização e o objeto de origem, pode ser dividido em subíndices separados para fornecer pesquisas mais precisas e direcionadas
Os mecanismos de pesquisa geralmente têm uma estrutura sintética internamente para corresponder a resultados de pesquisa válidos. Essa estrutura é o segundo componente do índice pesquisável.
Proceduralmente, o processo de indexação pode ser implementado de diferentes maneiras: um índice pesquisável pode ser obtido por:
- copiando literalmente uma representação pesquisável;
- copiando os detalhes da visualização. Isso pode ser parte ou todas as visualizações que existem fisicamente apenas como fragmentos, distribuídos de acordo com as regras de criação de um índice para pesquisa, que será coletado quando necessário.
Solicite regras de design e solicitações formais
A engenharia de consultas é uma função que faz a mediação entre uma consulta do usuário e uma consulta formal. Ele transforma a consulta do usuário, combinando-a com os dicionários de comando de recuperação, especificação de índice e índice antes da recuperação. No início do desenvolvimento do IPS, essa função era tradicionalmente atribuída a especialistas de TI qualificados.
Desenvolver consultas de computador que podem corresponder a consultas de dicionário em um sistema de índice pesquisável é comumente referido como o módulo "entrada de dicionário". A automação dessa função é promissora e oferece oportunidades para métodos de pesquisa especializados e probabilísticos.
Uma solicitação formal se torna uma solicitação formal após a conversão da solicitação do usuário. Exemplos de tais transformações formais incluem truncamento, substituição, normalização, vetorização e outras transformações da representação "externa" nas representações "internas" de IPS de computador (descriptografia - sistema de recuperação de informações).
Conjuntos de links de documentos extraídos
O conjunto resultante de fontes de informação é logicamente um subconjunto das visualizações criadas pelas regras de correspondência aplicadas à consulta formal por um índice pesquisável.
Geralmente, mas não necessariamente, há um processo de classificação separado para o conjunto de informações recuperado. Os catálogos de bibliotecas online geralmente reordenam os conjuntos recebidos em ordem alfabética por autor antes de serem exibidos. Em sistemas de recuperação de informações que produzem classificações rígidas, a ordem de classificação precede qualquer reordenação.
Fluxos de saída
A saída dos resultados da pesquisa é feita tradicionalmente no display, mais frequentemente na forma de um fluxo de objetos a serem usados em outro lugar ou para alguma outra finalidade, completando o loop de pesquisa principal. Tais fluxos podem ser enviados para dispositivos de visualização, armazenamento para processamento posterior ou uso como fluxos de entrada para outros serviços de seleção.
Sistemas de recuperação de informações permitem feedback dea saída de qualquer processo de seleção. A saída de qualquer processo pode ser um feedback para outros processos. O feedback pode fornecer a base para o julgamento de especialistas em qualquer estágio.
Recomendado:
O que é o negócio da informação? Negócios de informação de A a Z
Hoje, o negócio da informação é merecidamente considerado o principal recurso para o desenvolvimento da sociedade. Consideremos em detalhes como e em que se baseia essa atividade
Sistema de informação e referência: tipos e exemplos. O que é um sistema de informação e referência?
Divulgação da informação, sua posterior coleta e processamento na sociedade moderna se deve a recursos especiais: humanos, financeiros, técnicos e outros. Em algum momento, esses dados são coletados em um único local, estruturados de acordo com critérios pré-determinados, combinados em bancos de dados especiais convenientes para uso
Sistemas de informação econômica: definição, conceito e estrutura
Hoje o processamento de dados é uma área independente com uma variedade de métodos e ideias. Além disso, os elementos individuais desse processo alcançaram uma alta interconexão e um bom grau de organização. Isso possibilita combinar todas as ferramentas de processamento de informações em um objeto econômico específico, que é chamado de "sistema de informações econômicas" (EIS)
Sistemas Visa e Mastercard na Rússia. Descrição dos sistemas de pagamento Visa e Mastercard
Sistema de pagamento - uma comunalidade de métodos e ferramentas usadas para transferências de dinheiro, liquidações e regulação de obrigações de dívida entre participantes do giro econômico. Em muitos países, eles diferem significativamente entre si devido às diversas disposições nos níveis de desenvolvimento econômico e às características da legislação bancária
Proteção dos direitos do empresário. Formas e métodos de proteção dos direitos dos empresários
No nosso tempo, nem todos os empresários sabem como proteger os direitos de um empresário, mas esta é uma informação bastante importante que pode ser repetidamente útil no processo de gerir o seu próprio negócio