Pesquisa full-text

Criando um sistema de software no qual é precisa a pesquisa full-text apreciará o componente que lhe facilitará encontrar as palavras sem ver a sua forma concreta do dado texto. Para estes objetivos criou-se o presente componente que tem duas funções:

  • conseguir a forma básica de qualquer palavra
  • gerar todas as formas possíveis de qualquer palavra

Em geral, com a forma básica (lema) percebe-se o nominativo singular dos substantivos. No caso dos verbos considera-se a forma básica o infinitivo. Algumas línguas admitem exceções, por exemplo em búlgaro, onde não existe infinitivo, funciona como a forma básica dos verbos a primeira pessoa de singular. O húngaro dispõe de infinitivo, mas como lema costuma empregar-se a terceira pessoa de singular.

Parte linguística

O programa baseia-se, igual que um corretor ortográfico, na descrição formal da morfologia de uma língua concreta adicionando outras informações, ou seja, todas as categorias gramaticais:

  • género, número e caso nos substantivos   
  • pessoa, número, modo e aspeto verbal
  • categorias de pronomes, numerais, advérbios ou conjunções

Encontrar a forma básica de uma palavra não é tão simples como parece. Existem muitos verbos  irregulares como por exemplo: ter-tive, fazer-fiz, dizer-disse.

Outro problema aparece no caso da homonímia. Em muitas palavras não fica claro de que são derivadas, por exemplo, a forma jantar pode ser o verbo no infinitivo ou substantivo masculino.

Soluções de software

As nossas soluções de software são muito económicas. Sabe, por exemplo, quantas formas diferentes das vozes existe em checo? Mais de 6,7 milhões incluídas todas as informações morfológicas. Toda esta informação cabe num arquivo de 1 MB. Podemos dizer que um bit contém três palavras checas.

Funções acessíveis

  • pesquisa da forma básica de uma palavra
  • pesquisa de todas as formas morfologicamente relacionadas
  • declinação de todo o grupo nominal constituído por um adjetivo e um substantivo

O suporte da pesquisa full-text oferecemos para muitas línguas e plataformas (veja a tabela). Para fazer a pesquisa ainda mais cómoda, aconselhamos que use outro dos nossos componentes - Dicionário de sinónimos. No caso da pesquisa multilingue é possível combinar nossas tecnologias de tradução e para pesquisar nos arquivos de áudio e vídeo com as tecnologias de reconhecimento da fala. 

Experimente-o

Experimente as possibilidades da pesquisa morfológica em várias línguas na aplicação Lingea Lexicon.