Pesquisa nos conteúdos multimédia

A função de reconhecimento da voz é mais eficaz no momento da pesquisa nos conteúdos multimédia. Graças ao reconhecimento automático dos textos das gravações e sua indexação você ganha acesso às informações contidas nas gravações sem ter que ouvi-las inteiras. É uma vantagem grande uma vez que hoje em dia é preciso conseguir muitas informações de muitas gravações no tempo muito limitado. Se tem à sua disposição um arquivo de gravações processadas desta forma. não é preciso ouvi-las todas, nem precisa limitar a sua pesquisa às informações fragmentárias introduzindo manualmente as palavras-chaves.

Parte linguística

A presente tecnologia combina o reconhecedor da voz com a função de pesquisa full-text acompanhada dos instrumentos para a pesquisa morfológica, do dicionário de sinónimos ou de um tradutor. É possível combiná-la com a pesquisa de entradas criando assim um sistema que pesquisa por voz e ao mesmo tempo está dirigido por ela.

Soluções de software

Igual que os outros sistemas de pesquisa o primeiro passo do processo é a indexação que sucessivamente permite uma pesquisa efetiva através dos índices criados.

O componente básico desta tecnologia é o reconhecedor da voz que transforma o som no texto (no caso do resultado ambíguo do reconhecimento será ambíguo também o texto). Segue o processamento do texto antes da indexação (cria-se o índice), por exemplo, lematização (trasformação da palavra à forma base) para a pesquisa morfológica, eventualmente para a tradução à linguagem do índice no qual um mecanismo pesquisa sucessivamente segundo as palavras introduzidas. As palavras introduzidas processam-se também, pode realizar-se, por exemplo, a lematização ou a expansão das formas gramaticais, eventualmente podem expandir-se os sinónimos ou realizar-se a tradução à língua do índice. 

O mecanismo de um reconhecedor exige quantidade grande de cálculos ajustados de forma que esteja capaz de transformar rapidamente índices nos textos. O tempo preciso para o processamento da gravação é mínimo comparando com o tempo da sua reprodução. O número elevado de núcleos permite o processamento paralelo de mais gravações duma vez. É melhor colocar aos reconhecedores nos servidores de parámetros equivalentes no caso de carga elevada. Outras atividades da indexação são muito mais rápidas. A pesquisa pode ser limitada pela rapidez da leitura do disco, o que pode resolver-se empregando os discos mais rápidos. Os melhores são os discos SSD, a sua reflexão nos outros discos, eventualmente outros servidores de pesquisa.