[firebase-br] Busca em conteúdo de arquivos

brujeria em task.com.br brujeria em task.com.br
Qua Maio 30 16:53:39 -03 2007


Judison, 

essa sim é a maneira exata de atender a este requisito! 

Mas crei que não há muito do que fugir desta modelagem.
Uma coisa que pensei seria juntar estas palavras por grupos de assuntos 
específicos, como:
GRUPO: Saude - Palavras: Hemodiálise, injeção .....
Dai procurar qual o grupo da palavra e depois documentos com palavras nestes 
grupos. 

O que deve realmente diferenciar o projeto é o motor de busca. 

Vou efetuar alguns testes com as ferramentas prontas que achei (PHPDig , 
HT:Dig , MNogo ...) e depois entrarei em contato para verificar se o 
processo é lento. 

Mas com os benefícios que isto traz para uma instituição máquina de alto 
nível para fazer p trabalho sai barato. 

São apenas chutes, não sei bem... 

Qualquer ajuda é muito bem vinda! 

Valeu
Mario Mol 

> Ola, 
> 
> Que eu saiba nenhum banco faz pesquisa dentro de BLOB 
> 
> O melhor eh guardar as referencias mesmo. 
> 
> Caso sejam apenas arquivos pequenos e arquivos txt, voce pode guardar
> num campo varchar(8Kb) ou algo assim, porem qq pesquisa representa
> "ler" todos os arquivos... 
> 
> Agora, se seu sistema eh especificamente p/ isso, ou isso eh ago e
> grande importancia, basicamente voce deve fazer uma estrutura +/-
> assim:
> uma tabela PALAVRA com COD_PALAVRA, PALAVRA,
> uma tabela ARQUIVO com COD_ARQUIVO, ARQUIVO e
> uma tabela PALAVRA_ARQUIVO, com COD_PALAVRA, COD_ARQUIVO, QTD 
> 
> que voce vai polular na hora de adicionar o arquivo (processo
> relativamente lento e especializado pra cada tipo de arquivo (txt,
> doc, pdf)) porem as buscas serao bem rapidas... soh se atente ao
> volume de dados, nao queira fazer um google com uma estrutura simples
> assim hehehe 
> 
> []'s 
> 
> On 5/29/07, brujeria em task.com.br <brujeria em task.com.br> wrote:
>> Pessoal, 
>>
>> estou tentando fazer buscas de palavras dentro de conteúdo de arquivos. 
>>
>> Aqui está as possíveis soluções: 
>>
>> 1. Gravar os arquivos como blob e usar o fb para procurar estes termos
>> dentro do arquivo. 
>>
>> 2. Gravar apenas as referencias no banco e os arquivos dentro de um
>> diretorio. 
>>
>>
>> Alguem sabe alguma forma de procurar palavras em blob mesmo para arquivos de
>> diferentes tipos como .doc , .txt .pdf ... ? 
>>
>> Alguem conhece algum script em php, java ou o que for para procurar estas
>> palavras dentro do conteúdo dos arquivos? 
>>
>> Qualquer ajuda é muito bem vinda! 
>>
>> Obrigado, 
>>
>> Mario Mol 
>>
>>
>>  --------------------------------------------------------
>> Task.Blog
>> Um espaço para comunicação entre a Task e seus clientes.
>> Visite: http://blog.task.com.br 
>>
>> ______________________________________________
>> FireBase-BR (www.firebase.com.br) - Hospedado em www.locador.com.br
>> Para editar sua configuração na lista, use o endereço http://mail.firebase.com.br/mailman/listinfo/lista_firebase.com.br
>> Para consultar mensagens antigas: http://firebase.com.br/pesquisa 
>>
>  
> 
> -- 
> Judison
> judison em gmail.com 
> 
> ______________________________________________
> FireBase-BR (www.firebase.com.br) - Hospedado em www.locador.com.br
> Para editar sua configuração na lista, use o endereço http://mail.firebase.com.br/mailman/listinfo/lista_firebase.com.br
> Para consultar mensagens antigas: http://firebase.com.br/pesquisa
 

 --------------------------------------------------------
Task.Blog
Um espaço para comunicação entre a Task e seus clientes.
Visite: http://blog.task.com.br




Mais detalhes sobre a lista de discussão lista