Joomla 1.5 template design door Websitebird

Leitura recomendada

O caderno Link (dedicado ao tema da tecnologia) do jornal O Estado de São Paulo publicou na última segunda-feira uma interessante matéria sobre a importância de se pensar sobre o arquivamento de informações a longo prazo. O texto começa contando uma história de cientistas da Nasa que, em 2001, procuravam informações capturadas por uma sonda enviada à Marte na década de 1970. Os arquivos não puderam ser abertos pois, “o software que os lia não existia mais, e […] os técnicos que conheciam o formato estavam todos mortos”.

Esse assunto já foi tema de um artigo publicado nesse blog. Por isso, a recomendação da leitura.

http://blogs.estadao.com.br/link/site-arqueologico/

 

Verdades absolutas não existem

A discussão não é nova. Sempre que um projeto de digitalização inicia-se a discussão vem à galope. Sempre existe aquele que traz a verdade absoluta: “Esse formato é melhor do que aquele”. Quem disse?

Em um lugar em que existem diversos cenários e parâmetros, existe uma palavra mágica que a maioria das pessoas desconhece: adequação. E, escolher adequadamente os formatos de arquivo, as verdades absolutas caem por terra.

Determinados formatos de arquivo podem, de fato, serem superiores a outros. Armazenar arquivos de áudio em formato WAV é, sem dúvida, garantia de maior qualidade em comparação com compactações MP3. Assim como armazenar fotografias em arquivos TIFF de 600 dpi é, sem dúvida, garantia de maior qualidade em comparação com arquivos JPEG de 100 dpi. Mas, e se tudo isso não for um grande preciosismo, para não dizer desperdício?

A discussão sobre a adequação ao formato de arquivo parte do princípio de que outras perguntas já foram respondidas: qual o orçamento do projeto? Qual o seu propósito? Qual a matriz dos documentos?

Tomando a primeira pergunta, esbarra-se em uma questão orçamentária, na maioria das vezes, mandatória no projeto. A escolha por WAV no lugar de MP3 pode não ter impacto nenhum no custo da digitalização, mas sem dúvida terá reflexo no custo do storage (arquivos MP3 de boa qualidade tendem a ocupar cerca de 10 vezes menos espaço do que seus respectivos WAV). Em outros casos, além do espaço de armazenamento, a escolha do formato pode refletir em um encarecimento dos serviços de digitalização. Digitalizar fotografias em 600 dpi será, sem dúvida, mais caro do que digitalizar as mesmas fotografias em 100 dpi.

Tomando a segunda pergunta, a questão é de propósito. O projeto de digitalização propõe-se apenas a preservar dados ou outras informações são relevantes? Trocando em miúdos, quando digitalizamos um relatório estamos interessados em seu conteúdo ou se a fonte é ou não serifada. Se a primeira alternativa for a válida, então basta digitalizar em resolução próxima de 100dpi. Caso contrário, a resolução terá que ser maior.

A última pergunta é aquela que as pessoas normalmente prestam menos atenção. De que adianta digitalizar em resolução full HD (1080p) um filme cuja matriz é uma fita VHS? De que adianta digitalizar em WAV com qualidade de CD se a matriz é uma fita cassete? Poucas pessoas se dão conta de que em um processo de digitalização não é possível ganhar resolução a partir da matriz.

Escolher adequadamente o formato de arquivo e qualidade da digitalização é um dos fatores que garantirá o sucesso do projeto e um melhor aproveitamento dos recursos humanos e financeiros, tornando o processo como um todo mais eficiente.

 

Memória, memória, memória

Um dos dois principais fatores na popularização da digitalização de documentos é o barateamento do custo de armazenamento de dados. O outro é o incrível avanço nas tecnologias e equipamentos de digitalização, mas tratarei desse assunto em outro artigo.

Ora, para que se digitaliza documentos? Resgatá-los e reproduzi-los é um bom motivo para um projeto de digitalização. De que adianta digitalizar milhares e milhares de documentos se não será possível dispor deles rapidamente? Dispor esses arquivos rapidamente significa armazená-los em equipamentos cujo tempo de acesso é baixo, como matrizes de discos rígidos. Não é possível disponibilizar documentos on line em outro tipo de mídia, como CDs ou fitas, sob pena de tornar o processo de busca lento ou até mesmo impossível.

A computação pessoal teve início no princípio na década de 1980, com os primeiros IBM PC. As primeiras gerações destes computadores raramente tinham algum disco rígido. Aqueles que tinham, ofereciam 5 megabytes. Mesmo para os padrões da época, que utilizavam disquetes de 5 ¼” com capacidade para 180 kbytes ou 360 kbytes, 5 megabytes não era lá grandes coisas. Só o sistema operacional padrão da época, MS-DOS, podia ocupar cerca de 512 kbytes, ou 10% da capacidade do disco rígido.

Num cenário de cerca de 30 anos, além do avanço na capacidade de processamento dos computadores um outro importante fator é notado: a queda no custo de armazenamento de dados. O gráfico abaixo ilustra o custo por gigabyte desde a década de 1980 até os dias de hoje.

O gráfico só é visível usando escala logaritmica pois a evolução da tecnolgia de armazenamento versus o seu custo evoluiu exponencialmente. Para se ter uma idéia desta evolução, um disco rígido de 5 megabytes, em 1981 custava aproximadamente US$ 1.700,00, ou US$ 340,00/megabyte. Quatro anos depois, um disco rígido de 10 megabytes custava "apenas" US$ 710,00, ou US$ 71,00/megabyte, uma queda de quase cinco vezes. Nos dias de hoje, é possível adquirir um disco rígido de 2 Tbytes, ou 400 mil vezes maior do que o disco rígido típico de 1981, por meros US$ 180,00, ou 9 centavos de dólar por gigabyte.

Isso significa que, graças a queda no custo de armazenamento de dados, hoje é possível dispor documentos on line a um custo muito menor do que há 5 ou 10 anos atrás. Como a questão fundamental da disponibilidade de documentos gira em torno dos equipamentos de armazenamento (os chamados storages), uma vez que os seus preços caem, os orçamentos de projetos de digitalização caem em proporção semelhante e tornam-se mais palatáveis aos seus investidores.

Fonte: http://www.littletechshoppe.com/ns1625/winchest.html site com referência para os preços dos discos rígidos ao longo do tempo.

Última atualização (Seg, 05 de Abril de 2010 18:23)

 

A biblioteca do Vaticano digitalizará 80.000 manuscritos

A Revista ñ do jornal argentino El Clarin publicou a notícia de que a biblioteca do Vaticano pretende, pelos próximos 10 anos, digitalizar mais de 80.000 manuscritos, todos em alta definição. No total, espera-se que sejam digitalizadas cerca de 40 milhões de páginas.

Mais informações no site da Revista ñ: http://www.revistaenie.clarin.com/notas/2010/03/29/_-02169759.htm

 

Projeto Memória das Telecomunicações

Como este também é um espaço reservado para divulgações, aproveito-o para divulgar o portal recém lançado pelo Instituto Fernando Henrique Cardoso intitulado "Memória das Telecomunicações", trabalho que tivemos a honra de participar.

Como descrito na página do iFHC (http://ifhc.org.br/index.php?module=conteudo&class=fixo&event=ver&id_conteudo=564), o portal reúne documentos relativos ao processo que culminou na privatização do Sistema Telebrás, em 1998. Esses documentos são:
 

  • 51 fitas K7, contendo registros de seminários realizados em 1997, com membros da Comissão Especial de Licitação, formada por diretores da Embratel e consultores da área de telecomunicações, nos quais era discutido qual o modelo ideal para a venda da Telebrás.
  • 85 fitas em formato VHS e Beta, contendo registros de seminários realizados em 1997, vídeos institucionais e clippings.
  • 100 fotografias, de eventos, como inaugurações (por exemplo, da Anatel), viagens internacionais, posses de diretorias.
  • 1.132 volumes de clippings diários com a cobertura jornalística sobre o tema.
  • 130.000 documentos textuais (revistas, livros, decretos, pronunciamentos).


É importante destacar que a digitalização destes arquivos somou mais de 62 Gbytes de dados, distribuídos e organizados em mais de 1.600 fichas catalográficas, tudo gerido pelo sistema GesDoc.

Este foi um projeto interessante não apenas pelo seu rico conteúdo mas também pelas tecnologias empregadas. O sistema GesDoc funcionou perfeitamente durante a etapa de classificação e inserção de dados, entretanto havia o desafio de publicar o material na Internet. O portal seria desenvolvido por outra empresa, contratada para desenvolver todas as interfaces em Flash.

Para que fosse possível integrar as duas tecnologias (Flash e GesDoc), foi necessário desenvolver um webserver sob medida para a solução. O papel do webserver era receber as solicitações de pesquisa vindas dos visitantes do portal, pesquisar na base de dados do GesDoc e devolver o resultado de busca ao portal, para que este formatasse e exibisse o resultado de volta ao usuário pesquisados. E claro, tudo de maneira transparente para o usuário final.

O resultado está publicado no Portal Memória das Telecomunicações, de livre pesquisa a qualquer visitante: http://www.ifhc.org.br/telecomunicacoes.

 
Mais Artigos...