Internet Archive: Site da organização supera 100 petabytes e quer cobrir até radioamadorismo

Wayback Machine, do Internet Archive, alcançou 100 PB de conteúdo; só de páginas web são 741 bilhões de cópias.

Há 26 anos que o Internet Archive atua como um “backup” da web. O site preserva softwares, vídeos, imagens e páginas dos mais diversos tipos. O conteúdo mantido por lá é tão extenso que, recentemente, o banco de dados do serviço atingiu a marca de 100 PB (petabytes)! E vem mais por aí: o plano, agora, é o de também arquivar materiais sobre radioamadorismo.

Página do Internet Archive

Internet Archive é o nome da organização sem fins lucrativos por trás da iniciativa. O serviço que coleta e armazena os arquivos da internet é chamado de Wayback Machine.



Como o nome sugere, o site funciona como uma espécie de máquina do tempo. Grande parte do conteúdo arquivado por lá não existe mais na origem ou é diferente nos dias atuais.

 

100 PB e 741 bilhões de página web

Só de páginas web, o Wayback Machine reúne mais de 741 bilhões de cópias. Mas vídeos, áudios, imagens e livros, por exemplo, também fazem parte do acervo da plataforma.


Para você ter noção, o Internet Archive arquivou 2 mil jogos de MS-DOS em 2019. No ano seguinte, foi a vez de jogos em Flash. Em 2021, um processo de digitalização de mais de 250 mil discos em 78 rpm foi colocado em curso.

 

Esse trabalho é realizado desde 1996. Em 1997, o serviço chegou à marca de 2 terabytes de dados arquivados — hoje, esse volume pode caber em uma única unidade SSD.

Como você já sabe, o serviço chegou a 100 petabytes de dados recentemente, um número equivalente a 100.000 terabytes.

 

Agora é a vez do rádio amador

Nesta semana, o Internet Archive revelou que está reunindo conteúdo para a recém-criada Biblioteca Digital de Rádio Amador e Comunicações (DLARC, na sigla em inglês).


A biblioteca foi idealizada para preservar todo tipo de conteúdo digital relacionado ao radioamadorismo. Alguns exemplos: materiais impressos digitalizados, sites especializados, arquivos de áudio, coleções pessoais e registros de comunicações.

 

Para tanto, esse trabalho seguirá algumas estratégias, como:

  • Digitalizar materiais impressos, como jornais, livros e documentos;
  • Arquivar e organizar conteúdos “nascidos digitais”, como fotos, sites, vídeos, newsletters e podcasts;
  • Realizar entrevistas em áudio com membros importantes da comunidade.


A DLARC é apoiada financeiramente por uma fundação privada — a ARDC —, mas depende da colaboração de outras entidades ou pessoas para montar o seu acervo.

Interessados podem ajudar com revistas, livros, manuais, catálogos e qualquer outro tipo de conteúdo que tenha relação com o radioamadorismo.

 

Paywall é um problema


A atenção ao radioamadorismo é um acréscimo. Os trabalhos de preservação de páginas, vídeos, softwares e afins continuam. Mas há alguns desafios pela frente. Um deles é o paywall, isto é, o mecanismo usado por sites de notícias que bloqueia o acesso ao conteúdo por usuários não pagantes.

 

Esse tipo restrição tem dificultado a coleta de notícias e outros conteúdos que, daqui a alguns anos, provavelmente não existirão mais nas origens.

O problema não é exatamente novo. A restrição de acesso a conteúdos já acontece em redes sociais. O Facebook, por exemplo, permite que suas páginas sejam indexadas por serviços externos, mas muitas de suas publicações são restritas a comunidades fechadas ou usuários pagantes.

 

É inegável que o Internet Archive faz um excelente trabalho, mas, apesar dos esforços, muito conteúdo deve ficar de fora de sua cobertura por causa dessas limitações.

Continue acompanhando o Portal Vovo GaTu para ficar por dentro de outros conteúdos de entretenimento!


Fonte:
Financial Times

--------------------------------------------------------------------------------------
Enfim, gosta do Portal Vovo GaTu😍?
Siga-nos nas redes sociais. 
Fique por dentro das noticias, e nao perca nada!😄 Contamos consigo!

Assine as notificações de Feed do Site ou entre em nosso Canal de  Noticias no Discord, há, e nos adicione ãos favoritos do seu navegador.

Conheça nossa EquipeHerley costa:
É o editor chefe e criador do canal do Vovo Gatu, supervisiona todos os conteúdos publicados diariamente, mas faz um pouco de tudo, desde notícias, análises a vídeos, tutoriais e lives para o nosso canal do Youtube. Gosta de experimentar todo o tipo de jogos, mas prefere, mundos abertos e jogos online com longa longevidade. Um grande apaixonado por vídeo games e filmes desde criança, nunca deixou de jogar ou assistir um filme praticamente por todos os dias desde que se conhece por gente.

Me siga nas redes sociais
Clique para abrir meu FacebookClique para abrir meu InstagramClique para abrir meu TwitterClique para abrir meu canal do YoutubeClique para abrir meu LinkedinClique para abrir meu perfil de musica no DeezerClique para abrir meu grupo no WhatsappClique para abrir meu perfil no PinterestClique para abrir meu perfil no VKontakte - VKClique para abrir meu perfil de musica no SpotiFy
--------------------------------------------------------------------------------------
Postagem Anterior Proxima Postagem