O truque da memória pode acelerar a web

Os pesquisadores da computação em Stanford querem jogar fora o disco rígido e armazenar informações em data centers em memória de acesso aleatório, o armazenamento temporário mais caro que faz os programas rodarem mais rápido.





Os discos rígidos de hoje podem armazenar cerca de 10.000 vezes mais informações do que em meados da década de 1980, mas eles só podem transferir grandes quantidades de dados cerca de 50 vezes mais rápido do que podiam naquela época. Esse é um gargalo cada vez mais significativo para os dados armazenados em um servidor em um data center - o tipo que se torna cada vez mais comum à medida que as empresas enviam seus dados para a computação em nuvem.

Para aplicativos que precisam manipular muitos dados muito rapidamente, como negociação de ações de alta frequência ou tradução de páginas da Web de um idioma para outro, o atraso é um problema, diz John Ousterhout , professor pesquisador de ciência da computação em Stanford e chefe de um novo projeto baseado na ideia, apelidado de RAMCloud. Estamos vendo cada vez mais aplicativos interessantes que têm enormes conjuntos de dados e acessam esses dados de forma muito intensa, diz ele.

O sistema proposto por Ousterhout é baseado na memória dinâmica de acesso aleatório (DRAM). Em computadores pessoais, depois que os dados são buscados em um disco ou unidade flash, eles são armazenados temporariamente em DRAM, o que fornece um programa com acesso muito rápido. Os dados são armazenados como carga elétrica em um capacitor. Em um data center, buscar bits da DRAM e enviá-los pela rede interna do centro deve ser de 100 a 1.000 vezes mais rápido do que obtê-los de um disco.

Você será capaz de construir novos tipos de aplicativos que simplesmente não eram possíveis antes, diz Ousterhout. Você consegue pensar em uma época na história da tecnologia em que aumentar a velocidade em mil vezes ... aconteceu e nada mudou?

Alguns outros cientistas da computação são mais céticos. Eu esperava ouvir um argumento mais convincente, escreveu Murat Demirbas, professor associado de ciência da computação e engenharia da Universidade Estadual de Nova York, Buffalo, em uma postagem de blog revisando o artigo RAMCloud de Ousterhout. Demirbas também escreve que usar muitos discos em paralelo pode ser outra abordagem para reduzir o tempo de recuperação.

Uma preocupação é o custo potencial do RAMCloud. Ousterhout estima que 2.000 servidores podem fornecer 48 terabytes de armazenamento DRAM a US $ 65 por gigabyte. Isso é 50 a 100 vezes mais caro do que discos. No entanto, se você olhar o custo em termos de quantos bits você pode acessar por segundo, a DRAM é na verdade de 10 a 100 vezes mais barata do que o disco, diz Ousterhout. E ele projeta que até 2020, com melhorias na tecnologia DRAM, um RAMCloud poderia armazenar de um a 10 quatrilhões de bytes por apenas $ 6 por gigabyte.

Ousterhout compara a situação com a da década de 1970, quando os discos rígidos substituíram as unidades de fita como o principal sistema de armazenamento para computadores, não porque fossem menos caros, mas porque faziam os computadores funcionarem com mais eficiência. Os discos nunca ficaram mais baratos do que a fita, diz Ousterhout. Acho que a mesma coisa vai acontecer com DRAM.

Outro problema com a DRAM é que ela é volátil, o que significa que só contém informações enquanto a eletricidade flui para ela. Portanto, o RAMCloud ainda usaria discos como armazenamento de backup, junto com cópias extras de dados em DRAM, permitindo que dados perdidos durante uma falha sejam recuperados.

Luiz Barroso, um engenheiro renomado do Google, diz que o grupo de Stanford está lidando com um problema muito importante e ele vê alguma promessa. A economia da tecnologia DRAM atual descartaria o RAMCloud como a solução para alguns problemas importantes de big data, mas poderia ser atraente para cargas de trabalho de tamanho mais modesto, diz ele.

ocultar