Computadores baseados em proteínas

Autor: Pedro Luis Kantek G. Navarro- GPT
Este artigo foi originalmente escrito por Robert R. Birge e publicado pela revista Scientific American - março/95 - págs. 66 a 71. Tradução livre.
Robert Birge é professor de química, diretor d Centro W. M. Keck para Eletrônica Molecular e diretor pesquisador do Centro de Tecnologia Avançada em aplicações de computador e engenharia de software da Universidade de Siracusa do Estado de Nova York. Em adição ao seu trabalho com o desenvolvimento de dispositivos eletrônicos baseados em proteínas e computadores híbridos, ele investiga espectroscopia laser e a teoria quântica das proteínas. Fez o bacharelado em química, na Universidade de Yale em 1968, obteve seu PhD em físico-química na Universidade Wesleyan em 72 e fez seu pós-doutorado na Universidade de Harvard de 73 a 75.
Dispositivos fabricados a partir de moléculas biológicas prometem armazenamento em unidades compactas e rápidas. Eles serão adequados para usar em computadores de processamento paralelo memórias tri- dimensionais e redes neurais.

O mais avançado supercomputador não requer um único chip semicondutor. O cérebro humano consiste de um conjunto de moléculas orgânicas que combinadas formam uma rede altamente sofisticada, hábil em calcular, manipular, auto-reparar, pensar e sentir. Computadores digitais certamente podem fazer cálculos muito mais rápida e precisamente do que podem os humanos, mas mesmo organismos simples são superiores aos computadores nos outros cinco domínios.

Os projetistas de computadores nunca conseguiram construir máquinas que tivessem todas as faculdades do cérebro natural, mas muitos de nós pensamos poder explorar algumas propriedades especiais das moléculas biológicas - particularmente proteínas para construir componentes de computadores que são menores, mais rápidos e mais poderosos do que qualquer unidade eletrônica.

A pressão por menores tamanhos é muito forte. Desde os anos 60, a indústria de computação tem sido compelida a fazer componentes individuais em chips de semicondutores menores e cada vez menores para permitir a manufatura de grandes memórias e processadores mais poderosos e econômicos. Esses chips consistem essencialmente de arrays de chaves usualmente conhecidas como gates lógicos que se alternam entre dois estados - chamados zero e um - em resposta a variações na corrente elétrica que passa através deles. (Computadores, tipicamente, representam todas as informações em termos de tais dígitos binários ou bits). Se a tendência de miniaturização continuar, o tamanho de um único gate deverá se aproximar do tamanho de uma molécula, lá pelo ano 2030.

Mas existe um sério fator limitante: cada fator de dois em miniaturização aumenta o custo de manufatura do chip em cinco vezes. Em algum momento, a busca de componentes menores será limitada mais pelo aspecto econômico do que pelo físico. Por outro lado, o uso de moléculas biológicas como componentes ativos em circuitos de computadores podem oferecer uma abordagem alternativa que seja mais econômica.

Moléculas podem servir, potencialmente, como chaves porque seus átomos são móveis e trocam de posição de um modo previsível. Se pudermos direcionar o movimento atômico e dessa forma gerar consistentemente aos menos dois estados discretos em uma molécula poderemos usar esses estados para representar o zero e o 1. Tais chaves oferecem redução no tamanho do hardware porque elas mesmas são pequenas, cerca de 1 milésimo do tamanho dos transistores semicondutores usados hoje em dia como gates (os quais medem cerca de 1 micron ou 1 milhonésimo de metro).

Na verdade, um computador biomolecular poderia ter, em princípio, um cinquentavo (1/50) do tamanho de um computador atual formado pelo mesmo número de elementos. Em computadores comerciais, gates menores fazem geralmente unidades mais rápidas e computadores baseados em proteínas podem teoricamente operar a 1000 vezes a velocidade de um moderno computador.

Neste momento ninguém está propondo seriamente um computador puramente biológico. Nos próximos estágios, ao menos no futuro próximo, deverá ser usada uma tecnologia híbrida nas quais moléculas e semicondutores serão usados em combinação. Tal abordagem permite que sejam construídos computadores que terão um cinquentavo do tamanho e serão 100 vezes mais velozes do que os atuais.

Moléculas biológicas também têm atratividade, já que elas podem ser desenhadas átomo por átomo, dando aos engenheiros o controle de que eles precisam para manufaturar portas hábeis a executar exatamente as aplicações requeridas Mais ainda, computadores bio-eletrônicos poderão ajudar a construir computadores mais adaptáveis. Cientistas da computação já estão aumentando a versatilidade de unidades eletrônicas pelo desenvolvimento de novas configurações de hardware de computador, conhecidas como arquiteturas.

Pesquisadores introduziram arquiteturas de processamento paralelo, na qual conjuntos múltiplos de dados são manipulados simultaneamente. Para aumentar as capacidades de memória eles projetam hardware que pode armazenar dados em três dimensões ao contrário das duas usuais. E os cientistas têm construido redes neurais (ou neuronais, como se queira) que imitam as capacidades de aprendizado por associação do cérebro, uma habilidade mais que necessária para progressos significantes.

A habilidade de certas proteínas para trocar suas propriedades em resposta a estímulos luminosos deveria simplificar o hardware requerido para implementar tais arquiteturas.

Ainda que componentes de computador total ou parcialmente feitos por proteínas não estejam no mercado ainda, esforços de pesquisa internacionais estão construindo uma excitante trilha. Parece razoáveI predizer que a tecnologia híbrida, combinando chips semicondutores e moléculas biológicas deverá se mover de cenários de ficção científica para a realidade em breve. A tecnologia de display em cristal líquido oferece um primeiro exemplo de um sistema híbrido que alcançou sucesso comercial. Muitos lap-tops hoje dependem de tais displays que combinam eletrônica e moléculas orgânicas para controlar a intensidade da imagem na tela.

Diversas moléculas biológicas estão hoje sendo consideradas para uso em hardware de computador, mas a proteína da bactéria bacteriodopsina tem gerado o maior interesse. Durante os últimos 10 anos meu laboratório, e outros na América do Norte, Europa e Japão tem construido protótipos de unidades de processamento paralelo, memórias tridimensionais e redes neurais baseados nesta proteína.

O interesse da bacteriorodopsina data do início dos anos 70 quando Walther Stoecknius da Universidade da Califórnia em São Francisco e Dieter Oesterhelt, agora no Instituto Max Plank de Bioquímica em Martinstied descobriram que esta proteína exibia comportamento inesperado quando submetida à luz. Encontrado na membrana da Halobacterium salinarium, a bacteriorodopsina habilita a bactéria a crescer mesmo quando a concentração de oxigênio é insuficiente para sustentar o organismo. Quando atingida pela luz, a proteína troca sua estrutura e transporta um proton através da membrana, suprindo energia para a manutenção do metabolismo da célula.

Cientistas soviéticos foram os primeiros a reconhecer e desenvolver o potencial da bacteriorodopsina para a computação. Logo após esta descoberta, o falecido Yuri Ovchirmikov do Instituto de Química Bio-orgânica de Moscou montou um time de cientistas a partir de 5 institutos soviéticos para trabalhar em eletrônica biomolecular como parte do que viria a ser chamado projeto Bacteriorodopsina. Ele teve a boa idéia de juntar tal grupo para tal pesquisa porque ele tinha que prestar contas aos líderes militares soviéticos e foi hábil em convencê-los de que explorando a bio-eletrônica, a ciência soviética poderia ultrapassar o Oeste em tecnologia de computação.

Muitos aspectos deste ambicioso projeto são considerados ainda segredos militares e talvez nunca sejam revelados. Agora sabemos que os militares soviéticos fabricaram filmes de microfichas, chamadas biochromos feitos de bacteriorodopsina. Relatórios informais de cientistas soviéticos, agora nos EUA indicam que eles também construíram processadores óticos usando a tecnologia das proteínas. Os detalhes do seu produto mais impressionante, um processador para sistemas de radar, permanecem obscuros.

Eu iniciei meu interesse na bacteriorodopsina nos anos 70, enquanto estava estudando bioquímica básica na Universidade da Califórnia em Riverside. Meu trabalho estava inicialmente focado em uma proteína parecida, a rhodopsina presente na retina dos mamíferos. Ambas (a bacteriorodopsina e a rhodopsina) são proteínas complexas que incluem um componente que absorve a luz, conhecido como chromóforo. O chromóforo absorve energia da luz, disparando uma série complexa de movimentos internos que resultam em mudanças dramáticas na estrutura da grande proteína. Essas mudanças alteram as características óticas e elétricas da proteína. Por exemplo, quando a rhodopsina absorve luz no olho humano, a troca na sua estrutura, libera energia que serve como sinal elétrico o que, por sua vez, gera a informação visual no cérebro.

Aplicações no computador

No início eu estudava apenas para entender como ocorriam as mudanças na rhodopsina quando ativada pela luz. Ao final dos anos 70, me interessei também pela bacteriorodospsina. Eu decidi aplicar o meu conhecimento de suas propriedades no projeto de memórias de computador e de processadores baseados na proteína. Albert Lawrence, então na Hughes Aircraft Company, desempenhou um papel importante em me convencer de que a bioeletrônica tinha potencial. Ele juntou-se a mim, no meu laboratório por um ano para explorar o uso de material biológico em memórias óticas. Escolhemos a bacteriorhodopsina no lugar da rhodopsina por sua maior estabilidade e melhores propriedades óticas. Também, ela pode ser preparada em largas quantidades. A bacteriorhodopsina exercita tais propriedades mesmo quando sua temperatura ultrapassa 150° F e quando as moléculas estão expostas à luz intensa.

As aplicações em estudo operam explorando o chamado fotociclo - a série de mudanças estruturais da bacteriorhodopsina em resposta à luz. Em estado de repouso, a molécula é conhecida como bR, e cada estado intermediário é conhecido por uma letra do alfabeto. Esses estados intermediários podem ser usados para armazenar bits de dados. Quando em bR, recebendo um feixe verde, a molécula atinge o estado K, que em seguida é relaxado ao estado M e depois relaxado ao estado O. Quando este recebe um raio vermelho, a molécula atinge o estado P, que relaxa para o estado Q. Neste, a chegada de um raio azul a leva ao estado bR. No estado O, se nenhum raio mais a atingir, a molécula relaxa para o estado bR.

Como os estados intermediários absorvem luz em diferentes comprimentos de onda do espectro, podemos ler os dados, apontando feixes de laser nas moléculas e notando os comprimentos de onda que não conseguem passar através do detector. Já que podemos mudar a estrutura com um feixe de laser e com outro feixe de laser descobrir em que estado intermediário ela havia ficado, temos atendida a necessidade básica de ler e escrever numa memória.

Muitos engenhos sob estudo usam apenas o estado de repouso e um estado intermediário da bacteriorhodopsina. Um estado é o zero e o outro é um, e a troca entre os estados é controlado por um raio laser. Muitas unidades de memória mais recentes baseadas na bacteriorhodopsina podem operar somente em ambientes muito frios de nitrogênio líquido, nos quais a luz indutora necessária para trocar o estado bR e o estado K pode ser controlada. Tal mudança é muito rápida. A conversão bR para K ocorre em poucos trilhonésimos de segundo comparada com os bilhonésimos de segundo que as atuais tecnologias semicondutoras exigem (mil vezes mais rápido). Mas a necessidade de baixíssimas temperaturas delimitam sua aplicação geral.

Hoje os componentes baseados na bacteriorhodopsina funcionam em temperatura ambiente, em condições nas quais o estado M é estável. Ainda que a maioria dos dispositivos de memória baseados na bacteriorhodopsina incorporem a trasição bR-M, outras estruturas provaram ser mais poderosas.

Processamento Paralelo

Os estados intermediários produzidos após a bacteriorhodopsina ter sido exposta à luz podem dar origem a novos estados quando eles absorvem energia a partir de um segundo laser em um processo conhecido como arquitetura sequencial mono-fotônica. Por exemplo, um desvio ocorre do estado O para formar o P e o Q. Tal desvio inexistiria se a bacteriorhodopsina não tivesse recebido um feixe vermelho. Esta estrutura é gerada por 2 pulsos consecutivos de luz: o primeiro verde e o segundo vermelho. Ainda que P seja instável, ele rapidamente decai a Q que é estável por largo período de tempo (alguns anos). Por esta estabilidade o estado Q tem grande significância na pesquisa em memórias de longo prazo.

Os estados P e Q formados no processo sequencial mono-fotônico são particularmente importantes para o processamento paralelo. Para escrever dados de forma paralela, nossa abordagem incorpora outra inovação: o armazenamento de dados tridimensionais. Um cubo de bacteriorhodopsina é envolto por 2 arrays de jatos de laser colocados em 90° um em relação ao outro. Um array (de luz verde), chamado de fluxo de paging, ativa o fotociclo da proteína de qualquer plano quadrado (ou página) dentro do cubo. Após poucos milissegundos o número de estados O está estabelecido e então é disparado um outro jato de laser (vermelho).

O segundo array é programado para iluminar apenas as regiões dentro da página ativada dentro das quais os bits devem ser ecritos, trocando suas moléculas para o estado P. O estado P relaxa e forma o estado Q que é estável. Se dissermos que o estado bR corresponde a 0, e que P (e/ou Q) correspondem a 1, o processo é análogo ao que ocorre tradicionalmente nos semicondutores já que o laser pode ativar moléculas em vários locais através da iluminação de páginas escolhidas, múltiplos locais de dados, conhecidos como endereços podem ser escritos simultaneamente --- em outras palavras, em paralelo.

O sistema para ler a memória armazenada refere-se à absorção seletiva da luz vermelha pelo estado intermediário O. Para ler múltiplos dados em paralelo, nós iniciamos pelo mesmo lugar do processo de escrita. Primeiro um feixe verde ilumina o plano a ser lido, disparando o ciclo normal das moléculas que estão no estado bR. Após 2 milissegundos todo o conjunto de lasers é ligado por uma luz vermelha de baixa intensidade. As moléculas que estão no estado binário um (P ou Q) não absorvem este feixe vermelho nem trocam seu estado, ou seja, são transparentes à esta luz.

Mas as moléculas que estavam no estado bR (eram zero) absorvem a luz, embora não troquem sua estrutura pois isto só se daria no estado O (e elas estão em bR, lembre-se). Absorvendo-a, tornam-se opacos a esta luz. Um detector de imagem localizado em lado oposto ao feixe vermelho é capaz de localizar os estados O e P (ou Q) -- ou em termos binários ele é capaz de reconhecer onde estão os zeros e uns. O processo é completado em 10 milissegundos, dando uma taxa de 10 megabytes por segundo para cada página de memória.

Memórias tridimensionais

Além da vantagem do paralelismo os cubos de bacteriorhodopsina provêem muito mais espaço de memória do que seus equivalentes óticos bidimensionais. Por exemplo, um sistema relativamente recente (não biológico) incorpora uma fina película de material que é escrito por um feixe de laser e apagado por um campo magnético. Essas memórias são bidimensionais porque os dados estão armazenados na superfície de um disco. Este tipo de memória está limitado a cerca de 100 milhões de bits por centímetro quadrado.

Em oposição, memórias óticas tridimensionais podem teoricamente atingir densidades de um trilhão de bits por centímetro cúbico. Na prática, restrições óticas e físicas devem diminuir tal limite. Não obstante, pesquisadores crêem poder multiplicar por 300 a densidade das memórias ao se usar a abordagem tri-dimensional. Eu, particularmente, creio que o maior impacto da bioeletrônica aplicada a hardware de computador será na área de memória volumétrica.

Velocidade também é um importante benefício das memórias volumétricas. A combinação de memória tri-dimensional com o processamento paralelo melhora significativamente tais memórias, tal como o processamento paralelo do cérebro humano torna o processo computacional de redes neurais muito lento e permite ao cérebro ser uma máquina de pensamento com reflexos rápidos e capacidade de tomada de decisão muito rápida. O processo inteiro de escrita na memória bio-eletrônica acima descrito toma cerca de 10 milissegundos. Se iluminarmos uma página de 1.024 bits por 1.024 bits dentro de um cubo de proteínas, poderemos escrever 1.048.576 bits de dados (cerca de 105 kBytes) na memória em um ciclo de 10 milissegundos. Esses valores representam um desempenho de escrita de cerca de 10 milhões de caracteres por segundo, muito mais do que as memórias lentas de semicondutores. Ainda, cada unidade de memória possa acessar mais do que um cubo de dados e a velocidade da memória é proporcional ao número de cubos operando em paralelo. Então, uma memória de 8 cubos poderia operar mais rápido, em taxa de 80 milhões de caracteres por segundo.

Cubos de memória devem ser extremamente uniformes na sua composição para assegurar leitura e escrita acurada, já que muitas moléculas ou poucas moléculas em uma região distorcerão as informações lá armazenadas. A manufatura desses cubos em ambiente de baixa gravidade pode produzir a homogeneidade necessária. Dois vôos do space shuttle investigaram essa possibilidade e foram monitorados pelo Centro W. M. Keck para Eletrônica Molecular da Universidade de Siracusa em colaboração com o Laboratório da Força Aérea Americana BioServe Space Technologies e com a Administração Nacional de Aeronáutica e Espaço (NASA). Os resultados foram encorajadores e mais vôos estão em planejamento.

Diversos outros tipos de computadores baseados na bacteriorhodopsina estão sendo investigados. Por exemplo, moléculas biológicas surgem como promissor componente para as memórias associativas necessárias às redes neurais e consequentemente à inteligência artificial.

Redes Neurais

As memórias associativas operam de maneira diferente do que as convencionais. (Nas memórias convencionais, dado um endereço, obtém-se um conteúdo. Nas memórias associativas, dada uma parte do conteúdo, obtém-se o conteúdo integral. O cérebro humano funciona assim: quem não é capaz de seguir cantando "ouviram do Ipiranga às margens..."). Este tipo de arquitetura obtém um conjunto de dados, frequentemente na forma de uma imagem e pesquisam todo o conjunto da memória até achar um subconjunto que coincida com o original. O computador pode ser programado para encontrar imagens parecidas, ainda que não casem perfeitamente com a entrada fornecida. já que o cérebro opera no modo neural, associativo, muitos cientistas acreditam que memórias associativas serão requeridas se desejarmos inteligência artificial.

Meu laboratório desenvolveu uma unidade de memória associativa que trabalha com as propriedades holográficas de finos filmes de bactedorhodopsina. Hologramas permitem que imagens múltiplas possam ser armazenadas no mesmo segmento de memória, permitindo que grandes conjuntos de dados possam ser analisados simultaneamente. Este sistema de memória está baseado no design clássico de Eung G. Paek e Demetri PsaItis do Instituto de Tecnologia da Califórnia. Nós achamos que a bacteriorhodopsina oferece melhores vantagens sobre os cristais fotorefratores usados para fabricar tais memórias. Já que as proteínas são mais sensíveis à luz do que os cristais inorgânicos, menores níveis de feixe de luz podem ser usados. Em consequência, menos energia é necessária para escrever e ler e a velocidade do processo aumenta. Além disso, a bacteriorhodopsina pode ser escrita e lida muito mais vezes que os cristais, os quais apresentam fadiga após ciclos repetidos de read-write.

O estudo com bacteriorhodopsina natural continua. Muitos laboratórios estão explorando a importância de formas modificadas da proteína em computadores. Especificamente, eles estão estudando versões de engenharia genética da proteína, nos quais um amino ácido substitui outro para melhorar as propriedades necessárias para uma dada aplicação. Por exemplo, o ciclo de vida do estado M no fotociclo pode ser aumentado pela remoção de um amino ácido interno à proteína, como mostrado por Norbert Hampp e Christopli Bräuchle da Universidade de Munique.

É claro que computadores biomoleculares representam o alvo final. Mas, como mencionei antes, muitos cientistas crêem que a primeira etapa no desenvolvimento destes será uma geração de sistemas hibridos que combinem as melhores propriedades das arquiteturas de semicondutor e molecular. ParticuIarmente, uma arquitetura que combine memória de alta densidade baseada em proteína, pode ajudar a resolver os eternos problemas de falta de memória. (Nota do tradutor: Já dizia Peter Norton, no início dos anos 80: "não importa quanto você tenha (de memória): não é o suficiente!").

Durante a última década, a velocidade dos computadores aumentou cerca de 1.000 vezes, enquanto a capacidade de memória alcançou um fator de apenas 50. A transferência de dados dentro do computador permanece o principal gargalo que limita o desempenho. Processamento paralelo e interconexões baseadas em luz, colocadas em um computador híbrido podem explorar a eficiência de switch das moléculas biológicas na memória e na transferência e manipulação de grandes conjuntos de dados.

Para explorar o possivel valor de computadores híbridos, meu laboratório está presentemente projetando um, que contém quatro tipos de unidades de memória ou processadores (placas). A placa da CPU consiste da tecnologia tradicional de semicondutor. Duas placas conterão memória volumétrica baseada em proteína com capacidade de 40 gigabytes. Uma dessas placas será rápida, permanente, com acesso randômico, sem partes movimentáveis. A outra oferecerá memória mais barata, removível, a ser usada como memória de longo prazo (como se fosse um winchester). A quarta placa conterá uma memória associativa baseada em filmes de bacteriorhodopsina.

O futuro dos computadores

O computador híbrido que enxergamos será altamente flexível. Tomando vantagem da combinação particular dos cartões de memória acima descritos, ele será capaz de manusear grandes conjuntos de dados necessários para complexas simulações matemáticas, ou para servir como plataforma única para investigações em IA. Com um terabyte (1012, ou 1.000.000.000.000 bytes) de memória em cubos de bacteriorhodopsina esta máquina poderia trabalhar com enormes bancos de dados de forma célere. Memórias associativas acopladas a memórias volumétricas poderiam pesquisar um data base com uma velocidade de muitas ordens de magnitude maior do que hoje.

Anda que meu grupo e outros tenham tido sucessos memoráveis em desenvolver memórias volumétricas, muito trabalho ainda é necessário para obter um computador híbrido completamente operacional. É possível que na estrada que leva ao poder computacional, outras arquiteturas concorrentes possam substituir muitos dos componentes aqui descritos. Apesar disso, cremos que um computador híbrido de algum tipo esteja disponível nos próximos 8 anos. Achamos que nas próximas 2 décadas deveremos evoluir nessas arquiteturas para certos tipos de computações tais como cálculos científicos e aplicações multimídia. Computadores pessoais usarão estes benefícios tendo grandes memórias (muitos gigabytes) para armazenamento de dados e com memórias removíveis de poucos gigabytes em um pequeno cubo. Imagine as vantagens de carregar em seu bolso um pequeno cubo com o equivalente a uma enciclopédia completa e todas as palavras que você escreveu nos últimos 10 anos.

Mas, a mais dramática aplicação para tudo isso será outra: com terabytes de memória, capacidades associativas neurais e processamento paralelo, computadores híbridos incorporarão, no primeiro momento, as três requisições cruciais de hardware, para a inteligência artificial. Nós realmente, estamos no limiar de uma nova e excitante era na computação.


kantek@celepar.gov.br

Copyright© 1990 / Companhia de Informática do Paraná - CELEPAR