A versão nova 1.2 do RAC traz uma novidade poderosa: o endereçamento usando textos. Este documento lhe ensinará como utilizá-lo.

Nas suas primeiras versões, o RAC usava apenas endereçamento numérico, indicando diretamente a posição de linhas e colunas, como por exemplo [5] para especificar a quinta coluna. Agora também é possível endereçar linhas pelo seu conteúdo, independente de sua posição no texto.

Antes de conhecer as novidades, um resumo rápido dos tipos de endereço conhecidos até então:

ENDEREÇOS NUMÉRICOS

Endereço Tipo Representa
3 Linha A terceira linha
-3 Contagem Regressiva A antepenúltima linha
[3] Coluna A terceira coluna
1:3 Trecho Da primeira a terceira linha
1~3 Salto À partir da primeira linha, ande de 3 em 3

Apesar do poder de se especificar endereços complexos, inclusive com trechos e saltos, o endereçamento numérico exige que o usuário saiba de antemão a posição exata do pedaço desejado de texto. Embora suficiente para uma grande variedade de tarefas, esse tipo de endereçamento se torna ineficiente quando se precisa buscar por conteúdo, e não posições.

Buscando por Conteúdo

Ao invés de buscar pela "quinta linha", certas tarefas exigem buscar por linhas que contenham determinada palavra ou frase, não importando a sua posição no texto original. Ou ainda, baseado nesta palavra obter as linhas adjacentes ou um trecho entre duas palavras distintas.

O RAC torna estas tarefas triviais, bastando ao usuário apenas fornecer o endereço desejado. Entre outras possibilidades, o programa pode buscar:

Entre várias outras possibilidades que combinam um texto com a sua contagem de aparições (normal ou reversa) e linhas adjacentes.

O uso é muito simples, basta colocar a palavra ou frase a se buscar entre sinais de igual, =assim=. A contagem de aparições da palavra é especificada usando o asterisco e o contexto usa os sinais de mais e menos.

ENDEREÇOS DE TEXTO

Endereço Tipo Representa
=abc= Texto Todas as linhas que contêm o texto abc
=abc=*3 Contagem Terceira linha que contém o texto abc
=abc=+3 Contexto Terceira linha após a que contém o texto abc
=abc=-3 Contexto Terceira linha anterior a que contém o texto abc

Curioso(a) porque o sinal de igual foi utilizado como delimitador? A explicação está no final deste documento.

Fácil de usar, não? Simplesmente colocar uma palavras entre iguais faz com que o RAC retorne todas as linhas do texto que contêm esta palavra. Ela pode estar no início, meio ou final da linha, tanto faz. Este comportamento é idêntico ao comando grep.

Se o desejado não forem todas as ocorrências da palavra mas apenas a primeira, terceira ou a última, basta adicionar um asterisco e informar o número. E mais, números negativos servem para contar à partir do final do texto, então =abc=*-2 retornará a linha com a penúltima aparição de "abc".

Para completar, o contexto serve para obter linhas próximas à linha com a palavra pesquisada, anteriores ou posteriores. Útil quando se tem uma palavra-chave para encontrar, mas o conteúdo desejado está na próxima linha. Exemplo: =Total de gastos=+1 retornará a linha seguinte ao texto informado, toda vez que o ele for encontrado.

Se no exemplo anterior for necessário obter a próxima linha somente da primeira aparição do texto, basta combinar os dois operadores, ficando =Total de gastos=*1+1.

Flexibilidade e Poder

Todos os conceitos dos endereços numéricos e de texto são intercambiáveis, combináveis, misturáveis. Lembre-se do brinquedo LEGO onde combinando formas básicas se obtém estruturas mais complexas.

No RAC é possível misturar endereços numéricos com texto num mesmo comando, produzindo endereços tão complicados e precisos quanto necessário.

ENDEREÇOS MAIS ELABORADOS

Endereço Representa
5:=abc=*1 Trecho da quinta linha até a primeira que conter abc
=abc=[1:10] As dez primeiras colunas das linhas com abc
=abc=*-1:-1 Trecho da última linha com abc até o final do texto
=abc=*5[-9:] As últimas nove colunas da quinta linha com abc
=abc=*-1:=xyz=*-1 Trecho da última linha com abc até a última linha com xyz
=abc=*1~3 À partir da primeira linha com abc, ande de 3 em 3
=abc=*5-2:=abc=*5+2 Quinta ocorrência da linha com abc, com contexto de 2 linhas antes e após

Os Detalhes

Ao usar endereços com texto, algumas dúvidas podem surgir. Aqui vão as respostas para algumas delas:

\t Tabulação (TAB)
\= Um sinal de igual literal
\\ Uma barra \ literal

A Pergunta Que Não Quer Calar

Mas por quê usar o = como delimitador? Isso é anti-Unix!

Resposta curta: A barra / está reservada para expressões regulares e o igual foi o melhor caractere livre que encontramos.

Resposta longa: A barra / é o caractere padrão de várias ferramentas Unix para delimitar expressões regulares. O RAC vai ter suporte às expressões e a barra já está reservada para isso. Fizemos um delimitador especial para texto pois nem sempre o que se pesquisa é uma expressão, e ficar escapando metacaracteres é chato. Um número IP por exemplo, fica =10.0.0.1=, sem precisar escapar os pontos. Fora a barra, procuramos outro delimitador. Os primeiros candidatos foram as aspas (simples e duplas), que ficam visualmente bonitas e seu uso é intuitivo. Mas é um inferno para inseri-las na linha de comando, pois as aspas já são especiais para o shell e seria preciso escapá-las sempre. Exclamação e cifrão sofrem do mesmo problema, vários outros caracteres já são especiais no RAC, outros já estão reservados para o futuro (como os parênteses e as chaves), < e > são perigosos. O que sobrou foi o =. Sim, é estranho num primeiro momento, mas acostuma rapidinho. E ainda tem o mnemônico de que o conteúdo é "igual" para você e para o RAC, pois nenhuma expansão é feita ;)


Voltar à página do RAC