CriptoGoma    Guias sobre segurança    Blog    Arquivos

Na vigilância em massa, a definição de anônimo é outra

Dado a pandemia, vimos governos estaduais - como os de Recife e São Paulo - apostarem na vigilância em massa como medida auxiliar no combate ao coronavírus. Sob o discurso de poder averiguar em que locais o isolamento social está sendo descumprido, as cidades fizeram parcerias com operadoras de celular.

A medida foi adotada sob pretexto de que os dados coletados seriam anonimizados. Contudo, ao contrário do que pode parecer, o fato desses dados serem anônimos não significa que a persona atrelada a eles é anônima. Os dados são peças de um quebra-cabeça - a identidade - e, como dito por estudante da Universidade Havard sobre um estudo que mostrava a fácil conexão entre dados de uma base anonimizada e outra conhecida, “por si só, [os dados] não são particularmente poderosos, mas quando vários vazamentos são reunidos, eles formam uma imagem surpreendentemente clara de nossas identidades.”

gato-anonimo

Basicamente, o que acontece é: temos três bases de dados anonimizadas A, B e C. Escolhemos alguns parâmetros em A (como, por exemplo, idade, gênero, estado civil) e comparamos com os parâmetros em B - quais são os grupos de dados em B que satisfazem esses parâmetros que escolhemos em A? Respondendo isso, obtemos um grupo de dados menor (denotemos por D) do que o conjunto das bases A e B. Agora, pegando a base de dados C para refinar D, poderemos conseguir informações bem mais precisas sobre as indivíduas, mesmo se tratando de dados anonimizados. Tal método - o cruzamento de dados - permite identificar as usuárias devido a baixa probabilidade de em um mesmo banco de dados existirem múltiplas pessoas com as mesmas caractérias e comportamentos.

Sobre isso, em um estudo britânico de 2019, cientistas foram capazes de desenvolver um modelo de apredizagem automática capaz de identificar corretamente 99,98% dos norte-americanos com qualquer conjunto de dados anonimizados usando apenas 15 caractéristicas - como idade, raça, gênero, estado civil, dentre outros. Ainda, o estudo apontava possibilidade de identificação correta em casos de a exclusividade da população ser baixa, argumento frequentemente utilizado para justificar que os dados são suficientemente desidentificados a ponto de serem considerados anônimos.

Assim, vemos que, mesmo numa coleta de dados anonimizada, as nossas identidades ainda estão expostas. Há quem diga que não há o que temer ou que cidadãs comuns não são tão importantes para serem alvos de algum ataque cibernético; para essas pessoas, recomendamos esta apresentação do Gleen Greenwald sobre o porquê a privacidade importa - tem legenda em português brasileiro.

privacidade no meio online importa

Agora, se é problemática a coleta de dados, o é também a falta de transparência quanto a forma, o processamento e a quantidade de vezes que ela ocorre. A criação de banco de dados além de auxliar políticas públicas e fornecer propaganda personalizada permite a empresas lucrarem, visto que a venda de dados tem se tornado uma prática comum, principalmente entre empresas que não cobram por seu produto.

No começo do ano passado, veio a tona o caso da Vivo, Net e Oi que trocavam entre si dados de clientes, neste ano tivemos o escândalo envolvendo a empresa Zoom, e é possível elencar diversos casos. Afinal, na era do Big Data, somos produto.

Embora tenha quem defenda que devemos aproveitar o momento para capitalizar a nossa própria existência, sob o discurso “a privacidade acabou”, acreditamos serem necessárias a resistência e a luta em prol da liberdade e autonomia (dentro e fora da internet). Para tanto, é preciso que determinados pontos sejam pautados quando falamos de tecnologia:

  • Descentralização da internet. Ter uma internet federada, descentralizada fisicamente - em relação aos cabos e as empresas que alugam servidores - e virtualmente - quanto aos sites e serviços utilizados cotidianamente.

  • Abolição do uso de reconhecimento facial e outras tecnologias identificáveis de locais públicos. Que os corpos possam circular livremente em espaços públicos sem que tenhamos dossiês sendo feitos acerca de onde estávamos, com quem estávamos, o que fazíamos.

  • Conferir às usuárias maior controle dos dados gerados sobre elas. Considerando toda e qualquer plataforma, que se tenha transparência quanto a que dados são coletados ou gerados conforme a experiência naquela plataforma.