Os dados abertos de pesquisa compreendem informações brutas, metadados e materiais digitais gerados durante atividades científicas. Com o avanço dos repositórios e a consolidação de políticas de ciência aberta na década de 2010, plataformas como Harvard Dataverse Repository, Zenodo, Figshare e Dryad estabeleceram diretrizes para a publicação de dados científicos. Esses dados devem ser armazenados em repositórios apropriados, garantindo acessibilidade e transparência. Isso é o que discute artigo da nova edição da Ciência & Cultura, que tem como tema Ciência Aberta.
Antes de compartilhar dados de pesquisa, é essencial compreender o que pode ser divulgado. O conceito de dados de pesquisa não é recente, mas a era digital acelerou sua produção e disseminação. No passado, cientistas organizavam informações em fichários físicos; atualmente, esses registros evoluíram para metadados e bancos de dados digitais. Muitos pesquisadores ainda enfrentam desafios na publicação de seus dados, pois a definição do que deve ser compartilhado depende da estratégia metodológica adotada. Por exemplo, entrevistas gravadas podem ser publicadas integralmente ou editadas, dependendo das restrições éticas. Já em pesquisas médicas, os prontuários originais não devem ser divulgados, mas os dados anonimizados derivados da análise podem ser compartilhados.
O princípio fundamental dos dados abertos é que os repositórios devem conter o produto da coleta científica e os critérios pelos quais foi realizada, e não os objetos ou pessoas pesquisados. A metodologia de análise pode ser incluída para garantir a reprodutibilidade da pesquisa, permitindo que outros cientistas obtenham resultados semelhantes. “A digitalização de acervos documentais e bibliográficos permitiu a criação de bases de dados transversais, que acumulam milhões de documentos advindos de diferentes arquivos no mundo”, afirma Thiago Lima Nicodemo, diretor do Arquivo Público do Estado de São Paulo e professor do Departamento de História da Unicamp.
A adesão da comunidade científica aos dados abertos ainda é dificultada por lacunas na formação metodológica. Para garantir a sustentabilidade das coletas, os pesquisadores devem definir claramente quais dados serão coletados, como e a partir de quais materiais brutos. Repositórios tendem a privilegiar os critérios de coleta e os dados estruturados derivados, enquanto os dados brutos podem ser armazenados para fins de preservação e reprodutibilidade. Muitos projetos brasileiros publicam seus dados em repositórios internacionais, como Harvard Dataverse Repository, MIT Libraries Data Management e Zenodo. No entanto, é fundamental fortalecer a infraestrutura nacional para evitar a dependência de plataformas estrangeiras e garantir a soberania do conhecimento científico.
Do ponto de vista da infraestrutura, a governança dos dados é mais importante do que a escolha do armazenamento em nuvem. As universidades devem adotar planos institucionais de gestão de dados, separando os dados abertos de outros serviços digitais. A segurança e a preservação digital dependem de padrões claros e de um planejamento sustentável para migração de plataformas. O principal desafio não está no armazenamento dos dados, mas na forma como são produzidos e organizados.
Para evitar a fragmentação e obsolescência dos projetos científicos, é necessário um modelo sustentável de infraestrutura compartilhada. A criação de laboratórios institucionais para digitalização e padronização de metadados reduziria custos, asseguraria a longevidade dos dados e facilitaria sua integração em análises de larga escala, incluindo aplicações de inteligência artificial. Universidades devem liderar a reflexão crítica sobre governança e tecnologia, enquanto gestores científicos e pesquisadores devem comprometer-se com políticas soberanas que otimizem recursos públicos e fortaleçam a capacidade de armazenamento e processamento de dados no Brasil. “A ciência aberta é uma realidade sem volta, uma condição para que a nossa ciência ganhe maior maturidade, amplitude e escala”, ressalta Thiago Nicodemo.
Leia o artigo completo:
Ciência & Cultura