Última atualização em 10 de março de 2021

Embora os estudiosos geralmente acreditem no valor de compartilhar e preservar conjuntos de dados de pesquisa, muitos não acreditam que valha a pena fazer isso . E, quando investem seu tempo no compartilhamento e na preservação de dados, tendem a ter uma preferência por fazê-lo de maneira independente e autossuficiente . Essas são questões que não apenas documentamos por meio de nossa pesquisa nacional de longa data com o corpo docente, mas também aquelas que enfrentamos em nosso próprio trabalho como pesquisadores de ciências sociais conduzindo estudos de pesquisa em larga escala.

O compartilhamento de dados pode ser valioso por uma série de razões . Ele permite que outros replicem análises e resultados, estimula pesquisas adicionais com conjuntos de dados pré-existentes, melhora os métodos de coleta de dados por meio do escrutínio de outros e incentiva amplamente perspectivas alternativas que podem promover uma diversidade de análises e conclusões. Além disso, o compartilhamento de dados de pesquisa contribui para o conhecimento da sociedade e pode evitar que outros pesquisadores canalizem recursos para duplicar os esforços de coleta de dados, permitindo que trabalhem com dados pré-existentes. Particularmente durante a pandemia COVID-19, quando o corpo docente encontra desafios na realização de pesquisas com dados recém-gerados, aproveitar os dados que já foram coletados e analisados pode ser particularmente útil. Muitos acadêmicos pesam esses benefícios em relação aos desafios mencionados acima, juntamente com os mandatos dos financiadores, ao determinar se e como depositar seus dados.

Como existe um panorama robusto de espaços de compartilhamento de dados de pesquisa , decidimos conduzir pesquisas exploratórias de alto nível em vários repositórios de dados, principalmente para informar nossos próprios protocolos de depósito de dados. Depositamos regularmente dados do US Faculty Survey , do Library Director Survey , bem como de vários outros projetos de pesquisa com o ICPSR . Reconhecendo que nossa pesquisa sobre uma variedade de características de repositórios de dados pode render utilidade para outros pesquisadores, hoje estamos publicando um resumo de nossas descobertas.

Abaixo você pode encontrar sete repositórios comparados lado a lado em formato tabular. Destacamos fatores específicos que são essenciais para informar a tomada de decisão: escopo disciplinar, cronogramas típicos para o processamento de conjuntos de dados, custos associados e serviços oferecidos (como curadoria de dados).

Nome do repositório Âmbito disciplinar Oferece curadoria de dados? Período de tempo para selecionar dados Custo do depósito de dados Acessando depósitos de dados
Dríade Repositório geral com foco em conjuntos de dados científicos e médicos sim Aproximadamente um dia Há uma variedade de planos de associação pagos disponíveis para instituições e editoras para o depósito de conjuntos de dados. O preço é baseado em fatores como o nível de financiamento de bolsas de pesquisa. Nenhum custo associado ao acesso a conjuntos de dados
Figshare Repositório geral Não, mas disponível para Figshare para instituições N / D Nenhum custo associado ao depósito de conjuntos de dados Nenhum custo associado ao acesso a conjuntos de dados
Harvard Dataverse Repositório geral sim A consulta e a avaliação gratuitas levam de 1 a 3 horas, mas o tempo real de curadoria varia de acordo com a complexidade dos dados Nenhum custo associado ao depósito de conjuntos de dados Nenhum custo associado ao acesso a conjuntos de dados
ICPSR Repositório geral com foco em conjuntos de dados de ciências sociais sim Uma vez atribuído a um curador, o processo de curadoria da maioria dos estudos leva de 4 a 8 semanas, mas pode levar vários meses, dependendo da complexidade dos dados e do nível de curadoria necessário. Nenhum custo associado ao depósito de conjuntos de dados; pode haver taxas adicionais para conjuntos de dados particularmente grandes O acesso ao ICPSR requer inscrição paga por meio de uma instituição membro, embora alguns conjuntos de dados sejam de acesso aberto.
Mendeley Data Repositório geral Não N / D Assinaturas gratuitas e pagas estão disponíveis para armazenamento e depósito de conjuntos de dados com três planos mensais pagos diferentes com base no espaço de armazenamento total Nenhum custo associado ao acesso a conjuntos de dados.
Centro Roper para Pesquisa de Opinião Pública Inclui principalmente conjuntos de dados de pesquisas de opinião pública sim Aproximadamente uma semana Nenhum custo associado ao depósito de conjuntos de dados Tanto membros quanto não membros podem acessar os dados. Os não membros pagam uma taxa associada aos dados.
Zenodo Repositório geral Não N / D Nenhum custo associado ao depósito de conjuntos de dados Nenhum custo associado ao acesso a conjuntos de dados

 

Naturalmente, existem diferentes compensações associadas à escolha de um repositório em vez de outro.

Alcance e impacto: vários desses repositórios são gerais em termos de escopo disciplinar, enquanto alguns atendem principalmente às ciências sociais ou ciências. Isso pode ajudar a definir qual repositório os pesquisadores podem selecionar, dependendo do público-alvo para reutilizar seus dados. Da mesma forma, quem tem a capacidade de acessar conjuntos de dados em cada um dos repositórios e a que custo deve ser considerado. Se o acesso aberto for uma prioridade, pode fazer sentido selecionar Mendeley Data, Zenodo ou Dryad, já que os conjuntos de dados nesses repositórios são de acesso livre ao público. Harvard Dataverse e Figshare permitem que os estudiosos escolham se os conjuntos de dados são de acesso livre ou restrito. Na outra extremidade do espectro, ICPSR e The Roper Center exigem pagamento ou associação para acessar conjuntos de dados.

Custo de depósito : Vários repositórios exigem associação institucional ou individual ou têm taxas associadas ao depósito de dados de pesquisa. Se o custo do depósito do conjunto de dados for uma preocupação, Figshare, Harvard Dataverse, The Roper Center e Zenodo não cobram pelo depósito de dados de pesquisa e o Mendeley Data também tem uma opção de associação gratuita.

Curadoria de dados : os serviços de curadoria de dados envolvem processos que validam dados, como garantir que haja alinhamento com o questionário, livro de códigos e conjunto de dados de projetos de pesquisa. Os dados também podem ser disponibilizados em vários formatos de arquivo, como arquivos CSV, SAS e SPSS. Os serviços de curadoria de dados também podem servir como uma verificação adicional antes de os dados serem disponibilizados para outros, e é um recurso que valorizamos muito na Ithaka S + R. Dryad, Harvard Dataverse, ICPSR e The Roper Center oferecem serviços de curadoria de dados, enquanto a Figshare oferece curadoria de dados por meio de um serviço de assinatura adicional, e o Mendeley Data não oferece curadoria de dados. É importante observar que a curadoria de dados pode aumentar o tempo antes que um conjunto de dados se torne disponível em qualquer repositório.. Para Dryad, o período de tempo para curar e depositar dados é normalmente de um dia, enquanto para The Roper Center isso pode levar cerca de uma semana, e para Harvard Dataverse, isso normalmente varia dependendo da complexidade dos dados. Se o período de tempo antes de um conjunto de dados ficar disponível não é uma grande preocupação, o ICPSR leva aproximadamente quatro a oito semanas para selecionar a maioria dos conjuntos de dados. No entanto, dependendo da complexidade dos dados, esse processo pode levar vários meses, então o ICPSR também se desenvolveu e oferece outro serviço – openICPSR – que não oferece curadoria de dados em que os dados podem ser rapidamente depositados. Se a curadoria de dados não for importante e a velocidade for ideal, Figshare e Mendeley Data podem ser boas escolhas.

Esperamos que o instantâneo de 2020 resumido aqui possa ajudar a servir outros pesquisadores, especialmente aqueles nas ciências sociais, pois eles pesam os prós e os contras de cada repositório. Claro, esses provedores de repositório frequentemente mudam e adaptam seus serviços e ofertas. Ao considerar a preservação e o compartilhamento de seus dados de pesquisa, ficaremos felizes em discutir essas opções com você. Envie um e-mail para nicole.betancourt@ithaka.org .

Agradeço a Janan Shouhayib, uma aluna de PhD do The Graduate Center e estagiária da equipe de pesquisas e pesquisas Ithaka S + R durante a primavera e o verão de 2019, por suas contribuições para esta pesquisa exploratória.

== REFERENCIA ==

BETANCOURT, Nicole. Data Repository Platforms: A Primer. Ithaka Blog, Jan. 2021 – updated March 2021. Disponível em: https://sr.ithaka.org/blog/data-repository-platforms-a-primer/ Acesso em: 30 abril 2021.