Webscraping em R: uma abordagem para investigação em ciências sociais

Autores

  • Quemuel Baruque de Freitas Rodrigues Universidade Federal de Pernambuco, Brasil
  • Mayres Pequeno Universidade Federal de Alagoas, Brasil
  • Marina Félix de Melo Universidade Federal de Alagoas, Brasil
  • Amurabi Oliveira Universidade Federal de Santa Catarina, Brasil

DOI:

https://doi.org/10.47456/simbitica.v8i4.37351

Resumo

Este artigo apresenta uma breve introdução ao uso de algoritmos para coleta de dados em repositórios online em investigações no campo das ciências sociais a partir de um modelo empírico de pesquisa sobre produção acadêmica de bolsistas de produtividade do CNPq no Brasil. Metodologicamente, apresentamos uma pesquisa realizada com a aplicação da técnica computacional de elaboração de algoritmos e, em seguida, descrevemos o passo-a-passo do planejamento de algoritmo de scrapping a partir do software R. Busca-se não apenas tornar mais compreensível a técnica computacional para recolha de dados, como também fomentar sua utilização no campo das ciências sociais, tornando as coletas de dados em repositórios institucionais mais sistemáticas, transparentes, replicáveis e céleres.

Palavras-chave: ciências sociais; produção acadêmica; coleta de dados quantitativos; algoritmos.

 

Abstract

This article presents a brief introduction to the algorithms for data collection used in online repositories in social sciences investigations based on empirical research on academic production of CNPq scientific productivity grants in Brazil. Methodologically, we present a study carried out to apply the computational technique of elaborating algorithms. Then we describe the step-by-step planning of the scrapping algorithm using the R software. The computational approach for data collection is understandable and promotes its use in the field of social sciences, making data collection in institutional repositories more systematic, transparent, replicable and quick.

Keywords: Social sciences; academic production; quantitative data collection; algorithms.

 

Resumen

Este artículo presenta una breve introducción al uso de algoritmos para la recolección de datos en repositorios en línea en investigaciones en el campo de las ciencias sociales a partir de un modelo de investigación empírica sobre la producción académica de becarios de productividad del CNPq en Brasil. Metodológicamente, presentamos una investigación realizada con la aplicación de la técnica computacional de elaboración de algoritmos y luego describimos la planificación paso a paso del algoritmo de scrapping utilizando el software R. La técnica computacional para la recolección de datos intenta promover su uso en el campo de las ciencias sociales, haciendo que la recolección de datos en los repositorios institucionales sea más sistemática, transparente, replicable y rápida.

Palavras clave: ciencias sociales; producción académica; recopilación de datos cuantitativos; algoritmos.

Downloads

Não há dados estatísticos.

Biografia do Autor

Quemuel Baruque de Freitas Rodrigues, Universidade Federal de Pernambuco, Brasil

Mestrando em Ciência Política pelo PPGCP da UFPE e graduado em Ciências Sociais pela UFAL. Tem experiência profissional com análise e avaliação de políticas públicas, criação e gerenciamento de banco de dados e desenvolvimento de aplicativos

Mayres Pequeno, Universidade Federal de Alagoas, Brasil

Graduanda em Ciências Sociais pela UFAL e pesquisadora nas temáticas de partidos políticos, reformas eleitorais, políticas públicas e metodologias quantitativas

Marina Félix de Melo, Universidade Federal de Alagoas, Brasil

Professora e vice-diretora do Instituto de Ciências Sociais da Universidade Federal de Alagoas. Doutora em Sociologia pelo PPGS da UFPE, coordena o Grupo de Pesquisa do CNPq “Produção Acadêmica, Científica e Tecnológica”

Amurabi Oliveira, Universidade Federal de Santa Catarina, Brasil

Bolsista de Produtividade em Pesquisa do CNPq - Nível 2. Doutor em Sociologia pelo PPGS da UFPE com estágio pós-doutoral em Didática das Ciências Sociais pela Universidade Autônoma de Barcelona (2020). Professor da Universidade Federal de Santa Catarina

Downloads

Publicado

31-12-2021

Como Citar

Rodrigues, Q. B. de F., Pequeno, M., Melo, M. F. de, & Oliveira, A. (2021). Webscraping em R: uma abordagem para investigação em ciências sociais. Simbiótica. Revista Eletrônica, 8(4), 191–215. https://doi.org/10.47456/simbitica.v8i4.37351

Edição

Seção

Dossiê