-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathBibView.Rmd
132 lines (113 loc) · 5.67 KB
/
BibView.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
---
title: "BibView - Bibliometric Analysis"
author: "Diego Cavalca"
date: "14 de julho de 2017"
output: html_document
runtime: shiny
---
---
title: "Analise Bibliometrica com R"
output:
html_notebook: default
---
Neste trabalho irei apresentar o workflow básico para a realização de uma análise bibliométrica utilizando o R e o pacote Bibliometrix a partir dos dados de publicações científicas obtidas na base de dados [Scopus](http://www.scopus.com).
A preparação do ambiente (instalação do R, RStudio e Bibliometrix) e a obtenção dos dados seguirão conforme a aula apresentada anteriormente. Mais informações sobre estas etapas podem ser obtidas [aqui](http://github.com/diegocavalca/data-science).
Este _markdown_ foi desenvolvido baseado no [material oficial](http://htmlpreview.github.io/?https://github.com/massimoaria/bibliometrix/master/vignettes/bibliometrix-vignette.html) do Bibliometrix.
***
Inicialmente, se faz necessário carregar o pacote _Bibliometrix_ no R, que irá ser responsável por todo o processamento e análise de indicadores de nosso trabalho.
```{r, echo = FALSE}
library(bibliometrix)
```
```{r, echo = FALSE}
```
***
Com o ambiente preparado, iremos carregar os dados bibliométricos obtidos junto a base de dados Scopus.
```{r}
D <- readLines(inFile$datapath)
M <- convert2df(D, dbsource = "scopus", format = "bibtex")
```
***
Para dar início a análise, é necessário executar o pré-processamento dos dados, preparando-os para posterior análise de indicadores. Além disso, algumas métricas interessantes podem ser extraídas.
```{r}
### (grafico) Processar resultados bibliometricos
results <- biblioAnalysis(M, sep = ";")
plot(x = results, k = 10, pause = FALSE)
```
***
Com os dados preparados, o Bibliometrix oferece um resumo completo do conjunto de publicações analisados, incluido:
* Resumo quantitativo
+ Artigos
+ Periódicos
+ Palavras-chave (Autorais e Indexadas)
+ Citações média por artigo
+ Período contemplado na pesquisa
* Evolução histórica (p/ ano)
* Autores mais produtivos
* Artigos mais citados
* Produção científica por país
* etc.
```{r}
### (console) Resumo dos resultados
S <- summary(object = results, k = 10, pause = FALSE)
```
***
É possível também realizar uma análise cruzada entre os trabalhos do conjunto de dados onde, por exemplo, extrair quais os papers mais citados no conjunto de dados analisado.
```{r}
### (console/viewer) Referências (Papers) mais citadas, no conjunto de dados
CR_Papers = citations(M, field = "article", sep = ";")
CR_Papers <- as.data.frame(CR_Papers$Cited[1:10])
names(CR_Papers) <- c('Paper', 'Citations')
CR_Papers
#View(CR_Papers)
```
***
Ou ainda, é possível obter os autores mais referenciados dentro do conjunto de dados.
```{r}
CR_Authors = citations(M, field = "author", sep = ";")
CR_Authors <- as.data.frame(CR_Authors$Cited[1:10])
names(CR_Authors) <- c('Author', 'Citations')
CR_Authors
#View(CR_Authors)
```
***
O Fator de Dominância é um importante indicador que mensura a produtividade de autores, calculando a razão entre o número de trabalhos em que o autor aparece como **Primeiro Autor** e o número total de trabalhos multi-autorais em que este aparece.
```{r}
# k = 10 registros
DF <- dominance(results, k = 10)
DF
```
***
O índice-H (H-index) é outra métrica importante para avaliar a relevância acadêmica de um autor. Ela leva em consideração o número de artigos com citações maiores ou iguais a esse número.
Por exemplo: um autor com índice-H = 15 indica que este autor possui 15 artigos com pelo menos 15 citações.
```{r}
authors = gsub(",", " ", names(results$Authors)[1:10])
indices <- Hindex(M, authors, sep = ";", years=10)
HI <- indices$H
HI
```
***
Dentro do conjunto de dados, os atributos dos papers estão conectados entre si através do próprio paper. Assim, por exemplo, Autor(es) estão interconectados com Periódicos, Palavras-chave com Data de publicação, etc.
Essas conexões de diferentes atributos geram redes bipartidas que podem ser representadas como matrizes retangulares (Papers x ATRIBUTO_QUALQUER).
Logo, por exemplo, é possível gerar uma rede que apresenta o comportamento colaborativo entre países dentro da área de pesquisa em questão, ou seja, representa o modo como ocorre a transferência de conhecimento acadêmico.
```{r, fig.width=8, fig.height=8}
M <- metaTagExtraction(M, Field = "AU_CO", sep = ";")
NetMatrix <- biblioNetwork(M, analysis = "collaboration", network = "countries", sep = ";")
networkPlot(NetMatrix, n = 20, Title = "Country Collaboration", type = "circle", size=TRUE, remove.multiple=FALSE)
```
***
Ou também, pode ser gerado uma rede de coocorrências de palavras-chave, permitindo analisar subáreas da área de conhecimento estudada.
```{r, fig.width=10, fig.height=10}
# (grafico) Rede de co-ocorrencias de palavras-chave (20 keywords)
NetMatrix <- biblioNetwork(M, analysis = "co-occurrences", network = "keywords", sep = ";")
networkPlot(NetMatrix, n = 20, Title = "Keyword Co-occurrences", type = "kamada", size=T)
```
***
## Conclusão
Portanto, a linguagem R juntamente com o pacote Bibliometrix fornecem mecanismos eficientes para realizar a análise bibliométrica em conjuntos de publicações acadêmicas obtidos na Scopus, permitindo extrair conhecimento importante a partir de indicadores relevantes, os quais podem agregar qualidade na produção científica em quaisquer áreas do conhecimento.
***
## Referências
* http://r-project.org/
* http://www.bibliometrix.org/
* https://github.com/diegocavalca/data-science
* http://www.collnet.de/Berlin-2008/KumarWIS2008cir.pdf
* http://htmlpreview.github.io/?https://github.com/massimoaria/bibliometrix/master/vignettes/bibliometrix-vignette.html