-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathe080_comparacion_expresion.r
94 lines (67 loc) · 2.91 KB
/
e080_comparacion_expresion.r
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
## e080_comparacion_expresion.r
## 2015-03-26 [email protected]
##Modificado: 2015-05-26
## Script para comparar los niveles de expresión
date ()
Sys.info ()[c("nodename", "user")]
commandArgs ()
rm (list = ls ())
R.version.string ##"R version 3.2.0 (2015-04-16)"
try (source (".job.r")); try (.job)
options (width = 170)
#options (width = 1000)
setwd (file.path (.job$dir$proces))
#Ahora le añadimos los datos
load (file.path (.job$dir$proces, "clinicos_miryprot.RData")) #Con esto cargamamos mat
load (file.path (.job$dir$proces, "miR_exp.RData")) #Con esto cargamos miR.exp.info y mir.exp
load (file.path (.job$dir$proces, "prot_exp.RData")) #Con esto cargamos prot.exp.info y prot.exp
tag <- names(miR.exp)
#Primero dejamos solo al referencia al paciente en los barcodes de miR.exp
for (t in tag) {
barcode <- colnames(miR.exp[[t]])
colnames(miR.exp[[t]]) <- sub("-...-....-..", "", barcode)
}
#Miramos los tipos de muestras tomadas, solo hay 45 de tejido normal.
t (t (table (mat[,"sample_type"])))
#Vamos a buscar el cancer que tenga mas muestras con datos de miR y prot
table(mat[,"tag"])
max(table(mat[,"tag"])) #En este caso vemos que es LGG
#Tratamos de generar matrices de miR y prot solo para el cancer de interes y las muestras comunes
matriz <- mat[mat[,"tag"] == "LGG",]
miRNAs <- miR.exp[["LGG"]]
prots <- prot.exp[["LGG"]]
#Guardar solo la expresión de lso que tienen datos comunes
miRNAs <- miRNAs[, colnames(miRNAs) %in% matriz[, "bcr_sample_barcode"]]
prots <- prots[, colnames(prots) %in% matriz[, "bcr_shipment_portion_uuid"]]
table(duplicated(matriz[, "bcr_sample_barcode"]))
table(duplicated(matriz[, "bcr_shipment_portion_uuid"]))
#En este caso no hay Ids duplicados, así que no voy a mirar como tratariamos con ello
#Cambiamos el nombre de columna de las proteinas por el barcode que indica la muestra.
for (i in 1:length(colnames(prots))) {
colnames(prots)[i] <- matriz[matriz[, "bcr_shipment_portion_uuid"] == colnames(prots)[i], "bcr_sample_barcode"]
}
#Llamamos a las filas de matriz como la muestra a la que representan y borramos la columna que indica el sample_barcode
for (i in 1:length(rownames(matriz))) {
rownames(matriz)[i] <- matriz[i, "bcr_sample_barcode"]
}
matriz["bcr_sample_barcode"] <- NULL
#Y ahora lo ponemos todo en el mismo orden
miRNAs <- miRNAs[, rownames(matriz)]
prots <- prots[, rownames(matriz)]
table (duplicated (colnames (miRNAs)))
table (duplicated (colnames (prots)))
table (colnames (prots) == colnames (miRNAs))
table (colnames (prots) == rownames (matriz))
matriz[1:3,]
#Se cambia el nombre de las variables y las guardamos
sinfo <- matriz
mirna <-miRNAs
prots
###SAVE
save (list = "sinfo", file = file.path (.job$dir$proces, "clinicos_miryprot_LGG.RData"))
save (list = "mirna", file = file.path (.job$dir$proces, "miR_exp_LGG.RData"))
save (list = "prots", file = file.path (.job$dir$proces, "prot_exp_LGG.RData"))
###EXIT
warnings ()
sessionInfo ()
q ("no")