De fondo
Tengo d
, un dataframe:
d <- data.frame(ID = c("a","a","a","a", "b","b"),
event = c("G12","G12","O99","O99","B4","B2"),
date = as.Date(c("2011-01-01","2011-01-01","2011-12-23","2011-12-23","2011-01-01","2011-07-12")),
stringsAsFactors=FALSE)
Como se puede ver, ID a
tiene 4 filas, de las cuales 2 son repeticiones basado en event
y date
(filas 2 y 4 son los duplicados).
El Problema y la Salida Deseada
Me gustaría eliminar estas filas duplicadas por preguntar R
para eliminar filas dentro de ID
que tienen el mismo event
y date
. En otras palabras, me gustaría algo que se parece a esto:
d <- data.frame(ID = c("a","a", "b","b"),
event = c("G12","O99","B4","B2"),
date = as.Date(c("2011-01-01","2011-12-23", "2011-01-01","2011-07-12")),
stringsAsFactors=FALSE)
Lo he intentado
He hecho un intento, pero no es lo que hay:
d2 <- subset(d, duplicated(d$ID, d$event))
Los pensamientos?