Data.table: Roturas clave "por" funcionalidad

Creado en 16 may. 2016 · 3Comentarios · Fuente: Rdatatable/data.table

No estoy del todo seguro de qué causa esto, así que aquí está el NOSOTROS más mínimo que pude encontrar

library(data.table) # Tested on v 1.9.7
dt <-  data.table( origin = c("A", "A", "A", "A", "A", "A", "B", "B", "A", "A", "C", "C", "B", "B", "B", "B", "B", "C", "C", "B", "A", "C", "C", "C", "C", "C", "A", "A", "C", "C", "B", "B"),
                   destination = c("A", "A", "A", "A", "B", "B", "A", "A", "C", "C", "A", "A", "B", "B", "B", "C", "C", "B", "B", "A", "B", "C", "C", "C", "A", "A", "C", "C", "B", "B", "C", "C"),
                   points_in_dest = c(5, 5, 5, 5, 4, 4, 5, 5, 3, 3, 5, 5, 4, 4, 4, 3, 3, 4, 4, 5, 4, 3, 3, 3, 5,5, 3, 3, 4, 4, 3, 3),
                   depart_time = c(7, 8, 16, 18, 7, 8, 16, 18, 7, 8, 16, 18, 7, 8, 16, 7, 8, 16, 18, 8, 16, 7, 8, 18, 7, 8, 16, 18, 7, 8, 16, 18),   
                   travel_time = c(0, 0, 0, 0, 70, 10, 70, 10, 10, 10, 70, 70, 0, 0, 0, 70, 10, 10, 70, 70, 10, 0, 0, 0, 10, 70, 10, 70, 10, 70, 70, 10) )

dt[ depart_time<=8  & travel_time < 60, condition1 := TRUE]
dt[ depart_time>=16 & travel_time < 60, condition2 := TRUE] 

setkey(dt, origin, destination)
res <- unique(dt[(condition1)])[unique(dt[(condition2)]), 
                                on = c(destination = "origin", origin = "destination"), 
                                nomatch = 0L]
res[, .(points = sum(points_in_dest)),  keyby = origin]
#    origin points
#1:      A      5
#2:      A      4
#3:      B      4
#4:      B      3
#5:      C      5
#6:      C      4
#7:      C      3

Como puede ver, by no funcionó como se esperaba y se devolvieron todas las filas. Obviamente, es un problema de codificación, ya que lo siguiente corrige este

setattr(res, "sorted", NULL)
res[, .(points = sum(points_in_dest)), keyby = origin]
#    origin points
#1:      A      9
#2:      B      7
#3:      C     12

O, alternativamente, antes de clasificar origin a un factor

res[, .(points = sum(points_in_dest)), keyby = factor(origin)]
#    factor points
#1:      A      9
#2:      B      7
#3:      C     12

Esto fue tomado de esta pregunta SO http://stackoverflow.com/questions/37239649/aggregate-data-table-based-on-condition-in-another-row

High bug

Fuente

DavidArenburg

👍2

Comentario más útil

Muy buen ejemplo. Arreglará. Gracias.

arunsrinivasan en 16 may. 2016

👍4

Todos 3 comentarios

Muy buen ejemplo. Arreglará. Gracias.

arunsrinivasan en 16 may. 2016

👍4

Tengo que decir que es una forma creativa de deletrear funcionalidad.

MichaelChirico en 16 may. 2016

Reparado....

DavidArenburg en 16 may. 2016

¿Fue útil esta página

0 / 5 - 0 calificaciones

Temas relacionados

La combinación con índice ofrece resultados inesperados si el nombre de la columna indexada es un prefijo del nombre de la columna de combinación

pannnda · 3Comentarios

Tamaño de SHM excedido Error

tcederquist · 3Comentarios

fread puede fallar al analizar un archivo válido cuando dec = ','

st-pasha · 3Comentarios

incluir %ilike% de PostgreSQL en data.table

andschar · 3Comentarios

GForce también debería poder trabajar con `: =`.

arunsrinivasan · 3Comentarios