Me gusta mucho el operador %like%
en data.table ya que estoy acostumbrado a las consultas SQL. En PostgreSQL también existe la opción ILIKE donde __i__ significa mayúsculas y minúsculas__.
¿Qué opinas de incluir %ilike%
en data.table?
Para incluir esto en data.table, crearía un operador %ilike%
en ilike.R basado en like.R agregando ignore.case = TRUE
a las llamadas grep()
de la siguiente manera:
ilike <- function(vector, pattern)
{
# Intended for use with a data.table 'where'
# Don't use * or % like SQL's like. Uses regexpr syntax - more powerful.
if (is.factor(vector)) {
as.integer(vector) %in% grep(pattern,levels(vector), ignore.case = TRUE)
} else {
# most usually character, but integer and numerics will be silently coerced by grepl
grepl(pattern,vector, ignore.case = TRUE)
}
# returns 'logical' so can be combined with other where clauses.
}
"%ilike%" = ilike
ejemplo reproducible:
require(data.table)
cars = data.table(cars = rownames(mtcars), mtcars)
cars[ cars %like% 'fiat' ] # no case-insensitive search possible
cars[ grep('fiat', cars, ignore.case = TRUE) ] # using comparably long grep
cars[ cars %ilike% 'fiat' ] # the new %ilike%
Podrías usar la etiqueta (?i)
en su lugar:
cars[cars %like% '(?i)fiat']
Es cierto que también funciona, no estaba al tanto de tal expresión regular. Sin embargo %ilike%
me parece más intuitivo. Tal vez porque conozco PostgreSQL. En general, esta es una cuestión de estilo de codificación de todos modos.
@andreasLD gracias de nuevo por criar. Probablemente lo viste ya que comentaste allí también, pero notando para el registro que esto se cerró en # 3333 y # 3552
Comentario más útil
Es cierto que también funciona, no estaba al tanto de tal expresión regular. Sin embargo
%ilike%
me parece más intuitivo. Tal vez porque conozco PostgreSQL. En general, esta es una cuestión de estilo de codificación de todos modos.