No, este post no va sobre la canción de Medina Azahara sino de comparar un par de librerías para lectura y procesamiento de datos. A saber, polars escrita en Rust y con api en python versus vroom en combinación con librerías como data.table o collapse en R. Estas últimas usan por debajo C++, así que tanto por el lado de python como por el de R el principal mérito se debe a usar Rust y C++.
Estoy usando Rmarkdown así que primero defino que versión o entorno de python quiero
Sys.setenv(RETICULATE_PYTHON = "/usr/bin/python3") import pandas as pd df = pd.DataFrame({'A' : [1, 2, 3, 4], 'B' : [4, 3, 2, 1]}) df ## A B ## 0 1 4 ## 1 2 3 ## 2 3 2 ## 3 4 1 El index es autonumérico
df.index ## RangeIndex(start=0, stop=4, step=1) Pues ahora viene lo raro, al menos para mí.
La verdad es que no sé como traducir el término “lookup table”, en fin, vamos al grano.
Supongamos que tengo un factor con 3 niveles o un vector de caracteres con 3 letras únicas y 20 valores.
set.seed(43) vector_largo <- sample(c("a","b","c"), size = 20, replace = TRUE) vector_largo ## [1] "b" "c" "a" "c" "a" "b" "c" "b" "a" "c" "b" "a" "b" "a" "b" "c" "a" ## [18] "a" "a" "a" Y que en otro sitio tengo un vector “con nombres” dónde tengo el valor que asigno a “a”, “b” y “c”