Python

Veeelooosidad

No, este post no va sobre la canción de Medina Azahara sino de comparar un par de librerías para lectura y procesamiento de datos. A saber, polars escrita en Rust y con api en python versus vroom en combinación con librerías como data.table o collapse en R. Estas últimas usan por debajo C++, así que tanto por el lado de python como por el de R el principal mérito se debe a usar Rust y C++.

Cosas de pandas

Estoy usando Rmarkdown así que primero defino que versión o entorno de python quiero Sys.setenv(RETICULATE_PYTHON = "/usr/bin/python3") import pandas as pd df = pd.DataFrame({'A' : [1, 2, 3, 4], 'B' : [4, 3, 2, 1]}) df ## A B ## 0 1 4 ## 1 2 3 ## 2 3 2 ## 3 4 1 El index es autonumérico df.index ## RangeIndex(start=0, stop=4, step=1) Pues ahora viene lo raro, al menos para mí.

"Lookup table" en R y en Python

La verdad es que no sé como traducir el término “lookup table”, en fin, vamos al grano. Supongamos que tengo un factor con 3 niveles o un vector de caracteres con 3 letras únicas y 20 valores. set.seed(43) vector_largo <- sample(c("a","b","c"), size = 20, replace = TRUE) vector_largo ## [1] "b" "c" "a" "c" "a" "b" "c" "b" "a" "c" "b" "a" "b" "a" "b" "c" "a" ## [18] "a" "a" "a" Y que en otro sitio tengo un vector “con nombres” dónde tengo el valor que asigno a “a”, “b” y “c”