Muestrear no es pecado

Estadística, ciencia de datos, big data, cosas varias

Las nuevas hornadas

Por circunstancias de la vida estoy entrevistando a nuevas generaciones de científicos de datos y no dejo de constatar algunas cosas , enumero algunas. Saben programar (R, Python, Scala) Están a la última en cuanto a modelos ensemble, Random Forest, Xgboost, catboost, lightgbm Conocen algo de deep learning Hablan más de un idioma correctamente Pero luego me pongo a charlar con ellos y parece que a todos se les ha olvidado el principio de parsimonia.

Jugando con h2o

Qué es h2o Aparte de lo que todos entendemos por h2o, h2o también es una empresa, y tiene algunos productos útiles para aquellos que nos dedicamos a lo que ahora se llama “ciencia de datos”. Más info aquí h2o en R El tema es que h2o tiene apis para usarlo con R, python, hadoop o maven. info Veamos un pequeño ejemplo en R. En primer lugar instalamos h2o según las instrucciones.