Git Product home page Git Product logo

taller-regex-2021's Introduction

Expresiones regulares para la limpieza y transformación de datos

Taller a cargo de Stephanie Orellana y Riva Quiroga

¿De qué se trata este taller?

Este taller tiene por objetivo que sus participantes se familiaricen con el uso de expresiones regulares (conocidas también como "regex"). Específicamente, abordaremos el potencial que tienen como parte del proceso de limpieza y transformación de datos usando paquetes del "Tidyverse". Los ejemplos prácticos se enfocarán en el trabajo con dataframes y archivos de texto y en cómo utilizar expresiones regulares en conjunto con funciones de los paquetes {stringr}, {dplyr} y {tidyr}.

¿Qué necesito para participar?

Para este taller es necesario tener una versión de R igual o superior a 3.6 y tener instalados RStudio y los paquetes {tidyverse}, {janitor}, {pdftools} y la versión en desarrollo de {datos}. Esta última se puede instalar desde GitHub con: remotes::install_github("cienciadedatos/datos"). Puede que tengas que instalar antes el paquete {remotes}.

Materiales

Sesión 1

Los datos

Parte 1

paises <- datos::paises 

telefonos <- https://raw.githubusercontent.com/rladieschile/taller-regex-2021/main/datos/telefonos.csv 

Parte 2

peliculas <- read_csv("https://raw.githubusercontent.com/cienciadedatos/datos-de-miercoles/master/datos/2020/2020-02-19/ranking_imdb.csv")

pinguinos <- datos::pinguinos

animales <- read_csv("https://raw.githubusercontent.com/rladieschile/taller-regex-2021/main/datos/animales.csv")

El código

Parte 1

Parte 2

Video Por el momento el video está disponible en Dropbox. Pronto lo subiremos a Vimeo.

Sesión 2

Los datos

Parte 1

Archivos en https://github.com/rladieschile/taller-regex-2021. Si quieres seguir el ejemplo en vivo:

Apretar el boton verde que dice "Code" para clonar

Descargar el repositorio completo en ZIP ("Download ZIP")

Descomprimir y abrir el archivo .Rproj

También usaremos el archivo de conexiones que se encuentra en:

https://raw.githubusercontent.com/sporella/30daymap/master/data/conexiones_internet_fija.csv

Parte 2

(próximamente)

El código

Parte 1

Parte 2

Video (próximamente)

Material complementario

Cheatsheet Regex: guía de referencia de expresiones regulares.

Cheatsheet {stringr}: guía de referencia del paquete {stringr}

Nombrar cosas: presentación Stephanie Orellana día 2.

Naming Things: presentación de Jenny Bryan

Funciones pivotantes Breve presentación para explicar lo básico.

taller-regex-2021's People

Contributors

rivaquiroga avatar sporella avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.