Git Product home page Git Product logo

hominin_skeletal_part_abundances's Introduction

  • 👋 Hi, I’m @ajcanepa (also @canepaoneto in twitter), Asistant professor at University of Burgos.
  • 👀 I’m interested in topics related with Ecology and Humand Health (i.e. #OneHealth #GlobalHealth), you can see more on @OMDataScience or in our Global Health List.
  • 🌱 I’m currently learning about ensembling modelling, fussion modelling applied to #bioacoustics and #ecoacoustics (see the Bioacoustics List)
  • 💞️ I’m looking to collaborate on #soundscape #bioacoustics #globalhealth
  • 📫 How to reach me: I'm mostly active on twitter

hominin_skeletal_part_abundances's People

Contributors

ajcanepa avatar jonasgrabbe avatar

Stargazers

 avatar  avatar

Watchers

 avatar  avatar  avatar  avatar

hominin_skeletal_part_abundances's Issues

Reunión 1

Tareas a completar tras la reunión

  • Leer la documentación básica de R #1
  • Verificar la duplicidad de los datos disponibles Artículo PNAS, como en el set Lian Bua_Layer R.
  • Verificar que yacimientos con nombre muy parecido son considerados diferentes o no.
  • Agregar al conjunto de datos, tanto de baja resolución (disponible) como el de alta resolución (CENIEH) información adicional interesante como:
  • Agregar el número de individuos (n)
  • Agregar Antigüedad de los yacimientos
  • Decidir con Nohemí las características (ojalá comunes a todos los yacimientos) que afecten la proporción de huesos para tenerles controlado.

Reunión 2 (02/11/2023)

Tareas a completar

  • Elaborar tabla con batería de pruebas ( Datasets / algoritmos / atributos algoritmos / label?)
  • Trasladar esta batería de pruebas a una receta en Tidymodels
  • Consultar a Noemí la aproximación de normalizar por %MAU o %MMI...

Literatura y Referencias para el Análisis

Dejaré en este Issue algunas referencias claves para familiarizarse con R y sus paquetes. El listado irá desde lo más simple a lo más complejo.

Basics of R

  • El repositorio fasteR muestra la base del lenguaje R. Les recomiendo leer de este repositorio hasta la Lesson 13.
  • Una vez aprendido lo básico de los objetos de R, deberemos introducirnos a los paquetes de procesamiento y análisis de datos del así llamado Tidyverse.
  • Para esto utilizaremos la ayuda de dos libros gratuitos online:
  • R for Data Science . Este libro cubre la aproximación tidyverse que veremos más adelante. Además, muestra una introducción a los paquetes de procesamiento y manejo de datos dplyr y de visualización gráfica ggplot2. Adicionalmente se puede ampliar con el libro Advanced R.

Machine Learning en R

  • El recurso más sencillo que agregaré será el Tidymodels, que con una filosofía similar a Tidyverse permite generar workflows para entrenar, diagnosticar, evaluar diferentes algoritmos. Este conjunto de paquetes se acompana del siguiente libro online Tidy Modeling with R.

  • Con un nivel de complejidad un poco mayor está el paquete de R llamado caret, disponible en el CRAN y en su Repo en github. Este paquete permite el entrenamiento en clasificación y regresión y está acompañadpo por un libro gratruito online.

  • El paquete mlr3 es el de mayor complejidad y puede ser consultado en mlr3. La documentación de este paquete también se ofrece como un libro online gratuito o en su Repo de GitHub. Una lista de las funciones y paquetes de este ecosistema se puede ver aquí o en la siguiente imagen:

Paleo con R

Reunion 3

  • Crear tabla con combinaciones de experimentos (en Excel o directamente en R)
  • Futuro: Hablar con CENIEH sobre una posible taxonomía para definir jerarquía de categorías (en la nueva clasificación definida hay algunas con 1 sola muestra)

¿Posible aproximación multivariada?

Dándole un par de vueltas a los potenciales conjuntos de datos que tenemos y a una idea que sugirió Ana (@asermam ), quizás sería interesante analizar los metadatos asociados a los conjuntos de huesos y ver si existen variables importantes que determinen las estructuras óseas determinadas.

Hace poco he dado un curso en el que revisando los métodos multivariantes, he visto que el CRAN Task View: Analysis of Ecological and Environmental Data está actualizado hace poco (diciembre de 2023) y en el que se incluyen varias aproximaciones que podríamos considerar.

Jonas (@JonasGrabbe) crees que sería posible conseguir metadatos de los yacimientos? Al final casi todos ellos están explorados y hay varios grupos trabajando en esos datos, a lo mejor podríamos conseguir algunos metadatos del tipo:

  • Temporal como la antigüedad (eso ya lo habñiamos visto)
  • Geomorfológicos (estratos y química de las piedras donde se ha encontrado)
  • Tipo de enterramiento (creo que esto también lo tenemos)
  • Bioma reconstruido
  • Especies asociadas a los yacimientos....

Lo dejo establecido simplemente para que no se nos olvide, lo hablamos mañana.

Reunion 4

  • Preparar pequeña presentación para reunión con CENIEH (3 slides suficiente)

  • Pasos seguidos hasta ahora ( hemos llegado a reproducir sus resultados y mejorarlos)

  • Resumen de resultados en una tabla

  • Resumen balanceo de clases

Reunión 29-02. Definición de bloques herramienta

BLOQUE 1: Comparación de yacimientos:

  • descripción del conjunto de datos
  • definición de aproximaciones y metodología
  • descripción entre yacimientos

BLOQUE 2: Nº de huesos y proporción de huesos y su relación con la densidad (Metodología de Subi)

BLOQUE 3: Clasificación del tiempo en el que se realizan las fracturas: PERI-MORTEN y POST MORTEM

Revistas candidatas:

De cara a mantener el repositorio:
(coger como referencia Paleoverse https://github.com/palaeoverse/palaeoverse)

  • Gestión de ramas (al menos separar del main una rama de desarrollo, y al menos una por cada feature que vayamos a implementar)
  • Añadir Vignettes para conseguir más citas

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.