๐ Vincent D. Warmerdam โฃโโ ๐ฆ Open Source Packages โ โฃโโ bulk - simple bulk labelling interface โ โฃโโ embetter - embeddings ready for sklearn โ โฃโโ doubtlab - suite of tools to help find bad labels โ โฃโโ drawdata - draw datasets in jupyter โ โฃโโ scikit-lego - lego bricks for sklearn โ โฃโโ scikit-partial - partial_fit() pipelines for sklearn โ โฃโโ scikit-bloom - bloom transformers for sklearn โ โฃโโ human-learn - rule-based components for sklearn โ โฃโโ sentence-models - a different take on textcat โ โฃโโ mktestdocs - turn markdown files into pytest tests โ โฃโโ lazylines - lightweight utils for .jsonl wrangling โ โฃโโ cluestar - inspiration for your first text labels โ โฃโโ durations - pytest duration insights โ โฃโโ tuilwindcss - tailwindcss for textual tui apps โ โฃโโ memo - saves a whole log of time โ โฃโโ skedulord - makes cron a bit more fun โ โฃโโ icepickle - cool and safe storage for linear models โ โโโ evol - grammar for genetic heuristics โฃโโ ๐ Project Contributions โ โฃโโ fairlearn - contributed the CorrelationFilter โ โฃโโ polars - contributed the .pipe() method โ โโโ BERTopic - added lightweight sklearn pipeline support โฃโโ โญ Online Projects โ โฃโโ calmcode.io - intermediate developer education โ โฃโโ koaning.io - personal blog โ โโโ dearme.email - reflection via a 30 day delay โฃโโ ๐๏ธ Popular Talks โ โฃโโ Natural Intelligence is All You Need โ โฃโโ Group-by statements that save the day โ โฃโโ Tools to Improve Training Data โ โฃโโ Optimal on Paper, Broken in Reality โ โฃโโ Playing by the Rules-Based-Systems โ โฃโโ How to Constrain Artificial Stupidity โ โฃโโ The Profession of Solving the Wrong Problem โ โฃโโ Winning with Simple, even Linear, Models โ โโโ Untitled12.ipynb โฃโโ ๐ฌ Random Experiments โ โฃโโ scikit-prune - prune scikit learn pipelines โ โฃโโ gitlit - tracking github action times across open source โ โฃโโ sentimany - many sentiment models, one repo โ โฃโโ tokenwiser - sklearn token tricks โ โฃโโ clumper - functional API for lists of dicts โ โโโ whatlies - exploration tools for word embeddings โโโ ๐จโ๐ป Employer โฃโโ ๐ฒ :probabl. - scikit-learn and friends โ โฃโโ scikit-churn - safety rails for churn work โ โโโ scikit-playtime - rethinking pipelines โฃโโ ๐ฅ Explosion - developer tools for nlp โ โฃโโ prodigy-hf - Prodigy integration for the HuggingFace stack โ โฃโโ prodigy-pdf - Annotate PDFs via Prodigy โ โฃโโ prodigy-ann - ANN techniques to find relevant subsets โ โฃโโ prodigy-segment - Prodigy integration for Segment Anything โ โฃโโ prodigy-lunr - Search techniques to find relevant subsets โ โฃโโ prodigy-whisper - Transcribe audio with OpenAI's whisper models โ โฃโโ prodigy-tui - Prodigy from the terminal โ โโโ cluestar - inspiration for your first text labels โโโ ๐ค Rasa - conversational software provider โฃโโ nlu examples - custom nlu components for Rasa โฃโโ taipo - data augmentation tools โโโ algo whiteboard - nlp education Follow me on twitter @fishnets88
koaning / bulk Goto Github PK
View Code? Open in Web Editor NEWA Simple Bulk Labelling Tool
License: MIT License