Git Product home page Git Product logo

negative-comment-classifier's Introduction

Negative Comment Classifier

A machine learning application that classifies texts/comments based on their level of negativity

Team members:

  • 171111022 -- Suhendra
  • 171111036 -- Nurami Nasrullah
  • 171111069 -- Qori Hidayatulloh

Langkah Pembuatan Program:

  • Data Collection

Aplikasi ini menggunakan pre-collected toxic comment dataset dari Kaggle.

  • Data Preparation

Melakukan analisa awal dengan melihat isi baris dan kolom dari data untuk menentukan atribut mana yang cocok digunakan sebagai parameter. Kemudian membagi data ke dalam atribut dan label. Setelah itu membagi data ke dalam training dan test set.

  • Choosing a Model

Menentukan algoritma apa yang akan digunakan untuk mengklasifikasi dataset. Aplikasi ini menggunakan algoritma SVM, Karena algoritma ini bisa mengklasifikasikan data dengan baik dan cepat.

  • Training the Model

Melakukan training atau memberi pengetahuan terhadap algoritma sebelum bisa melakukan prediksi.

  • Evaluating the Model

Menggunakan data sample modifikasi dari training set untuk melakukan evaluasi terhadap efektifitas dan efesiensi dari algoritma yang dipilih. Seperti tingkat akurasi dan lama pemrosesan.

  • Making Predictions

Membuat prediksi nyata dengan menggunakan sampel dari test set atau data yang tidak termasuk dalam training set. Input dari web kemudian dapat digunakan untuk melakukan prediksi data baru.

Library Yang Dibutuhkan:

  • Pandas untuk mengolah dataset menjadi table dataframe yang bisa dibaca.
  • TfidfVectorizer untuk mengubah dataset menjadi vector agar bisa digunakan sebagai input untuk proses prediksi.
  • Train_test_split untuk membagi dataset kedalam Training Set dan Test Set serta meminimalisir overfitting atau underfitting dengan mengacak dataset.
  • LinearSVC untuk mengklasifikasi dan memprediksi data. LinearSVC dipilih karena proses eksekusinya lebih cepat dan mampu memisahkan data dengan baik.
  • Accuracy_score untuk menghitung akurasi dari hasil prediksi.

Prerequisites:

Untuk menjalankan program ini di direktori lokal, Anda harus menginstal beberapa tool yang dibutuhkan seperti akan dijelaskan dibawah. Namun jika Anda sudah melakukan semuanya, Anda dapat langsung mendownload atau clone repositori ini.

git clone https://github.com/hdpolover/negative-comment-classifier.git

Installing Python :

Python dapat diunduh di https://www.python.org/downloads/. Ikuti langkah instalasinya sampai selesai.

Installing PIP

PIP dapat diunduh di https://pip.pypa.io/en/stable/installing/ atau dengan menginstallnya melalui console.

python install pip 

Installing Flask

Install Virtual Environment pada direktori yang ingin anda gunakan.

python -3 โ€“m venv venv 

Kemudian unduh Flask di http://flask.pocoo.org/ atau melalui PIP.

pip install flask

Setelah semua proses berhasil, jalankan program di direktori dimana anda mengunduh atau clone repositori ini.

python flask_app.py

Lalu akses http://127.0.0.1:5000 di browser Anda.

negative-comment-classifier's People

Contributors

hdpolover avatar nasrullah1 avatar above99 avatar stevenleonard271 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    ๐Ÿ–– Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. ๐Ÿ“Š๐Ÿ“ˆ๐ŸŽ‰

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google โค๏ธ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.