har07 / pysastrawi Goto Github PK
View Code? Open in Web Editor NEWIndonesian stemmer. Python port of PHP Sastrawi project.
License: MIT License
Indonesian stemmer. Python port of PHP Sastrawi project.
License: MIT License
ketika saya masukan kata dibelinya -> bel
ketika saya dikurangi -> rang
kalimat = 'Saya dan Kamu adalah Manusia' stop = stopword.remove(kalimat) print(stop)
Print = Saya Kamu Manusia
kalimat = 'saya dan kamu adalah Manusia' stop = stopword.remove(kalimat) print(stop)
Print = dan kamu Manusia
Ini memang seperti ini ya? atau cuma saya yang salah tanggap?
kata relawan jadi rawan, yg seharusnya tetap jadi kata relawan
dalam kasus ini, saya mencoba untuk menstem banyak text dari csv ke csv utk mengetahui perbedaannya seberapa banyak
with open('asdasd.csv','r', encoding='utf8') as f:
thereader = csv.reader(f)
with open('asdasd_stem.csv','w', newline='', encoding='utf8') as w:
thewriter = csv.writer(w)
for row in thereader:
thewriter.writerow([row[0],row[1],stemmer.stem(row[1]),row[2]])
Untuk metode pencarian di kamusnya pada fungsi yang mana ya? karena saya berencana melakukan improve dibagian tersebut. Terimakasih.
saya ingin menanyakan, apakah ada dokumentasi penambahan list stopword. jika belum ada bagaimana cara menambahkan kata ke list stopword.
Untuk melakukan stemming 87000 paragraf di i7, membutuhkan waktu ~ 24 jam.
Kecepatannya sekitar 500-1000 ms per paragraf.
Sepertinya ada potensi untuk optimisasi, tapi saya sendiri belum tahu. :D
izin mas, untuk kata bekasi saya coba stemming menggunakan library ini, malah menjadi kata bekas, mohon petunjuknya mas
stemmer nama kota bekasi --> hasilnya menjadi bekas
run: print(stemmer.stem("bekasi barat"))
out: bekas barat
Stemmer "pengering", jadi "ering", yang seharusnya "kering"
Kapan: Saat stemmer factory dicoba digunakan dalam fungsi
Output yang diharapkan: fungsi stemming semestinya
Output yang didapatkan: AttributeError: 'list' object has no attribute 'lower'
Kode yang ditulis:
factory = StemmerFactory()
stemmer = factory.create_stemmer()
def stemm(text):
stemmed = stemmer.stem(text) <-- Error terjadi di sini
return stemmed
news['stems'] = news['clean_sw'].apply(lambda x: stemm(x))
news.head()
Info tambahan; Sastrawi di-install dengan cara
pip install PySastrawi
dalam platform google colab
Mohon bantuanya
A declarative, efficient, and flexible JavaScript library for building user interfaces.
๐ Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. ๐๐๐
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google โค๏ธ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.