Comments (5)
사용하는 모델
논문을 인용하며 klue/roberta-large
를 사용한다고 언급했지만 → 용량 문제, 크게 차이나지 않는 성능을 근거로 klue/roberta-base
로 변경
from nlp-project.
데이터 전처리
원본 데이터에는 감성 종류가 positive, negative, neutral 총 3개 있다. 개수를 EDA를 통해 살펴보고 neutral이 개수가 너무 적으므로 제외하겠다고 언급했지만 → 복잡해지므로, 그리고 있던 속성도 없애버리므로 그냥 가져가기로 결정
from nlp-project.
대시보드
모델에 넣을 대시보드용 데이터를 특정 사이트에서 스크래핑한다고 언급했는데, 해당 리뷰에 대해 라벨링을 손수해야 정답 확인 및 점수 확인이 가능하다. 그리고 스크래핑은 NLP와 직접적인 연관이 없어서 시간을 쓰기가 애매하다. 시간이 부족하다. → 그냥 train, validation, test 데이터 중에서 test만 따로 빼서 대시보드용으로 활용하기로 결정
from nlp-project.
그리고 추가로 후속 과제를 적어보자.
아직 코드를 작성 중이지만 시간 내에 해결하지 못할 것 같은 사안들이 있다.
from nlp-project.
후속과제
- Train, Validation, Test 데이터 균형 맞추기 (속성의 경우
True
/False
, 감성의 경우0
,1
,2
) - 리뷰 텍스트 잘림 문제 (#10 에서 언급됨)
from nlp-project.
Related Issues (10)
- 프로젝트 주제 HOT 5
- 데이터 개방 관련 HOT 5
- EDA 과정 HOT 5
- 데이터 사전 가공 HOT 6
- GPU 문제 HOT 5
- 데이터 사전 가공과 관련한 문제 HOT 5
- 디스크 용량 부족 문제 HOT 5
- 워드 클라우드 HOT 5
- 모델의 성능과 속도 HOT 5
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from nlp-project.