Git Product home page Git Product logo

Comments (5)

heewoneha avatar heewoneha commented on July 18, 2024

사용하는 모델

논문을 인용하며 klue/roberta-large를 사용한다고 언급했지만 → 용량 문제, 크게 차이나지 않는 성능을 근거로 klue/roberta-base로 변경

from nlp-project.

heewoneha avatar heewoneha commented on July 18, 2024

데이터 전처리

원본 데이터에는 감성 종류가 positive, negative, neutral 총 3개 있다. 개수를 EDA를 통해 살펴보고 neutral이 개수가 너무 적으므로 제외하겠다고 언급했지만 → 복잡해지므로, 그리고 있던 속성도 없애버리므로 그냥 가져가기로 결정

from nlp-project.

heewoneha avatar heewoneha commented on July 18, 2024

대시보드

모델에 넣을 대시보드용 데이터를 특정 사이트에서 스크래핑한다고 언급했는데, 해당 리뷰에 대해 라벨링을 손수해야 정답 확인 및 점수 확인이 가능하다. 그리고 스크래핑은 NLP와 직접적인 연관이 없어서 시간을 쓰기가 애매하다. 시간이 부족하다. → 그냥 train, validation, test 데이터 중에서 test만 따로 빼서 대시보드용으로 활용하기로 결정

from nlp-project.

heewoneha avatar heewoneha commented on July 18, 2024

그리고 추가로 후속 과제를 적어보자.
아직 코드를 작성 중이지만 시간 내에 해결하지 못할 것 같은 사안들이 있다.

from nlp-project.

heewoneha avatar heewoneha commented on July 18, 2024

후속과제

  • Train, Validation, Test 데이터 균형 맞추기 (속성의 경우 True/False, 감성의 경우 0, 1, 2)
  • 리뷰 텍스트 잘림 문제 (#10 에서 언급됨)

from nlp-project.

Related Issues (10)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.