Git Product home page Git Product logo

Comments (5)

heewoneha avatar heewoneha commented on July 18, 2024

원인

사실 단일 모델 하나는 속도 상에 문제가 없다.
속성 예측을 어떻게 할까 고민하다가, True/False를 예측하도록 그냥 모델을 Main Category의 속성 개수만큼 만들어서 돌려버렸기 때문에...... ..,, ,.,.
카테고리마다 속성이 20여개~30여개 존재하다보니 최소 20*4(속성) + 4(감성) 개의 모델을 순차적으로 돌리는 구조다.

from nlp-project.

heewoneha avatar heewoneha commented on July 18, 2024

또한, 예시에서는 BERT를 사용하긴 했지만 여기를 참고해서 하이퍼 파라미터를 구성했다.

from nlp-project.

heewoneha avatar heewoneha commented on July 18, 2024

epoch는 5를 넘어가면 안 되겠기에, 딱 5로 설정했었고 EarlyStopping은 예시보다 작은 2로 설정했다.
모델이 학습하는 과정을 쭉 지켜봤는데 대부분 epoch이 4~5까지 가서 큰 문제는 없었다. 다만 학습량은 1e-5로 했고 대신 batch size는 더 작게 했다.
f1 score에는 전반적으로 큰 문제가 없었다.

from nlp-project.

heewoneha avatar heewoneha commented on July 18, 2024

분명 내 방법보다 멋지게 해결하는 법이 있을 것 같은데, 데이터 구축 업체 측의 선례를 봐도 어떻게 해결했는지 이해하기 어려웠다.

어쨌든 대시보드를 통해 예측한 속성을 봤을 때는 README.md에 게재한 결과 이미지처럼 오히려 정답에는 누락됐던 속성(청량감→쿨링감)이 예측 값에 드러나는 경우도 있었다.

from nlp-project.

heewoneha avatar heewoneha commented on July 18, 2024

#14 에서 언급했던 후속 과제에 이 내용을 추가해야겠다.

from nlp-project.

Related Issues (10)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.