Comments (3)
안녕하세요,
해당 부분은 Huggingface Transformers에서는 사용하지 않지만,
Google BERT( https://github.com/google-research/bert )에서 사용하는 BERT Config에 필요한 옵션입니다.
학습을 위 구글버트로 진행해서 기본값을 넣어준 항목입니다 :)
from kcbert.
빠른 답변 감사합니다 :)
말씀주신 구글 공식 레포의 BERT Config를 살펴보았을 때에도 pooler에 대한 attention heads 옵션은 찾지 못하여 재차 질문을 드리게 되었습니다.
레포 내에서 attention으로 검색해도 Encoder 내부 self attention에 대한 attention heads 옵션만 보여지고, pool 관련은 [CLS] 토큰에 대한 Dense pooling만 보여집니다.
self.pooled_output = tf.layers.dense( first_token_tensor, config.hidden_size, activation=tf.tanh, kernel_initializer=create_initializer(config.initializer_range))
혹시 구글 버트상에서 pooler_num_attention_heads 기본값이 있는 부분을 알고 계시다면 한 번 공유해주실 수 있을지 조심스럽게 여쭙고 싶습니다 :)
다시 한 번 친절한 답변에 감사드립니다.
from kcbert.
아직 이 이슈를 닫지 않았었네요.
이부분은 Google bert에서 finetune할때 사용하는 부분이 맞습니다 :)
KcBERT는 PyTorch huggingface로 convert한 형태로 제공하기 때문에 해당 부분은 없어도 동작하는 것이 정상입니다.
from kcbert.
Related Issues (15)
- 안녕하세요! 질문이 있습니다. HOT 2
- 안녕하세요, colab코드에 대해 질문이 있습니다.
- Pre-train 시 코퍼스 파일 문서 나누기 HOT 2
- optuna를 통합 매개변수 최적화와 모델 앙상블 HOT 1
- predictions_tr = trainer.predict(dataloaders=model.val_dataloader()) 부분 오류 문의 HOT 1
- 파일이 없는 것 같습니다. HOT 1
- pre-train시 학습 데이터
- pretraining 관련 문의 HOT 1
- IndexError: Target 2 is out of bounds. 오류 질문드립니다. HOT 8
- ckpt 에서 BERT 모델 로드하는 방법 HOT 4
- kcbert-large colab에서 오류가 발생합니다 HOT 3
- predict 시에 데이터가 증가하는 현상 HOT 10
- kcbert-large에서의 predict방법
- KcBERT Pre-Training Corpus (Korean News Comments)
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from kcbert.