A Study on Contextualized Language Modeling for Machine Reading Comprehension
基於 BERT、BERT-wwm 以及 MacBERT 的官方資源修改。
適用於中文機器閱讀理解:繁體中文 DRCD、簡體中文 CMRC。
本程式碼為論文 A Study on Contextualized Language Modeling for Machine Reading Comprehension 以及 A Study on the Information Extraction and Knowledge Injection for Machine Reading Comprehension 於單輪機器閱讀理解的實作部分。包括 Fine-tune 於 BERT/BERT-wwm/MacBERT 結果、加入 Information Extration 資訊結果,以及 N-best 答案進行 Reranking 的 Ensemble 方法與結果。
- tf.yml 模型訓練環境
- prep.yml 資料預處理環境(Clustering、Ensemble)
- Information Extraction
bash cls/run_cls.sh
- Train & Prediction
bash run.sh
- Evaluate
bash eval.sh
- output
- output_wwm
- output_mac
- output
- output_c_wwm
- output_c_mac
- cls