Comments (21)
from ccks2019-ckbqa-4th-codes.
@MrRace 请问楼主你在运行entity_filter.py之后实体的召回率能达到多少?
from ccks2019-ckbqa-4th-codes.
@duterscmy 那现在上传的这个版本其实仅利用到了BERT的特征?
现在上传的这个版本features数据如下:
(1)这种情况,怎么写 X.append()
?
(2)在生成负样本时,这种随机数生成的方式为啥能够确保0.05的负样本比例?
谢谢~
from ccks2019-ckbqa-4th-codes.
@MrRace 我是直接使用的X.append([features[2]])
from ccks2019-ckbqa-4th-codes.
@MrRace 我是直接使用的
X.append([features[2]])
你的feature也是类似的结构吗?
from ccks2019-ckbqa-4th-codes.
from ccks2019-ckbqa-4th-codes.
@duterscmy 那在SaveFilterCandiT
中的new_features = features[0:2]+[features[9][0][1]]
需要改成:
new_features = features
? 还是?
from ccks2019-ckbqa-4th-codes.
单实体问题中,候选答案可召回的的比例为:0.730
候选答案能覆盖标准查询路径的比例为:0.461
在验证集上逻辑回归筛选后top10 召回率为0.72
单实体问题中,候选答案可召回的的比例为:0.731
候选答案能覆盖标准查询路径的比例为:0.560
@ZainZhou 你的呢?
from ccks2019-ckbqa-4th-codes.
第二个逻辑回归模型只用bert特征吗,不加上之前的词频、长度、字重合度等特征吗?我理解的Bert返回的特征是一个数即正例的概率吧?
from ccks2019-ckbqa-4th-codes.
@MrRace 我跑的tuple_filter的比你这个低很多,因为我前面实体抽取的召回率就偏低,所以才问你entity_filter.py你可以召回多少实体
from ccks2019-ckbqa-4th-codes.
@MrRace 我跑的tuple_filter的比你这个低很多,因为我前面实体抽取的召回率就偏低,所以才问你entity_filter.py你可以召回多少实体
在entity_filter.py
上,
在验证集上逻辑回归top5筛选后,所有问题实体召回率为0.774,单实体问题实体召回率0.820
训练集的话,大概是0.8左右。
from ccks2019-ckbqa-4th-codes.
@MrRace 那其实差不了多少,但不知道为什么后面tuple_filter的差20个点,我再研究研究吧
from ccks2019-ckbqa-4th-codes.
from ccks2019-ckbqa-4th-codes.
@duterscmy 我运行tuple_filter.py
的结果:
单实体问题中,候选答案可召回的的比例为:0.730
候选答案能覆盖标准查询路径的比例为:0.461
单实体问题中,候选答案可召回的的比例为:0.772
候选答案能覆盖标准查询路径的比例为:0.638
在验证集上逻辑回归筛选后top10 召回率为0.72
单实体问题中,候选答案可召回的的比例为:0.731
候选答案能覆盖标准查询路径的比例为:0.560
这个结果是偏低吗?你的大概多少?
from ccks2019-ckbqa-4th-codes.
from ccks2019-ckbqa-4th-codes.
from ccks2019-ckbqa-4th-codes.
我理解错了,这是候选答案的数据啊,我今晚把流程重新跑一下告诉你
…
---原始邮件--- 发件人: "JaonLiu"<[email protected]> 发送时间: 2019年12月12日(周四) 上午8:57 收件人: "duterscmy/ccks2019-ckbqa-4th-codes"<[email protected]>; 抄送: "Mention"<[email protected]>;"Caomingyu"<[email protected]>; 主题: Re: [duterscmy/ccks2019-ckbqa-4th-codes] tuple_filter.py中的疑问 (#18) @duterscmy 我运行tuple_filter.py的结果: 单实体问题中,候选答案可召回的的比例为:0.730 候选答案能覆盖标准查询路径的比例为:0.461 单实体问题中,候选答案可召回的的比例为:0.772 候选答案能覆盖标准查询路径的比例为:0.638 在验证集上逻辑回归筛选后top10 召回率为0.72 单实体问题中,候选答案可召回的的比例为:0.731 候选答案能覆盖标准查询路径的比例为:0.560 这个结果是偏低吗?你的大概多少? — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.
我运行tuple_filter.py的结果和上面相近,是不是参数或模型哪里有变化?我最近在做相关的工作,希望能够复现你提交的结果
from ccks2019-ckbqa-4th-codes.
我理解错了,这是候选答案的数据啊,我今晚把流程重新跑一下告诉你
…
---原始邮件--- 发件人: "JaonLiu"<[email protected]> 发送时间: 2019年12月12日(周四) 上午8:57 收件人: "duterscmy/ccks2019-ckbqa-4th-codes"<[email protected]>; 抄送: "Mention"<[email protected]>;"Caomingyu"<[email protected]>; 主题: Re: [duterscmy/ccks2019-ckbqa-4th-codes] tuple_filter.py中的疑问 (#18) @duterscmy 我运行tuple_filter.py的结果: 单实体问题中,候选答案可召回的的比例为:0.730 候选答案能覆盖标准查询路径的比例为:0.461 单实体问题中,候选答案可召回的的比例为:0.772 候选答案能覆盖标准查询路径的比例为:0.638 在验证集上逻辑回归筛选后top10 召回率为0.72 单实体问题中,候选答案可召回的的比例为:0.731 候选答案能覆盖标准查询路径的比例为:0.560 这个结果是偏低吗?你的大概多少? — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.我运行tuple_filter.py的结果和上面相近,是不是参数或模型哪里有变化?我最近在做相关的工作,希望能够复现你提交的结果
朋友,问题解决了吗,我运行的结果也差不多:还望指教
单实体问题中,候选答案可召回的的比例为:0.745
候选答案能覆盖标准查询路径的比例为:0.471
单实体问题中,候选答案可召回的的比例为:0.755
候选答案能覆盖标准查询路径的比例为:0.579
在验证集上逻辑回归筛选后top10 召回率为0.74
单实体问题中,候选答案可召回的的比例为:0.748
候选答案能覆盖标准查询路径的比例为:0.573
from ccks2019-ckbqa-4th-codes.
@duterscmy 我运行
tuple_filter.py
的结果:单实体问题中,候选答案可召回的的比例为:0.730 候选答案能覆盖标准查询路径的比例为:0.461 单实体问题中,候选答案可召回的的比例为:0.772 候选答案能覆盖标准查询路径的比例为:0.638 在验证集上逻辑回归筛选后top10 召回率为0.72 单实体问题中,候选答案可召回的的比例为:0.731 候选答案能覆盖标准查询路径的比例为:0.560
这个结果是偏低吗?你的大概多少?
为啥跑出来全是0,是哪里出问题了吗?
from ccks2019-ckbqa-4th-codes.
@duterscmy 那在
SaveFilterCandiT
中的new_features = features[0:2]+[features[9][0][1]]
需要改成:
new_features = features
? 还是?
这个features应该怎么写啊?解决了吗?
from ccks2019-ckbqa-4th-codes.
@duterscmy 那在
SaveFilterCandiT
中的new_features = features[0:2]+[features[9][0][1]]
需要改成:
new_features = features
? 还是?这个features应该怎么写啊?解决了吗?
请问这个features的问题解决了吗?写成new_features = features的效果好差。
from ccks2019-ckbqa-4th-codes.
Related Issues (20)
- 文本匹配模型的准确度?
- 请问 keras和keras-bert用的是什么版本? HOT 1
- neo4j的关系种类数限制是6.5w 请问你是怎么解决的
- 文本匹配模型中dev.csv的构造方式
- 文本匹配模型中dev.csv的构造方式
- 请问train_ner.py里面的corpus_train.pkl和corpus_valid.pkl是怎么得到的呢 HOT 1
- 关于tuple_filter.py中验证集的召回率 HOT 3
- 第一次运行train_ner.py的时候,提示找不到../data/model/ner_model.h5/{saved_model.pbtxt|saved_model.pb} HOT 3
- 有关tuple_filter.py产生的结果指标,一项略低其余正常 HOT 1
- 您好,想问下similarity.py的tf版本和protobuf的版本应该是多少?很多属性值都失效了。 HOT 5
- neo4j查询慢的问题 HOT 3
- 请问pkubase-full.txt可以在哪下载 HOT 8
- tuple_filter.py文件SaveFilterCandiT函数运行error HOT 3
- 该方法是否后续发表论文了? HOT 2
- segment_dic.txt
- 请问双实体的部分没有代码实现吗? HOT 1
- 你好,tuple_filter.py用到的LR模型用到的特征,为什么只有len(mention)?bert_score等其他特征不用吗? HOT 1
- 大佬您好,请问CCKS2019电子病历命名实体识别的数据集有吗 HOT 5
- 请问作者和大家复现时各模块指标都是多少呀? HOT 8
- 内存炸了,大家都可以跑最后的answer_bot吗?
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from ccks2019-ckbqa-4th-codes.