文章"基于多重异质图的恶意软件相似性度量方法"的相关内容
数据集位于Dataset1和Dataset2目录下:
Dataset1下的样本进行论文中的实验一、三、四这个数据集是从合作企业提供的15689个PE文件样本virustotal报告中,筛去加壳、抗沙箱、解析失败、良性样本的报告得到的,最终得到747个恶意样本,这里给出这747个恶意样本的md5和出现时间,对于样本的家族标记可以参考论文利用avclass进行标记,对于样本的报告可以将样本md5上传virustotal得到 Dataset2下增加了2020年和2021年的样本,总共有2290个恶意样本