用来提取百度百科的词条内容
包括:词条概述、基本信息栏、正文文本。支持一词多义的多个义项分别提取。
暂不包括:词条图片、内链外链、参考资料、正文内的表格信息。
{
{ //义项1
'subtitle': '子标题', //义项子标题,没有则初始化为'默认'
'summary': //概述段落
{
'段落1的正文',
'段落2的正文',
...
},
'basic': //基本信息栏
{
'项名1': '项内容1',
'项名2': '项内容2',
...
},
'main': //正文
{
'一级目录标题1':
{
'content':
{
'段落1的正文',
'段落2的正文',
...
},
'sub': //这个一级目录之下的二级目录列表,假如没有二级目录,则这个元素为null
{
'二级目录标题1':
{
'段落1的正文',
'段落2的正文',
...
},
'二级目录标题2': ...
}
},
'一级目录标题2': ...
},
},
{ //义项2
...
},
...
}