Git Product home page Git Product logo

pinuo520 / api-data Goto Github PK

View Code? Open in Web Editor NEW

This project forked from zhangps110/api-data

0.0 0.0 0.0 27 KB

整理开发中常用的各类API接口,当前有4大类:微信相关、数据及分析、开发专用、生活服务,如:天气预报、文档生成、身份证识别、代理IP等; 整理各种数据包,如:中华古诗词数据、词库、敏感词表、医学词表、四六级英汉词典数据等

api-data's Introduction

各类开发API接口

1、微信相关

名称:公众号对接
说明:用腾讯微信公众号对接网盘数据,在微信公众号输入搜索关键词就可以返回对应的网盘链接。

2、数据及分析

名称:书籍信息查询
说明:根据书籍名称、作者、译者、出版社、isbn等查看书籍的价格、概述等信息

名称:电影信息查询
说明:根据电影名称、导演、演员、语言、剧情分类、描述等提取电影信息(不包括下载链接等侵权信息)

名称:敏感词指出
说明:当输入一串字符,接口会判断其中是否包含不和谐内容,并标记出来

名称:长尾词挖掘
说明:主要帮助挖掘一些用户可能会大量搜索的,利于SEO的长尾词

名称:相关词挖掘
说明:输入某个词汇,将返回和该词汇相关的其他词汇

名称:中文分词
说明:输入一串中文,接口会以一定算法将其拆分为中文习惯使用的词组返回。

名称:文本相似度分析
说明:输入两串字符串,判断二者是否相似,并且返回相似度

名称:热门搜索词
说明:返回一定时间内,被用户热门搜索的词汇

名称:代理ip地址
说明:调用我方接口,将返回一系列可以使用的代理IP

名称:网盘数据
说明:提取我方提供的网盘数据,目前支持国内主流的百度网盘和新浪微盘。

3、开发专用

名称:生成DOC,PDF
说明:根据一定规则的内容,生成DOC和PDF

名称:EXCEL生成
说明:根据一定规则的内容,生成EXCEL文件

名称:二维码生成
说明:将用户需要生成的文字信息以二维码的形式表现出来

名称:验证码生成
说明:自动生成用户可控复杂度的验证码以及验证码图片

名称:IP地址归属地
说明:查询IP地址属于哪个地区,具体返回内容可查看返回接口

名称:手机号归属地
说明:查询手机号属于哪个地区,具体返回内容可查看返回接口

名称:文档转图片
说明:将pdf每一页转换成图片返回给接口调用者

名称:银行卡识别
说明:提交银行卡图片,以一定数据格式返回银行卡的文字内容

名称:文档内容提取
说明:提取word、ppt、pdf等文档中的内容返回给接口调用者

名称:身份证识别
说明:提交身份证图片,以一定数据格式返回身份证的文字内容

4、生活服务

名称:十万个为什么
说明:十万个为什么,有什么要问的嘛?

名称:童话故事集
说明:返回一系列精心整理的童话故事

名称:常见疾病
说明:根据疾病名称、科室、人群来查找相关的疾病信息以及附加的药物信息、症状等

名称:周公解梦
说明:输入相关梦境,输出对梦的解释

名称:空气质量指数
说明:城市空气质量、城市空气PM2.5、NO、臭氧指数等

名称:新华词典数据库
说明:根据汉字查询相关信息,如拼音、读音、详解、五笔等

名称:名人名言大全
说明:根据接口参数返回一定条数的名人名言

名称:笑话大全
说明:返回一些列精心整理的笑话、段子

名称:谜语大全
说明:返回一系列精心整理的谜语,并分类展示,如:灯谜、字谜、人名、地名、趣味等

名称:历史上的今天
说明:输入日期,返回历史上的今天发生过的一些大事件

名称:老黄历
说明:提供老黄历查询,黄历每日吉凶宜忌查询

名称:万年历
说明:根据传入日期返回当天详细信息

名称:成语接龙
说明:输入一个成语,返回一串接龙成功的成语

名称:成语大全
说明:返回一些列精心整理的成语

名称:简体繁体转换
说明:输入简体字,返回对应的繁体字

名称:汉字转拼音
说明:输入一串汉语字符串,返回对应的拼音

名称:天气预报查询
说明:输入城市,返回该地区的天气预报信息

名称:身份证信息查询
说明:输入身份证号,返回该身份证所在的省市区、持有人性别等,不包括姓名

名称:短网址服务
说明:将长的网址缩成短的网址,短网址输入浏览器又可还原成长网址

开源数据集锦

名称:100多万商品条形码
数据描述:商品条形码相当于商品的省份证,每个商品都不一样。而且条形码包含了此商品的很多信息,比如:商品名字、商品产地、商品制造商等等

名称:10万英语单词
数据描述:10万英语单词,mysql数据库,包含中文/音标 可以直接导入数据库

名称:12万对话语料青云库
数据描述:有10w数据,来自某聊天机器人交流群,相对不错,比较生活化。例如:Q:看来你很爱钱 A:噢是吗?那么你也差不多了

名称:IT词库
数据描述:与IT相关的名词,词组统计,可用于it相关关键词提取,标注等

名称:PTT八卦语料
数据描述:有40W数据,繁体,语料较生活化,有噪音,如:Q:为什么乡民总是欺负国高中生呢?QQ A:如果以为选好科系就会变成比尔盖兹那不如退学吧

名称:中文分词词组
数据描述:中文分词,分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。此TXT文件包含30W中文词组,可用于中文分词。

名称:中文名字字库
数据描述:此字库包含120万中文名字,并根据名字首字母排序,此字库可用于智能起名字,名字查重等

名称:中文缩写
数据描述:包含7000多天中文缩写数据,比如:文委会 -> 文化教育委员会、城建办 -> 城市建设办公室、西交会 -> **西部商品交易会等等

名称:中文谣言数据
数据描述:中文谣言数据,谣言止于智者,记录已经辟谣的一些谣言记录

名称:全国邮编
数据描述:最新全国区域,省市县,全国省市信息, 全国邮编,全国区号 全国省市,邮编,区号 全国区域,省市县,全国省市信息, 全国邮编,全国区号, 绝对绝对全国最齐全!!!!!!!!!!!! 没有比这更全了

名称:公司名字字库480w数据
数据描述:公司名字字库,本字库包含480万的公司名字,可用于公司名字查重,公司名字校验等

名称:动物词库
数据描述:涉及到动物相关词组,可用于文章动物名提取、标注等

名称:医学词库
数据描述:包含医学类常用的专业术语和相关词组,可以用于医学类文章,提取相关性文字短语标注、解释

名称:历史名人词库
数据描述:包含国内外名人人名,可用于提取、标注名人人名

名称:四六级英汉词典数据库
数据描述:四六级英汉词典数据库,从其他gson格式转换而来,可以直接导入mysql数据库,有15000多条,带例句

名称:地名词库
数据描述:涉及到国内外地名相关词组,可用于地名提取、标注、机器学习等等

名称:成语大全数据库
数据描述:成语资料包括成语的解释、翻译、读音、典故、出处、近义词、反义词、用法、例子等

名称:拆字词库
数据描述:汉字拆字词库,可用于字典汉字笔画书写等

名称:敏感词库表统计
数据描述:此敏感词表统计,包含4类敏感词类型,分别是:暴恐类、反动类、民生类、色情类,词表可用于敏感词校验、敏感词提醒、敏感词过滤等

名称:日本名字字库
数据描述:日本名字字库,此字库包含18w的日本名字,如:阿布木名、阿部愛莉、阿部八郎、阿部百合子、阿部百江等,并更具拼音首字母排序

名称:日本邮编大全
数据描述:日本邮编大全(含完整字段的.sql格式),包含 中文部分的及日文部分的都道府县(相当于**的省)、市、区6个字段,区代码及邮编及其他共 15 个字段。

名称:法律词库
数据描述:包含法律类常用的专业术语和相关词组,可以用于法律类文章,提取相关性文字短语标注、解释等

名称:网易云音乐民谣歌单排行
数据描述:今天花了一点时间抓取了网易云音乐的热门民谣歌单,共1500热门民谣歌单,大约50w首歌曲

名称:考研英语CET六级词汇SQLite数据库源文件
数据描述:考研英语-CET六级词汇SQLite数据库源文件,有1.5万词汇。 单词,类型,用例。 来源网络,通过XML导入的。

名称:职业词库
数据描述:包含大多数职业名称,如:复合固体推进剂物理机械性能测试工、审计统计人员、工艺制作人员、操作拉床进行工件拉削加工的人员等

名称:诗词短句词库
数据描述:诗词短语词库,可用于短诗句接龙,诗词填空等

名称:豆瓣100w语料和短信
数据描述:豆瓣多轮-闲聊常用语料和短信,来自北航和微软的paper, 开源项目,噪音相对较少

名称:财经词库
数据描述:包含财经类常用的专业术语和相关词组,可以用于财经类文章,提取相关性文字短语标注、解释

名称:食物词库
数据描述:此食物词库包含水果名、蔬菜名、奶制品、甜品、菜品等,可以用食物类词组提取、标注等

名称:草根吧全站数据分享
数据描述:草根吧已经把整个网站数据打包分享出来了,这里我分享的是数据库部分

名称:**211高校地区分布数据
数据描述:**211高校地区分布数据,这无需在介绍了

名称:**省市数据
数据描述:**省市数据

名称:**省自治区直辖市、市自治州、区县旗数据,包含名称、拼音、拼音首字母、行政代码、区号(CSV版)
数据描述:**各省/自治区/直辖市、市/自治州/盟/地区、区/县/县级市/旗数据,包含名称、拼音、拼音首字母、行政代码、区号等数据。本数据使用 MySQL 处理,现导出 SQL(基本兼容各主流关系型数据库) 和 CSV 两种数据格式,

名称:**省自治区直辖市、市自治州、区县旗数据,包含名称、拼音、拼音首字母、行政代码、区号(SQL版)
数据描述:**各省/自治区/直辖市、市/自治州/盟/地区、区/县/县级市/旗数据,包含名称、拼音、拼音首字母、行政代码、区号等数据。本数据使用 MySQL 处理,现导出 SQL(基本兼容各主流关系型数据库) 和 CSV 两种数据格式,

名称:从微信爬出来的**各地银行列表,包含 10 万条银行数据
数据描述:从微信爬出来的**各地银行列表,包含 10 万条银行数据。该 JSON 压缩后仍然有 17M 的大小,不推荐直接在客户端使用。你应该导入服务器数据库,让客户端通过 api 请求对应银行类型和地址的银行信息。

名称:俄罗斯行政单位
数据描述:俄罗斯行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:全唐诗TXT版本
数据描述:全唐诗TXT版本,可用于唐诗数据挖掘,分析,还可以解析TXT,做唐诗搜索展示等

名称:全国地铁名-数据可视化分析-数据
数据描述:全国地铁名-数据可视化分析,如:北京 S1线 金安桥;北京 S1线 四道桥;北京 S1线 桥户营;北京 S1线 上岸;北京 S1线 栗园庄;北京 S1线 小园;北京 S1线 石厂;北京 1号线 苹果园;北京 1号线 古城

名称:全球简略行政单位
数据描述:全球简略行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:冰岛行政单位
数据描述:冰岛行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:加拿大行政单位
数据描述:加拿大行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:南非共和国行政单位
数据描述:南非共和国行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:印度行政单位
数据描述:印度行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:国民经济行业分类数据
数据描述:国民经济行业分类数据,数据采用爬虫得到

名称:巴西行政单位
数据描述:巴西行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:彩票历史数据分享下载(推荐用于机器学习)- 500彩票网双色球历史数据
数据描述:彩票历史数据分享下载(推荐用于机器学习)- 500彩票网双色球历史数据;数据格式【| 期号 | 红球1 | 红球2 | 红球3 | 红球4 | 红球5 | 红球6 | 蓝球 | 快乐星期天 | 奖金奖池(元) | | 一等奖注数 | 一等奖奖金(元) | 二等奖注数 | 二等奖奖金(元) | 总投注额(元) | 开奖日期 |】

名称:彩票历史数据分享下载(推荐用于机器学习)- 中彩网双色球历史数据
数据描述:彩票历史数据分享下载(推荐用于机器学习)- 中彩网双色球历史数据;数据格式:【| 序号 | 开奖日期 | 期号 | 红球1 | 红球2 | 红球3 | 红球4 | 红球5 | 红球6 | 蓝球 | 销售额 | | 一等奖注数 | 一等奖奖金(元) | 二等奖注数 | 二等奖奖金(元) | 三等奖注数 | 三等奖奖金(元)| 奖池(元)】

名称:德国行政单位
数据描述:德国行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:所有国民经济行业分类数据
数据描述:所有国民经济行业分类数据

名称:挪威行政单位
数据描述:挪威行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:数据分析练习数据-《人民的名义》-文本
数据描述:本数据可用于数据分析练习使用,包括《人名的名义》电视剧中所涉及到的人名、故事情节等

名称:数据分析,改革春风吹满地火在哪里
数据描述:2018年年末,“改革春风吹满地”火了。这是一个来自哔哩哔哩的一个鬼畜类音乐视频。由up主小可儿上传,目前播放量已达到1400多万,有着相当高的热度。该视频剪辑了赵本山的历年作品的经典台词,配以略带喜感的音乐(bgm由其他up主制作),每一句台词衔接的相当完美。在网易云音乐里也可以搜到同名音乐,另有别名「念诗之王」正常,网易云的一位

名称:新加坡行政单位
数据描述:新加坡行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:新西兰行政单位
数据描述:新西兰行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:日本行政单位
数据描述:日本行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:最全中华古诗词数据库
数据描述:最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。(使用时请把后缀改成.rar,并解压)

名称:法国行政单位
数据描述:法国行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:澳大利亚行政数据
数据描述:澳大利亚行政数据,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:瑞典行政单位
数据描述:瑞典行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:瑞士行政单位
数据描述:瑞士行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:美国行政单位
数据描述:美国行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:芬兰行政单位
数据描述:芬兰行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:英格兰行政单位
数据描述:英格兰行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:荷兰行政单位
数据描述:荷兰行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:葡萄牙行政单位
数据描述:葡萄牙行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:补天厂商汇总-厂商-2019
数据描述:2019 补天厂商爬虫,获取数据来源:专属SRC、公益SRC、补天登陆接口遍历所有厂、历史漏洞中补天厂商,获取厂商共 : 20078 家,不排除误报

名称:补天厂商汇总-厂商网址-2019
数据描述:2019 补天厂商爬虫,获取数据来源:专属SRC、公益SRC、补天登陆接口遍历所有厂、历史漏洞中补天厂商,获取网址共 : 20238 条,不排除误报

名称:西班牙行政单位
数据描述:西班牙行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:韩国行政单位
数据描述:韩国行政单位,包括基本的行政单位,可用于地名标注,搜索,地域选择等等

名称:1 万本畅销书评分数据
数据描述:1 万本畅销书的6百万读者评分数据,每个评分1-5分不等

名称:2015年美国航班延误和取消数据
数据描述:美国交通运输部统计司公布的2015年国内民航航班数据

名称:2016年美国两党辩论数据
数据描述:该数据是一个竞选辩论文本数据,包括2016年**党、共和党和共和党内的辩论内容。

名称:20news 新闻数据
数据描述:英文新闻数据集,包含 20个 类别共 20000篇 新闻文档,可用以进行文档分类和自然语言处理等任务。

名称:3D MNIST 数字识别数据
数据描述:一个3D数字识别数据,用以识别三维空间中的数字字符。

名称:Alexa网站排名
数据描述:**网站,全球网站,德国网站,日本网站,法国网站,美国网站,英国网站,韩国网站,香港网站Alexa排名TOP500;更新:2019年8月

名称:Amazon product co-purchasing 商品数据
数据描述:Amazon product co-purchasing 商品数据

名称:Amazon 无锁手机用户评论数据
数据描述:Amazon 无锁手机评论数据

名称:Amazon 食品评论数据
数据描述:Amazon 食品评论数据

名称:Bao Face 人脸数据
数据描述:Bao Face 人脸数据

名称:BioID Face 人脸数据
数据描述:BioID Face 人脸数据;数据格式: txt,zip

名称:Book Crossing 推荐系统数据
数据描述:Book Crossing 是一个书籍推荐系统数据,用以向用户推荐偏好的书籍。

名称:Buffy pose 人类姿势图像数据
数据描述:一个人类姿势图像数据,包括不同的人类动作姿势,可用于针对姿势的图像检索识别。

名称:Caltech 10k Web Faces 人脸图像数据
数据描述:Caltech 10k Web Faces 人脸图像数据

名称:Capital 共享单车骑行数据
数据描述:Capital 共享单车骑行数据

名称:CIFAR-10 图像数据集
数据描述:60000 张 32x32 分辨率的彩色图像,airplane、automobile、bird、cat、deer、dog、frog、horse、ship、truck 10 个类别,每个类别 6000 张图片,类别之间的交集为空。

名称:CMU Frontal Face Images 图像数据
数据描述:一个正面人脸灰度图像以及人脸位置标注的数据集,虽然人脸图像不多约 180张,但有详细的人脸位置标注信息。

名称:DNA基因序列数据
数据描述:该数据为某人DNA遗传基因序列原始数据,以23andMe作为DNA表型SNP

名称:FDDB 人脸数据集
数据描述:一个人脸数据集,从 2845张 图像中标注了 5171张 人脸位置。

名称:Forex 历史中心各货币对外汇交易数据
数据描述:Forex 历史中心各货币对外汇交易数据,时间区间为 2001.01.01 到 2012.01.01。

名称:HetRec 2011
数据描述:“The 2nd International Workshop on Information Heterogeneity and Fusion in Recommender Systems” 会议上发布的一系列用户喜好的数据

名称:iCubWorld 图像分类数据
数据描述:iCubWorld 图像分类数据

名称:IMDB 五千部电影数据
数据描述:包括5043部电影28个属性信息,4906张海报,电影时间跨度超过100年和66个国家,并包括2399位导演和数千位演员。

名称:Jester 推荐系统数据
数据描述:从 Jester Online Joke Recommender System 抓取的匿名用户对Joke的评份数据。

名称:JRC Names 实体专有名词库
数据描述:跨语言实体名称语料库,数据格式: zip,txt,gzip

名称:KTH-TIPS 纹理材质数据
数据描述:一个纹理图像数据集,在不同的光照、角度和尺度下拍摄的不同材质表面纹理图片

名称:Large Movie Review Dataset
数据描述:Large Movie Review Dataset

名称:Lending Club 信贷违约数据
数据描述:美国网络贷款平台 LendingClub 在2007-2015年间的信用贷款情况数据,主要包括贷款状态和还款信息。附加属性包括:信用评分、地址、邮编、所在州等

名称:MNIST 手写数字图像数据
数据描述:包含‘0 - 9’ 十组手写手写阿拉伯数字灰度图图片,分辨率为 20x20 。训练样本 60000 ,测试样本 10000,数据为图片的像素点值。

名称:Motion Capture 动作捕捉视频数据
数据描述:一个动作捕捉视频数据,可用以捕捉人类动作。

名称:MovieLens 100k 电影推荐数据集
数据描述:数据集包含 943个 用户对 1682部 电影的 100000 个 电影的评分(1-5分)

名称:NEC Toy Animal 图像数据
数据描述:包含 60个 动物玩偶的 5000张 不同角度图像,每个玩偶约 72个 角度连续拍摄的照片图像,可用于物体3D、图像识别等任务。

名称:Nice Ride 共享单车骑行数据
数据描述:Nice Ride 共享单车骑行数据

名称:NIPS 2003 属性选择竞赛数据
数据描述:包含5个属性(列数)较大的数据集,用以对属性选择或属性提取算法的效能进行评判。

名称:NIPS会议文章信息数据(1987-2017)
数据描述:包含了从PDF文档中抽取得到的1987年到2017年NIPS学术会议中所有论文的标题、作者、摘要和提取文本。

名称:NIST 8-Bit Gray Scale Images of Fingerprint 指纹图像数据
数据描述:一个指纹图像数据,包括 2000张指纹灰度图,400组左右手五指指纹灰度图,图像分辨率为512x512。

名称:NIST Structured Forms Reference Set of Binary Images (SFRS) II 图
数据描述:一个结构化表单的图像数据,包括5595页税务填报表单的黑白照片以及对应表单填报内容。

名称:NIST Structured Forms Reference Set of Binary Images (SFRS) 图像数据
数据描述:一个结构化表单的图像数据,包括5590页税务填报表单的黑白照片以及对应表单填报内容。

名称:Quora Question Pairs 问答数据集
数据描述:美国知识问答网站 Quora 上的问题答案数据集,可用以进行重复问题检测。

名称:Recognition of human actions 动作视频数据
数据描述:包含六种类型的人类活动(步行、慢跑、跑步、拳击、摆手、拍手)由25名受试者在四种不同的情况:室内、外,不同尺度变化,不同的衣服条件下所拍摄。

名称:Reddit 2.5 million 社交新闻数据
数据描述:美国 reddit 新闻网站最受欢迎的 2500 名发布者每家媒体 1000 个发布内容及评论数据。

名称:Retailrocket 电子商务网站行为数据
数据描述:真实电子商务网站用户的行为数据,包括4.5个月内网站访问者的行为数据

名称:Sinhala TTS 语音识别数据
数据描述:Sinhala TTS 语音识别数据

名称:Stanford Sentiment Treebank 英文语义词表数据
数据描述:由斯坦福大学标注的语义词汇数据,人工标注了9645个英语句子的语义树结构。

名称:Structured Web Data Extraction 数据集
数据描述:Structured Web Data Extraction 数据集

名称:The Oxford-IIIT 宠物图像数据
数据描述:一个宠物图像数据集,包含37种宠物,每种宠物200张左右宠物图片,并同时包含宠物轮廓标注信息。

名称:TIMIT 语音识别数据
数据描述:一个英语语音识别数据,包括 630人8个不同地区的美国方言录制的音频信息。

名称:Uber 纽约市乘车数据
数据描述:数据包含Uber在美国纽约市的乘车记录

名称:UCI Germny Credit 数值型数据集独立测试数据
数据描述:UCI Germny Credit 数值型数据集独立测试数据,按70%比例抽取,剩余30%独立测试。

名称:UCI Germny Credit 数值型数据集独立训练数据
数据描述:UCI Germny Credit 数值型数据集独立训练数据,按70%比例抽取,剩余30%独立测试。

名称:UCI Iris Versicolour vs. Virginica 二分类数值型数据集
数据描述:UCI Iris: Versicolour vs. Virginica 二分类数值型数据集

名称:UCI Iris 随机抽取 13 测试数据
数据描述:UCI Iris: 随机抽取 1/3 测试数据

名称:UCI Iris 随机抽取 23 训练数据
数据描述:UCI Iris: 随机抽取 2/3 训练数据

名称:UCI Statlog (German Credit Data) 原始数据数值化
数据描述:UCI Statlog (German Credit Data) 原始数据数值化

名称:UCI Statlog (German Credit Data) 原始数据集
数据描述:UCI Statlog (German Credit Data) 原始数据集

名称:UCI多分类组合出的二分类数据集
数据描述:利用 UCI 机器学习数据集合中的多分类数据集,排列组合出的二分类数据集,用以测试二分类模型的预测效果。(把下载的.csv文件改成.rar文件)

名称:UCI经典二分类数据集
数据描述:包括 Iris、Hert Dieses、German Credit 等经典二分类问题测试数据集。(把下载的.csv文件改成.rar文件)

名称:UCSD 行人视频数据
数据描述:UCSD 行人视频数据

名称:UT-Interaction 人类动作视频数据
数据描述:包括20个视频序列,6类人类交互动作:握手、指点、拥抱、击打、推、踢拳,视频格式为 720x480,30fps,视频中人像的大小为 200像素。

名称:VGG Face 人脸图像数据
数据描述:一个人脸图像数据,包括 2622个 人的人脸图像URL和对应人脸检测位置。

名称:WikiText 英语词库数据
数据描述:1亿个词汇的英文词库数据,从Wikipedia的优质文章和标杆文章中提取得到,包括WikiText-2和WikiText-103两个版本

名称:上证主板股票日线数据,原始价前复权后复权三种价格
数据描述:上证主板股票的日线数据,包括:原始、前复权、后复权三种价格。数据截止2017年05月08日,总计 1260支股票。

名称:世界各国经济发展数据
数据描述:由世界银行发布的全球100多个国家的1000多个经济指标,时间跨度为1960-2015年。

名称:世界大学排名
数据描述:世界大学排名,2019年版本

名称:世界范围显著地震数据(1965-2016)
数据描述:世界范围显著地震数据(1965-2016)

名称:世界银行 World Development Indicators 数据
数据描述:世界银行编录的各国官方发布的经济发展指标数据,时间为1960-2016年

名称:人力资源分析数据
数据描述:该数据为人力资源绩效相关数据

名称:信用卡欺诈数据
数据描述:欧洲的信用卡持卡人在2013年9月2天时间里的284807笔交易数据,其中有492笔交易是欺诈交易。

名称:全世界1908年以来空难数据
数据描述:1908年以来世界范围内的空难信息,数据包括,时间、地点、飞机类型、具体描述等

名称:全世界鲨鱼袭击人类数据
数据描述:鲨鱼袭击人类统计数据。

名称:全国各地车牌查询表
数据描述:全国各地车牌字母查询表 - 收录了全国各地的车牌字母信息,可以通过查询车牌字母找到是哪个市的车

名称:全国火车票代售点
数据描述:全国火车票代售点,包含省份、城市、区县、地址、联系电话、营业时间等字段

名称:全国行政区划代码表_201907版
数据描述:全国行政区划代码表,区县级。可用于快递地址查询,地址填写提醒等需要地址

名称:全国邮编区号大全
数据描述:全国邮编区号大全,包含市、县、区名,区号,邮编。数据准确

名称:全国高等学校名单
数据描述:截至2017年5月31日,全国高等学校共计2914所,其中:普通高等学校2631所(含独立学院265所),成人高等学校283所。数据来源中华人民共和国教育部公开。

名称:几个聊天机器人语料
数据描述:Github 上几个用于训练中英文对话系统的语料库。

名称:凶杀案报告数据
数据描述:凶杀案报告数据【Kaggle数据】

名称:创业板个股权日线数据
数据描述:深圳证券交易所创业板股票日线数据,510支股票,1999.12.09-2016.06.08,前复权,剔除假期休市。

名称:北美电影票房
数据描述:2011年至2019年北美票房日票房榜,数据包括:当日票房、中文片名、英文片名、上映天数、累计票房

名称:历史地震数据_20190805之前
数据描述:地震数据资料,7000多条地震数据,数据包括地震的时间、震级、维度、经度、深读、地震位置

名称:历史棒球比赛数据
数据描述:该数据包括从1871年到2015年美国主要棒球比赛的统计数据。

名称:国内机场三字码表
数据描述:国内机场名称及对应三字码查询

名称:国际区号
数据描述:提供国际电话区号数据,包括亚洲、欧洲、非洲、北美洲、南美洲、大洋洲等国际区号。

名称:常用号码数据
数据描述:全国常用电话号码列表大全。例如:火警:119,匪警:110、急救中心:120、道路交通事故报警:122等

名称:广告实时竞价数据
数据描述:广告牌、商场广告位和互联网广告栏中的广告位的实时竞价情况信息

名称:房屋租赁信息查询次数
数据描述:根据房屋租赁信息创建的日期和其它相关特征,预测该租赁信息预计被查询点击的次数

名称:斯坦福问答数据库(SQuAD)
数据描述:从 Wikipedia 文章中提取出的问题和答案对,从 500 多篇文章中摘取出的 10 万多个问题和答案。

名称:标准电码表
数据描述:标准中文电码,总计8746个

名称:欧洲足球运动员赛事表现数据
数据描述:包括欧洲2008到2016赛季中的25000多场比赛,10000多个运动员,11个欧洲国家的联赛,运动员和球队的属性,赌博赔率,比赛详情等数据。

名称:汉字简体繁体参照表
数据描述:汉字简体繁体转换映射表,可用于汉字字形转换,简繁体对照学习等

名称:沪深股票除权除息、配股增发全量数据
数据描述:沪深股票除权除息、配股增发全量数据,包括:除权除息、股本变化、增发新股、配送股上市、非流通股上市等事件,截止2016年12月31日。

名称:波士顿 Airbnb 公开数据
数据描述:共享民宿网站Airbnb的开放数据

名称:深证A股个股日线数据
数据描述:深证证券交易所A股股票日线数据,1766支股票,1999.12.09-2016.06.08,前复权,剔除假期休市。

名称:深证中小板股票日线数据,原始价前复权后复权三种价格
数据描述:深证中小板股票的日线数据,包括:原始、前复权、后复权三种价格。数据截止2017年05月08日,总计 852支股票。

名称:深证主板股票日线数据,原始价前复权后复权三种价格
数据描述:深证主板股票的日线数据,包括:原始、前复权、后复权三种价格。数据截止2017年05月08日,总计 466支股票。

名称:深证创业板板股票日线数据,原始价前复权后复权三种价格
数据描述:深证创业板股票的日线数据,包括:原始、前复权、后复权三种价格。数据截止2017年05月08日,总计 636支股票。

名称:用户对美国航空公司的Twitter评论情绪数据
数据描述:美联航 Twitter 用户评论数据

名称:纽约股票交易所标准普尔500股票数据
数据描述:2010年到2016年的标准普尔500股票数据。

名称:美国医疗保险市场数据
数据描述:由美国健康与国民服务部发布,针对全美个人和小企业医疗健康与牙医保险的市场数据。

名称:美国婴儿姓名数据
数据描述:从国家和州两个维度对新生婴儿姓名进行统计,为了保障个人隐私相同姓名的婴儿在5名以上。

名称:美国股票数据XBRL
数据描述:美国股票数据XBRL

名称:美国股票新闻数据
数据描述:Reddit WorldNews Channel网站新闻数据(2008-06-08至2016-07-01)和对应时间的 Dow Jones Industrial Average (DJIA)股票指数数据。

名称:美国视频游戏销售和评价数据
数据描述:美国视频游戏销售和评价数据

名称:美国金融客户投诉数据
数据描述:美国金融客户投诉数据

名称:芝加哥犯罪数据(2005-2007)
数据描述:美国芝加哥市从2005年至2007年犯罪记录,包括时间、地点、区域、案件描述、社区、经纬度坐标等。

名称:芝加哥犯罪数据(2008-2011)
数据描述:美国芝加哥市从2008年至2011年犯罪记录,包括时间、地点、区域、案件描述、社区、经纬度坐标等。

名称:芝加哥犯罪数据(2012-2017)
数据描述:美国芝加哥市从2012年至2017年犯罪记录,包括时间、地点、区域、案件描述、社区、经纬度坐标等。

名称:食品营养成分数据
数据描述:食品营养成分数据包括10万多种食品的营养物质、有效成分、过敏原等组成

名称:Human Pose Evaluator 人体轮廓识别图像数据
数据描述:Human Pose Evaluator 人体轮廓识别图像数据

名称:上证综合指数前复权日线数据
数据描述:上海证券综合指数的日线数据,1999.12.09-2016.06.08,前复权,剔除假期休市。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.