Git Product home page Git Product logo

findcl's Introduction

GitHub issues GitHub forks GitHub stars dependency status

项目简介

  • 使用 nodejs 实现磁力链接爬虫 磁力链接解析成 torrent种子信息,保存到数据库,利用 Elasticsearch 实现中文检索。koa2 搭建磁力链接搜索引擎
  • 前端站点 项目效果预览 http://findcl.com 命名 **吧
  • 源码地址 https://github.com/ssstk/findcl
  • 后端脚本 磁力链接获取 磁力链接解析 入库 Mongodb 定时同步 Elasticsearch
  • 源码地址 https://github.com/ssstk/manget2torrent
  • 此项目仅用学习交流技术使用 不做商业用途。

上线

  • 2018-06-01 网站正式上线。命名 **吧。域名是 http://findcl.com
  • 两台 VPS (都是某些云做活动买的 配置低)
  • 第一台部署了 FindCl 站点本身( koa2、nginx )和单个节点的 Elasticsearch
  • 第二台部署了磁力链接爬虫 hashinfo 解析 入库 Mongodb
  • Mongodb 数据库在套路云(目前有 300W 数据库,每日新收录 3W+的数据)

项目依赖

  • Mongodb
  • mongoose
  • Elasticsearch
  • nginx
  • koa2
  • vue
  • DHT BT 资源爬虫 磁力链接解析 manget2torrent
  • crontab 定时执行 Mongodb 与 Elasticsearch 的数据同步
  • ...

存在的问题

manget2torrent

  • 依赖的 dhtspider 爬虫 长时间使用一个端口的时,由于 P2P 网络的特性,越来越多的节点来访问 会导致带宽跑满(其主要是活动买的云主机 1M 的),如果活力全开不做闲置 大概稳定在 10M 左右。解决方案就是 每次采集 5000 条不重复的磁力 hashindo 就暂停爬虫,取解析获取信息。等小于 1000 条时候,再随机端口开启服务。
  • 解析磁力链接缓慢且成功率很低, 失败的大概在 3 成左右且需要好几秒

其他

  • 有其他问题请新建issue交流。

更新日志

  • 2018-06-21 搜索列表 按照资源收录时间排序
  • 2018-07-04 搜索列表 支持多关键字搜索
  • 2018-07-05 支持ssl 证书

findcl's People

Contributors

ssstk avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.