poochin / feedbyselectors Goto Github PK
View Code? Open in Web Editor NEWcreate Feed by scraped HTML using CSS Selector
Home Page: http://feedbyselectors.appspot.com/
License: Other
create Feed by scraped HTML using CSS Selector
Home Page: http://feedbyselectors.appspot.com/
License: Other
FeedbySelectors @version: 1.0.0 @author: poochin @site: http://poochin.sakura.ne.jp/ @LISENCE: Apache License 2.0 FeedbySelectors とは FeedbySelectors とは HTML をスクレイピングして Feed を作成するツールです。 スクレイピングに CSS セレクタを使うのが特徴です。 依存ライブラリ * BeautifulSoup: http://www.crummy.com/software/BeautifulSoup/ * soupselect: https://github.com/simonw/soupselect * dateutil: http://pypi.python.org/pypi/python-dateutil * Bootstrap: http://twitter.github.com/bootstrap/ 上記のライブラリの中から該当するファイルを以下のように配置してください。 feedbyselectors/ + lib/ | + BeautifulSoup.py | | soupselect.py | | dateutil/ | stylesheets/ | + bootstrap.min.css
特に躍動的に書く必要はなく、淡々と平坦な文章でよい。
ただし以下の事柄は必ず記入すること。
FeedbySelectors はアイテム内の各要素について zip ビルトイン関数で結合してアイテムを作成するため要素の数が少ないものの分だけアイテムを生成する。
よってセレクタをそもそも指定していない場合や、enable にしていない状態でかつセレクタが不正な指定だった場合は、その個数に捲き込まれてしまう。
enable プロパティを適切に見る事で、使用していない不正なセレクタについて配慮する必要なくフィードを適切に作成できるようになる。
T/O
入力フォームのバリデーションをするコードを加える。
各ユーザが自分の設定で上手くいくのかどうかを見極める為の「カスタムテストページ」を作成する。
ドキュメントに書くべき内容をまとめる
チュートリアルは FeedbySelectors を利用するにあたり重要なドキュメントである。
FeedbySelectors をどのようにして操作するのか、という操作感が分かるまでの情報を提供する。
・ 要素の概念
・ FeedbySelectors の入力方法
・ カスタムフィードの作成
この三つについて扱う。
関数自体の説明、またクラス自体の説明を書く
CustomFeed エンティティに updated 要素用の(セレクタと属性)セットのプロパティを用意する
データストアに関する単体テストを作成する。
特定のセレクタ属性セットを必要としない場合、それを使わない事を明示できるようにする。
これは時刻用のセレクタ属性セットが取得できない場合があるためである。
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.