ebal5 / shinra_ner Goto Github PK
View Code? Open in Web Editor NEWShinra 2019 extraction programs using NER
License: Other
Shinra 2019 extraction programs using NER
License: Other
森羅プロジェクト Named Entity Recognition ========= NER を利用した抽出器の作成(for Shinra2019 JP-5 and JP-30) 面倒なことは嫌なのでとりあえず CC0 でライセンスしてみた. よく考えたら Apache との互換性がないとかで死ぬのでは? まぁあまり気にするでもないか. データ形式 --------- 提出形式 ^^^^^^^^^ :: { "page_id": ページ ID: str, "title": ページタイトル: str, "ENE": Extended Named Entity dot separated: str, "attribute": 属性名: str, "html_offset": { "start": { "line_id": 開始位置行番号: int, "offset": 開始位置文字番号: int, } "end": { "line_id": 終了位置行番号: int, "offset": 終了位置文字番号: int, } "text": 内部に存在する文字列: str }, "text_offset": { "start": { "line_id": 開始位置行番号: int, "offset": 開始位置文字番号: int, } "end": { "line_id": 終了位置行番号: int, "offset": 終了位置文字番号: int, } "text": 内部に存在する文字列: str } } irex_ner --------- IREX の定義に基づく NER プログラム.提出形式での結果を出力する tools --------- offset ^^^^^^^^^ h2p, p2h がメイン.それぞれ html のオフセットからプレインテキストのそれへ変換するものとその逆変換である. ただし,純粋な逆関数となっていないことに注意. html タグの開始文字"<"は html offset ではそれ自身を示すが, テキストでは次のテキスト要素の先頭を示される. - p2h は one-to-one - h2p は n-to-one オフセットが一意に定まらない問題,考えるまでもなく p2h のときは<でない位置にあわせるのが正解だなこれ.
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.