Git Product home page Git Product logo

kovlang-corpus's Introduction

こふ語コッパスッ

こふ語コッパスですっこふ語の解析にご利用くださいっ

raw/
    raw.txt                ;生コッパスッ
parsed/
    kovlang.parsed.txt     ;annot.txt で KyTea を訓練して raw.txt を解析した解析済みコッパスッ
annot/
    preannot.txt           ;raw.txt を KyTea コッパス用に変換したもの (スペッスの挿入とエスケップ)
    annot.txt              ;訓練用の部分的アノテッションコッパスッ
    annot0.txt              ;訓練用の部分的アノテッションコッパスッ
keyword/
    keyword.lst            ;こふ語のうち比較的変わった使い方をする単語リスヨッ

部分的アノテッションコーパス annot.txt は KyTea 用のものですっ この部分的アノテッションコーパスを利用して学習したこふ語の KyTea モデルを使って 生コッパス raw/raw.txt を解析した結果が parsed/kovlang.parsed.txt ですっ

実際にこふ語用の KyTea モデルを学習するには次のようにしますっ

train-kytea -dictn 4 -charw 3 -charn 3 -typew 3 -typew 3 -global 1 \
    -feat kytea-0.4.2.feat \
    -part annot/preannot.txt \
    -part annot/annot.txt \
    -part annot/annot0.txt \
    -model kovlang.model

ここでは学習に KyTea の素性ファイル を用いましたっ

こふ語と思われる単語には、通常の品詞タグではなく こふ語 という品詞タグをつけていますっ 名前と思われる単語には、 名前 タグをつけていますっ

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.