Git Product home page Git Product logo

nlp4han's Introduction

nlp4han

中文自然语言处理工具集。更多信息参见Wiki

功能特性

  • 断句
    • 基于规则的中文断句器
  • 分词
    • 基于字的最大熵中文分词器
    • 组合中文分词和词性标注器
  • 词性标注
    • 基准中文词性标注器
    • 单步基于词的最大熵中文词性标注器
    • 单步基于字的最大熵中文词性标注器
    • 组合中文分词和词性标注器
    • 基于HMM的中文词性标注器
  • N元语言模型
  • HMM模型
  • 命名实体识别
    • 基于字的命名实体识别
    • 基于分词的命名实体识别
    • 基于分词和词性标注的命名实体识别
  • 组块/浅层句法分析
    • 基于词的最大熵中文基本组块标注
    • 基于词和词性的最大熵中文基本组块标注
    • 组合中文词性标注和基本组块标注
    • 基于SVM的中文组块标注
  • 依存句法分析
    • 基于最大生成树MST和最大熵的依存句法分析
    • 基于转换的依存句法分析
  • 短语结构(成分)句法分析
    • 基于最大熵的短语结构(成分)句法分析
    • 基于CKY的PCFG短语结构(成分)句法分析
    • 中心词驱动的短语结构句法分析
    • 基于隐藏标记的非词汇化短语结构句法分析
  • 语义角色标注
    • 基于最大熵的语义角色标注
  • 指代消解
    • 基于Hobbs算法的指代消解
  • 情感分析
    • 基于朴素贝叶斯的文档情感分析
    • 基于规则和短语结构树的句子情感分析
  • GUI工具
    • 基于nlp4han功能实现的短语结构树编辑工具

更新日志

  • 2018.12.16, 基于Hobbs算法的指代消解
  • 2018.12, 基于隐藏标记的非词汇化短语结构句法分析
  • 2018.11, 集成短语结构树编辑工具到nlp4han-tools,并使用nlp4han的中文分词、词性标注和句法分析功能。
  • 2018.10, 基于SVM的中文组块标注
  • 2018.9, 中心词驱动的短语结构句法分析
  • 2018.7, 基于CKY的PCFG短语结构(成分)句法分析
  • 2018.6, 基于转换的依存句法分析
  • 2018.5, 基于朴素贝叶斯的文档情感分析, 基于规则和短语结构树的句子情感分析
  • 2018.3, 基于最大熵的语义角色标注
  • 2018.2, 基于最大熵的短语结构(成分)句法分析, HMM模型
  • 2018.1, 基于最大生成树MST和最大熵的依存句法分析
  • 2017.12, 组合中文词性标注和基本组块标注, N元语言模型
  • 2017.11, 基于词和词性的最大熵中文基本组块标注, 基于词的最大熵中文基本组块标注
  • 2017.10, 基于分词和词性标注的命名实体识别
  • 2017.9, 基于分词的命名实体识别, 基于字的命名实体识别
  • 2017.8, 基于HMM的中文词性标注器
  • 2017.7, 组合中文分词和词性标注器
  • 2017.6, 单步基于字的最大熵中文词性标注器
  • 2017.5, 单步基于词的最大熵中文词性标注器
  • 2017.4, 基准中文词性标注器
  • 2017.3, 组合中文分词和词性标注器
  • 2017.2, 基于字的最大熵中文分词器
  • 2016.12, 基于规则的中文断句器

nlp4han's People

Contributors

filter11 avatar hubteam avatar kyriecham avatar lincham avatar qylnlp avatar whyzc avatar wn1652400018 avatar zhangsonglei avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.