Git Product home page Git Product logo

smp2018's Introduction

SMP2018

通过SMP2018,展现处理中文文本分类的一般方法。特别是 Keras 和中文分词工具 jieba 的联合使用

SMP2018中文人机对话技术评测由**中文信息学会社会媒体处理专委会主办,哈尔滨工业大学、科大讯飞股份有限公司承办,讯飞公司提供数据,华为公司提供奖金。旨在促进中文人机对话系统相关研究的发展,为人机对话技术相关的学术研究人员和产业界从业人员提供一个良好的沟通平台。在此,评测会务组诚邀各个单位参加本次人机对话技术评测活动!

用户意图领域分类  

在人机对话系统的应用过程中,用户可能会有多种意图,相应地会触发人机对话系统中的多个领域(domain) ,其中包括任务型垂直领域(如查询机票、酒店、公交车等)、知识型问答以及闲聊等。因而,人机对话系统的一个关键任务就是正确地将用户的输入分类到相应的领域(domain)中,从而才能返回正确的回复结果。

例如

1) 你好啊,很高兴见到你! — 闲聊类

2) 我想订一张去北京的机票。 — 任务型垂类(订机票)

3) 我想找一家五道口附近便宜干净的快捷酒店 — 任务型垂类(订酒店)

相关资源

标题 说明
CodaLab评测主页 数据下载
CodaLab 评测教程
评测排行榜
SMP2018-ECDT评测主页
SMP2018-ECDT评测成绩公告链接
  1. 本资源是一个完整的针对 SMP2018中文人机对话技术评测(ECDT) 的实验,由该实验训练的基线模型能达到评测排行榜的前三的水平。
  2. 通过本实验,可以掌握处理自然语言文本数据的一般方法。
  3. 推荐自己修改此文件,达到更好的实验效果,比如改变以下几个超参数
# 词嵌入的维度
embedding_word_dims = 32
# 批次大小
batch_size = 30
# 周期
epochs = 20

本实验还可以改进的地方举例

  1. 预处理阶段使用其它的分词工具
  2. 采用字符向量和词向量结合的方式
  3. 使用预先训练好的词向量
  4. 改变模型结构
  5. 改变模型超参数

资源说明

smp2018's People

Contributors

yuanxiaosc avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar

smp2018's Issues

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.