Git Product home page Git Product logo

connected-digit-online-decoding's Introduction

Server-Client online decoding

Nguyen Hai Duong
August 16 2016

Chương trình hỗ trợ online-decoding dựa trên phương thức TCP-IP. Để cài đặtchương trình hãy mở file INSTALL và làm theo hướng dẫn.

Chương trình nhận dạng cho bộ chữ số tiếng việt. Có thể nhận dạng các số từ 1 tới (không bao gồm số 10, cách đọ hai chữ số như mười lăm...).

Dữ liệu được training bao gồm : 1062 audio.wav file với 30 người đọc khác nhau. Kết quả decoding trên 1062 audio.wav : %WER 0.86 [ 101 / 11698, 93 ins, 1 del, 7 sub ] Xem chi tiết ở exp/dnn-v2.

Toàn bộ chương trình tại địa chỉ project site

Server

Server hỗ trợ cho phương thức dnn. Cùng một lúc có thể decoding nhiều client. Server sẽ liên tục decoing khi có dữ liệu từ client gửi lên. Khi có gói dữ liệu thứ nhất gửi lên, server sẽ decoding gói đó. Khi có gói thứ 2 gửi lên, server sẽ decoding lại gói 1 + gói thứ 2. Cứ như thế đến khí client kết thúc việc gửi dữ liệu.

Server hoàntoàn có thể decoding chỉ một gói dữ liệu mà client gửi lên nhưng như thế kết quả đa phần là sẽ không chính xác. Vấn đề này phải giải quyết ở client với việc cắt chính xác dữ liệu để gửi đi (phần này không được thực hiện).Do vậy để mô phỏng hết khả năng decoding chính xác của server, server sẽ decoding lại tất cả gói dữ liệu. Tất nhiên Nếu như vậy thì càng nhiều gói dữ liệu thì server sẽ decoding càng lâu. Ngoài ra server cũng có thể chờ đếnkhi client gửi hết dữ liệu sau đó mới thực hiện decoding.

File thực thi : src/server-dnn-online

Chạy chương trình : ./server.sh

Client

Client sẽ cắt từng gói dữ liệu (12kbyte) từ file audio.wav (tần số 16khz), sau đó sẽ gửi lên server để decoding. Dữ liệu server trả về là từ được nhận dạng. Client sẽ hiển thị lên màn hình. Để thuận tiên cho việc theo dõi. Client cứ 1s sẽ đọc dữ liệu từ audio.wav rồi sau đó mới gửi lên server, đọc tới khi nào hết dữ liệu.

File thực thì : src/client-online.

Chạy chương trình, có 2 cách :

  • ./client.sh : client sẽ đọc file audio.wav được liệt kê trong audio/wav.scp
  • ./client.sh 'audio.wav' : client đọc trực tiếp file auio.wav

connected-digit-online-decoding's People

Contributors

duongnguyenhai avatar

Watchers

James Cloos avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.