Git Product home page Git Product logo

rime-easy-en's People

Contributors

ace-who avatar ayaka14732 avatar blindingdark avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar

rime-easy-en's Issues

rime从 0.14.3升级到0.15.0不能连续输入了

windows10 64的系统
rime从 0.14.3升级到0.15.0
wordninja从32换成了64的(因为32在0.15.0版本里, 单独English模式是会闪退的, 64则正常运行)
连续输入却不会亮灯了, 也不能连续输入了
不知作者有没有升级新版本的rime, 有空时可否查看一下这个情况
谢谢

求连续增强输入rime.dll

等待 hchunhui/librime-lua#80

该功能实装后可以实现:

记住用户输入的新单词
调整词频
开启连续增强输入后,可以记住用户输入的新单词的 rime.dll {windows版}有吗,librime-lua actions过期了,新版的好像都没有这功能

easy_en.dict.yaml 数据损坏

有 12 处大量连续重复的 \0 字符,原数据本应是大量单词条目,例如以 k 开头的单词全部缺失。

标点符号的处理

英文的标点符号与上一个单词之间不能空格,应该紧挨着上一个单词。现在的easy-en输出的标点符号仍然被当作普通单词那样处理了,请问可以改进一下吗?
例如现在的easy-en输出:

I love easy english . I love rime . 

能否改成:

I love easy english. I love rime. 

即自动让标点紧挨着上一个单词,但是该标点的后面仍然接着一个空格。

`%1 is not a valid Win32 application.` when using `wordninja_windows_64_lua53.dll`

I used linux before where I tried wordninja-rs-lua or compiling wordninja-rs and all works fine.

But when I used weasel recently in Windows 11 22H2 22621.3155, I used rime.lua to use easy_en_enhance_filter and checked in git-bash

$ pwd
/d/Rime/weasel-0.15.0
$ ls lua53.dll data/wordninja_windows_64_lua53.dll
data/wordninja_windows_64_lua53.dll*  lua53.dll*
$ cat /tmp/rime.weasel.DESKTOP-O0JBM8G.czg.log.ERROR.20240314-162538.1228
...
E20240314 16:25:38.838465 19952 lua_gears.cc:59] Lua Compoment of initialize  error:( module: easy_en_enhance_filter name_space: easy_en_enhance_filter status: 2 ): error loading module 'wordninja' from file 'D:\Rime\weasel-0.15.0\data\wordninja_windows_64_lua53.dll':
        %1 is not a valid Win32 application.
E20240314 16:25:47.078372 19952 lua_gears.cc:15] LuaTranslation::Next error(2): D:\Rime\weasel-0.15.0\data\lua\easy_en.lua:59: attempt to call a nil value (upvalue 'wordninja_split')
...

I use the 64-bit system, and I tried to redownload the wordninja_windows_64_lua53.dll as this website hint but it didn't help.

一些安装过程的注意点

主要是一些文件的存放位置,不然会不生效
①easy_en/wordninja_rs_lua_module_path: "/SOME/PATH/wordninja.so"
=> 把【.so】=> 【.dll】

②【wordninja.dll文件】,我是放在 【用户文件夹】(因此这么写,要用斜半角的杠):
easy_en/wordninja_rs_lua_module_path: "C:/Files/Rime/Rime-Leon/wordninja.dll"

③“将 lua53.dll 解压到 weasel 目录“
实质上就是【程序文件夹】 ,不要放进 【data文件夹】 里面
“"C:\Files\Rime\weasel-0.14.3\lua53.dll"”
我现在的程序文件夹名称是weasel-0.14.3,建议不要改变它,它是程序安装时默认的文件名

④【rime.lua】文件 和 【lua 文件夹】,放在用户文件夹

以上就是我手动安装过程中遇到“不分词”、“没有小灯泡”、“选词框无空格”情况的解决方法了

和地球拼音terra_pinyin的兼容性问题

比如我想输入Fast,依次按Shift+F,a,s,t
在没加载easy_en时,地球拼音的表现是正常的,Fast是可以连续输入,然后一并输出
加载easy_en后,按下Shift+F后,直接就把F输出了,后面的ast连不上了。
luna_pinyin就没有这个问题,有什么设置能解决呢?

设置中英混输时出错

你好,想请教一个安装问题。
设置中英混输的时候提示我验证…

C:\Program Files (x86)\Rime\weasel-0.14.3>rime-install BlindingDark/rime-easy-en:customize:schema=luna_pinyin

Rime package installer

Working directory: C:\Program Files (x86)\Rime\weasel-0.14.3
Package installer directory: C:\Program Files (x86)\Rime\weasel-0.14.3\
Download cache directory: C:\Users\basil\AppData\Local\Temp
Rime user directory: C:\Users\basil\AppData\Roaming\Rime

Updating package: BlindingDark/rime-easy-en
Already up to date.
Installing recipe: BlindingDark/rime-easy-en:customize
- option: schema
bash: line 10: schema: command not found
Patching: luna_pinyin.custom.yaml
Updating patch.
No files updated.
Downloading package: luna_pinyin
Cloning into 'C:\Users\basil\AppData\Roaming\plum/package/rime/luna_pinyin'...
Username for 'https://github.com': scillidan
Password for 'https://[email protected]':
remote: Support for password authentication was removed on August 13, 2021. Please use a personal access token instead.
remote: Please see https://github.blog/2020-12-15-token-authentication-requirements-for-git-operations/ for more information.
fatal: Authentication failed for 'https://github.com/rime/rime-luna_pinyin.git/'

Feat: 自定义词库

目前词库只有一个,其中的词条完整性比较好,但也意味着数量比较多,这种设计会影响如下情形使用体验:

  1. 若使用混拼,并将英文词汇的优先级提高(参数easy_en/initial_quality: 0.5),那么很多常见的中文高频词会被英文词汇替代,比如 “LE 了”、“DE 的”等。这主要是因为我们的词库中有大量字母小于3个的词汇。
  2. 如果去掉短词,连续输入功能又无法正常使用。
  3. 难以平衡全面性和精小性:词条数量太多会影响计算机的运行性能,数量太少又导致常用词汇的缺失。
  4. 无法满足用户的个性化需求:不同用户有不同的个性化专业词库需求,难以穷尽。

鉴于上述原因,建议考虑将词库分级(通用性词库,可按权威词频统计信息来分级)、分类(字母长短、专业门类),并有配置参数可以让用户按需加载,更进一步则是提供相应的词库制作指引和工具,让用户可以自行定制个性化词库。

参考资料附后跟帖:

  1. 词频信息
  2. 专业门类

连续输入增强一直无法使用, 请指导帮忙, 谢谢

信息如下
OS: Ubuntu 20.04.6 LTS 64bit
Gnome version: 3.36.8
输入法: ibus-rime
已经按照readme指导操作, 手动安装easy_on, 并且中英文混排成功(依据如下, 小鹤双拼+英文),
image
librime-lua, 安装成功(依据如下, 可以使用应用lua-translators输入法直接打印时间和日期, 应该算是可以成功加载使用吧)
image
分词程序安装wordninja-rs(本地编译生成的和github下载的动态库文件都尝试过), 配置文件也一一按照说明操作, 还是无法出现连续输入.
配置文件: easy_en.custom.yaml

patch:
  easy_en/use_wordninja_rs: true
  easy_en/wordninja_rs_path: `"/home/madhouse/Applications/wordninja-rs/target/release/wordninja"`

配置文件: rime.lua

local easy_en = require("easy_en")
easy_en_enhance_filter = easy_en.enhance_filter
time_translator = require("time")
date_translator = require("date")
code_length_limit_processor = require("code_limit")

配置文件: double_pinyin_flypy.custom.yaml

patch:
  __include: easy_en:/patch
  easy_en/initial_quality: 0
  __include: code_limit:/patch

在/tmp下的log文件没有产生(ibus.WARNING: No such file or directory), 应该是代表没有报错吧

目录结构: ❯ tree -I 'use|syn|trash'
.
├── backibus_rime.yaml
├── build
│   ├── bopomofo.prism.bin
│   ├── bopomofo.schema.yaml
│   ├── bopomofo_tw.prism.bin
│   ├── bopomofo_tw.schema.yaml
│   ├── cangjie5.prism.bin
│   ├── cangjie5.schema.yaml
│   ├── default.yaml
│   ├── double_pinyin_flypy.prism.bin
│   ├── double_pinyin_flypy.schema.yaml
│   ├── double_pinyin.prism.bin
│   ├── double_pinyin.schema.yaml
│   ├── easy_en.prism.bin
│   ├── easy_en.reverse.bin
│   ├── easy_en.schema.yaml
│   ├── easy_en.table.bin
│   ├── ibus_rime.yaml
│   ├── latex.prism.bin
│   ├── latex.reverse.bin
│   ├── latex.schema.yaml
│   ├── latex.table.bin
│   ├── luna_pinyin_fluency.prism.bin
│   ├── luna_pinyin_fluency.schema.yaml
│   ├── luna_pinyin.prism.bin
│   ├── luna_pinyin.reverse.bin
│   ├── luna_pinyin.schema.yaml
│   ├── luna_pinyin_simp.extended.reverse.bin
│   ├── luna_pinyin_simp.extended.table.bin
│   ├── luna_pinyin_simp.prism.bin
│   ├── luna_pinyin_simp.schema.yaml
│   ├── luna_pinyin.table.bin
│   ├── luna_quanpin.prism.bin
│   ├── luna_quanpin.schema.yaml
│   ├── stroke.prism.bin
│   ├── stroke.reverse.bin
│   ├── stroke.schema.yaml
│   ├── stroke.table.bin
│   ├── terra_pinyin.prism.bin
│   └── terra_pinyin.schema.yaml
├── code_limit.yaml
├── default.custom.yaml
├── double_pinyin_flypy.custom.yaml
├── double_pinyin_flypy.schema.yaml
├── double_pinyin.schema.yaml
├── easy_en.custom.yaml
├── easy_en.dict.yaml
├── easy_en.schema.yaml
├── easy_en.yaml
├── installation.yaml
├── latex.dict.yaml
├── lua
│   ├── code_limit.lua
│   ├── date.lua
│   ├── easy_en.lua
│   └── time.lua
├── luna_pinyin_simp.custom.yaml
├── luna_pinyin_simp.extended.dict.yaml
├── luna_pinyin_tw.schema.yaml
├── rime.lua
└── symbols.yaml
请看看是什么问题?

请问如何关闭显示无意义的英文字符串?

我按照教程安装了easy-en实现了明月拼音的中英文混输, 这很棒. 但是有一个问题就是这里的英文会返回一些拼音或者毫无意义的单词, 比如我输入: zhy 预期返回: 这样, 但是首个返回词是: ZHY, 同样地, 还有: zhge 的首选词是: ZHGE, 这些符号对我毫无意义, 我只想实现中文输入的时候能够进行单词拼写的确认. 不是英文的字符我不想返回, 请问应该如何设置?

怎么手动安装?

因为在用FCITX5所以没法用官方的plum
我手动安装之后的结果是这样:
image
确定已经按照提示打了patch,如图:
image
用户资料目录下的文件也复制了过来:
image
同时也有lua目录:
image

Windows 10 下,连续输入增强失败, 可能是 wordninja 安装失败。

我用的是Windows 10,步骤如下:

  1. plum里用 bash rime-install BlindingDark/rime-easy-en 安装 easy_en;
  2. plum里 git clone --depth=1 https://github.com/chengyuhui/wordninja-rs
  3. 在 Windows Subsystem Linux (Ubuntu) 中输入cargo build --release 部署 wordninja 在 某文件夹下
  4. 按照指示:
    patch:
    easy_en/wordninja_rs_path: "/My/PATH/wordninja-rs/target/release/wordninja"
    结果部署后启用 easy_en 后有问题,具体如下
  • 不可以使用连续输入,
  • 在输入时经常闪一下,然后就无法输入了,或是自动输入英文(好像点击了shift 切换了到了En一样)。考虑到Windows 系统,我将路径里的 “/” 都换成了 “\” 还是没有效果。
  • 好的地方是现在在 easy_en 里输入英文可以自动插入空格了。

综上,我觉得我的 wordninja 可能没有安装成功,但是不知道问题出在哪。谢谢。

很奇怪的置顶词条无法删除:buts、yu、vs等

我在windows 10中使用rime + easy_en + 小鹤双拼,中英混输

只要我启用easy_en,就会出现一个置顶词汇 'buts',鉴于这个在小鹤双拼里是超高频词汇‘不同’的双拼,很是烦人,不知道该如何删除?我已经排查过easy_en.dict.yaml,其中没有这个词汇,即使将其整个清空,依然会出现 buts 这个置顶词。

还有部分词汇与此情形类似,比如”与“对应的拼音”yu“,以及”中“对应的双拼”vs“。

我遍寻词库,就是不知道该如何删除它们。还请指教。

an error occours when trying to install wordninja rust from AUR

When I use yay wordninja-rs to install wordninja rust from the AUR, the terminal shows no override and no default toolchain set. And I find the solution is to clone the git, and using command RUSTUP_TOOLCHAIN=stable cargo build --release to compile.
OS: Manjaro Linux x86_64
Kernel: 5.4.97-1-MANJARO
DE: Plasma 5.20.5

建议

你好 可以增加这种功能吗?

1.MP4

TTS朗读输入
应用于语言学习。发音纠正,这样可以纠正发音和加深记忆,
母语不是英语。需要学习英语,市场非常大

单独输入的字母没法输入

在混合输入模式中

比如输入 I
image
或者输入 a
image

检查了字典中的权重也是很高的

a a 999989
A A 999989
A A 999989

可否介绍一下英文词库的来龙去脉

目前输入company没有提示,这应该是高频词汇。可否介绍一下现有英文词库的来龙去脉,以便我们可以自定义更多适用的词汇?

skywind3000 曾经制作了高频英文词库:WordMax2K.zip

该词汇表基于coca 和 bnc 语料库,取 2w 高频词的词库,算上变形,一共 50-60k,踢掉3个字母以下的词,合计41789词。(适用背景:词频前1万也就是正常外国人的口语词汇量,连书面语都覆盖不了,英语母语的人,平均词汇量 3.5 万。覆盖常用书面语,起码 2 万的词汇量才够。)

我一直用它配合如下插件在Vim下使用,效果非常好: https://github.com/skywind3000/vim-auto-popmenu

更多专业词库: https://github.com/skywind3000/vim-dict/

手动配置混输模式,与挂载词库产生冲突

操作过程:
1、将 easy_en.schema.yaml easy_en.dict.yaml easy_en.yaml lua/easy_en.lua 复制到 rime 配置目录。
2、在 luna_pinyin.custom.yaml 文件中的 patch 下添加 __include: easy_en:/patch。
3、重新布署rime。
结果发现rime只能输入英文,无法输入中文,注释掉 __include: easy_en:/patch后可正常输入中文。注释掉luna_pinyin.custom.yaml 文件中的translator/dictionary: luna_pinyin.extended后可以正常中英混输。

双拼中英文混输的问题

你好,我按照提示将我自己的双拼集成了混输的功能,具体来说是,在double_pinyin_flypy.custom.yaml后增加几行:

__patch:
  - patch/+:
      __include: easy_en:/patch

但是无法像朙月拼音那样,在键入带有英文的句子中出现英文候选,如:
键入:woxihrschool
候选时,还是将school识别为两个三个词,即 sc ho l
请问这种是我理解错了,还是配置问题呀?

配置朙月拼音方案时,一切正常,非常棒!

使用 Rust 移植版本的 WordNinja

我尝试对 WordNinja 使用 Rust 进行了移植,目前已经可以通过原有项目自带的全部单元测试。

我在编译时就把词库读取进了程序(同样支持自定义词库),所以命令行调用时不会有任何额外的文件IO,后面也可以考虑做成Lua DLL(不清楚 Rime 那边能否支持这一功能),初步测试比原有版本快 7 倍以上。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.