Git Product home page Git Product logo

stroke-seq_mb's Introduction

单手笔顺输入法码表 one-hand_code 3.0 版

https://gitee.com/yq-ysy/one-hand_code
因国内访问 github 不畅,且操作烦琐,本版以后弃用 github
https://github.com/YQ-YSY/stroke-seq_MB

提示

此处提供的仅仅是“码表”,共录入20988个汉字,54万核心词库,192万常用词汇短语,160万扩展分类词库。
单手笔顺输入法包含三层编码:精简码、六全码、笔顺码。欢迎程序员以此开发输入法软件。
支持Windows及Linux系统的“单手笔顺输入法(3.0版)软件”下载地址列表请参阅:
https://gitee.com/yq-ysy/one-hand_-rime
https://github.com/YQ-YSY/one-hand_Rime

码表下载地址(请网络搜索“单手笔顺输入法3.0版下载”)

以下是“单手笔顺输入法(3.0版)码表.zip(125M)”各大网盘下载地址:
您也可以直接给我发邮件 [email protected] ,我会回复邮件发送给您。

天翼云盘:(速度快,需要注册用户才能下载,微信一扫即可)
https://cloud.189.cn/t/uuQvUzIrMRjm
访问码:3igx

坚果云:(需要注册用户才能下载)
https://www.jianguoyun.com/p/DWTYceUQgvjVCBjN5bQFIAA

百度云:(速度慢,需要注册用户且安装客户端才能下载)
https://pan.baidu.com/s/17IPOjZMQf8fHh0wsuICorg?pwd=1j2o
提取码:1j2o

腾讯微云:(速度慢,需要注册用户才能下载)
https://share.weiyun.com/iN9kjTzn

开发说明

版权:GPL v3+
遵照《GB18030-2022信息技术中文编码字符集》
遵照《GB13000.1字符集汉字字序(笔画序)规范》
遵照《GB13000.1字符集汉字笔顺规范》
共录入20988个汉字。
字形参考使用的字体文件是——**电子技术标准化研究院( CESI )国标字体:
(国标宋体)GB_ST_GB18030.ttf
(国标黑体)GB_HT_GB18030.ttf
(国标楷体)GB_KT_GB18030.ttf
(国标仿宋)GB_FS_GB18030.ttf
(国标小标宋)GB_XBS_GB18030.ttf
(国标宋体扩展)GB_ST_SUPER_GB18030.ttf
以后可继续扩展录入GB18030字符集里的其他汉字,即可涵盖GB18030字符集全部汉字共70377个。

由于Unicode编码包含大量日韩使用的、与汉字字型笔画完全相同的文字(即同一个字重复出现两次),极易造成混淆,故不以此为标准。
编码原理参考借鉴专利权已终止的(CN03159505.7)“一种数字笔画汉字输入方法”,原发明人:马晓光 <[email protected]>《数字五笔中文输入系统输入教程及编码查询手册》
开源码表初始手工录入、简化规则、全新重排部件编码(偏旁部首编码)、再次手工录入:一善鱼 YQ-YSY <[email protected]>

关键词库包括共计约542809个词组,包括《现代汉语词典》139053个词汇。
常用词汇短语约1923698个词组,包括《现代汉语常用词汇表》38285个已词组和短语,已剔除粗口话和淫秽词语。
扩展词库现共计有12个分类,约1604279个词汇。

欢迎各位朋友利用此码表,或开发独立的笔顺输入法,或嵌入已开发的输入法,新输入法程序名称亦可自行设定。
为了方便大家编辑并导出其他形式的码表,在此使用TXT文本文件,以及LibreOffice电子表格ods文件,里面有详细的分类编号及排序。
文件夹icon中还附带有本输入法的Logo图标以及部件编码的SVG格式和PNG格式文件,以及“悬浮栏功能设计说明”图JPG格式的文件。

按键说明

单手笔顺输入法使用键盘数字小键盘为主要输入工具,只用单手(右手或左手)即可完成简体繁体文字、词组以及标点符号的输入。
输入速度快,字词重码少,符合华人书写习惯,适合文案录入、会议速记、撰写书籍等工作,避免“提笔忘字”电脑病,亦方便残障人士。

小键盘的0~9按键默认是录入汉字,若先输入“*(星号)”紧接着输入0~9则为录入数字;
按键“/(斜杠号)”首先第一个输入时为逗号,若跟随在编码后输入则为切换悬浮栏第二行在“部首编码/后续编码”之间互相转换。
按键“*(星号)”首先第一个输入时为切换到数字输入模式,若跟随在编码后输入则作为未知编码的模糊查询通配符;
按键“-(减号)”为撤销上一步按键(类似BackSpace向左退格键);
按键“+(加号)”首先第一个输入时为+号,若跟随在编码后输入则切换到候选字(蓝色)选词模式,继续输入0~9选择列出的字词;
按键“Enter(回车)”用于确认选中排在第一个的候选字词就是需要的字词;
按键“.(点号)”首先第一个输入时为句号,若跟随在编码后输入则作为词组的汉字间隔符;
按键“00”为列出标点符号候选;按键“09”为列出特殊数字序号候选。

大键盘上的其他按键,与其他输入法功能相同。例如:
-号 或者 PageUp 候选字词向上翻页;=号 或者 PageDown 候选字词向下翻页;
Shift 4 为¥人民币符号,Shift 6 为……省略号,shift < 为书名号《,以及 Ctrl . 为全角半角切换等。
为了方便没有数字小键盘的笔记本用户,建议输入法开发者提供自定义按键替换0~9的功能,以及繁体简体互换功能。
建议输入法程序开发者采用混合输入模式,即:小键盘是单手笔顺输入法,大键盘默认是英文输入法,按一下shift键可切换为拼音输入法。
使用拼音输入时,数字小键盘依然是继续用于笔顺输入法,拼音候选字的选取依然是使用+号来选取字词,大键盘数字键0~4用于输入音调。

显示说明

建议输入法开发者参考文件夹icon中“单手笔顺输入法——悬浮栏功能设计说明”图分两行提示框的显示方式,方便用户学习记忆。
用户输入编码时,已输入的数字、以及相同编码所代表的字词,相同编码的候选字列表显示在悬浮栏第一行(候选框)。
建议精简码显示为100%全黑色(000000)、六全码显示为80%炭灰色(333333)、笔顺码显示为60%灰色(666666)。
如果候选字太多放不完,最后末端有按钮可点击滚动显示。
悬浮栏第二行(提示框)显示的是以该数字起头的两位数字所代表的部件编码表,因此不需要死记硬背,看见即可理解。
悬浮栏第二行(提示框)最末端的按钮可切换显示“部首编码/后续编码”模式,显示当前数字后还可以继续输入什么数字即可打出什么汉字。

编码输入完毕,用户按+号切换到备选字(蓝色)选词模式,
三类编码显示为100%全蓝(0000ff)、80%明蓝(3333ff)、60%淡蓝(6666ff)三种深度的蓝色,用户选择了所需要的字之后:
第一行(候选框)显示该用户最近输入的以这个字开头的句子或短语,以供用户再次重复输入,在写文章或网络聊天时经常会用到这个功能。
其后还可以跟随有该字的联想词组,以供用户快速选择输入,最后末端有按钮可点击滚动显示更多的候选词。
第二行(提示框)显示刚才这个字或词的精简码、六全码,及其汉语拼音,方便用户学习记忆。最后有附加按钮可链接字典网站获取信息。

输入法悬浮栏第一行(候选框)可以用鼠标左键点击选取字或词。
输入法悬浮栏第二行(提示框)不能选字词,鼠标左键点击并按住第二行任意位置可拖动悬浮栏,右键点击则可弹出菜单选项进行相关设置。

一、笔顺码

仅仅以1、2、3、4、5五个数字分别代表“一丨丿丶𠃌”五个笔画,按汉字笔顺进行输入。例如:

“开”字,按笔顺“一、一、丿、丨”,编码为1132;
“我”字为31;“向”字为325;“力”为53;
注意“万”为153,“方”为4153,“忄”为442。

其中有些笔画容易被误解:
“提”归为“一”:如“氵、扌”中的最后一笔;有些电脑字体繁体字的“雨字头”四点显示为四小横,皆按国标笔顺归为四点;
“亅”一竖往左勾的归为“丨”:如“小”字的第一笔、“扌”提手旁等;“乚”一竖往右勾的归为“𠃌”:如“比、民、氏”的左边那一笔;
“点、捺”都归为“丶”:如“文、入、表、厶”的最后一笔;“宀”宝盖头和“冖”秃宝盖的左边那一笔也都是点“丶”,不是竖“丨”;
各种折笔(乛、フ、乚、𠃌、⺄、折弯钩、竖提等)都归为“𠃌”:如“乃、孔、民”中的笔画。

标点符号输入:
常用标点符号可以输入“00”,常用的数字序号可以输入“09”。

二、六全码、精简码

使用0~9中某二个数字的组合来代表汉字中的偏旁部首或部件,注意每个部件必须严格按笔画顺序排列,不得跨越笔顺拆解部件。
每个汉字最多取六个编码,对于理论上超过六个编码的汉字,第六码取最后一个“偏旁部首”或“笔画”的末尾编码。例如:

尘:23419(“尘”的前三笔是竖丨、撇丿、点丶、编码234,后三笔为常用部件“土”,编码19。)
镜:916185(“镜”的钅为91,立为61,日为81,儿为35,但已经超出六码,最后一笔或部件的最后编码为“𠃌”,因此第六码取5。)
梦:121290(“梦”的两个木为1212,夕为90,恰好满六位。)
再:125211(“再”最后三笔虽然像是一个“土”字,但按笔顺则应该是先一竖再二横,因此不能取“土”作为部件。)
回:25801 (“回”字不能拆解为二个“口”(部件编码80),因为按笔顺外面大“囗”的最后一笔要等小“口”写完后才能封口。)

六全码目前一共录入了29685个汉字,包括《GB13000.1字符集汉字字序(笔画序)规范》收录的繁体字、异体字、以及日韩所用的汉字。
精简码则是六全码的简化格式,共5117个,囊括了《通用规范汉字表》大部分一级、二级汉字,1~5键即可快速打出最常用的汉字。例如:

我:精简码为31,  六全码为312154;
自:精简码为382, 六全码为382;
无:精简码为1135,六全码为1135;
心:精简码为65,  六全码为65;
是:精简码为8,   六全码为8176;

大多数常用的汉字不需取完所有六个编码,便可出现在候选汉字的首位,然后按回车键直接完成输入,
处在候选列表的汉字,只需在小数字键盘里,按下+号,黑色候选列表变为蓝色备选列表,再按数字键,即可选中备选列表里的汉字。

三、部件编码表

利用“1、2、3、4、5”作为开头,配以其他数字,代表比较简单的部件笔画“横一、竖丨、撇丿、点丶、折𠃌”,
利用“7、8、9、6、0”作为开头,配以其他数字,代表比较复杂的部件笔画“横一、竖丨、撇丿、点丶、折𠃌”,
在键盘上输入方位类似的二个0~9按键,就能得到各种常见的的偏旁部首和部件。在数字小键盘上的排列如下:
    
7横一  8竖丨  9撇丿
4点丶  5折𠃌  6点丶
1横一  2竖丨  3撇丿
0折𠃌        .

不需要死记硬背,因为在输入第一个数字后,提示框中会出现这个数字开头的的偏旁部首(部件)列表,一看便知,打字多了自然就记住了。
如果需要输入的汉字刚好就是这个部件,那么只需要输入这个部件编码即可。
以下是“单手笔顺输入法(偏旁部首)代码表”(由于某些部件无法用汉字直接显示,此表仅列出简单示意,详细列表请参阅原图)。
笔画数较少多、常用、结构简单的偏旁部首和部件(共50个)。

10 扌   11 二王  12 十木 13 厂歹豕 14 石   15 七丂  16 雨   17 艹卄  18 廿革  19 土士
20 山   21 止齿  22 业   23 非     24 ⺌常 25 冂巾  26 虫   27 且直  28 贝貝  29 足
30 饣食 31 牜牛  32 亻   33 彳𠂆   34 八人 35 九角  36 月   37 ⺮竹  38 犭風  39 爫豸
40 讠言 41 冫京  42 门   43 关养   44 氵   45 冖罕  46 宀穴 47 广鹿  48 疒    49 忄
50 马馬 51 刁那  52 阝卩 53 刀乃   54 厶矛 55 纟糹  56 幺登  57 弓巽 58 孑子  59 女

笔画数较多、不太常用、结构复杂的偏旁部首和部件(共48个):

70 其       71 青丰  72 耳臣    73 春來  74 覀西    75 酉   76 走是   77 车車   78 井镸     79 牙瓦彭
80 口       81 日曰  82 目      83 田由  84 四皿    85 骨黽 86 黑     87 虍尗睿 88 門鬥     89 婁
90 夕夂祭   91 钅金   92 禾舌缶  93 舟   94 合谷夭矢 95 鱼魚 96 鸟鳥   97 气手毛 98 段鼻臼鼠 99 鬼身
60 方       61 立辣商 62 礻     63 衤    64 兴学    65 心必 66 文六亦 67 户     68 米㡀     69 火灬
00 (标点符号) 01 彐聿  02 出爿韋 03 艮即  04 羽      05 巜巛 06 毌毋母 07 尸辟叚 08 𤴔疋     09 (数字序号)

部件编码的规则是以汉字笔顺为准,优先选用汉字起头的偏旁部首,原本就是二个笔画的偏旁部首也尽量保持在与笔顺编码相同的原位。
少数部件按视觉、听觉形成的思维习惯、以方便记忆为目的,进行编码排列。同一汉字有多种编码可能时,择取编码较少且易于记忆的方案。
由于某些部件没有相对应的单个汉字,在此以“某字边、某字头”来说明,请输入法开发者在制作提示框时,改为用图片显示正确的部件形式。

只需一个编码,即 0~9 所代表的最常用汉字分别是:1 一,2 国,3 的,4 为,5 能,6 这,7 要,8 是,9 和,0 即。
其中仅一个或二个编码的汉字(编码1~99~09)选择使用频率最高的、在句子中经常以单字形式出现的汉字,优先于大多用于组词的汉字。
重码的汉字,在码表中将按字频排列。在蓝色选字状态下,可以按键“/(斜杠号)加回车”滚动选取,或按键“+(加号)加数字”挑选。
建议输入法开发者按以下优先顺序排列单字(包括仅编码相同时的单字排列顺序、及其有后续编码时的更多单字排列顺序):
精简码位数、六全码位数、精简码笔画数、精简码数字大小、六全码字频、六全码笔画数、六全码数字大小、笔顺码数字大小、笔顺码字频。
例如:
编码 341804、441354、463414、13251354,可用于编程测试,这几个编码在输入的过程中,汉字会出现上述复杂排列情况。
在比较数字大小时,请留意“以0开头的编码”和“以0结尾的编码”,以避免在程序中把编码转换为数字时造成丢失编码的情况。

如果记不全某个汉字的六全码或者笔顺码,可以在输入第一个编码之后,使用“*(星号)”作为该字未知编码的模糊查询通配符。
例如:记不全“镜”这个字的六全码,只记得第一个和其他一两个编码:可以输入9*08*,或者9*5就可以在候选字列表中找到“镜”字。
注意,如果按键“*(星号)”作为第一个输入按键,则切换到数字输入模式。
例如:想输入数字123,就只需在数字小键盘输入*123回车即可。

六全码或精简码也可以打出繁体字,某些繁体字与简体字编码相同的,目前是默认排在简体字后面。
习惯使用繁体字输入的用户,可以在单字码表的基础上重新排列优先字序,让某些繁体字与简体字编码相同的,默认排在简体字前面。
也希望输入法开发者能做出一个“繁体/简体“转换按钮,或者一个”汉字信息“按钮,用来显示这个汉字完整笔顺、拼音、内码等信息。

四、词组输入规则

词组中的每个字之间用“.”(点号)隔开即可,用户可以输入自己记得的不定长的编码。词组码表只有六全码和笔顺码,不需要精简码。
唯一要注意的是词组的每个字的编码必须统一,即:第一个字用六全码或精简码,后面的字就不能混用笔顺码,反之亦然。例如:
**:802.251(六全码)或 25.251 (笔顺码)
汉武帝:44.11.61(六全码)或 441.11.414(笔顺码)

虽然词组中每个字可以输入任意长度的编码,但建议每字输入2-3个编码,这样更有利于精确定位词组,减少选词的麻烦。
多字超长词组的输入十分简单,只输入词组两头的汉字编码,中间要省略的多个字直接用一个“.”(点号)隔开即可。例:
中华人民共和国:85.32..25(这时,候选列表会显示出“中华人民共和国”和“中华民国”两个词组,因为匹配的是“中华……国”。)
百闻不如一见:13..1.25(注意不能输入 13..13..25 即:中间不能省几字、又加一字、又省几字。只能用两头、省中间。)

如果记不全词组中某个汉字的编码,可以在输入第一个编码之后,使用“*(星号)”作为该字未知编码的模糊查询通配符。
例如:记不全“汉武帝”这三个字的六全码,只记得第一个和其中两个编码:
可以输入4*.*4.6*,或者4*.*.*5就可以在候选字列表中找到“汉武帝”这个词组,所记得的编码越多,查询越准确。

注意:扩充词组编码时,应注意不要录入“错别词、网络篡改词”,以维护正确规范的词组用字行为(过多的不良杂词会影响正常输入效率)。
扩充词汇时,可参考附带的“错别异词对照表”来修正所录入的词汇,注意此表仅是针对书面用语的词汇,并未包括“网络新词”的错别字。
此外,也建议大家绝不录入“粗口话”和“淫秽词语”,让想说这些话的人只能一个字一个字地慢慢打出来,这样世界就安静多了。

建议输入法开发者能参考“云词库”的管理方式,利用单字码表生成多种分类词汇码表,并提供在线更新,以增强本输入法的生命力。
也希望输入法开发者能开发出“自造词组”的功能,以及上次经常输入的句子短语的记忆功能,这能让用户感受到极其便利的输入体验。
习惯使用繁体字的用户也许需要另外编排繁体字的编码和字频、以及生成繁体字专用的词组码表,或者开发一个“繁体/简体“转换按钮。

六、易错易混汉字

以下汉字结构是容易输入错误、被混淆、被误认为属于其他笔顺的:
1、“末、未、果”后四笔形成的“木”形结构,其结构清晰,易于辨认,且笔画顺序与“木”相同,故取“木”的编码12,“柬、谏”不行。
2、“国、因、回”含“囗”的汉字,因按笔顺这些字最后才封口,故不取“口”;正确取法应第一、二笔取“丨、𠃌”,取码25。
3、“都、教、考、孝、老”前三笔形成的“土”形结构,其结构清晰,易于辨认,且笔画顺序与“土”相同,故取“土”的编码19。
4、“里、垂、重、黑”中间的“土”形结构,其笔顺却是先一竖再二横,不是“土”字笔顺,故需按其笔顺取编码(“里”不取“甲”部件)。
5、“衰、蓑”中间的“口”形结构,按笔顺应先写“口”中间的一横,打乱了“口”字的笔顺,故不取“口”字部件编码,取其笔画编码2511。
6、“冒、帽”上面不是“日”字,而是丨𠃌一一,这两横不连接到旁边,即2511。
7、“有、育、膏”的下面不是“月”,而是先一竖,丨𠃌一一,即2511。
8、“用、甩”有类似“月”字的结构,但是结构变形较大,且混杂有其他笔画在其中,不易记忆,所以不取36编码,取笔顺即可。
9、“生”有类似“牛”字的结构,但是从记忆习惯上通常认为是一撇加“”字结构,因此不取“牛”字31编码,而取“”字71编码。
10、“满、螨”有类似“”编码18的部首,但因“艹”字头与下方的一横是断开的,且从习惯上通常认为“一”属于“两”字,故取编码17。
11、“垂、郵、甀、乗、剰”中间有类似“艹”的结构,但是因为混杂在其他笔画之中,不易辨认,故不取17编码,而取笔顺即可。
12、“脑、恼、垴”有类似“文”字的结构,但“乂”与上方的一横是断开的,且“乂”是属于“凶”字结构,故不取“文”字66编码,取笔顺即可。
13、“刪、姍、柵”中有类似“卄”字的结构,但是它的笔顺不是与“侖”字那样先一横再二竖,而是先二竖再一横,所以不取17编码。
14、“刺、棘、枣、策”中有类似“巾”字的结构,但是因为混杂在其他笔画之中,不易辨认,故不取25编码,而取笔顺即可。
15、“熏、薰、醺”中有类似“黑”字的结构,但因中间一竖穿透了“黑”字顶部,与上方其它笔画混杂,故不取86编码,而取笔顺。
16、“粛、簘、嘨”中有类似“米”字的结构,但按笔顺应先写中间一竖,然后接左一撇右一竖,不是"米”字笔顺,故需按其笔顺取编码。
77、有些汉字,在不同的电脑字体里显示出来的写法不一样,例如“爋”字的最后四点,“兏”字的第一笔是横,这类汉字以国标笔顺为准。

以下汉字和部件的笔顺容易出错(括号内为精简码或六全码):
七:一𠃌 15      九:丿𠃌 35      匕:丿𠃌 35      及:丿𠃌丶  354
刀:𠃌丿 53      力:𠃌丿 53      乃:𠃌丿 53      办:𠃌丿丶丶5344
万:一𠃌丿  153            小:丨丿丶  234        义:丶丿丶  434
方:丶一𠃌丿 4153(60)        忄:丶丶丨  442(49)     火:丶丿人  4334(69)
牜:丿一丨一  3121(31)     凹:丨𠃌丨𠃌一 25251       长:丿一𠃌丶 3154
牛:丿一一丨  3112(31)     凸:丨一丨𠃌一 21251       为:丶丿𠃌丶 4354(6)
车:一𠃌一丨   1512(77)    比:一𠃌丿𠃌  1535        巨:一𠃌一𠃌 1515(72)
轧:一𠃌丨一𠃌  15215(775)   世:廿𠃌  12215(185)      瓦:一𠃌𠃌丶 1554(79)
北:丨一一丿𠃌 21135       丹:丿𠃌丶一 3541        母:𠃌𠃌丶一丶 55414(06)
爿:𠃌丨一丿5213(02)   毋:𠃌𠃌丿一 5531(06)     毌:𠃌𠃌丨一  5521(06)
丑:𠃌丨一一  5211     必:丶𠃌丶丿丶 45434(65)   出:𠃌丨丨𠃌丨 52252(02)
那:𠃌一一丿阝 511352(51)  皮:𠃌丿丨又  53254     豖:一丿𠃌丿丿丶丿丶 13533434(13)
兆:丿丶一𠃌丿丶 341534    脊:丶一丿丶人丨𠃌一一 4134342511(41343) 
卵:丿𠃌丶丿卩丶 3543524(354354)  兜:丿日丿𠃌𠃌一丿𠃌  32511355135(38135)
非:丨一一一丨一一一 21112111(23)  飛:𠃌丿丶丿丿𠃌丿丶丨  534335342 (534332)
來:一丨丶丿丶丿丶丿12343434(73)  爽:一丿丶丿丶丿丶丿丶人13434343434(134344)
尒:丿丶丨丿丶 34234            美:丶丿王一丿丶  431121134   (431)
忝:一一丿丶丨丶丶丶 11342444(113424)  善:丶丿一丨丶𠃌  431112431251(432)
曲:丨𠃌卄一 251221 (25171)        曹:一丨𠃌卄一日  12512212511 (125171)
肃:彐丨丿丨八 51123234(0123)    衰:丶 一丨𠃌一一丿𠃌丿丶 4125113534(41251) 
敝:丶丿丨𠃌丨丿丶攵 43252343134(6890)  重:丿一日丨一一 312511211(318)
噩:一丨口口一口口一 1225125112512511  (128081)
舆:丿丨一一车𠃌一一一丿丶 32111512511134(987)

stroke-seq_mb's People

Contributors

yq-ysy avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar

stroke-seq_mb's Issues

关于笔顺码表中一个条目错误以及笔顺码表维护建议

[version:] 2560556
stroke-seq_MB/text/单字_笔顺码_29685个.txt
-----8< -------
8571 叄 11 54545434111 300
40343 㕘 1 54545434234 330
10525 叅 12 545454342444 300
8572 參 11 54545434333 300
45828 䫩 20 54545434333132511134 330
12292 剼 13 5454543433322 300
15371 毿 15 545454343333115 300
-----8< -------
我发现这个码表里存在一个条目错误,我反映下下,但我不想更正这个条目。

我不知道为什么会出现笔划数错误,笔划数是一个导出量,他是可以通过计算
后面的一个笔划序列得出的导出数值。
换句话说,从信息论的角度来看,在这个表里面,笔划数这一项不包含信息量。

我建议删去这一项,如果一定要考究它的作用,也许只能作较验码了。

以上是其一。

关于码表维护的一些建议

  1. 只维护源码表,不要把从源码表合并汇总得到的码表也放上来,格式转换的工作是输入法开发者的工作。
  2. 对这个输入法来说,拼音码似乎没什么用处,可以删除吧?

笔顺问题

你提到这个码表是以GB标准来写的,但是用汉字的人并不一定是大陆的。
带来的问题就是同一个字的笔顺对于不同的人可能是不同的。
以你举的例子 万 来说,还是很多人是按 (横、撇、横折钩) 的顺序来写的。
所以,建议增加兼容码或者叫容错码(如果你认为不按GB标准就是错的话),这样可以对更多人友好,有利于推广。

farteryhr的笔顺错误汇报贴 以及笔顺库IDS对照程序

䱿 3525121444412511123312 3525121444412511123321 false 最后两笔反了

https://repl.it/@farteryhr/StrokeOrderLib#index.js
搞了个很初步的对照器,主要是用另一人维护的IDS大表(https://raw.githubusercontent.com/cjkvi/cjkvi-ids/master/ids.txt )生成笔顺来对比,只输出不同的,查错校对效率应该可以大大提高。

rime的那个笔顺库很有毒,目前仅仅是摆在那里看似支持扩展B区,作为一个后备库,主要是一些部件。但是扩展B区妖魔鬼怪还是很多……

【开源 发布】单手笔顺输入法码表 stroke-seq_MB 1.1 版,欢迎程序员们开发笔顺输入法软件。

感谢您关注“单手笔顺输入法码表 stroke-seq_MB”
经过一年多的努力,现在正式发布 1.1 版,可以使用了,欢迎程序员们开发笔顺输入法软件。

开源项目网址: https://github.com/YQ-YSY/stroke-seq_MB
点击页面右侧上方的绿色“Clone or download”按钮,弹出的下拉菜单选择"Download ZIP"即可全部打包下载。压缩包文件大小约64M。
(最近更新时间: 2017年 07月 17日 星期一 17:37:25 CST)

在Ubuntu国内论坛的发布网址: http://forum.ubuntu.org.cn/viewtopic.php?f=35&t=484603

不方便访问 github 的朋友、或者觉得文件太大、不方便下载的朋友,可以给我发电子邮件索取: [email protected]
电子邮件的附件压缩包文件大小约18M,只包含有单字码表及核心词库和图标文件,不包括扩展词库和Python脚本工具。

欢迎各位朋友利用此码表,或开发独立的笔顺输入法,或嵌入已开发的输入法,
新输入法程序名称亦可自行设定,没有限制。

请教脚本用法

发现在小狼毫部署时有很多重复写入错误,考虑应该是词库里的问题,又不知道“辅助程序Python3脚本”里的脚本怎么用,能否麻烦你指导一下怎么用?能否附上示例文件?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.