hcfyapp / hcfy-desktop Goto Github PK

View Code? Open in Web Editor NEW

5.0 5.0 0.0 1 KB

划词翻译（桌面端）正在开发当中，此仓库的 issues 区域将作为未来反馈问题与提供建议的地方。

hcfy-desktop's People

Contributors

Stargazers

Watchers

hcfy-desktop's Issues

开发能调用操作系统的语音识别 API 的 Node.js 模块

背景

划词翻译（桌面端）的语音翻译功能需要用到语音识别 API 将语音转为文字，我希望能有人开发一个直接使用操作系统的语音识别 API 的 Node.js 模块。

Windows 语音识别 API 文档：https://docs.microsoft.com/en-us/windows/apps/design/input/speech-recognition
macOS 语音识别 API 文档：https://developer.apple.com/documentation/speech
Linux 似乎没有内置的语音识别 API

需求

开发一个能调用操作系统的语音识别 API 的 Node.js 模块。

实现方式

有两种方式可以开发出这个模块。

N-API

用 N-API 的话，需要用 C/C++ 来调用操作系统的接口，然后使用 N-API 包装成 Node.js 的模块。

单独为各个操作系统开发命令行工具

Node.js 是可以执行命令行的，所以也可以分别给不同的操作系统开发对应的命令行工具，然后我来写 Node.js 调用它。

比如在 macOS 上用 Swift 或 Object-C 开发一个命令行工具，在 Windows 上就开发一个 .exe 文件。

例如 https://github.com/sindresorhus/clipboardy 这个项目，在 Windows 上是用 Node.js 调用了一个 .exe 文件来读写剪切板：https://github.com/sindresorhus/clipboardy/blob/main/lib/windows.js

将 uiohook-napi 内的 libuiohook 升级到最新版本

背景

为了能实现在其它程序内划词后触发翻译的功能，划词翻译（桌面端）需要有响应操作系统层面的鼠标事件的能力。划词翻译（桌面端）是用 Electron 开发的，目前有两个库能提供此能力，但都有一些问题。

iohook

比较流行的是 iohook，但它已经好几年没人维护了，有很多 bug，且用的不是 N-API，以致于每次升级 Electron 的大版本都需要重新编译。

uiohook-napi

iohook 实际上是对 libuiohook 这个 C 库的 Node.js Native Module 封装（庆幸的是 libuiohook 仍然在积极更新中），uiohook-napi 也是如此，但它用了 N-API，所以可以跨 Electron 的版本使用，无需重新编译。

但是，uiohook-napi 内置的 libuiohook 是两年前的版本了，所以现在用也有一些 bug。

需求

我希望有熟悉 C/C++ 的人将 uiohook-napi 内的 libuiohook 升级到最新版本。

我自己已经尝试过升级了，虽然能成功编译且似乎能正常使用，但由于我不熟 Node.js 的 N-API、更不熟 C/C++，所以我不确定这样简单的更新 libuiohook 的代码有没有问题。

开发能调用操作系统的 OCR API 的 Node.js 模块

背景

划词翻译（桌面端）的截图翻译功能需要用到 OCR，我希望能有人开发一个能直接使用操作系统的 OCR 接口的 Node.js 模块。

Windows OCR API 文档：https://docs.microsoft.com/en-us/uwp/api/windows.media.ocr
macOS OCR API 文档：https://developer.apple.com/documentation/vision/recognizing_text_in_images
Linux 似乎没有内置的 OCR API

需求

开发一个能调用操作系统的 OCR 接口的 Node.js 模块。

实现方式

有两种方式可以开发出这个模块。

N-API

用 N-API 的话，你需要用 C/C++ 来调用操作系统的接口，然后使用 N-API 包装成 Node.js 的模块。

单独为各个操作系统开发命令行工具

Node.js 是可以执行命令行的，所以也可以分别给不同的操作系统开发对应的命令行工具，然后我来写 Node.js 调用它。

比如在 macOS 上用 Swift 或 Object-C 开发一个命令行工具，在 Windows 上就开发一个 .exe 文件。

这个命令行工具需要接收的参数有：

一个图片文件的路径
指定语种
其它可能有用的、OCR API 支持的参数

输出文字就行。

一些示例

这是一个用 Swift 开发的 OCR API 命令行工具：https://github.com/ughe/macocr 但是没有文档，也不知道要怎么用

这是一个 Windows 的 OCR API 命令行工具：https://github.com/zh-h/Windows.Media.Ocr.Cli 但上次维护是 4 年前了，未测试可用性

hcfyapp / hcfy-desktop Goto Github PK

hcfy-desktop's People

Contributors

Stargazers

Watchers

hcfy-desktop's Issues

背景

需求

实现方式

N-API

单独为各个操作系统开发命令行工具

背景

iohook

uiohook-napi

需求

背景

需求

实现方式

N-API

单独为各个操作系统开发命令行工具

一些示例

Recommend Projects

Recommend Topics

Recommend Org