Git Product home page Git Product logo

pandaocr.pro's People

Contributors

miaomiaosoft avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

pandaocr.pro's Issues

解决高DPI截图问题

今天晚上刷Github看到的项目,以前我也过相关的软件,专门用来游戏对话的。后面由于自身原因(有其他事)很少再更新,仅仅维持正常使用,然后看到这个项目就有点惺惺相惜的感觉,等过段时间有空了也去把把自己的软件重构一遍,OCR识别也放到自己私人服务器上做在线识别。
之后就是看到了目前软件的一个问题就是高DPI(或设置了缩放)截图会放大。
解决方法:
首先调用 SetProcessDPIAware 函数防止UI放大,然后再调用GetDeviceCaps和GetDC函数获取当前屏幕缩放(DPI),最后截图的时候给的屏幕高度和屏幕宽度都 *(乘) 计算出来的DPI即可解决缩放问题。

填入私有API Key后依然显示错误

填入私有API后使用截图ocr还是这个错误,网络功能一切正常,使用了百度OCR和合合OCR都是一样的结果,用演示OCR就正确。

当前识别接口未返回任何数据,可能为以下原因:

  1. 图像中不包含任何可识别字符数据,请更换更清晰的图像。
  2. 像素过大,在线接口通常限制最长4000像素,请缩小后重试!
  3. 公用演示接口暂时失效,请重试或更换更稳定的私用API接口。
  4. 私用API接口未配置或错误,请检查或重新配置(参照教程)。
  5. 网络不稳定或连接故障,请检查防火墙或网络环境是否连接正常。

如果不想注册OCR接口,也可以尝试免注册无限制使用的离线OCR。

无法显示程序主窗口

版本5.28
已设置DEP例外,高DPI缩放替代为应用程序,管理员运行
可以看到托盘图标,任务栏程序图标,鼠标放在程序任务栏图标上可以看到预览画面,可以看到“欢迎使用PandaOCR.Pro专业版”的系统通知
但是单击任务栏图标或托盘图标并不能显示pandaocr pro程序主界面
pandaocr 2.69可以正常显示程序窗口并使用
没有杀软拦截,wiki没有找到解决办法

关于识别之后主界面弹出

  • 您好!
  • Pro版能否增加识别文字之后主界面不弹出的选项(就是f4+自动复制实现后台连续识别并复制,现在Pro版每次识别之后窗口都会弹出需要关闭,稍显多余)。

程序窗口不显示

功能正常的,可以OCR,但是窗口显示不出来。昨天新版本发布后,把旧版本删了重新下,还是不显示窗口。
右键点托盘图标,点使用教程、问题反馈、激活专业版这三个都是要打开主窗口?都是打不开。点“关于程序”能出来一个关于程序的窗口。
image

截图范围比实际桌面范围要小

比如我桌面是1920x1080的分辨率,截图时只能截到1280x720左右的大小,盲猜缩放比适配存在问题

电脑是Thinkpad T14 AMD
系统是Win10LTSC 2021 已更新最新

期待有一天能开放更多键位组合的快捷键设法

两个键的快捷键,只要在稍微复杂一点的软件中几乎不可能不冲突,比如photoshop,indesign,autocad,word,excel等

特别是像photoshop、indesign,几乎3个键位都很难不冲突

期待有一天能开放3甚至4~5个键位的设法,也期待可以组合win键

祝生活愉快

需要弹窗背景色

pro版找了半天 好像没有弹窗背景色的选项
挺需要的 希望添加 像2.0那样

托盘气泡无法关闭以及每次打开语音提示问题

作者大大辛苦了!

1、最新版 PandaOCR.Pro V5.31设置内,“程序提示方式”明明已经选择了禁用,但是每次打开还有右下角提示通知。

2、能不能在设置内开启一个选项,选择可以关闭每次打开时的语音——“欢迎使用PandaOCR中意版”,还是粤语版的。这样电脑开着声音每次都很不方便。
ps:我翻以前的issue,发现有人提过,可是按照那个issue里方式,每次更新完后的第一天就得静音,能否设置一个永久的开关呢?

谢谢大佬!

弹窗颜色选择

弹窗字体颜色默认是0=黄色
如果我想要更换别的颜色
该如何选择另外的颜色相应得数字

2

跪等Mac版呀

Windows上一直用panda,换成Mac了,没有panda很难活呀,嘤嘤嘤~

图片里面有某种颜色的水印

image

背景:我现在看的电子书有蓝色的水印,我想识别的时候,软件自动忽略这种颜色。

想法:软件在设置里加入:取色棒,让我手动抓取水印的RGB。 以后每次识别时,软件自动把这些颜色去掉。

(其实一般的电子书都只有黑色,如果能只识别黑色的字,倒也方便快捷)

调用Snipaste错误

调用Snipaste时,在Snipaste打开并且热键为F1的情况下提示:“Snipaste未打开或Snipaste热键不是F1”

请问能否添加两个新功能?

1、老板键
就是字面意思啦,按一下就能立刻隐藏飘屏字幕的那种按键~

2、针对日文文本的纵向识别功能
因为有很多图片中,日文是从上至下,由右及左的排列方式,导致无法用pandaOCR识别并翻译,实在是很棘手,所以想问下这种功能能够实现吗?

以上。谢谢!

是否可以新增VISA之類的付費方式?

如題,想要解鎖專業版,但是無法使用現有的兩種方式付費_(:з」∠)_不知是否可以提供其他如VISA/Mastercard等的付費方式,或是上架Microsoft Store之類的來另外用信用卡支付……

高DPI屏幕显示异常

截图识别功能在高DPI屏幕上会出现显示异常,软件里内置的QQ截图需要背锅。

iShot2021-07-19 18 28 46

DPI.mp4

关于翻译问题的优化

Snipaste_2021-09-26_19-02-26
我翻译设置的是自动翻译,翻译完之后会保留上次翻译的内容,这样有点不方便,如第一次识别了单词adaptative,翻译窗口显示适应性,第二次识别1 algorithm handes 翻译之后,上次的翻译结构适应性还在,必须手动点击一次翻译按钮才能正常显示,这个问题可以优化一下嘛?

截圖後直接OCR

可以設定成跟舊版PandaOCR一樣直接OCR嗎? 現在又多點一下好麻煩. 沒錯 我就是懶.

哪里可以关闭启动音效

设置里找了半天,好像没找到?每次启动都会说一句“欢迎使用PandaOCR专业版”,屋里还有其他人....

pro版无法运行啊

win10 LTSC X64系统,一运行就显示0x0000000000CE1320指令引用了0x0000000000CE1320。该内存不能为written。

[功能讨论]更便捷的设置

(首先非常感谢作者编写出这样一个好用的软件。功能、交互的体验都很好。)


需求:切换到另一识别语言。

我目前是这样操作的:任务栏点开PandaOCR - 点开设置 - 切换识别语言 - 关掉设置。

如果可以的话,设置快捷键会更加方便。

一种供参考的实现:
按快捷键后弹出形如下图的小窗口供切换。
image

顺便谈谈我对 设置「识别语言、朗读语言、翻译来源、翻译目标」这些选项的理解。个人认为这些选项应该是和实际内容强关联的,因此可能不适合作为全局设置。

因此如果让我设计UI的话,我会把「设置识别语言」移动到「识别图形区」附近,其他几个同理。这样可能会再次大幅提高易用性。

这是我的想法,如果您觉得也有一定道理的话可以考虑一下。欢迎讨论。

点右上角关闭后的bug

点右上角的关闭 则会出现图3所示情况
如果是最小化,则正常,不会出现该情况
后来发现拖动窗口也会出现该bug 最后录了个屏

Snipaste_2021-08-24_21-14-19

Snipaste_2021-08-24_21-13-57

Snipaste_2021-08-24_21-14-10

2021.08.24-21.22.32.mp4

无法支持 Window 10 的提供的 Beta - UTF8 选项问题

缺陷描述

在 Windows 10 中微软引入了"非 Unicode 程序的语言" 设置中,多了一个“Beta 版:使用 Unicode UTF-8 提供全球语言支持”的选项,只要勾选了该选项就会导致程序显示界面乱码

重现此问题的步骤

请描述是如何一步一步操作, 最终使问题出现的:

将系统语言切换成 '中文' (或者香港的繁体中文环境)
启用 'Beta 版:使用 Unicode UTF-8 提供全球语言支持' 选项
重启电脑,启动软件端,即可发现错误

在锁屏恢复时触发截图识别

我不确定是触发了截图识别还是触发了主程序。在双屏模式下,和 GDI 模式下均能触发。

在打开需要管理员授权的软件时,授权完也会触发。造成需要按 esc 取消识别。不知道是不是我个人问题还是?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.