文章摘要
使用说明
1.软件在.Net Framework 4.8框架下编写,如无法运行软件,请安装该框架后尝试;
2.软件的RAR压缩包全部解压后,找到exe文件运行,添加命令行可新建快捷方式,目标末尾加入[空格]onnx,AMD CPU不加这个据说会慢;
3.题库中列的名称需严格限定(题干、答案、选项A、选项B、选项C、选项D、选项E、选项F),列的排序不严格要求;
4.其余功能自行探索。
更新情况
4月14日更新嗖嗖搜题V0.03:
更新内容
1.使用FileShare.ReadWrite,修复占用文件无法导入问题;
2.开启DPI感知,修复部分高DPI下识别区域偏差问题;
3.增加自定义快捷键功能,在识别窗口滚动滚轮会增减大小;
4.增加软件关闭时保存设置,软件开启时读取配置;
5.修复输出窗口透明度无法设置bug;
6.调整截屏间隔sleep时间,短期内存占用在1.1G左右;
存在问题
在部分电脑上出现不继续识图问题,目前发生于一台AMD R5 CPU的笔记本及一台没细看配置,开了很多不知什么软件的笔记本,原因未知,因为没有环境并且水平有限,目前无法修复。
测试更换NuGet包为PaddleOCRSharp,有个广告,默认使用轻量模型,感觉识别速度变慢,使用全量模型理论准确率更高,但据说更慢。如果没有特殊情况,后续打算放弃PaddleOCR,仅对Tesseract版更新。
使用方法
本次更新仅针对paddleOCR版,下载增量包,解压至原软件文件夹,覆盖文件。
只有增量包无法正常运行。
4月4日增加Tesseract版
更新内容
在0.02版基础上更换OCR引擎为Tesseract,具体表现有:
(1)理论可在32位或64位Windows系统运行(依然需要.Net Framework 4.8),实际未测试;
(2)依赖项较为精简,整个包的大小缩减为78M;
(3)内存占用减小,我识别时占用大约200+M,未长期测试;
存在问题
1.图像预处理未优化,比如红底黑字识别不出来;
2.由于可重设输出窗口尺寸,而其重定位还是用的MouseEnter,判断时仅针对顶部一条;
3.读取文件时没有创建临时副本,被占用的Excel无法作为题库导入;