GetWord 3.3 屏幕取词

本文介绍了如何使用GetWord3.3库实现从屏幕获取文本的功能,包括使用不同调用方式(ActiveX控件和DLL函数),并提供了Python版本的示例代码。同时讨论了与金山词霸XdictGrb.dll的比较,以及如何简化取词过程,忽略了额外的鼠标和键盘响应机制。

1. 缘起

要搞一个作弊软件,需要把屏幕上的试题取下来。

据说针对IE的取词很难,所以也就打消了自己开发的念头,找一找好用的控件。

发现了两个可以用的,一个是金山词霸的XdictGrb.dll文件,一个就是上面的GetWord。

1.1 金山词霸 XdictGrb.dll

这里有C#的例子

C# 的例子似乎不太稳定,取几个词之后就取不到了,不知道卡在哪里了。

而且 C# 转换为 Python 也遇到了困难,主要是不太熟悉COM和Python的相互调用,留着以后解决。

1.2 GetWord 3.3

GetWord 3.3,自带VB\VC\C#\Delphi的例子。

大概看了下原理:首先需要自己创建一个窗体。每当控件取词成功之后就会向这个窗口发送一个消息作为通知。窗体接受到消息之后可以做进一步的处理。

1.3 GetWord 官方版

这里是官网 http://www.textcapture.com/

官网版本比较高,接口变化挺大的,似乎调用起来比以前方便,不用像 3.3 那样非要自己实现一个窗口来接受消息,直接注册一个回调函数就可以了。可惜的是没有找到官方的例子,按照帮助文档试了试,没成功,也就放弃了。反正3.3也好用。

2. Python + GetWord 3.3

GetWord 3.3 有两种调用方式,一种是作为ActiveX控件,一种是直接调用DLL内的函数。还是DLL的方法比较简单。

下面的代码是从 C# 转过来的,由于没有文档,有些函数也不明白是什么意思,不过照猫画虎的能用。

import win32con,win32gui,win32api
import ctypes
class MyWindow():
    def __init__(self):
        self.getword_loaded = False
        #注册一个窗口类
        wc = win32gui.WNDCLASS()
        wc.lpszClassName = 'MyWindow'
        wc.hbrBackground = win32con.COLOR_BTNFACE+1 
        wc.lpfnWndProc = self.wndProc 
        class_atom=win32gui.RegisterClass(wc)
        #创建窗口
        self.hwnd = win32gui.CreateWindow(
            class_atom, u'窗口标题', win32con.WS_OVERLAPPEDWINDOW,
            win32con.CW_USEDEFAULT, win32con.CW_USEDEFAULT,
            200, 100,
            0,0, 0, None)
        #显示窗口
        win32gui.ShowWindow(self.hwnd, win32con.SW_SHOWNORMAL)
        self._init_getword()
    def _init_getword(self):
        LICENSEID = "{00000000-0000-0000-0000-000000000000}"
        MOUSEHOOK_CAPTURE_OK_MSG = "MOUSEHOOK_CAPTUREOK_MSG-" + LICENSEID
        self.MOUSEHOOK_CAPTURE_OK = win32gui.RegisterWindowMessage(MOUSEHOOK_CAPTURE_OK_MSG)
        self.icall = ctypes.windll.LoadLibrary('ICall')
        self.icall.SetMouseHook(self.hwnd)
        self.icall.MouseEnableCap(True) 
        self.icall.GetWordEnableCap(True)
        self.getword_loaded = True
    def _del_getword(self):
        self.getword_loaded = False
        self.icall.RemoveMouseHook()
        hdll = win32api.GetModuleHandle('ICall.dll')
        win32api.FreeLibrary(hdll)
    def _capture_text(self):
        MAX_OUTPUT_LEN = 1024     
        x,y = win32gui.GetCursorPos()
        hrwnd = self.icall.GetRealWindow(x, y)
        strtmp = ctypes.create_unicode_buffer('\0' * MAX_OUTPUT_LEN)
        i=ctypes.c_int(-1)
        ok = self.icall.GetWord(hrwnd, x, y, strtmp, MAX_OUTPUT_LEN, ctypes.byref(i))
        if ok:
            print u'全部文本:%s' % strtmp.value
            print u'单词位置:%s' % i.value
    #消息处理
    def wndProc(self, hwnd, msg, wParam, lParam):
        if self.getword_loaded and msg == self.MOUSEHOOK_CAPTURE_OK:
            print 'MOUSEHOOK_CAPTURE_OK'
            self._capture_text()
        if msg == win32con.WM_CLOSE:
            print 'WM_CLOSE'
            self._del_getword()
        if msg == win32con.WM_DESTROY:
            print 'WM_DESTROY'
            win32gui.PostQuitMessage(0)
        return win32gui.DefWindowProc(hwnd, msg, wParam, lParam)
mw = MyWindow()
win32gui.PumpMessages()

3. 其实也不用那么麻烦

如果只是用来捕获屏幕上某点的文本,而忽略其提供的一套鼠标和键盘响应机制,那么就十分简单了。
下面的代码单独封装了取词功能。

from ctypes import *
from ctypes import wintypes
class GetWord(): 
    '''封装 GetWord 3.3 的取词功能'''
    def __init__(self):
        self.icall = windll.LoadLibrary('ICall.dll')
        self.icall.GetWordEnableCap(True)
    def __del__(self):
        hdll = windll.Kernel32.GetModuleHandleA('ICall.dll')
        windll.Kernel32.FreeLibrary(hdll)
    def getText(self,x,y):
        '''屏幕取词,返回坐标所指的一行文字,以及所指字符在行中的索引'''
        MAX_OUTPUT_LEN = 1024
        hrwnd = self.icall.GetRealWindow(x, y)
        strtmp = create_unicode_buffer('\0' * MAX_OUTPUT_LEN)
        i = c_int(-1)
        ok = self.icall.GetWord(hrwnd, x, y, strtmp, MAX_OUTPUT_LEN, byref(i))
        if ok:
            return strtmp.value, i.value  

鼠标和键盘的响应机制包括判断鼠标悬停、快捷键等功能。下面用 pyHook 勉强模仿一下,粗糙简陋,仅仅作为取词演示。

from pyHook import HookManager
from pythoncom import PumpMessages
_gw = GetWord() 
def onKeyDown(event):
    if event.IsAlt(): #当按下Alt键的时候,进行鼠标取词,并打印出来。
        global _gw
        point = wintypes.POINT()
        windll.User32.GetCursorPos(byref(point))
        r = _gw.getText(point.x, point.y)
        if r:
            print u'整行文本:%s' % r[0]
            print u'字符位置:%s' % r[1]
    return True
if __name__ == "__main__":
    hm = HookManager()
    hm.KeyDown = onKeyDown
    hm.HookKeyboard()
    PumpMessages()

转载于:https://www.cnblogs.com/iszero/p/3851892.html

GetWord是一款专业的屏幕取词组件(控件),它可以帮助您在公司产品中快速便捷地集成屏幕取词功能,有效降低软件开发成本。 GetWord是世界上第一款也是目前唯一一款全面支持Windows和Adobe Acrobat/Acrobat Reader的专业屏幕取词引擎。GetWord支持单点取词、区域取词、选择取词等多种取词模式,支持Windows 2000/XP/Server2003/Vista/Server2008/Windows 7/Windows 8/Windows 10等各种主流操作系统,支持VB/VC/Delphi/C++ Builder/C#/.Net等各种常见开发环境。 目前,遍布世界各地的60多个国家和地区的众多客户都在使用GetWord。这些客户有:Apple(美国)、LEC(美国)、NetBrain(美国)、Autonomy(英国)、MJT Net(英国)、Linguatec(德国)、Issendis(法国)、Karolinska Insitutet(瑞典)、Caliber Multimedia(台湾)、MegaDict(泰国)、Matrix Development System(西班牙)、Future Electronics(新加坡)、支付宝(中国)、国泰君安(中国)、快鱼科技(中国)、爱科信(中国), 海词(中国)等等. 支持的操作系统: Windows 2000/Windows XP/Windows Server 2003/Windows Vista/Windows Server 2008/Windows 7/Windows 8/Windows 10 支持的软件开发环境: GetWord支持所有主流的软件开发环境,如Visual Studio, Visual Studio .Net, Delphi , C++ Builder, Dev-Cpp,Java等等。 主要功能特征: 1. 支持英文, 简体中文, 繁体中文, 俄语, 法语, 日语, 德语, 西班牙语, 阿拉伯语, 朝鲜语, 土耳其语, 瑞典语, 挪威语, 意大利语, 拉丁语, 葡萄牙语, 波兰语, 印度语, 泰国语, 越南语等所有常见语言编码格式. 2. 支持Unicode. 3. 支持语境信息提取和整句提取,不仅可取到光标所在处的词,还可以取到其前后的词,便于智能识别和分析. 4. 支持区域抓取,可以抓取到给定区域内的所有文字(一行或多行). 5. 支持Adobe Acrobat/Acrobat Reader的PDF屏幕取词(已集成Adobe商用数字证书,该证书Adobe售价2500美金). 6. 支持选择取词(亦称高亮取词,划词取词. 7. 支持命令行(Command Prompt)取词. 8. 支持各种标准Windows组件,如对话框、工具栏、菜单、编辑框、组合框、列表框、树型控件等. 9. 支持各种常见办公软件,如微软Office、Outlook Express等. 10. 支持各种常见浏览器,如IE、FireFox、Mozilla、MyIE、Netscape等. 11. 支持鼠标取词、热键取词等多种取词模式. 支持ActiveX、Raw Dll等多种调用接口. 12. 封装程度高,使用方便,向现有应用程序中添加屏幕取词支持一般只需要十几行语句即可.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值