最近因为有文字识别的需求,刚好有看见百度云提供了免费的文字识别接口,所以就用python写了一下,现在写下来记录一下。
要写文字识别需要安装python环境和集成开发环境,还需要稍微了解一下python。
Python3 安装教程:
http://www.runoob.com/python3/python3-install.html
Pycharm 安装教程:
http://www.runoob.com/w3cnote/pycharm-windows-install.html
Python 入门:
https://www.cnblogs.com/wupeiqi/articles/4906230.html
这些都弄好了之后,你还需要用百度账号去百度云申请一个接口使用权。获得APP_ID,API_KEY和SECRET_KEY。
写代码之前,先要想一想过程,文字识别分为几个过程,首先选择文件,然后上传文件到百度云,再然后从百度云下载文件,再然后将文件写入到本地。最后要这个软件能够提供普通用户使用还要写一下图形界面。
之所以能够90行代码写完文字识别,python丰富的库功不可没,这里用到了下面这些库。
首先就是要先设计一下程序运行出来是什么样子,我大概设计成这样 ↓↓↓
第一行提示用户选择文字识别还是表格识别
第二行提示用户已经选择了哪个文件
第三行显示两个按钮,一个是文件选择按钮,一个是转换按钮。
确定了大致形状后,开始写代码。
最后的成果如下 ↓↓↓
写完了图形界面以后,就要开始写具体的功能了,这里主要包括三部分功能,即选择文件,上传,下载文件以及将文件保存到本地。
选择文件没什么好说的,调用一个库函数就搞定了。
具体代码如下:
文件写入部分也很容易,将文字识别结果写到txt文件,表格识别保存成xls格式,我默认将他们保存在照片同一文件夹内,统一命名。
最后总共代码90行(不算注释),识别效率也还行,和一般的软件差不多。其实这个东西挺容易的,也挺鸡肋的,手机都这么发达了,谁会用电脑识别呢。
最后附上全部代码:
领取专属 10元无门槛券
私享最新 技术干货