我正在尝试在python上使用RestfulAPI。
在OCR pdf之后,我想将文本发送到一个restfulAPI,以取回特定的单词以及它们在文本中的位置。我还没有设法将文本字符串发送到API。
守则如下:
import requests
import PyPDF2
import json
url = "http://xxapi.xxapi.org/xxx.util.json"
pdfFileObj = open('/Users/xxx/pdftoOCR.pdf','rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pageObj = pdfReader.getPage(1) # To try with the text found in the first page
data = {"text": pageObj.extractText()}
data_json = json.dumps(data)
params = {'text':'string'}
r = requests.post(url, data=data_json, params=params)
r1 = json.loads(r.text)
虽然我从请求中得到响应200,但是数据应该以Json格式出现,需要轮询一些令牌URL (我也不知道如何做),而且我认为请求是不正确的,因为当我将令牌url粘贴到浏览器时,我看到一个空的Json文件(没有单词,没有位置),即使我知道我试图发送的文本中包含了想要的单词。
提前感谢!我使用OS,python 3.5
发布于 2016-11-16 15:50:45
非常感谢@Jose.Cordova.Alvear解决了这个问题
import json
import requests
pdf= open('test.pdf','rb')
url = "http://xxapi.xxapi.org/xxx.util.json"
payload = {
'file' :pdf
}
response = requests.post(url, files=payload)
print response.json()
https://stackoverflow.com/questions/40423561
复制相似问题