首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >XPath查询所有“ocrx_word”

XPath查询所有“ocrx_word”
EN

Stack Overflow用户
提问于 2014-02-08 20:37:48
回答 1查看 72关注 0票数 0

我正在尝试构建一个XPathQuery来获取'ocrx_word'类中的所有内容--我尝试了一些变体,但是没有找到任何可以工作的,我得到了一个Unable to Parse错误。

下面是我的HTML的样子。

代码语言:javascript
复制
<span class='ocr_line' id='line_3' title="bbox 165 201 443 219">
  <span class='ocrx_word' id='word_5' title="bbox 165 201 252 217">Associate</span> 
  <span class='ocrx_word' id='word_6' title="bbox 259 202 335 218">Director</span> 
  <span class='ocrx_word' id='word_7' title="bbox 341 203 358 218">of</span> 
  <span class='ocrx_word' id='word_8' title="bbox 361 203 443 219">Athletics</span> 
</span>

我想要获取标题属性和字符串。

全HTML

代码语言:javascript
复制
NSString *htmlString = [tesseract getHOCRText];

NSData *tutorialsHtmlData = [htmlString dataUsingEncoding:NSASCIIStringEncoding];

// 2
TFHpple *tutorialsParser = [TFHpple hppleWithHTMLData:tutorialsHtmlData];
NSString *tutorialsXpathQueryString = @"//*[@class='ocrx_word']/text()";
NSArray *tutorialsNodes = [tutorialsParser searchWithXPathQuery:tutorialsXpathQueryString];
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-02-08 20:42:54

此XPath提取标题:

代码语言:javascript
复制
//*[@class='ocrx_word']/@title

这段文字摘录如下:

代码语言:javascript
复制
//*[@class='ocrx_word']/text()

这就是你需要的吗?

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21651553

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档