<ul class="contact">
<li class="first">Carnegie Mellon University</li>
<li>5000 Forbes Avenue, Pittsburgh, PA 15213</li>
</ul>=>
<ul class="contact">
<li class="first">[univ]Carnegie Mellon University[/univ]</li>
<li>[address]5000 Forbes Avenue, Pittsburgh, PA 15213[/address]</li>
</ul>展示了我想要对成千上万的网页进行语义标注的过程。为了表明我的意图,我想下载所有这些网页,并用用户定义的标签(例如,univ、address)对它们进行注释。带注释的页面稍后将用于处理。
我使用的最天真的方法是下载页面,打开页面文件,用文本编辑器编辑文件并保存它。太麻烦了。
我一直使用的更好的方法是从浏览器中选择要注释的目标文本,使用Firebug等工具检查目标,在检查的视图中编辑目标文本,并保存已编辑的页面。这有助于减轻一些负担,但仍有很大的改进余地。
我想要的理想工具是可以在浏览器中从页面中选择目标文本,选择相应的注释标记(最好从显示所有可用标签的工具栏中选择),并用一个按钮保存编辑过的页面。
如果有人知道这样的工具,那就太好了。但我怀疑这种工具的存在。很可能我必须自己写一个这样的工具。问题是,我该怎么开始?我没有什么web应用程序开发经验。
我应该写一个浏览器扩展吗?我应该写一个独立的应用程序吗?用什么语言?
编辑:这个问题的一个更简单的版本可以找到这里。最好采用完整的工作解决方案。我想这个问题对有经验的web开发人员来说并不是什么大问题,但对我来说可能真的需要一段时间,我需要尽快实现这个功能。
编辑:此外,我更喜欢在选择后的工具栏,而不是右击后的下拉列表。我认为用于铬扩展Diigo Web Collector的工具条非常酷。

更重要的是,在工具栏上需要一个save按钮来将编辑过的页面保存到默认或用户指定的计算机位置。工具栏上的按钮应该是这样的:univ address tag3 tag4 . tagn save。保存按钮是最后一个。
编辑:使用Javascript将编辑后的页面下载到本地文件系统似乎是不可能的。在Chrome或Firefox中,当我们在被检查的视图中编辑页面的源代码后,有一个保存按钮让我们将编辑的页面保存到本地文件系统中。这是如何实施的?对于这个保存按钮,我不想要的是它总是提示目录下载页面。我想用我自己的保存按钮使它成为默认目录。
发布于 2013-01-11 07:29:05
浏览器扩展应该是可以的。一个独立的应用程序需要使用一个成熟的浏览器,这是很麻烦的。
只有使用浏览器扩展(与书签相反),您才有权限将结果直接保存到文件系统。您也可以将“注释”按钮添加到浏览器(G)UI中。
然而,在硬盘上存储数千个HTML文件可能不是您的目标。相反,您可以设置一个简单的数据库服务器,将注释结果发布到该服务器。在客户端,一个带有ajax代码的小书签就足够了。
https://stackoverflow.com/questions/14244498
复制相似问题