我使用apache-nutch-crawler1.6进行爬行。在爬行之后,当我尝试使用命令读取爬行结果的内容时错误是
Exception in thread "main" org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file:/home/ubuntu/nutch/framework/apache-nutch-1.6/blogs/segments/20
我的问题是:我有sharepoint 2007 web应用程序和windows server 2008操作系统。我在SharePoint2007中做搜索,它工作得很好。最近我添加了一个新的网站页面,但它没有出现在搜索结果中。我也在爬虫日志中查找了它,但我没有找到页面的url。我的问题是:如何让新页面出现在搜索结果中?