我有包含大约1000个微博的html源代码(每行一条推特)。大多数推文如下所示。我正在使用delphi尝试通过使用Pos函数和删除函数来去除html标记,但是失败了。this.href,0)" href="http://plixi.com/p/57846587">http://plixi.com/p/57846587</a> when we get 150</div>
我想比较text1文件和text2文件,并从text1文件中删除text2匹配的url。www.basketbal.vlaanderen/clubs/detail/bbc-alsemberg #duplicate url from text 2df.drop_duplicates(subset ="link", keep =