最初的任务可以这样描述:我需要删除庞大的列表(可能有数十亿个项目),而不存储原始项目--这简直是负担不起的
我只需要知道一个问题的答案:“我的系统以前见过这个元素吗?”
到目前为止,我所能找到的最接近的数据结构是一个布卢姆过滤器,但是它有假阳性,这在我的任务中最好避免,因为它会导致数据丢失。
例如,提供i帐户来存储至少2^32项,并且肯定错误率仅为1% (这意味着我需要至少访问所有urls的1%)。
n = 4,294,967,296, p = 0.01 (1 in 100) → m = 41,167,512,262 (4.79GB), k = 7
4.79GB内存..。
任务本身是一个高规模
当我遇到这样的错误: C# (在我正在观看的课件中没有这个错误)时,试图用System.IO从一个控制台应用程序写入一个文件:UnauthorizedAccessException unhandled。我知道这是一个非常简单的问题,并且已经在msdn.com上寻找了解决方案,但是我所能找到的只是一个安全错误或System.IO错误,而不是关于如何解决这个问题的问题。
这是代码:
string someText = "I want to write this to a text file!";
File.WriteAllText(@"C:\Users\Keagan\De