我们一直在审查微软的现代数据仓库架构,其中提到了使用Azure Data Factory将结构化和非结构化数据拉入Azure Data Lake。我也参加了很多关于这个主题的演讲,但大多数人对data Lake是否是结构化数据的好去处意见不一。我想确定的是,如果我们要利用的唯一来源是本地SQL Server数据库,那么将数据导入到数据湖中是否是一个好策略?那么,该策略的优点/缺点是什么?
就背景而言,我们正在寻找一个单一的消费窗格-无论是使用Power BI的最终用户报告,还是Azure数据仓库/本地数据仓库的素材。我们想要一个容器,它是所有这些系统的源,而不是源OLTP系统(即OLTP数据库
我想用trie ()构建一个简单的搜索器,但是我遇到了一个问题,那就是TRIE的逻辑运算符(还有,或者,不是)。有没有办法给Trie增加一个操作员?
我想在下面搜索一些案例:
输入数据3句:
1. Tom is husband of Marry.
2. Tom is a teacher.
3. Tom is old friend of Marry.
查询如下:
(Tom AND Marry NOT friend).
=> result is 1st sentence.
和2种建立trie的方法:
从查询中生成trie,并在其上读取输入数据搜索。
用每句话从输入数据中构建trie。搜索t