我最近做了一个基本的聊天机器人,让我的朋友测试它。她说了许多胡言乱语,路易斯的结果使我感到困惑。
例如,她将输入)(*)($*#)(!*#&$*#&$*#&)$(*)(!*)(!@*09837$)(@*#||||,LUIS将此标识为我检查数据库状态的意图之一。我唯一能想到的就是它包含了09837,一个数字,并从那里触发了特定的意图。但是,用于检查数据库状态的数字实体是复合实体( part )的一部分。这对我来说毫无意义。
为了消除number实体,我缩短了查询到)(*)($*#)(!*#&$*#&$*#&)$(*)(!*)(!@*,但它仍然触发相
我找不到一种方法来告诉an标记引擎忽略文本内联部分中的格式化代码。例如,如果我在坩埚注释中编写[_var_ for _var_(*args) in list],它认为这是一个带有下划线等的链接。
我不想转义这个代码块中的每个单独的标记字符;它容易出错,而且混乱不堪。{noformat}宏创建一个文本块(单独的段落),而不是与周围的文本内联。
我已经搜索了很长时间,最近找到的是通过创建自定义宏的。这可能有效,但我没有JIRA的管理权限,似乎必须为我们所有的亚特兰蒂斯服务(JIRA、坩埚、FishEye等)创建这个宏。
没有其他方法可以完成从标记引擎转义内联部分文本的简单而基本的操作吗?
我的问题是我的表中有重复的条目。然而,事情并没有那么简单。有些是有效的副本,而另一些则不是。例如,E Pearl River, NY和East Pearl River, NY是同一个城市,而Bardonia, NY和Nanuet, NY则不是。所以,如果我删除所有的副本,它将移除像巴多尼亚这样的有效城市。
我的问题是,是否有人知道(在SQL或任何编程语言中)遍历每一行并执行以下操作的方法:
检查行是否重复
检查city是否有部分匹配(即E珠江、纽约和东珠江、纽约)
删除重复行的第一
如果没有部分匹配city (即Bardonia,NY和Nanuet,NY),继续前进。