首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

入门 | 玩转词向量:用fastText预训练向量做个智能小程序

完成句子:巴黎对于法国就相当于罗马对于___ 来试试更难的任务。给定的两个词「巴黎」和「法国」之间存在语义关系(巴黎是法国的首都);对于第三个词「罗马」,我们能推理得到「意大利」吗?...它的结果很出色,但错起来也很离谱。 如果我们看看建议列表,而不只是第一个,会有更好的答案吗?...这个仅由少量 Python 代码组成的程序能让你感到它是智能的并且能真正理解你询问的东西。 在我尝试过一些困难的问题之后,我意识到这个程序也可能「离题千里」——任何人类都不会犯这样的错。...一点简单的开发工作 我第一次实现该算法时,得到的结果是错误的,比如: man-king is like woman-king 这是因为通过「向量(国王)- 向量(男人)+ 向量(女人)」所得到的答案向量与...我做了一些开发来跳过建议答案中的这些多余的词,然后才开始得到上面给出的相关答案。这部分开发在代码中被称为 is_redundant。

1.6K91

使用 Python 创建一个简单的基于规则的聊天机器人

还记得这个价值一个亿的AI核心代码吗? while True: AI = input('我:') print(AI.replace("吗", " ").replace('?'...通常的做法是将文本转换为词袋(单词计数)或使用TF-IDF方法(频率概率)。在我们的例子中,我们将使用TF-IDF。 我将创建一个函数,它接收查询文本,并根据以下代码中的余弦相似性给出一个输出。...在本文中,我们使用从网页中获取的数据,利用余弦相似度和TF-IDF,用Python创建了一个简单的聊天机器人项目,真正的将我们的1个亿的项目落地。...回答环节,其实就是通过某种特定的算法或者规则从我们的语料库中搜索最匹配的答案,本文中使用的相似度top1的方法其实就是一个最简单的类greedsearch的算法,对于答案结果的优化还可以使用类beamsearch...等等很多,欢迎留言 在端到端的深度学习兴起之前,很多的聊天机器人都是这样基于规则来运行的并且也有很多落地案例,如果你想快速的做一个POC展示,这种基于规则方法还是非常有用的。 作者:Wijaya

1.2K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    11个你可能不知道的Python库

    近日,听到很多数据科学家切换到Python的消息,我不由地想到,虽然他们得到了pandas、scikit-learn和numpy的一些巨大好处,但却错过了一些稍微老一点但同样能提供帮助的Python库。...在这篇文章中,我将介绍一些鲜为人知的库。即使你已经是Python高手,也应该看看,可能会有那么一两个是你从来没有见过的! 1)delorean Delorean是一个非常酷的日期/时间库。...它是我在Python中使用过的感觉最自然的日期/时间munging库之一。有点像JavaScript中的moment。文档也不错,除了在技术上有帮助,还让无数人情不自禁地回过头来参考。 ?...它被着重描述于Cam Davidson Pilon的《Bayesian Methods for Hackers》一文中,并已在很多流行的数据科学/ python的博客中亮过相,但一直未能得到类似于scikit-learn...10)uuid 在我的想法中,我们在编程的时候其实真正只需要几个工具就可以了:hashing、键/值存储以及全局惟一标识符(universally unique ids,uuid)。

    93480

    你会写Web简单的脚本么?

    用到的编程语言:python,其它语言均可 第一题 key又又找不到了 分值: 200 小明这次哭了,key又找不到了!!!key啊,你究竟藏到了哪里,为什么我看到的页面上都没有啊!!!!!!...分值: 350 小明要参加一个高技能比赛,要求每个人都要能够快速口算四则运算,2秒钟之内就能够得到结果,但是小明就是一个小学生没有经过特殊的培训,那小明能否通过快速口算测验呢?...什么才是空的呢?通关地址:没有,请直接提交答案(小写即可) 思路:空?还要小写?null试试,果然! 第四题: 怎么就是不弹出key呢?...前一关貌似也是那样做的呀套用上一关脚本,直接出答案.....1298 -------正确key is LJLJLfuckvcodesdf#@sd 第八题: 微笑一下就能过关了 分值: 150 尼玛,碰到这样的题我能笑得出来嘛...if __name__ == '__main__': main() 总结 题目偏简单,有一点编程基础均可尝试闯关 其中验证码识别并不是真正的验证码识别,与实战中有些差别

    40020

    ChatGLM-6B 安装试用

    希望这个简单的步骤能帮助你制作出美味的鱼香肉丝。祝你用餐愉快! 在生成答案的过程中,GPU显存使用在一直上涨。 用户:我没有猪肉这个食材,我可以用鸡肉代替吗?做出来好吃吗?...解方程的答案是错的,模型不擅长数学问题 用户:我有一个孩子,我刚怎么教他做减法,还有带括号的减法呢,请说的有童趣一些,简单易懂 ChatGLM-6B:���孩子做减法是一种很有童趣的事情,下面是一些有趣味的方法...写代码 用户:如你能帮我写一个python版本的快速排序代码吗? ChatGLM-6B:当然可以!...然后,对左右两部分分别进行快速排序,并将排序后的元素合并起来,以得到未排序的数组。...接下来,我们可以在组件的 state 中保存表单中填写的信息,并在组件的生命周期方法中处理表单的提交和显示。

    97750

    网络安全实验室平台(脚本关)

    key啊,你究竟藏到了哪里,为什么我看到的页面上都没有啊!!!!!!...第二题 快速口算 分值: 350 小明要参加一个高技能比赛,要求每个人都要能够快速口算四则运算,2秒钟之内就能够得到结果,但是小明就是一个小学生没有经过特殊的培训,那小明能否通过快速口算测验呢?...图片.png 第五题: 逗比验证码第一期 分值: 100 逗比的验证码,有没有难道不一样吗?...前一关貌似也是那样做的呀套用上一关脚本,直接出答案.....1298 -------正确 key is LJLJLfuckvcodesdf#@sd 第八题: 微笑一下就能过关了 分值: 150 尼玛,碰到这样的题我能笑得出来嘛...if __name__ == '__main__': main() 个人偏喜欢做脚本关,能有一种写作业的充实感,不过题目也偏简单,其中验证码识别并不是真正的验证码识别,与实战有些差别,总之通关了脚本关相信会和我一样收获了很多

    1.4K10

    Python-初识Python

    (int_type) num = 666 print(type(num))  这里需要注意在python语言中变量有类型吗?...下面介绍一些常见的数据类型转换的语句: 这里需要注意几个问题: 任何类型都可以转换成字符串吗?这个答案是肯定的,所有字符带上""就是字符串 字符串可以随意转换成数字吗?...会丢失精度,丢掉小数部分 2.6 标识符   标识符:是用户在编程的时候所使用的一系列名字,用于给变量、类、方法等命名 。 在python中标识符是不可以随便命名的,它有以下规则: 1)内容限定。 ...2个空格补足宽度,小数部分限制2位精度后,四舍五入为 .35 %.2f: 表示不限制宽度,只设置小数点精度为2,如11.345设置%.2f后,结果是11.35 下面讲述一个快速格式化的方法:   通过语法...:f“内容{变量}”的格式来快速格式化。

    4600

    Python编程快速上手 让繁琐工作自动化

    今天分享一本好书《Python编程快速上手 让繁琐工作自动化》,也是我自学python看过的第二本书。...这本《Python编程快速上手 让繁琐工作自动化 第2版》是为了帮助读者快速上手学会使用Python,将日常工作中那些需要计算机操作的繁琐工作自动化,比如: 移动并重命名几千个文件,将它们分类,并放入文件夹...它们既解释了这条错误信息的含义,又说明了导致其产生的原因,还给出了有效解决方案。 遇到不懂的,搜一下大概率就能解决问题,这比我们想象中的要简单。我们常会听人调侃道“你不会百度吗?”...另外,还能加入社区学习,与其他读者共同讨论进步,老师在线答疑也能助你快速上手Python!...《Python编程快速上手 让繁琐工作自动化 第2版》中给出的答案就非常有效,并且适用于编程的所有阶段,在任何时候使用这些方法去获取答案都是很好的。

    82760

    『爬虫』学习记录

    原因:问题都出现在 zmq 文件夹中,搜索答案需要重新安装 zmq 解决: pip uninstall pyzmq pip install pyzmq 在 install 时又出现如下错误: pip...by SSLError("Can't connect to HTTPS URL because the SSL module is not available.")) - skipping 原因: 我得到了相同的...在我的例子中,这是一个系统路径问题,我通过将以下目录添加到我的路径变量来解决: %Miniconda3_DIR%;%Miniconda3_DIR%\Library\mingw-w64\bin;%Miniconda3...其实出现一段时间不能运行的程序,重新安装是最简单的操作,但我想要真正得解决问题,让我对世界能多少掌握一点控制权。...通过一步步发现问题、解决问题、总结及预防,不正是人类发展的恒在规律吗?希望人类继承和探索之路长明。

    76430

    怎样才算学会PythonPython 实践基础

    再假如你已经对各类语言范式都有一定的了解,那么最后的困难之处就是...细节,它是魔鬼。 我相信真正拥抱一门新语言,花在工具和语言生态上的时间一定很多。...一般情况下,我们会选择最新版的解释器或者编译器,但是Python有一点点例外,因为Python3和2并不兼容,那么该选择哪个版本呢?寻找这类问题的答案其实就是融入Python社区的过程。...多年养成的TDD习惯让我首先想要了解什么是Python中常用的测试工具。...答案不难寻找,unittest是Python内置的测试模块,而pytest是比unittest更简洁和强大的选择,所以我选择后者。...这个程序的测试我使用pytest,但是它并不是所有项目测试的唯一选择,所以最好能局部安装,尤其是限制在当前工程目录里。

    97920

    python实现百万英雄答题神器

    最近百万英雄之类的答题软件广受大家的喜爱,不过对于我这菜鸟基本没有拿过奖。 但是作为一名码农怎么能忍,于是研究出了即将要与大家分享的答题神器。...图像识别 其实我的上一篇文章就是为了这一篇做铺垫,我在python人工智能-图像识别文章中已经详细介绍了如何通过PIL截取图片,并通过pytesseract进行文字识别。...搜索答案 这里我们用到了python库中的requests、BeautifulSoup和urllib.request 这篇文章就不具体讲解爬虫的基本知识了。...secondresult = i.find("dd", "dd answer") #百度知道的答案 数据分析 到这里我们已经有了如下的数据: ?...至少我们心中可以快速的检索到答案,并且有推荐答案,提高了答题正正确率,哈哈。

    1K10

    Python玩数据入门必备系列(7):最会匹配的集合——字典

    > 最近有许多小伙伴问我要入门 Python 的资料,还有小伙伴完全没有入门 Python 就直接购买了我的 pandas 专栏。...前言 我们有一批个人信息(姓名、年龄等),在 Python 中使用元组+列表管理这些数据最适合不过。但是如果需要从里面找出指定名字的信息呢?每次查找都遍历吗?这显然不太科学。...这样的问题,他也能快速给你答案: - 行14:'张三' in mapping ,判断某个值是否在字典的 key 列中 - 在 Python 中, xx in 集合 ,是一个通用表达某个值是否在一个集合中的语义...如下是各个班的成绩: - 我希望给出一个班别,快速得到该班的所有学生的记录(多行) 代码如下: - 行14:判断班级值是否在字典,如果存在,表明此时已经执行过 行17 的代码了。...因此只需要往这个列表中追加记录即可(列表的 append 方法) - 行17:当某个班级的记录第一次出现时,就会执行到这里,只需要把一个包含这行记录的 r 的列表,放入字典的 value 即可 那么此时查找某个班级的记录

    91920

    腾讯云上Selenium用法示例

    话说回来,PhantomJS不也是一个浏览器吗,那么 Selenium 支持不?答案是肯定的,这样二者便可以实现无缝对接了。 然后又有什么好消息呢?...Selenium支持多种语言开发,比如 Java,C,Ruby等等,有 Python 吗?那是必须的!哦这可真是天大的好消息啊。 嗯,所以呢?...快速开始 初步体验 我们先来一个小例子感受一下 Selenium,这里我们用 Chrome 浏览器来测试,方便查看效果,到真正爬取的时候换回 PhantomJS 即可。...setUp方法是初始化的方法,这个方法会在每个测试类中自动调用。每一个测试方法命名都有规范,必须以 test 开头,会自动执行。最后的 tearDown 方法会在每一个测试方法结束之后调用。...然后轮流设置了 select 选项卡中的每一个 option 选项。你可以看到,这并不是一个非常有效的方法。

    3.7K00

    AI 与不求甚解的新手开发者

    看看 Nathan Wall 的高赞回答(他赚了 10000 多分,是 StackSource 联合创始人兼 CTO): 你能想象有人会不借助 AI,仅凭自己的知识,写出如此详细且高质量的答案吗?...而且还是免费的? 我的问题得到了彻底的解答,但他并没有就此止步。我学到了许多新的东西,有些是我从未听说过的,有些甚至是我原本不想知道的,但现在它们永远刻在了我的脑海里。...他们只需要打开 chat.com,直接复制粘贴他们遇到的错误信息。更懒惰的人甚至都不需要花那 30 秒切换到浏览器窗口,直接在同一个工具中完成所有操作。 这既方便又快速。...这个过程虽然较慢,但最终你会明白,不仅是什么方法有效,更重要的是为什么它有效。 想一想你认识的每一个伟大的开发者,他们是靠复制粘贴解决方案而变得如此优秀吗?...但我们需要诚实地面对我们为了获得这种便利而放弃调的东西。 我们能做些什么? 我一直在寻找解决方法(我们不得不面对 AI 无处不在的事实)。而真正有效的方法是: 首先,带着学习的心态去使用 AI。

    4900

    Sublime text || 系统找不到指定的文件 || 编译Python代码

    文章目录 问题描述 解决方法一:复制python.exe并重命名 解决方法二:修改Python.sublime-package文件 简单总结 参考来源 问题描述 在Sublime中编译Python代码...python后进行复制,并粘贴到现在的文件夹anaconda3里面,得到python-副本; 将python-副本重命名为py,重启sublime即可成功编译代码。...首先,不管是直接关闭,还是选择菜单栏中的文件进行保存、另存为,都不能将修改后的内容保存到名为Python的SUBLIME-PACKAGE文件(使用解压软件打开)中;我是将修改后的SUBLIME-BUILD...其次,我还在SUBLIME-BUILD文件中多添加了一行"shell": true,对此我也真的很无奈啊。...所以这一行命令的作用就是,编译绘图代码后,能显示图像,即图像窗口可以弹出。 当然,解决问题的方法不止一种,甚至你的问题仍没有得到解决。但这也并不妨碍我们继续去寻找答案,不是吗?

    3K20

    百度低质回答是如何坑了你

    我一看这不是 Python 高频问题之一吗1。 就问他PATH是怎么设置的,结果他把django-admin 复制到了site-packages/django/bin下面。...这就好比上数学课,一道应用题的解法可以有很多种,有的甚至你能试几个整数就能得到答案,那么我能把这题的题解写成「尝试数字 3, 5,满足题设,此即答案」吗?显然不能。...这中对于某题有用的方法,不能推及其他题目,所以考试,同样的套路,换几个数字,就不会做了。网上的这些低质的回答,就属于这种无效的解法记录。作者缺乏对问题的解决路径的归纳和提炼,所以只好遇到一个记录一个。...另一方面,一个新手在遇到一个问题的时候,也只是把错误信息复制到搜索框里,得到的结果也肯定是那些针对具体问题的解决方法。缺乏提炼的问题,搜索到的也肯定是缺乏提炼的答案。...而应该把遇到的相似问题,总结起来写一篇文章,能锻炼逻辑思维和归纳概括能力。 Footnotes 这个问题解决方法是有套路的,可以参阅我之前写的文章你的 Python 包都装到哪了?

    14950

    如何有效的向 AI 提问 ? —— GPT 开发使用指南

    明确的问题: "我计划去巴黎旅游,你能告诉我巴黎的最佳旅游季节吗?"通过将问题具体化和明确化,AI可以更好地理解您的需求并给出更有针对性的回答。...用简单直接的语言表达问题,可以提高AI理解问题的准确性。例如,冗长的问题: "我在这个城市有一个会议,我需要一个在市中心附近、价格适中的酒店,带有免费早餐和免费停车场的。你能推荐一些吗?"...避免二义性: "我对苹果公司感兴趣,你能提供一些关于其历史和产品的信息吗?"二义性问题: "这部电影好看吗?"避免二义性: "你个人认为这部电影是否值得观看?"二义性问题: "明天的天气怎么样?"...绝对化问题: "哪个城市是全球最美丽的城市?"避免绝对化: "你能推荐一些风景优美的城市吗?"绝对化问题: "什么是最有效的减肥方法?"避免绝对化: "你有一些建议来帮助我减肥吗?"...opml 类型的中,写入完成后使用幕布、MindManager 等能可以导入 OPML 的思维脑图软件导入你所创建完成的 OPML 脑图文件即可看到 AI 生成的脑图。

    1.2K11

    如何有效的向 AI 提问 ?

    明确的问题: "我想学习法语,你有什么建议和资源推荐吗?" 不明确的问题: "旅游的最佳时间是什么时候?" 明确的问题: "我计划去巴黎旅游,你能告诉我巴黎的最佳旅游季节吗?"...例如, 冗长的问题: "我在这个城市有一个会议,我需要一个在市中心附近、价格适中的酒店,带有免费早餐和免费停车场的。你能推荐一些吗?"...避免二义性: "我对苹果公司感兴趣,你能提供一些关于其历史和产品的信息吗?" 二义性问题: "这部电影好看吗?" 避免二义性: "你个人认为这部电影是否值得观看?"...绝对化问题: "哪个城市是全球最美丽的城市?" 避免绝对化: "你能推荐一些风景优美的城市吗?" 绝对化问题: "什么是最有效的减肥方法?" 避免绝对化: "你有一些建议来帮助我减肥吗?"...opml 类型的中,写入完成后使用幕布、MindManager 等能可以导入 OPML 的思维脑图软件导入你所创建完成的 OPML 脑图文件即可看到 AI 生成的脑图。

    1.3K22
    领券