腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我如何获得特定字符限制的所有单词?
、
然后,我删除最后一个字,以确保我没有
断句
。 这适用于英文内容,但不适用于其他语言,如日语或繁体
中文
。当我限制日语或
中文
的描述时,它会在结尾处给出一个特殊的字符,比如这个�。
浏览 1
提问于2018-08-16
得票数 0
回答已采纳
2
回答
将包含汉语、日语或英语的字符串拆分成单词
、
、
如何使用regex或任何实用工具类将包含
中文
、日语或英语的字符串拆分为单词?
浏览 0
提问于2016-05-05
得票数 1
1
回答
如果文件没有以r‘“结尾,我如何将r’”添加到文件的每一行
、
、
、
、
我希望.txt文件的每一行都以"结尾,但是文件的编码是gb2312或gbk,因为
中文
是包含的。= r'"'作为判
断句
子是否以"结尾的条件。我不知道会发生什么。顺便说一下,我在Windows7中使用
python
2.7.11 有人知道这是怎么回事吗?
浏览 2
提问于2016-12-11
得票数 0
回答已采纳
1
回答
修复中间有行中断的句子:
Python
is \n很有趣
、
、
例如, 模式通常是一个空格,后面跟着一个行中断,<space>\n或有时是<space>\n<space>。我如何支持三个行的
断句
?在这里标题第一句将匹配。然而,由于某些原因,这一行将不匹配,我无法理解。全名旧金山,CA 94000 1500测试一个数字作为一个
断句
中的第一个单词。请问我如何支持三行
断句
?标题在这里第一句将匹配。然而,由于某些原因,这一行不匹配,我无法弄清楚。投资组合:全名旧金山,CA 94000 1500测试一
浏览 3
提问于2015-10-01
得票数 3
回答已采纳
4
回答
如何正确显示在
Python
中调用raw_input()的
中文
字符串?
、
、
、
我当时正试图解决
中文
编码的问题。到目前为止,我面前的唯一障碍是正确显示用户输入的raw_input()。如果用户在raw_input()中键入
中文
字符,打印name_a将显示utf-8代码点,如'/xb7‘#coding: utf-8 n=raw_input一眨眼的功夫,程序就结束了(我知道在Windows环境下
python
的特性,所以我在文件末尾加上了x = input() )。后来我删除了包含第二段代码的原始测试py文件。我在Windows XP环境下使用
浏览 1
提问于2014-01-07
得票数 2
2
回答
通过
python
检查mysql文章之间的相似性/剽窃
、
、
我是否需要使用
python
在while循环中与其他100篇文章进行比较?正如我在论坛上看到的那样,
python
是最好的方法,但是我尝试了一些库来比较string1(article1)和string2(article2),即使它的文章完全不同,它也告诉我它是70%相同的。
浏览 11
提问于2021-12-05
得票数 1
5
回答
删除
python
中使用的停止词for循环
、
、
我最近正在学习
python
循环,我想尝试一下是否可以使用for循环来删除停止词和标点符号。我知道它可以通过列表理解来实现,在StackOverflow中有很多答案,但是我想知道如何使用for循环来实现它。我在实践中使用的代码如下:punctuations = ',
浏览 11
提问于2022-10-06
得票数 0
回答已采纳
2
回答
如何替换
Python
中的unicode汉字?
、
假设我有一根这样的绳子我想用蛋代替egg,我该怎么做呢? 看来example.replace()是无用的。
浏览 4
提问于2017-05-29
得票数 1
回答已采纳
1
回答
tachyons.io:用斜体强调一个单词
、
、
我想用斜体字体来强调句子中的一个单词,而不是用一个断线来中
断句
子的流动。建议使用<p class="i"></p>,但是使用p会增加行中断。我的问题 我怎样才能在不用换行符打
断句
子的情况下,用斜体强调一个单词呢?
浏览 3
提问于2018-04-02
得票数 1
回答已采纳
1
回答
文本摘要的多语种数据处理
、
现在总结起来很简单,因为"Ruby dog.Ruby有一只狗“其中一些问题是:有代码切换的情况,我不知道数据集中的语言是什么。
浏览 0
提问于2018-06-02
得票数 0
1
回答
python
在错误的地方截取
断句
、
我发现
python
的文本缠绕库在错误的地方破坏句子。但是,在例如at last the | Caterpillar中添加了不正确的
断句
,最后一句完全混乱。有人能建议如何正确包装这个吗?
浏览 3
提问于2015-12-19
得票数 2
回答已采纳
1
回答
C fget不等待输入
、
我的代码中有两个fget,它们都不是等待输入.printf("Insert path: "); perror("fgets dir path");}在第一个fgets之前,我有2个scanf("%ms", &string); (如果这可能是个麻烦)。
浏览 2
提问于2012-07-09
得票数 0
2
回答
拉丁文基础语言切分语法规则
、
"I have used Google MT API for this" 在上面的例子中,我将用句号.来打断上面的句子--这是我在点上
断句
的正常情况,但是有n个字符用于
断句
,比如(.,!,?
浏览 7
提问于2010-05-12
得票数 3
回答已采纳
1
回答
什么算法可以用于单词列表的匹配/配对?
、
、
、
我有一个从人类书写的来源(文字记录)中解析出来的单词列表,也有
断句
信息。我有一个带有时间戳的单词列表,这些单词来自对Google API的调用,它没有
断句
信息。只要每个句子都有相当数量的匹配单词,我就可以使用这些单词作为锚,然后在音频中寻找最长的静默间隙,并将其视为
断句
。但是,即使是这个基本的单词匹配算法,我也遇到了麻烦。我认为知道原文中的
断句
应该会有所帮助。一个问题是,在后面的文本中,可能会有匹配的句子后面的单词,这可能会打乱一切。所以我需要最好的有序匹配。 有人能告诉我一些代码或算法的细节吗?
浏览 10
提问于2020-06-24
得票数 0
1
回答
实时语音识别的静音
断句
时长支持修改吗?
浏览 144
提问于2022-06-15
2
回答
当
python
解释器加载源文件时,它会在内存中将文件内容转换为unicode吗?
、
、
比方说,我有一个用utf8编码的源文件,当
python
解释器加载该源文件时,它会在内存中将文件内容转换为unicode,然后尝试在unicode中计算源代码吗?如果我有一个包含非ASCII字符的字符串,比如 在使用
python
2运行该文件时,我发现字符串实际上仍然以原始gbk字节为单位。所以我的dboubt,
python
2解释不把源代码转换成unicode。因为如果是这样的话,字符串内容将是unicode(我听说实际上是UTF16)。 是那么回事吗?如果是的
浏览 4
提问于2017-10-14
得票数 0
1
回答
具有多个负查找的Regex
、
、
这里有几个与我的问题相似的问题,但无论如何我都无法使它发挥作用。但是,比赛不能以点开始,也不能以“ABC”开头。IShouldMatchDataSet // should match (entity = IShouldMatch)WhatEver.IShouldNotMatchDataSet // should not .S
浏览 5
提问于2016-10-14
得票数 0
回答已采纳
2
回答
在TfidfVectorizer中删除法语和英语中的词组
、
、
、
我试图删除TfidfVectorizer中法语和英语中的
断句
。到目前为止,我只从英语中删除了
断句
。当我尝试为stop_words输入法语语言时,我会收到一条错误消息,上面说它不是内置的。我正在使用
Python
对这700行进行集群项目。然而,我的集群出现了一个问题:我得到了满是法语停止词的集群,这正在破坏我的集群的效率。
浏览 0
提问于2019-08-05
得票数 5
回答已采纳
1
回答
Python
-从熊猫系列中删除
断句
的功能
、
、
、
、
我已经看到了一些使用“lambdas”来实现这一目标的例子(参见下面的示例中的dataframe),但是我希望通过运行DEF函数来实现这一点(我是
Python
新手,这在我看来是最容易理解的)。
浏览 1
提问于2019-03-05
得票数 0
3
回答
中文
文档的句子拆分
、
、
、
我必须将
中文
文本分成多个句子。我试过斯坦福大学的DocumentPreProcessor。它在英语上运行得很好,但在
中文
上就不行。 请你能让我知道有什么好的
中文
分句最好是在Java或
Python
。
浏览 3
提问于2014-12-12
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python 中文编码
Python 中文编码-Python 基础教程
Python中文社区官方群组
“结巴”中文分词:做最好的 Python 中文分词组件
python中pycharm中文汉化教程
热门
标签
更多标签
云服务器
ICP备案
实时音视频
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券