我是Python新手,我很难理解为什么我会遇到某些错误,或者事情没有按照我所希望的那样工作。
我想做的一件事是从句子中的所有单词中替换给定的标点符号。这就是我所拥有的:
def beautify_sentence(sentence, punctuation): """Returns a sentence that removes all the specified trailing punctuation from words.""" sentence = [words.strip(punctuation) for wo
我正在尝试用Python编写一个程序来检查文本文件中是否有重复的单词。(反过来,如果有或没有,则返回一个布尔值)
例如,我有一个名为"copy“的文本文件。在文本文件中是一行句子。“没有副本”(句子中有两个副本)
在另一个文件"nocopy“中,应该是一行"there is no nocopy”。(只有一个)
到目前为止,我已经完成了Python程序的构建:
def duplicate(fname):
'(file.txt) ==> (Boolean) Returns True if there are duplicate words'
inf
该程序的目的是计算文章中的每个单词并记录频率。不幸的是,程序也在计算空字符串。我的密码是:
def build_map( in_file, word_map ):
# Receives an input file and an empty dictionary
for line in in_file:
# Splits each line at blank space and turns it into
# a list.
word_list = line.split()
for word in word_list:
我做了一个程序,让你先输入句子,然后输入单词。如果句子中的单词是您输入的单词,请将其标记为集合中的工作。示例:
input sentence
My name is John.
input words
name
Why
do
apple
Final output
My [name] is John.
这是可行的。我使用strtok将单词拆分到标记上(通过“"),并将它们添加到结构中。我将输入的单词存储在一个数组中。但问题是,当用户输入“name”(开头有空格)时,它与句子中的单词不匹配,因为我用“”将其拆分,这意味着结构中没有空格。
有没有办法,不使用暴力循环来检查句子中是否存在
我的问题是在搜索查询中使用了符号。我希望用户能够在没有问题的情况下使用符号,但mysql中的类似功能似乎不是解决方案,所以我需要一些帮助。
例如:如果有人搜索"Blue's car“,而"Blues car”在数据库中,则此查询将返回0个结果。或者viseversa,如果有人搜索"Blues car“,而"Blue's car”在数据库中,则此查询也将返回0个结果。
这是我当前使用的一个示例:
("SELECT Title FROM MyData WHERE Title LIKE '%".$search."%
我想检查一个网站是否至少有一个多个单词。我只能找到一个词。当我尝试添加多个单词时,我得到了错误。
import requests
url = 'https://www.python.org/'
r = requests.get(url)
html_content = r.text
list = "Calculations" # This works
# list = ("Calculations", "simple") # this would fail
if list in html_content:
我是Python新手,在阅读regex文档时非常困惑。据我所知,re.search在字符串中到处搜索,而re.match只搜索字符串的开头。但是我什么时候必须使用re.compile
我试着玩regex,但没能让它起作用。如果字符串与字母、标点符号、数字和空格混在一起,我如何才能获得带有字母的字符串部分?
import re
a = "123,12 jlkjL kSljdf 12.2"
test = re.search('^[a-zA-Z]', a)
print test
我想得到的输出是jlkjL kSljdf。
问题4.编写一个创建新单词列表的循环,使用字符串方法从问题3中创建的列表中去掉所有前导和尾随标点符号。提示:上面导入的字符串库包含一个名为标点符号的常量。三行代码。
好的,我已经完成了如下代码:
import string
text = ("There once was a man in Idaho, he invented the potato.")
listWords = text.split() #problem3
for i in string.punctuation:
listWords = text.replace(i,"") #proble
什么是一个好的开源C word标记器库?
我在找像这样的东西
Tokenize("there are three apples. One is orange, the other is blue,"
" and, finally, the last is yellow!")
输出中不包含任何标点符号。
假设我有一张桌子:
ID | description
-------------------
5 | The bird flew over the tree.
2 | The birds, flew over the tree
这两行具有“相似”的内容。我如何删除#2?
对于“相似”文本,我应该使用什么算法?
我将如何用Python来完成这个任务呢?
谢谢!
我对python和一般的编程都很陌生。我有两个文本文件。每一项都是一个列表,每一项都在新的一行上。
我尝试在每个列表中查找匹配的字符串,忽略大小写和某些标点符号(“,”,"-“,"\n")。这就是我到目前为止所知道的:
基本上,我需要翻译列表项并在2
List1.txt
Proper Title Here
A Title Here, crap
B Title Here-more crap
C Title Here
D Title Here
E Title Here
List2.txt
Proper Title Here
B Title Here-more crap
Q
我有一个如下的字符串:
4s: and in this <em>new</em>, 5s: <em>year</em> everybody try to make our planet clean and polution free.
替换字符串:
4s: and in this <em>new</em>, <em>year</em> everybody try to make our planet clean and polution free.
我想要的是,如果字符串有两个<em>
我希望分裂的句子包括标点符号(例如:?,!,.)如果句子末尾有双引号,我也想把它包括进去。
我在python3中使用了python3()函数将字符串拆分成句子。但遗憾的是,结果字符串不包括标点符号,如果句子末尾有双引号,它们也不包含标点符号。
这就是我当前代码的样子:
x = 'This is an example sentence. I want to include punctuation! What is wrong with my code? It makes me want to yell, "PLEASE HELP ME!"'
sentence =
我正在编写一个程序,它使用标点符号作为分隔符来分隔文本中的子句。
目前,我的代码有一个大列表,其中每个项目都是一组子句。
import re
from random import shuffle
clause_split_content = []
text = ["this, is. a test?", "this: is; also. a test!"]
for i in text:
clause_split = re.split('[,;:".?!]', i)
clause_split.remove
我解析来自新闻网站的信息。每个新闻都是存储在translated_news变量中的字典。每一条新闻都有自己的标题,网址和国家。然后,我试着重复每个新闻标题,删除停止词和标点符号。我写了这段代码:
for new in translated_news:
tk = tokenize(new['title'])
# delete punctuation signs & stop-words
for t in tk:
if (t in punkts) or (t+'\n' in stops):
tk
我是python的新手,我不确定如何才能让这个程序忽略标点符号;我知道它的效率非常低,但目前我并不担心这个问题。
while True:
y="y"
n="n"
Sentence=input("Please enter your sentence: ").upper()
print("Your sentence is:",Sentence)
Correct=input("Is your sentence correct? y/n ")
if Correct==n:
break
elif Correct==
我使用tm包,在R中,我想删除除微笑之外的所有标点符号。
data <- c("conflict need resolved :<. turned conversation exchange ideas richer environment one tricky concepts :D , �conflict� always top business agendas :>. maybe different ideas/opinions different :) " )
我试过了
library(tm) data <- gsub("[^a-z]&
3 3 how are you doing???
2 5 dear, where abouts!!!!!!........
4 6 don't worry i'll be there for ya///
我有这样一种句子的档案。我想从他们身上去掉标点符号。我怎样才能用regex循环和剥离。
>>> import re
>>> a="what is. your. name?"
>>> b=re.findall(r'\w+',a)
>>> b
['
Hi一直在玩一个简单的程序,读取文本和识别的关键字,其中的初始字母是大写的。我的问题是,这个程序不会从文字中删除标点符号,我的意思是佛罗多·弗罗多。佛罗多,是作为不同的条目,而不是相同的。我试着使用导入字符串和使用标点符号,但没有起作用。
下面是我的代码,我使用的文本来自 (复制到一个名为novel.txt的txt文档中)。再次感谢
by_word = {}
with open ('novel.txt') as f:
for line in f:
for word in line.strip().split():
if word[0].isupper()
我需要在Python中使用或创建一个比较函数,也许它已经存在这样做的方法了?
我需要将字符串与列表中的值进行比较,即使只有几个字符,也需要进行匹配。我会举一个例子,这样你就能明白我的意思了。
示例1:
列表中的值:Name: This is the title
搜索中的价值:Name This is the title
示例2:
列表中的值:Name and shortening m.m.
搜索中的价值:Name and shortening m.m
正如您所看到的,我想要比较的值和需要匹配的值非常相似。搜索中的值是文件夹名称,因此它们略有不同,因为它们包含非法字符。
完成此操作的最简单方法可