我试图使用正则表达式来拆分标点符号上的文本,只有当标点符号跟随一个单词并继续一个空格或字符串的末尾时。
我试过([a-zA-Z])([,;.-])(\s|$)
但是,当我想在Python中拆分时,它包含了单词的最后一个字符。
我想像这样分开:
text = 'Mr.Smith is a professor at Harvard, and is a great guy.'
splits = ['Mr.Smith', 'is', 'a', 'professor', 'at', 'Harvard&
在Python中,我需要删除列表中几乎所有的标点符号,但要保存句号和逗号。我应该创建一个函数来完成这个任务,还是创建一个变量?基本上,我想删除除字母(我已经将大写字母转换为小写)、句号和逗号(可能还有撇号)以外的所有符号。
#Clean tokens up (remove symbols except ',' and '.')
def depunctuate()
clean_tokens = []
for i in lc_tokens:
if (i not in [a-z.,])
...
所以我尝试使用python编写一段代码,用户输入特定的输入,然后返回一个列表,列表的前面只有一个单词(#)。
def labeled(): message_input=input("Enter a message or type q to end:").split() result=list(message_input) print (result)
到目前为止,我可以得到用户输入的消息,并提供一个列表作为输出,但我希望用户输入一条消息(例如:“今天天气不错#running # marathon "),让python返回running,marathon。考虑到这一点,如
我希望分裂的句子包括标点符号(例如:?,!,.)如果句子末尾有双引号,我也想把它包括进去。
我在python3中使用了python3()函数将字符串拆分成句子。但遗憾的是,结果字符串不包括标点符号,如果句子末尾有双引号,它们也不包含标点符号。
这就是我当前代码的样子:
x = 'This is an example sentence. I want to include punctuation! What is wrong with my code? It makes me want to yell, "PLEASE HELP ME!"'
sentence =
我必须用python编写一些代码,这些代码将读取文本中的所有单词,反转它们并找到它们中的哪一个在正常格式和反向格式中是相同的。到目前为止,我已经做到了:
filename=raw_input("enter the file name: ")
fop=open(filename)
for line in fop:
words=line.split()
li=[]
li.extend(words)
size=len(li)
for i in range(0,size/2):
li[i], li[size-1-i] = li[size-1-i], li[i]
`enter
我在这里看到了很多例子,但我没有找到一个适合我的场景。
我试着用一根绳子,比如:
string = "Hi my Name is Bill, Bill likes coding, coding is fun"
并只返回每个副本的1值。
因此输出类似于(忽略标点符号):
Bill
coding
我如何在Python3中实现这一点?
我是python的新手,我不确定如何才能让这个程序忽略标点符号;我知道它的效率非常低,但目前我并不担心这个问题。
while True:
y="y"
n="n"
Sentence=input("Please enter your sentence: ").upper()
print("Your sentence is:",Sentence)
Correct=input("Is your sentence correct? y/n ")
if Correct==n:
break
elif Correct==
3 3 how are you doing???
2 5 dear, where abouts!!!!!!........
4 6 don't worry i'll be there for ya///
我有这样一种句子的档案。我想从他们身上去掉标点符号。我怎样才能用regex循环和剥离。
>>> import re
>>> a="what is. your. name?"
>>> b=re.findall(r'\w+',a)
>>> b
['
这是一个计算机科学项目,我们必须分离一个文本文件,去掉标点符号和大写字母,然后用sys.argv计算一个单词显示的次数。我们的教授希望我们使用的代码格式是-
cleanToken = ""
for i in range(0,len(token),1):
if (???): #test token[i] to see if it is a letter
cleanToken = cleanToken + token[i]
但这总是弹出一条错误消息。有人知道如何修复错误消息吗?
我有以下字符串:
input = "I love programming with Python-3.3! Do you? It's great... I give it a 10/10. It's free-to-use, no $$$ involved!"
除"/“、”‘“、"-”、"+“和"$”外,所有标点符号都应与单词分开。
因此,产出应该是:
"I love programming with Python-3 . 3 ! Do you ? It's great . . . I give it a 10/1
这个问题( )处理的是从单个字符串中去掉标点符号。但是,我希望从输入文件中读取文本,但只打印出所有字符串的一个副本,而不结束标点符号。我开始做了这样的事情:
f = open('#file name ...', 'a+')
for x in set(f.read().split()):
print x
但是问题是,如果输入文件有,例如,这一行:
This is not is, clearly is: weird
它对"is“的三种不同情况的处理方式不同,但我想忽略任何标点符号,让它打印一次,而不是三次。如何删除任何以结尾的标点符号,然后将结果字
这是一个让我很困惑的例子。
class Point(val xc: Int, val yc: Int) {
var x: Int = xc
var y: Int = yc
def move(dx: Int, dy: Int) {
x = x + dx
y = y + dy
println ("x 的坐标点 : " + x);
println ("y 的坐标点 : " + y);
}
}
class Location(override val xc: Int,
我想用标点符号和空格分隔字符串,但保留标点符号。E.x
String example = "How are you? I am fine!"
我想这样做
["How","are","you","?","I","am","fine","!"]
但我却得到了
["how"," ","are"," ","you"," ","?","
我对python很陌生,我正试着理解下面这一行:
"".join(char for char in input if not unicodedata.category(char).startswith('P'))
来源:
此代码从输入中删除所有unicode标点符号。我不明白为什么会起作用。据我所知,它只是在输入中迭代所有字符,忽略标点符号。在for循环中声明之前,它如何访问char?我来自java背景,所以这让我非常困惑。