对于每一行(doc_id),我希望在文本列中重复n次的两个字符串之间提取一个子字符串(在我的例子中是政府部门的名称)。of Health \n Matters \n Blah blah blah \n PART 5 Department of Sport \n Matters \n Blah blah"))
我想说的是Forestry&
我正在尝试编写一个正则表达式(在Google电子表格中)以删除括号、括号内的文本和括号前的空格。换句话说,我只想提取文本中的名字。例如,我希望字符串"A.J.到目前为止,我已经让=REGEXEXTRACT(D2,"[^()]*")和=REGEXEXTRACT(D2,"^[^(]+")提取了"A.J. Sm