在 Python 中,我们可以使用各种方法按另一个列表对子列表进行分组,例如使用字典和使用 itertools.groupby() 函数,使用嵌套列表推导。在分析大型数据集和数据分类时,按另一个列表对子列表进行分组非常有用。它还用于文本分析和自然语言处理。在本文中,我们将探讨在 Python 中按另一个列表对子列表进行分组的不同方法,并了解它们的实现。
字典可以以非常简单的方式用于按 Python 中的另一个列表对子列表进行分组。让我们借助示例了解字典在另一个列表上按另一个列表分组子列表的用法。
list_name.append(element)
在这里,元素是要添加到列表末尾的元素。追加方法将此元素放在列表的末尾。
在下面的示例中,我们定义了一个函数group_sublists,它采用两个参数:子列表(子列表的列表)和grouping_list(确定分组顺序的列表)。在函数内部,我们创建空字典组来存储按键分组的子列表。我们迭代子列表列表中的每个子列表。假设每个子列表的第一个元素是键,我们提取它并检查它是否存在于组字典中。如果是这样,我们将当前子列表附加到该键的现有子列表列表中。否则,我们将在组字典中创建一个新的键值对,并将键和当前子列表作为值。最后,我们返回一个列表推导式,该推导式按grouping_list指定的顺序检索分组的子列表。
def group_sublists(sublists, grouping_list): groups = {} for sublist in sublists: key = sublist[0] # Assuming the first element of each sublist is the key if key in groups: groups[key].append(sublist) else: groups[key] = [sublist] return [groups[key] for key in grouping_list] # Example usage sublists = [[1, 'apple'], [2, 'banana'], [1, 'orange'], [2, 'grape']] grouping_list = [1, 2] result = group_sublists(sublists, grouping_list) print(result)
[[[1, 'apple'], [1, 'orange']], [[2, 'banana'], [2, 'grape']]]
Python 的 itertools 模块提供了一个名为 groupby() 的方便函数,可用于根据关键函数对元素进行分组。让我们借助示例来理解这一点。
list_name.append(element)
在这里,append() 函数是一个列表方法,用于将元素添加到list_name的末尾。它通过将指定的元素添加为新项来修改原始列表。
itertools.groupby(iterable, key=None)
在这里,可迭代是输入可迭代对象,它可以是要分组的任何序列,key=None 是一个可选参数,可以是一个可以用作分组键的函数。如果未提供键功能,则元素本身将用作分组的键。
在下面的示例中,我们首先根据键对子列表进行排序(假设它是第一个元素)。然后,我们创建一个名为 result 的空列表来存储分组的子列表。接下来,我们迭代由 itertools.groupby() 生成的组。groupby() 函数采用两个参数:可迭代函数(在本例中为子列表)和键函数(从每个子列表中提取键的 lambda 函数)。它返回键对和包含分组子列表的迭代器。在循环中,我们检查grouping_list中是否存在密钥。如果是这样,我们使用 list(group) 将迭代器转换为列表并将其附加到结果列表中。最后,我们返回包含分组子列表的结果列表。
import itertools def group_sublists(sublists, grouping_list): sublists.sort(key=lambda x: x[0]) # Sort the sublists based on the key result = [] for key, group in itertools.groupby(sublists, lambda x: x[0]): if key in grouping_list: result.append(list(group)) return result # Example usage sublists = [[1, 'apple'], [2, 'banana'], [1, 'orange'], [2, 'grape']] grouping_list = [1, 2] result = group_sublists(sublists, grouping_list) print(result)
[[[1, 'apple'], [1, 'orange']], [[2, 'banana'], [2, 'grape']]]
我们可以使用 Python 编写嵌套列表推导,它可用于按另一个列表对子列表进行分组。让我们看一个例子,看看我们如何实现这一点。
[expression for item in list if condition]
此处,语法由方括号组成,方括号将表达式括起来,后跟一个循环访问列表的 for 循环。也可以在表达式末尾添加任何 if 条件以过滤掉某些元素。
在下面的示例中,我们定义了函数 group_sublists,它将子列表和grouping_list作为参数。我们使用嵌套列表推导来迭代grouping_list中的每个键。对于每个键,我们遍历子列表并仅过滤掉具有匹配键的子列表(假设它是第一个元素)。然后将这些筛选的子列表收集到一个新列表中,该列表表示该键的分组子列表。结果是一个列表列表,其中每个子列表都包含特定键的分组子列表。
def group_sublists(sublists, grouping_list): return [ [sublist for sublist in sublists if sublist[0] == key] for key in grouping_list ] # Example usage sublists = [[1, 'apple'], [2, 'banana'], [1, 'orange'], [2, 'grape']] grouping_list = [1, 2] result = group_sublists(sublists, grouping_list) print(result)
[[[1, 'apple'], [1, 'orange']], [[2, 'banana'], [2, 'grape']]]
在本文中,我们讨论了如何在 Python 中按另一个列表对子列表进行分组。我们讨论了三种方法:使用字典和利用 itertools.groupby() 函数,以及使用嵌套列表推导。每种方法都有其优点,并且可能更适合,具体取决于程序的特定要求。