"对每一行应用不同的函数"

Question

初始问题：你有一个包含两列（field和value）的数据框，需要根据field列的值对每行执行不同的检查，并将结果存储在status列中。你的代码已经实现了这个需求，通过一个函数列表与字段名对应并使用apply函数来调用相应的方法。

对于改进方法，可以使用Python字典和条件表达式（如np.select）来实现更简洁且易于扩展的解决方案：

import pandas as pd
import numpy as np

data = {
    'field': ['a', 'b'],
    'value': [5, 20],
}

df = pd.DataFrame(data)

conditions = {
    'a': (1 <= df['value']) & (df['value'] <= 10),
    'b': df['value'].isin([10, 20, 30, 40]),
}

choices = [True] * len(conditions)

df['status'] = np.select(list(conditions.values()), choices, default=False)

print('After check DF')
print(f'{df=}')

更新后的问题：
基于编辑后的信息，你可以使用np.select结合多个条件和选择列表来实现目标功能。这已经在你的最后示例代码中得到体现，这段代码是有效且易于添加更多字段的：

data = {
    'field': ['a', 'b', 'c'],
    'value': [5, 20, 80],
}

df = pd.DataFrame(data)

condlist = [df['field'] == 'a', df['field'] == 'b', df['field'] == 'c']
choicelist = [df['value'].between(1, 10), df['value'].isin([10, 20, 30, 40]), df['value'].between(50, 100)]

df['status'] = np.select(condlist, choicelist, False)

print('After check DF')
print(f'{df=}')

Allan Cameron · Answer

你也可以使用字典来实现这个功能：

import pandas as pd

data = {
    'field': ['a', 'b'],
    'value': [5, 20],
}

df = pd.DataFrame(data)
print('初始数据框')
print(df)

# 定义针对不同字段的检查函数
def check_field_a(value):
    return 1 <= value <= 10

def check_field_b(value):
    return value in [10, 20, 30, 40]

# 将字段映射到它们各自对应的函数上
check_functions = {'a': check_field_a, 'b': check_field_b}

# 应用函数
df['status'] = df.apply(lambda row: check_functions[row['field']](row['value']), axis=1)

print('
检查后的数据框')
print(df)

Markus Jarderot · Answer

对于这两个特定的函数，你可以将其矢量化处理：

df['status'] = np.where(
    df['field'] == 'a',
    df['value'].between(1, 10),  # 如果需要，请在这里更改min和max值
    df['value'].isin([10, 20, 30, 40])
)

David Arenburg · Answer

你可以使用NumPy的np.where()函数配合多个条件来实现这个需求。

a_min = 1
a_max = 10
b_vals = [10, 20, 30, 40]

df['status'] = np.where(
    ((df['field'] == 'a') & (df['value'].between(a_min, a_max))) |
    ((df['field'] == 'b') & (df['value'].isin(b_vals))),
    True,
    False
)