【问题标题】:Best algorithm to filter data with multiple criteria in Python在 Python 中使用多个条件过滤数据的最佳算法
【发布时间】:2023-04-02 18:10:01
【问题描述】:

我有一个多维且仅限数值的数据集,在概念上如下所示:

Id   Field1  Field2  Field3  
1    123     .05     10.33
2    234     .17     5.78
3    345     .01     0.23
4    456     .99     1233
...
...
...

我需要检索符合某些条件的排序数据,如下例所示。

select * from data where Field1 > x and Field2 > y ordered by Field3 desc

对于过滤子句:

  • 条件只能是Field*“运算符”x,其中“运算符”可以是>、=或
  • 条件相交(即,它们由 AND 而非 OR 连接)。
  • “排序者”字段可以是任何字段*。

为我所描述的用例实现数据结构和算法的最佳方法是什么?

假设数据集的大小适中,低于 10 万行。

在这里,我使用 SQL 语法来解释我想要实现的目标。我不打算卸载 SQL 中的数据。并且数据集不需要像 Python 中的数据结构那样在数据帧中实现。可以是栈/队列/列表/字典...

任何帮助将不胜感激。

【问题讨论】:

    标签:
    python
    algorithm
    sorting
    search
    data-structures