Skip to content

在第(1)步不是已经找到异常值,为什么把满足deviation-score所有点进行聚类? #14

@iamsuarez

Description

@iamsuarez

您好,大佬,有个疑问,想请教您下,若您有空了,请回复下,谢谢!疑问如下:
cluster_list = list(
[list(
filter(lambda x: np.min(self.leaf_deviation_score[]) <= self.leaf_deviation_score[x] <= np.max(
self.leaf_deviation_score[
]), np.arange(len(self._f)))
)
for _ in cluster_list]
)
在整个数据集中,若满足deviation-score的点,都会进入类中。这样做的理论是什么?
若这样子做非常好,个人感觉那倒不如直接在第1步就用deviation-score而不是偏差?
个人感觉去掉再聚类这一步(去掉上面代码),是不是更好些?这样完全是根据第一步的偏差以及第二步的deviation-score来判断叶子节点是否是异常(找出从哪些点出发,去找事件的根因)。
麻烦作者,给出解释,谢谢!

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions