From 4fedd82caa36d062f7a25b38cc9066e9281a3a21 Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Mon, 22 Apr 2024 14:30:11 +0300
Subject: [PATCH 01/24] Add multiple workload loaders, refactor kubeapi
 workload loader

---
 examples/custom_strategy.py                   |   4 +-
 robusta_krr/api/models.py                     |   4 +-
 robusta_krr/core/abstract/metrics.py          |   4 +-
 robusta_krr/core/abstract/strategies.py       |   6 +-
 .../core/integrations/kubernetes/__init__.py  | 463 +-----------------
 .../kubernetes/workload_loader/__init__.py    |   5 +
 .../kubernetes/workload_loader/base.py        |  16 +
 .../workload_loader/kube_api/__init__.py      | 273 +++++++++++
 .../kube_api/loaders/__init__.py              |  19 +
 .../workload_loader/kube_api/loaders/base.py  | 127 +++++
 .../kube_api/loaders/cronjobs.py              |  68 +++
 .../kube_api/loaders/daemonsets.py            |  13 +
 .../kube_api/loaders/deploymentconfigs.py     |  38 ++
 .../kube_api/loaders/deployments.py           |  13 +
 .../workload_loader/kube_api/loaders/jobs.py  |  18 +
 .../kube_api/loaders/rollouts.py              |  61 +++
 .../kube_api/loaders/statefulsets.py          |  13 +
 .../kubernetes/workload_loader/prometheus.py  |  10 +
 .../core/integrations/prometheus/loader.py    |   6 +-
 .../integrations/prometheus/metrics/base.py   |   6 +-
 .../integrations/prometheus/metrics/cpu.py    |   8 +-
 .../integrations/prometheus/metrics/memory.py |   8 +-
 .../metrics_service/base_metric_service.py    |   4 +-
 .../prometheus_metrics_service.py             |   6 +-
 robusta_krr/core/models/config.py             |   1 +
 robusta_krr/core/models/objects.py            |   6 +-
 robusta_krr/core/models/result.py             |   6 +-
 robusta_krr/core/runner.py                    |  12 +-
 robusta_krr/strategies/simple.py              |   8 +-
 tests/conftest.py                             |   4 +-
 30 files changed, 739 insertions(+), 491 deletions(-)
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/base.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/__init__.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/base.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/cronjobs.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/daemonsets.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deploymentconfigs.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deployments.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/jobs.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/rollouts.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/statefulsets.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/prometheus.py

diff --git a/examples/custom_strategy.py b/examples/custom_strategy.py
index f9e281d1..05735e57 100644
--- a/examples/custom_strategy.py
+++ b/examples/custom_strategy.py
@@ -3,7 +3,7 @@
 import pydantic as pd
 
 import robusta_krr
-from robusta_krr.api.models import K8sObjectData, MetricsPodData, ResourceRecommendation, ResourceType, RunResult
+from robusta_krr.api.models import K8sWorkload, MetricsPodData, ResourceRecommendation, ResourceType, RunResult
 from robusta_krr.api.strategies import BaseStrategy, StrategySettings
 from robusta_krr.core.integrations.prometheus.metrics import MaxMemoryLoader, PercentileCPULoader
 
@@ -24,7 +24,7 @@ class CustomStrategy(BaseStrategy[CustomStrategySettings]):
     rich_console = True  # Whether to use rich console for the CLI
     metrics = [PercentileCPULoader(90), MaxMemoryLoader]  # The metrics to use for the strategy
 
-    def run(self, history_data: MetricsPodData, object_data: K8sObjectData) -> RunResult:
+    def run(self, history_data: MetricsPodData, object_data: K8sWorkload) -> RunResult:
         return {
             ResourceType.CPU: ResourceRecommendation(request=self.settings.param_1, limit=None),
             ResourceType.Memory: ResourceRecommendation(request=self.settings.param_2, limit=self.settings.param_2),
diff --git a/robusta_krr/api/models.py b/robusta_krr/api/models.py
index 3a453ce9..e61f01ef 100644
--- a/robusta_krr/api/models.py
+++ b/robusta_krr/api/models.py
@@ -1,6 +1,6 @@
 from robusta_krr.core.abstract.strategies import MetricsPodData, PodsTimeData, ResourceRecommendation, RunResult
 from robusta_krr.core.models.allocations import RecommendationValue, ResourceAllocations, ResourceType
-from robusta_krr.core.models.objects import K8sObjectData, PodData
+from robusta_krr.core.models.objects import K8sWorkload, PodData
 from robusta_krr.core.models.result import ResourceScan, Result
 from robusta_krr.core.models.severity import Severity, register_severity_calculator
 
@@ -8,7 +8,7 @@
     "ResourceType",
     "ResourceAllocations",
     "RecommendationValue",
-    "K8sObjectData",
+    "K8sWorkload",
     "PodData",
     "Result",
     "Severity",
diff --git a/robusta_krr/core/abstract/metrics.py b/robusta_krr/core/abstract/metrics.py
index 3b6f19c5..e1151ea6 100644
--- a/robusta_krr/core/abstract/metrics.py
+++ b/robusta_krr/core/abstract/metrics.py
@@ -2,7 +2,7 @@
 from abc import ABC, abstractmethod
 
 from robusta_krr.core.abstract.strategies import PodsTimeData
-from robusta_krr.core.models.objects import K8sObjectData
+from robusta_krr.core.models.objects import K8sWorkload
 
 
 class BaseMetric(ABC):
@@ -16,6 +16,6 @@ class BaseMetric(ABC):
 
     @abstractmethod
     async def load_data(
-        self, object: K8sObjectData, period: datetime.timedelta, step: datetime.timedelta
+        self, object: K8sWorkload, period: datetime.timedelta, step: datetime.timedelta
     ) -> PodsTimeData:
         ...
diff --git a/robusta_krr/core/abstract/strategies.py b/robusta_krr/core/abstract/strategies.py
index 5b6521e1..ab5ab6c4 100644
--- a/robusta_krr/core/abstract/strategies.py
+++ b/robusta_krr/core/abstract/strategies.py
@@ -9,7 +9,7 @@
 import pydantic as pd
 from numpy.typing import NDArray
 
-from robusta_krr.core.models.result import K8sObjectData, ResourceType
+from robusta_krr.core.models.result import K8sWorkload, ResourceType
 
 if TYPE_CHECKING:
     from robusta_krr.core.abstract.metrics import BaseMetric  # noqa: F401
@@ -133,7 +133,7 @@ def description(self) -> Optional[str]:
     # Abstract method that needs to be implemented by subclass.
     # This method is intended to calculate resource recommendation based on history data and kubernetes object data.
     @abc.abstractmethod
-    def run(self, history_data: MetricsPodData, object_data: K8sObjectData) -> RunResult:
+    def run(self, history_data: MetricsPodData, object_data: K8sWorkload) -> RunResult:
         pass
 
     # This method is intended to return a strategy by its name.
@@ -167,6 +167,6 @@ def get_settings_type(cls) -> type[StrategySettings]:
     "StrategySettings",
     "PodsTimeData",
     "MetricsPodData",
-    "K8sObjectData",
+    "K8sWorkload",
     "ResourceType",
 ]
diff --git a/robusta_krr/core/integrations/kubernetes/__init__.py b/robusta_krr/core/integrations/kubernetes/__init__.py
index a772a5c2..051cc232 100644
--- a/robusta_krr/core/integrations/kubernetes/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/__init__.py
@@ -18,11 +18,12 @@
 )
 
 from robusta_krr.core.models.config import settings
-from robusta_krr.core.models.objects import HPAData, K8sObjectData, KindLiteral, PodData
+from robusta_krr.core.models.objects import HPAData, K8sWorkload, KindLiteral, PodData
 from robusta_krr.core.models.result import ResourceAllocations
 from robusta_krr.utils.object_like_dict import ObjectLikeDict
 
 from . import config_patch as _
+from .workload_loader import BaseWorkloadLoader, KubeAPIWorkloadLoader, PrometheusWorkloadLoader
 
 logger = logging.getLogger("krr")
 
@@ -30,441 +31,7 @@
 HPAKey = tuple[str, str, str]
 
 
-class ClusterLoader:
-    def __init__(self, cluster: Optional[str]=None):
-        self.cluster = cluster
-        # This executor will be running requests to Kubernetes API
-        self.executor = ThreadPoolExecutor(settings.max_workers)
-        self.api_client = settings.get_kube_client(cluster)
-        self.apps = client.AppsV1Api(api_client=self.api_client)
-        self.custom_objects = client.CustomObjectsApi(api_client=self.api_client)
-        self.batch = client.BatchV1Api(api_client=self.api_client)
-        self.core = client.CoreV1Api(api_client=self.api_client)
-        self.autoscaling_v1 = client.AutoscalingV1Api(api_client=self.api_client)
-        self.autoscaling_v2 = client.AutoscalingV2Api(api_client=self.api_client)
-
-        self.__kind_available: defaultdict[KindLiteral, bool] = defaultdict(lambda: True)
-
-        self.__jobs_for_cronjobs: dict[str, list[V1Job]] = {}
-        self.__jobs_loading_locks: defaultdict[str, asyncio.Lock] = defaultdict(asyncio.Lock)
-
-    async def list_scannable_objects(self) -> list[K8sObjectData]:
-        """List all scannable objects.
-
-        Returns:
-            A list of scannable objects.
-        """
-
-        logger.info(f"Listing scannable objects in {self.cluster}")
-        logger.debug(f"Namespaces: {settings.namespaces}")
-        logger.debug(f"Resources: {settings.resources}")
-
-        self.__hpa_list = await self._try_list_hpa()
-        workload_object_lists = await asyncio.gather(
-            self._list_deployments(),
-            self._list_rollouts(),
-            self._list_deploymentconfig(),
-            self._list_all_statefulsets(),
-            self._list_all_daemon_set(),
-            self._list_all_jobs(),
-            self._list_all_cronjobs(),
-        )
-
-        return [
-            object
-            for workload_objects in workload_object_lists
-            for object in workload_objects
-            # NOTE: By default we will filter out kube-system namespace
-            if not (settings.namespaces == "*" and object.namespace == "kube-system")
-        ]
-
-    async def _list_jobs_for_cronjobs(self, namespace: str) -> list[V1Job]:
-        if namespace not in self.__jobs_for_cronjobs:
-            loop = asyncio.get_running_loop()
-
-            async with self.__jobs_loading_locks[namespace]:
-                logging.debug(f"Loading jobs for cronjobs in {namespace}")
-                ret = await loop.run_in_executor(
-                    self.executor,
-                    lambda: self.batch.list_namespaced_job(namespace=namespace),
-                )
-                self.__jobs_for_cronjobs[namespace] = ret.items
-
-        return self.__jobs_for_cronjobs[namespace]
-
-    async def list_pods(self, object: K8sObjectData) -> list[PodData]:
-        loop = asyncio.get_running_loop()
-
-        if object.kind == "CronJob":
-            namespace_jobs = await self._list_jobs_for_cronjobs(object.namespace)
-            ownered_jobs_uids = [
-                job.metadata.uid
-                for job in namespace_jobs
-                if any(
-                    owner.kind == "CronJob" and owner.uid == object._api_resource.metadata.uid
-                    for owner in job.metadata.owner_references or []
-                )
-            ]
-            selector = f"batch.kubernetes.io/controller-uid in ({','.join(ownered_jobs_uids)})"
-
-        else:
-            if object.selector is None:
-                return []
-
-            selector = self._build_selector_query(object.selector)
-            if selector is None:
-                return []
-
-        ret: V1PodList = await loop.run_in_executor(
-            self.executor,
-            lambda: self.core.list_namespaced_pod(
-                namespace=object._api_resource.metadata.namespace, label_selector=selector
-            ),
-        )
-
-        return [PodData(name=pod.metadata.name, deleted=False) for pod in ret.items]
-
-    @staticmethod
-    def _get_match_expression_filter(expression) -> str:
-        if expression.operator.lower() == "exists":
-            return expression.key
-        elif expression.operator.lower() == "doesnotexist":
-            return f"!{expression.key}"
-
-        values = ",".join(expression.values)
-        return f"{expression.key} {expression.operator} ({values})"
-
-    @staticmethod
-    def _build_selector_query(selector: Any) -> Union[str, None]:
-        label_filters = []
-
-        if selector.match_labels is not None:
-            label_filters += [f"{label[0]}={label[1]}" for label in selector.match_labels.items()]
-
-        if selector.match_expressions is not None:
-            label_filters += [
-                ClusterLoader._get_match_expression_filter(expression) for expression in selector.match_expressions
-            ]
-
-        if label_filters == []:
-            # NOTE: This might mean that we have DeploymentConfig,
-            # which uses ReplicationController and it has a dict like matchLabels
-            if len(selector) != 0:
-                label_filters += [f"{label[0]}={label[1]}" for label in selector.items()]
-            else:
-                return None
-
-        return ",".join(label_filters)
-
-    def __build_scannable_object(
-        self, item: AnyKubernetesAPIObject, container: V1Container, kind: Optional[str] = None
-    ) -> K8sObjectData:
-        name = item.metadata.name
-        namespace = item.metadata.namespace
-        kind = kind or item.__class__.__name__[2:]
-
-        obj = K8sObjectData(
-            cluster=self.cluster,
-            namespace=namespace,
-            name=name,
-            kind=kind,
-            container=container.name,
-            allocations=ResourceAllocations.from_container(container),
-            hpa=self.__hpa_list.get((namespace, kind, name)),
-        )
-        obj._api_resource = item
-        return obj
-
-    def _should_list_resource(self, resource: str) -> bool:
-        if settings.resources == "*":
-            return True
-        return resource in settings.resources
-
-    async def _list_namespaced_or_global_objects(
-        self,
-        kind: KindLiteral,
-        all_namespaces_request: Callable,
-        namespaced_request: Callable
-    ) -> list[Any]:
-        logger.debug(f"Listing {kind}s in {self.cluster}")
-        loop = asyncio.get_running_loop()
-
-        if settings.namespaces == "*":
-            requests = [
-                loop.run_in_executor(
-                    self.executor,
-                    lambda: all_namespaces_request(
-                        watch=False,
-                        label_selector=settings.selector,
-                    ),
-                )
-            ]
-        else:
-            requests = [
-                loop.run_in_executor(
-                    self.executor,
-                    lambda ns=namespace: namespaced_request(
-                        namespace=ns,
-                        watch=False,
-                        label_selector=settings.selector,
-                    ),
-                )
-                for namespace in settings.namespaces
-            ]
-
-        result = [
-            item
-            for request_result in await asyncio.gather(*requests)
-            for item in request_result.items
-        ]
-
-        logger.debug(f"Found {len(result)} {kind} in {self.cluster}")
-        return result
-
-    async def _list_scannable_objects(
-        self,
-        kind: KindLiteral,
-        all_namespaces_request: Callable,
-        namespaced_request: Callable,
-        extract_containers: Callable[[Any], Union[Iterable[V1Container], Awaitable[Iterable[V1Container]]]],
-        filter_workflows: Optional[Callable[[Any], bool]] = None,
-    ) -> list[K8sObjectData]:
-        if not self._should_list_resource(kind):
-            logger.debug(f"Skipping {kind}s in {self.cluster}")
-            return
-
-        if not self.__kind_available[kind]:
-            return
-        
-        result = []
-        try:
-            for item in await self._list_namespaced_or_global_objects(kind, all_namespaces_request, namespaced_request):
-                if filter_workflows is not None and not filter_workflows(item):
-                    continue
-
-                containers = extract_containers(item)
-                if asyncio.iscoroutine(containers):
-                    containers = await containers
-
-                result.extend(self.__build_scannable_object(item, container, kind) for container in containers)
-        except ApiException as e:
-            if kind in ("Rollout", "DeploymentConfig") and e.status in [400, 401, 403, 404]:
-                if self.__kind_available[kind]:
-                    logger.debug(f"{kind} API not available in {self.cluster}")
-                self.__kind_available[kind] = False
-            else:
-                logger.exception(f"Error {e.status} listing {kind} in cluster {self.cluster}: {e.reason}")
-                logger.error("Will skip this object type and continue.")
-
-        return result
-
-    def _list_deployments(self) -> list[K8sObjectData]:
-        return self._list_scannable_objects(
-            kind="Deployment",
-            all_namespaces_request=self.apps.list_deployment_for_all_namespaces,
-            namespaced_request=self.apps.list_namespaced_deployment,
-            extract_containers=lambda item: item.spec.template.spec.containers,
-        )
-
-    def _list_rollouts(self) -> list[K8sObjectData]:
-        async def _extract_containers(item: Any) -> list[V1Container]:
-            if item.spec.template is not None:
-                return item.spec.template.spec.containers
-
-            loop = asyncio.get_running_loop()
-
-            logging.debug(
-                f"Rollout has workloadRef, fetching template for {item.metadata.name} in {item.metadata.namespace}"
-            )
-
-            # Template can be None and object might have workloadRef
-            workloadRef = item.spec.workloadRef
-            if workloadRef is not None:
-                ret = await loop.run_in_executor(
-                    self.executor,
-                    lambda: self.apps.read_namespaced_deployment(
-                        namespace=item.metadata.namespace, name=workloadRef.name
-                    ),
-                )
-                return ret.spec.template.spec.containers
-
-            return []
-
-        # NOTE: Using custom objects API returns dicts, but all other APIs return objects
-        # We need to handle this difference using a small wrapper
-        return self._list_scannable_objects(
-            kind="Rollout",
-            all_namespaces_request=lambda **kwargs: ObjectLikeDict(
-                self.custom_objects.list_cluster_custom_object(
-                    group="argoproj.io",
-                    version="v1alpha1",
-                    plural="rollouts",
-                    **kwargs,
-                )
-            ),
-            namespaced_request=lambda **kwargs: ObjectLikeDict(
-                self.custom_objects.list_namespaced_custom_object(
-                    group="argoproj.io",
-                    version="v1alpha1",
-                    plural="rollouts",
-                    **kwargs,
-                )
-            ),
-            extract_containers=_extract_containers,
-        )
-
-    def _list_deploymentconfig(self) -> list[K8sObjectData]:
-        # NOTE: Using custom objects API returns dicts, but all other APIs return objects
-        # We need to handle this difference using a small wrapper
-        return self._list_scannable_objects(
-            kind="DeploymentConfig",
-            all_namespaces_request=lambda **kwargs: ObjectLikeDict(
-                self.custom_objects.list_cluster_custom_object(
-                    group="apps.openshift.io",
-                    version="v1",
-                    plural="deploymentconfigs",
-                    **kwargs,
-                )
-            ),
-            namespaced_request=lambda **kwargs: ObjectLikeDict(
-                self.custom_objects.list_namespaced_custom_object(
-                    group="apps.openshift.io",
-                    version="v1",
-                    plural="deploymentconfigs",
-                    **kwargs,
-                )
-            ),
-            extract_containers=lambda item: item.spec.template.spec.containers,
-        )
-
-    def _list_all_statefulsets(self) -> list[K8sObjectData]:
-        return self._list_scannable_objects(
-            kind="StatefulSet",
-            all_namespaces_request=self.apps.list_stateful_set_for_all_namespaces,
-            namespaced_request=self.apps.list_namespaced_stateful_set,
-            extract_containers=lambda item: item.spec.template.spec.containers,
-        )
-
-    def _list_all_daemon_set(self) -> list[K8sObjectData]:
-        return self._list_scannable_objects(
-            kind="DaemonSet",
-            all_namespaces_request=self.apps.list_daemon_set_for_all_namespaces,
-            namespaced_request=self.apps.list_namespaced_daemon_set,
-            extract_containers=lambda item: item.spec.template.spec.containers,
-        )
-
-    def _list_all_jobs(self) -> list[K8sObjectData]:
-        return self._list_scannable_objects(
-            kind="Job",
-            all_namespaces_request=self.batch.list_job_for_all_namespaces,
-            namespaced_request=self.batch.list_namespaced_job,
-            extract_containers=lambda item: item.spec.template.spec.containers,
-            # NOTE: If the job has ownerReference and it is a CronJob, then we should skip it
-            filter_workflows=lambda item: not any(
-                owner.kind == "CronJob" for owner in item.metadata.owner_references or []
-            ),
-        )
-
-    def _list_all_cronjobs(self) -> list[K8sObjectData]:
-        return self._list_scannable_objects(
-            kind="CronJob",
-            all_namespaces_request=self.batch.list_cron_job_for_all_namespaces,
-            namespaced_request=self.batch.list_namespaced_cron_job,
-            extract_containers=lambda item: item.spec.job_template.spec.template.spec.containers,
-        )
-
-    async def __list_hpa_v1(self) -> dict[HPAKey, HPAData]:
-        loop = asyncio.get_running_loop()
-        res = await loop.run_in_executor(
-            self.executor,
-            lambda: self._list_namespaced_or_global_objects(
-                kind="HPA-v1",
-                all_namespaces_request=self.autoscaling_v1.list_horizontal_pod_autoscaler_for_all_namespaces,
-                namespaced_request=self.autoscaling_v1.list_namespaced_horizontal_pod_autoscaler,
-            ),
-        )
-        return {
-            (
-                hpa.metadata.namespace,
-                hpa.spec.scale_target_ref.kind,
-                hpa.spec.scale_target_ref.name,
-            ): HPAData(
-                min_replicas=hpa.spec.min_replicas,
-                max_replicas=hpa.spec.max_replicas,
-                current_replicas=hpa.status.current_replicas,
-                desired_replicas=hpa.status.desired_replicas,
-                target_cpu_utilization_percentage=hpa.spec.target_cpu_utilization_percentage,
-                target_memory_utilization_percentage=None,
-            )
-            async for hpa in res
-        }
-
-    async def __list_hpa_v2(self) -> dict[HPAKey, HPAData]:
-        res = await self._list_namespaced_or_global_objects(
-            kind="HPA-v2",
-            all_namespaces_request=self.autoscaling_v2.list_horizontal_pod_autoscaler_for_all_namespaces,
-            namespaced_request=self.autoscaling_v2.list_namespaced_horizontal_pod_autoscaler,
-        )
-        def __get_metric(hpa: V2HorizontalPodAutoscaler, metric_name: str) -> Optional[float]:
-            return next(
-                (
-                    metric.resource.target.average_utilization
-                    for metric in hpa.spec.metrics
-                    if metric.type == "Resource" and metric.resource.name == metric_name
-                ),
-                None,
-            )
-        return {
-            (
-                hpa.metadata.namespace,
-                hpa.spec.scale_target_ref.kind,
-                hpa.spec.scale_target_ref.name,
-            ): HPAData(
-                min_replicas=hpa.spec.min_replicas,
-                max_replicas=hpa.spec.max_replicas,
-                current_replicas=hpa.status.current_replicas,
-                desired_replicas=hpa.status.desired_replicas,
-                target_cpu_utilization_percentage=__get_metric(hpa, "cpu"),
-                target_memory_utilization_percentage=__get_metric(hpa, "memory"),
-            )
-            for hpa in res
-        }
-
-    # TODO: What should we do in case of other metrics bound to the HPA?
-    async def __list_hpa(self) -> dict[HPAKey, HPAData]:
-        """List all HPA objects in the cluster.
-
-        Returns:
-            dict[tuple[str, str], HPAData]: A dictionary of HPA objects, indexed by scaleTargetRef (kind, name).
-        """
-
-        try:
-            # Try to use V2 API first
-            return await self.__list_hpa_v2()
-        except ApiException as e:
-            if e.status != 404:
-                # If the error is other than not found, then re-raise it.
-                raise
-
-            # If V2 API does not exist, fall back to V1
-            return await self.__list_hpa_v1()
-
-    async def _try_list_hpa(self) -> dict[HPAKey, HPAData]:
-        try:
-            return await self.__list_hpa()
-        except Exception as e:
-            logger.exception(f"Error trying to list hpa in cluster {self.cluster}: {e}")
-            logger.error(
-                "Will assume that there are no HPA. "
-                "Be careful as this may lead to inaccurate results if object actually has HPA."
-            )
-            return {}
-
-
-class KubernetesLoader:
-    def __init__(self) -> None:
-        self._cluster_loaders: dict[Optional[str], ClusterLoader] = {}
-
+class ClusterWorkloadsLoader:
     async def list_clusters(self) -> Optional[list[str]]:
         """List all clusters.
 
@@ -505,36 +72,42 @@ async def list_clusters(self) -> Optional[list[str]]:
 
         return [context["name"] for context in contexts if context["name"] in settings.clusters]
 
-    def _try_create_cluster_loader(self, cluster: Optional[str]) -> Optional[ClusterLoader]:
+    def _try_create_cluster_loader(self, cluster: Optional[str]) -> Optional[BaseWorkloadLoader]:
+        WorkloadLoader = KubeAPIWorkloadLoader if settings.workload_loader == "kubeapi" else PrometheusWorkloadLoader
+
         try:
-            return ClusterLoader(cluster=cluster)
+            return WorkloadLoader(cluster=cluster)
         except Exception as e:
             logger.error(f"Could not load cluster {cluster} and will skip it: {e}")
             return None
 
-    async def list_scannable_objects(self, clusters: Optional[list[str]]) -> list[K8sObjectData]:
+    async def list_workloads(self, clusters: Optional[list[str]]) -> list[K8sWorkload]:
         """List all scannable objects.
 
-        Yields:
-            Each scannable object as it is loaded.
+        Returns:
+            A list of all loaded objects.
         """
+
         if clusters is None:
             _cluster_loaders = [self._try_create_cluster_loader(None)]
         else:
             _cluster_loaders = [self._try_create_cluster_loader(cluster) for cluster in clusters]
 
-        self.cluster_loaders = {cl.cluster: cl for cl in _cluster_loaders if cl is not None}
+        self.cluster_loaders: dict[Optional[str], BaseWorkloadLoader] = {
+            cl.cluster: cl for cl in _cluster_loaders if cl is not None
+        }
+
         if self.cluster_loaders == {}:
             logger.error("Could not load any cluster.")
             return
-        
+
         return [
             object
             for cluster_loader in self.cluster_loaders.values()
-            for object in await cluster_loader.list_scannable_objects()
+            for object in await cluster_loader.list_workloads()
         ]
 
-    async def load_pods(self, object: K8sObjectData) -> list[PodData]:
+    async def load_pods(self, object: K8sWorkload) -> list[PodData]:
         try:
             cluster_loader = self.cluster_loaders[object.cluster]
         except KeyError:
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
new file mode 100644
index 00000000..95431478
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
@@ -0,0 +1,5 @@
+from .base import BaseWorkloadLoader
+from .kube_api import KubeAPIWorkloadLoader
+from .prometheus import PrometheusWorkloadLoader
+
+__all__ = ["BaseWorkloadLoader", "KubeAPIWorkloadLoader", "PrometheusWorkloadLoader"]
\ No newline at end of file
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
new file mode 100644
index 00000000..a7bba214
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
@@ -0,0 +1,16 @@
+import abc
+from typing import Optional
+from robusta_krr.core.models.objects import K8sWorkload, PodData
+
+
+class BaseWorkloadLoader(abc.ABC):
+    def __init__(self, cluster: Optional[str] = None) -> None:
+        self.cluster = cluster
+
+    @abc.abstractmethod
+    async def list_workloads(self, clusters: Optional[list[str]]) -> list[K8sWorkload]:
+        pass
+
+    @abc.abstractmethod
+    async def list_pods(self, object: K8sWorkload) -> list[PodData]:
+        pass
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
new file mode 100644
index 00000000..8586b77a
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
@@ -0,0 +1,273 @@
+import asyncio
+import logging
+from collections import defaultdict
+from concurrent.futures import ThreadPoolExecutor
+from typing import Any, Awaitable, Callable, Optional
+
+from kubernetes import client  # type: ignore
+from kubernetes.client import ApiException  # type: ignore
+from kubernetes.client.models import V1Container, V2HorizontalPodAutoscaler  # type: ignore
+
+from robusta_krr.core.models.config import settings
+from robusta_krr.core.models.objects import HPAData, K8sWorkload, KindLiteral, PodData
+from robusta_krr.core.models.result import ResourceAllocations
+from robusta_krr.utils.object_like_dict import ObjectLikeDict
+
+from ..base import BaseWorkloadLoader
+from .loaders import (
+    BaseKindLoader,
+    CronJobLoader,
+    DaemonSetLoader,
+    DeploymentConfigLoader,
+    DeploymentLoader,
+    JobLoader,
+    RolloutLoader,
+    StatefulSetLoader,
+)
+
+logger = logging.getLogger("krr")
+
+HPAKey = tuple[str, str, str]
+
+
+class KubeAPIWorkloadLoader(BaseWorkloadLoader):
+    workload_loaders: list[BaseKindLoader] = [
+        DeploymentLoader,
+        RolloutLoader,
+        DeploymentConfigLoader,
+        StatefulSetLoader,
+        DaemonSetLoader,
+        JobLoader,
+        CronJobLoader,
+    ]
+
+    def __init__(self, cluster: Optional[str] = None):
+        super().__init__(cluster)
+
+        # This executor will be running requests to Kubernetes API
+        self.executor = ThreadPoolExecutor(settings.max_workers)
+        self.api_client = settings.get_kube_client(cluster)
+
+        self.autoscaling_v1 = client.AutoscalingV1Api(api_client=self.api_client)
+        self.autoscaling_v2 = client.AutoscalingV2Api(api_client=self.api_client)
+
+        self._kind_available: defaultdict[KindLiteral, bool] = defaultdict(lambda: True)
+        self._hpa_list: dict[HPAKey, HPAData] = {}
+        self._workload_loaders: dict[KindLiteral, BaseKindLoader] = {
+            loader.kind: loader(self.api_client, self.executor) for loader in self.workload_loaders
+        }
+
+    async def list_workloads(self) -> list[K8sWorkload]:
+        """List all scannable objects.
+
+        Returns:
+            A list of scannable objects.
+        """
+
+        logger.info(f"Listing scannable objects in {self.cluster}")
+        logger.debug(f"Namespaces: {settings.namespaces}")
+        logger.debug(f"Resources: {settings.resources}")
+
+        self._hpa_list = await self._try_list_hpa()
+        workload_object_lists = await asyncio.gather(
+            *[
+                self._fetch_workload(loader)
+                for loader in self._workload_loaders.values()
+                if self._should_list_resource(loader.kind)
+            ]
+        )
+
+        return [
+            object
+            for workload_objects in workload_object_lists
+            for object in workload_objects
+            # NOTE: By default we will filter out kube-system namespace
+            if not (settings.namespaces == "*" and object.namespace == "kube-system")
+        ]
+
+    async def list_pods(self, object: K8sWorkload) -> list[PodData]:
+        return await self._workload_loaders[object.kind].list_pods(object)
+
+    def __build_scannable_object(self, item: Any, container: V1Container, kind: Optional[str] = None) -> K8sWorkload:
+        name = item.metadata.name
+        namespace = item.metadata.namespace
+        kind = kind or item.__class__.__name__[2:]
+
+        obj = K8sWorkload(
+            cluster=self.cluster,
+            namespace=namespace,
+            name=name,
+            kind=kind,
+            container=container.name,
+            allocations=ResourceAllocations.from_container(container),
+            hpa=self._hpa_list.get((namespace, kind, name)),
+        )
+        obj._api_resource = item
+        return obj
+
+    def _should_list_resource(self, resource: str) -> bool:
+        if settings.resources == "*":
+            return True
+        return resource in settings.resources
+
+    async def _list_namespaced_or_global_objects(
+        self,
+        kind: KindLiteral,
+        all_namespaces_request: Callable[..., Awaitable[Any]],
+        namespaced_request: Callable[..., Awaitable[Any]],
+    ) -> list[Any]:
+        logger.debug(f"Listing {kind}s in {self.cluster}")
+
+        if settings.namespaces == "*":
+            requests = [
+                all_namespaces_request(
+                    label_selector=settings.selector,
+                )
+            ]
+        else:
+            requests = [
+                namespaced_request(
+                    namespace=namespace,
+                    label_selector=settings.selector,
+                )
+                for namespace in settings.namespaces
+            ]
+
+        result = [item for request_result in await asyncio.gather(*requests) for item in request_result.items]
+
+        logger.debug(f"Found {len(result)} {kind} in {self.cluster}")
+        return result
+
+    async def _fetch_workload(self, loader: BaseKindLoader) -> list[K8sWorkload]:
+        kind = loader.kind
+
+        if not self._should_list_resource(kind):
+            logger.debug(f"Skipping {kind}s in {self.cluster}")
+            return
+
+        if not self._kind_available[kind]:
+            return
+
+        result = []
+        try:
+            for item in await self._list_namespaced_or_global_objects(
+                kind, loader.all_namespaces_request_async, loader.namespaced_request_async
+            ):
+                if not loader.filter(item):
+                    continue
+
+                containers = await loader.extract_containers(item)
+                if asyncio.iscoroutine(containers):
+                    containers = await containers
+
+                result.extend(self.__build_scannable_object(item, container, kind) for container in containers)
+        except ApiException as e:
+            if kind in ("Rollout", "DeploymentConfig") and e.status in [400, 401, 403, 404]:
+                if self._kind_available[kind]:
+                    logger.debug(f"{kind} API not available in {self.cluster}")
+                self._kind_available[kind] = False
+            else:
+                logger.exception(f"Error {e.status} listing {kind} in cluster {self.cluster}: {e.reason}")
+                logger.error("Will skip this object type and continue.")
+
+        return result
+
+    async def __list_hpa_v1(self) -> dict[HPAKey, HPAData]:
+        loop = asyncio.get_running_loop()
+        res = await self._list_namespaced_or_global_objects(
+            kind="HPA-v1",
+            all_namespaces_request=lambda **kwargs: loop.run_in_executor(
+                self.autoscaling_v1.list_horizontal_pod_autoscaler_for_all_namespaces(**kwargs),
+            ),
+            namespaced_request=lambda **kwargs: loop.run_in_executor(
+                self.autoscaling_v1.list_namespaced_horizontal_pod_autoscaler(**kwargs),
+            ),
+        )
+
+        return {
+            (
+                hpa.metadata.namespace,
+                hpa.spec.scale_target_ref.kind,
+                hpa.spec.scale_target_ref.name,
+            ): HPAData(
+                min_replicas=hpa.spec.min_replicas,
+                max_replicas=hpa.spec.max_replicas,
+                current_replicas=hpa.status.current_replicas,
+                desired_replicas=hpa.status.desired_replicas,
+                target_cpu_utilization_percentage=hpa.spec.target_cpu_utilization_percentage,
+                target_memory_utilization_percentage=None,
+            )
+            async for hpa in res
+        }
+
+    async def __list_hpa_v2(self) -> dict[HPAKey, HPAData]:
+        loop = asyncio.get_running_loop()
+
+        res = await self._list_namespaced_or_global_objects(
+            kind="HPA-v2",
+            all_namespaces_request=lambda **kwargs: loop.run_in_executor(
+                self.executor, self.autoscaling_v2.list_horizontal_pod_autoscaler_for_all_namespaces(**kwargs)
+            ),
+            namespaced_request=lambda **kwargs: loop.run_in_executor(
+                self.autoscaling_v2.list_namespaced_horizontal_pod_autoscaler(**kwargs),
+            ),
+        )
+
+        def __get_metric(hpa: V2HorizontalPodAutoscaler, metric_name: str) -> Optional[float]:
+            return next(
+                (
+                    metric.resource.target.average_utilization
+                    for metric in hpa.spec.metrics
+                    if metric.type == "Resource" and metric.resource.name == metric_name
+                ),
+                None,
+            )
+
+        return {
+            (
+                hpa.metadata.namespace,
+                hpa.spec.scale_target_ref.kind,
+                hpa.spec.scale_target_ref.name,
+            ): HPAData(
+                min_replicas=hpa.spec.min_replicas,
+                max_replicas=hpa.spec.max_replicas,
+                current_replicas=hpa.status.current_replicas,
+                desired_replicas=hpa.status.desired_replicas,
+                target_cpu_utilization_percentage=__get_metric(hpa, "cpu"),
+                target_memory_utilization_percentage=__get_metric(hpa, "memory"),
+            )
+            for hpa in res
+        }
+
+    # TODO: What should we do in case of other metrics bound to the HPA?
+    async def __list_hpa(self) -> dict[HPAKey, HPAData]:
+        """List all HPA objects in the cluster.
+
+        Returns:
+            dict[tuple[str, str], HPAData]: A dictionary of HPA objects, indexed by scaleTargetRef (kind, name).
+        """
+
+        try:
+            # Try to use V2 API first
+            return await self.__list_hpa_v2()
+        except ApiException as e:
+            if e.status != 404:
+                # If the error is other than not found, then re-raise it.
+                raise
+
+            # If V2 API does not exist, fall back to V1
+            return await self.__list_hpa_v1()
+
+    async def _try_list_hpa(self) -> dict[HPAKey, HPAData]:
+        try:
+            return await self.__list_hpa()
+        except Exception as e:
+            logger.exception(f"Error trying to list hpa in cluster {self.cluster}: {e}")
+            logger.error(
+                "Will assume that there are no HPA. "
+                "Be careful as this may lead to inaccurate results if object actually has HPA."
+            )
+            return {}
+
+
+__all__ = ["KubeAPIWorkloadLoader"]
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/__init__.py
new file mode 100644
index 00000000..6ca6efd6
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/__init__.py
@@ -0,0 +1,19 @@
+from .base import BaseKindLoader
+from .cronjobs import CronJobLoader
+from .daemonsets import DaemonSetLoader
+from .deploymentconfigs import DeploymentConfigLoader
+from .deployments import DeploymentLoader
+from .jobs import JobLoader
+from .rollouts import RolloutLoader
+from .statefulsets import StatefulSetLoader
+
+__all__ = [
+    "BaseKindLoader",
+    "CronJobLoader",
+    "DeploymentLoader",
+    "DaemonSetLoader",
+    "DeploymentConfigLoader",
+    "JobLoader",
+    "RolloutLoader",
+    "StatefulSetLoader",
+]
\ No newline at end of file
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/base.py
new file mode 100644
index 00000000..0c14e89f
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/base.py
@@ -0,0 +1,127 @@
+import abc
+import asyncio
+import logging
+from concurrent.futures import ThreadPoolExecutor
+from typing import Any, Iterable, Optional, Union
+
+from kubernetes import client  # type: ignore
+from kubernetes.client.api_client import ApiClient  # type: ignore
+from kubernetes.client.models import (  # type: ignore
+    V1Container,
+    V1DaemonSet,
+    V1Deployment,
+    V1Job,
+    V1Pod,
+    V1PodList,
+    V1StatefulSet,
+)
+
+from robusta_krr.core.models.objects import K8sWorkload, KindLiteral, PodData
+
+logger = logging.getLogger("krr")
+
+AnyKubernetesAPIObject = Union[V1Deployment, V1DaemonSet, V1StatefulSet, V1Pod, V1Job]
+HPAKey = tuple[str, str, str]
+
+
+class BaseKindLoader(abc.ABC):
+    """
+    This class is used to define how to load a specific kind of Kubernetes object.
+    It does not load the objects itself, but is used by the `KubeAPIWorkloadLoader` to load objects.
+    """
+
+    kind: KindLiteral
+
+    def __init__(self, api_client: Optional[ApiClient], executor: ThreadPoolExecutor) -> None:
+        self.executor = executor
+        self.api_client = api_client
+        self.apps = client.AppsV1Api(api_client=self.api_client)
+        self.custom_objects = client.CustomObjectsApi(api_client=self.api_client)
+        self.batch = client.BatchV1Api(api_client=self.api_client)
+        self.core = client.CoreV1Api(api_client=self.api_client)
+
+    @abc.abstractmethod
+    def all_namespaces_request(self, label_selector: str) -> Any:
+        pass
+
+    async def all_namespaces_request_async(self, label_selector: str) -> Any:
+        """Default async implementation executes the request in a thread pool."""
+
+        loop = asyncio.get_running_loop()
+        return await loop.run_in_executor(
+            self.executor,
+            lambda: self.all_namespaces_request(
+                label_selector=label_selector,
+            ),
+        )
+
+    @abc.abstractmethod
+    def namespaced_request(self, namespace: str, label_selector: str) -> Any:
+        pass
+
+    async def namespaced_request_async(self, namespace: str, label_selector: str) -> Any:
+        loop = asyncio.get_running_loop()
+        return await loop.run_in_executor(
+            self.executor,
+            lambda: self.namespaced_request(
+                namespace=namespace,
+                label_selector=label_selector,
+            ),
+        )
+
+    async def extract_containers(self, item: Any) -> Iterable[V1Container]:
+        return item.spec.template.spec.containers
+
+    def filter(self, item: Any) -> bool:
+        return True
+
+    async def list_pods(self, object: K8sWorkload) -> list[PodData]:
+        loop = asyncio.get_running_loop()
+
+        if object.selector is None:
+            return []
+
+        selector = self._build_selector_query(object.selector)
+        if selector is None:
+            return []
+
+        ret: V1PodList = await loop.run_in_executor(
+            self.executor,
+            lambda: self.core.list_namespaced_pod(
+                namespace=object._api_resource.metadata.namespace, label_selector=selector
+            ),
+        )
+
+        return [PodData(name=pod.metadata.name, deleted=False) for pod in ret.items]
+
+    @classmethod
+    def _get_match_expression_filter(cls, expression: Any) -> str:
+        if expression.operator.lower() == "exists":
+            return expression.key
+        elif expression.operator.lower() == "doesnotexist":
+            return f"!{expression.key}"
+
+        values = ",".join(expression.values)
+        return f"{expression.key} {expression.operator} ({values})"
+
+    @classmethod
+    def _build_selector_query(cls, selector: Any) -> Union[str, None]:
+        label_filters = []
+
+        if selector.match_labels is not None:
+            label_filters += [f"{label[0]}={label[1]}" for label in selector.match_labels.items()]
+
+        if selector.match_expressions is not None:
+            label_filters += [
+                cls._get_match_expression_filter(expression) for expression in selector.match_expressions
+            ]
+
+        if label_filters == []:
+            # NOTE: This might mean that we have DeploymentConfig,
+            # which uses ReplicationController and it has a dict like matchLabels
+            if len(selector) != 0:
+                label_filters += [f"{label[0]}={label[1]}" for label in selector.items()]
+            else:
+                return None
+
+        return ",".join(label_filters)
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/cronjobs.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/cronjobs.py
new file mode 100644
index 00000000..d999c650
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/cronjobs.py
@@ -0,0 +1,68 @@
+import asyncio
+from collections import defaultdict
+import logging
+from typing import Any, Iterable
+
+from kubernetes.client.models import V1Container, V1Job, V1PodList  # type: ignore
+
+from robusta_krr.core.models.objects import K8sWorkload, PodData
+
+from .base import BaseKindLoader
+
+logger = logging.getLogger("krr")
+
+
+class CronJobLoader(BaseKindLoader):
+    kind = "CronJob"
+
+    def __init__(self, *args, **kwargs) -> None:
+        super().__init__(*args, **kwargs)
+
+        self._jobs: dict[str, list[V1Job]] = {}
+        self._jobs_loading_locks: defaultdict[str, asyncio.Lock] = defaultdict(asyncio.Lock)
+
+    def all_namespaces_request(self, label_selector: str) -> Any:
+        return self.batch.list_cron_job_for_all_namespaces(label_selector=label_selector, watch=False)
+
+    def namespaced_request(self, namespace: str, label_selector: str) -> Any:
+        return self.batch.list_namespaced_cron_job(namespace=namespace, label_selector=label_selector, watch=False)
+
+    async def extract_containers(self, item: Any) -> Iterable[V1Container]:
+        return item.spec.job_template.spec.template.spec.containers
+
+    async def list_pods(self, object: K8sWorkload) -> list[PodData]:
+        loop = asyncio.get_running_loop()
+
+        namespace_jobs = await self._list_jobs(object.namespace)
+        ownered_jobs_uids = [
+            job.metadata.uid
+            for job in namespace_jobs
+            if any(
+                owner.kind == "CronJob" and owner.uid == object._api_resource.metadata.uid
+                for owner in job.metadata.owner_references or []
+            )
+        ]
+        selector = f"batch.kubernetes.io/controller-uid in ({','.join(ownered_jobs_uids)})"
+
+        ret: V1PodList = await loop.run_in_executor(
+            self.executor,
+            lambda: self.core.list_namespaced_pod(
+                namespace=object._api_resource.metadata.namespace, label_selector=selector
+            ),
+        )
+
+        return [PodData(name=pod.metadata.name, deleted=False) for pod in ret.items]
+
+    async def _list_jobs(self, namespace: str) -> list[V1Job]:
+        if namespace not in self._jobs:
+            loop = asyncio.get_running_loop()
+
+            async with self._jobs_loading_locks[namespace]:
+                logging.debug(f"Loading jobs for cronjobs in {namespace}")
+                ret = await loop.run_in_executor(
+                    self.executor,
+                    lambda: self.batch.list_namespaced_job(namespace=namespace),
+                )
+                self._jobs[namespace] = ret.items
+
+        return self._jobs[namespace]
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/daemonsets.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/daemonsets.py
new file mode 100644
index 00000000..1005bed2
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/daemonsets.py
@@ -0,0 +1,13 @@
+from typing import Any
+
+from .base import BaseKindLoader
+
+
+class DaemonSetLoader(BaseKindLoader):
+    kind = "DaemonSet"
+
+    def all_namespaces_request(self, label_selector: str) -> Any:
+        return self.apps.list_daemon_set_for_all_namespaces(label_selector=label_selector, watch=False)
+
+    def namespaced_request(self, namespace: str, label_selector: str) -> Any:
+        return self.apps.list_namespaced_daemon_set(namespace=namespace, label_selector=label_selector, watch=False)
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deploymentconfigs.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deploymentconfigs.py
new file mode 100644
index 00000000..33b64d95
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deploymentconfigs.py
@@ -0,0 +1,38 @@
+import logging
+from typing import Any
+
+from robusta_krr.utils.object_like_dict import ObjectLikeDict
+
+from .base import BaseKindLoader
+
+logger = logging.getLogger("krr")
+
+
+class DeploymentConfigLoader(BaseKindLoader):
+    kind = "DeploymentConfig"
+
+    # NOTE: Using custom objects API returns dicts, but all other APIs return objects
+    # We need to handle this difference using a small wrapper
+
+    def all_namespaces_request(self, label_selector: str) -> Any:
+        return ObjectLikeDict(
+            self.custom_objects.list_cluster_custom_object(
+                group="apps.openshift.io",
+                version="v1",
+                plural="deploymentconfigs",
+                label_selector=label_selector,
+                watch=False,
+            )
+        )
+
+    def namespaced_request(self, namespace: str, label_selector: str) -> Any:
+        return ObjectLikeDict(
+            self.custom_objects.list_namespaced_custom_object(
+                group="apps.openshift.io",
+                version="v1",
+                plural="deploymentconfigs",
+                namespace=namespace,
+                label_selector=label_selector,
+                watch=False,
+            )
+        )
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deployments.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deployments.py
new file mode 100644
index 00000000..fc202b57
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deployments.py
@@ -0,0 +1,13 @@
+from typing import Any
+
+from .base import BaseKindLoader
+
+
+class DeploymentLoader(BaseKindLoader):
+    kind = "Deployment"
+
+    def all_namespaces_request(self, label_selector: str) -> Any:
+        return self.apps.list_deployment_for_all_namespaces(label_selector=label_selector, watch=False)
+
+    def namespaced_request(self, namespace: str, label_selector: str) -> Any:
+        return self.apps.list_namespaced_deployment(namespace=namespace, label_selector=label_selector, watch=False)
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/jobs.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/jobs.py
new file mode 100644
index 00000000..87ce5a77
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/jobs.py
@@ -0,0 +1,18 @@
+from typing import Any
+
+from .base import BaseKindLoader
+
+
+class JobLoader(BaseKindLoader):
+    kind = "Job"
+
+    def all_namespaces_request(self, label_selector: str) -> Any:
+        return self.batch.list_job_for_all_namespaces(label_selector=label_selector, watch=False)
+
+    def namespaced_request(self, namespace: str, label_selector: str) -> Any:
+        return self.batch.list_namespaced_job(namespace=namespace, label_selector=label_selector, watch=False)
+
+    def filter(self, item: Any) -> bool:
+        # NOTE: If the job has ownerReference and it is a CronJob,
+        # then we should skip it, as it is a part of the CronJob
+        return not any(owner.kind == "CronJob" for owner in item.metadata.owner_references or [])
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/rollouts.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/rollouts.py
new file mode 100644
index 00000000..0148745a
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/rollouts.py
@@ -0,0 +1,61 @@
+import asyncio
+import logging
+from typing import Any, Iterable
+
+from kubernetes.client.models import V1Container  # type: ignore
+
+from robusta_krr.utils.object_like_dict import ObjectLikeDict
+
+from .base import BaseKindLoader
+
+logger = logging.getLogger("krr")
+
+
+class RolloutLoader(BaseKindLoader):
+    kind = "Rollout"
+
+    # NOTE: Using custom objects API returns dicts, but all other APIs return objects
+    # We need to handle this difference using a small wrapper
+
+    def all_namespaces_request(self, label_selector: str) -> Any:
+        return ObjectLikeDict(
+            self.custom_objects.list_cluster_custom_object(
+                group="argoproj.io",
+                version="v1alpha1",
+                plural="rollouts",
+                label_selector=label_selector,
+                watch=False,
+            )
+        )
+
+    def namespaced_request(self, namespace: str, label_selector: str) -> Any:
+        return ObjectLikeDict(
+            self.custom_objects.list_namespaced_custom_object(
+                group="argoproj.io",
+                version="v1alpha1",
+                plural="rollouts",
+                namespace=namespace,
+                label_selector=label_selector,
+                watch=False,
+            )
+        )
+
+    async def extract_containers(self, item: Any) -> Iterable[V1Container]:
+        if item.spec.template is not None:
+            return item.spec.template.spec.containers
+
+        logging.debug(
+            f"Rollout has workloadRef, fetching template for {item.metadata.name} in {item.metadata.namespace}"
+        )
+
+        # Template can be None and object might have workloadRef
+        workloadRef = item.spec.workloadRef
+        if workloadRef is not None:
+            loop = asyncio.get_running_loop()
+            ret = await loop.run_in_executor(
+                self.executor,
+                lambda: self.apps.read_namespaced_deployment(namespace=item.metadata.namespace, name=workloadRef.name),
+            )
+            return ret.spec.template.spec.containers
+
+        return []
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/statefulsets.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/statefulsets.py
new file mode 100644
index 00000000..069f2c6b
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/statefulsets.py
@@ -0,0 +1,13 @@
+from typing import Any
+
+from .base import BaseKindLoader
+
+
+class StatefulSetLoader(BaseKindLoader):
+    kind = "StatefulSet"
+
+    def all_namespaces_request(self, label_selector: str) -> Any:
+        return self.apps.list_stateful_set_for_all_namespaces(label_selector=label_selector, watch=False)
+
+    def namespaced_request(self, namespace: str, label_selector: str) -> Any:
+        return self.apps.list_namespaced_stateful_set(namespace=namespace, label_selector=label_selector, watch=False)
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus.py
new file mode 100644
index 00000000..d2a98831
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus.py
@@ -0,0 +1,10 @@
+import logging
+from .base import BaseWorkloadLoader
+
+
+logger = logging.getLogger("krr")
+
+
+class PrometheusWorkloadLoader(BaseWorkloadLoader):
+    # TODO: Implement PrometheusWorkloadLoader
+    pass
diff --git a/robusta_krr/core/integrations/prometheus/loader.py b/robusta_krr/core/integrations/prometheus/loader.py
index db493927..c449bca2 100644
--- a/robusta_krr/core/integrations/prometheus/loader.py
+++ b/robusta_krr/core/integrations/prometheus/loader.py
@@ -11,7 +11,7 @@
 from prometrix import MetricsNotFound, PrometheusNotFound
 
 from robusta_krr.core.models.config import settings
-from robusta_krr.core.models.objects import K8sObjectData, PodData
+from robusta_krr.core.models.objects import K8sWorkload, PodData
 
 from .metrics_service.prometheus_metrics_service import PrometheusMetricsService
 from .metrics_service.thanos_metrics_service import ThanosMetricsService
@@ -82,7 +82,7 @@ async def get_history_range(
     ) -> Optional[tuple[datetime.datetime, datetime.datetime]]:
         return await self.loader.get_history_range(history_duration)
 
-    async def load_pods(self, object: K8sObjectData, period: datetime.timedelta) -> list[PodData]:
+    async def load_pods(self, object: K8sWorkload, period: datetime.timedelta) -> list[PodData]:
         try:
             return await self.loader.load_pods(object, period)
         except Exception as e:
@@ -91,7 +91,7 @@ async def load_pods(self, object: K8sObjectData, period: datetime.timedelta) ->
 
     async def gather_data(
         self,
-        object: K8sObjectData,
+        object: K8sWorkload,
         strategy: BaseStrategy,
         period: datetime.timedelta,
         *,
diff --git a/robusta_krr/core/integrations/prometheus/metrics/base.py b/robusta_krr/core/integrations/prometheus/metrics/base.py
index f4265e22..d55af004 100644
--- a/robusta_krr/core/integrations/prometheus/metrics/base.py
+++ b/robusta_krr/core/integrations/prometheus/metrics/base.py
@@ -15,7 +15,7 @@
 from robusta_krr.core.abstract.metrics import BaseMetric
 from robusta_krr.core.abstract.strategies import PodsTimeData
 from robusta_krr.core.models.config import settings
-from robusta_krr.core.models.objects import K8sObjectData
+from robusta_krr.core.models.objects import K8sWorkload
 
 
 class PrometheusSeries(TypedDict):
@@ -86,7 +86,7 @@ def get_prometheus_cluster_label(self) -> str:
         return f', {settings.prometheus_label}="{settings.prometheus_cluster_label}"'
 
     @abc.abstractmethod
-    def get_query(self, object: K8sObjectData, duration: str, step: str) -> str:
+    def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         """
         This method should be implemented by all subclasses to provide a query string to fetch metrics.
 
@@ -148,7 +148,7 @@ async def query_prometheus(self, data: PrometheusMetricData) -> list[PrometheusS
         return await loop.run_in_executor(self.executor, lambda: self._query_prometheus_sync(data))
 
     async def load_data(
-        self, object: K8sObjectData, period: datetime.timedelta, step: datetime.timedelta
+        self, object: K8sWorkload, period: datetime.timedelta, step: datetime.timedelta
     ) -> PodsTimeData:
         """
         Asynchronous method that loads metric data for a specific object.
diff --git a/robusta_krr/core/integrations/prometheus/metrics/cpu.py b/robusta_krr/core/integrations/prometheus/metrics/cpu.py
index c7a2c733..72576545 100644
--- a/robusta_krr/core/integrations/prometheus/metrics/cpu.py
+++ b/robusta_krr/core/integrations/prometheus/metrics/cpu.py
@@ -1,4 +1,4 @@
-from robusta_krr.core.models.objects import K8sObjectData
+from robusta_krr.core.models.objects import K8sWorkload
 
 from .base import PrometheusMetric, QueryType
 
@@ -10,7 +10,7 @@ class CPULoader(PrometheusMetric):
 
     query_type: QueryType = QueryType.QueryRange
 
-    def get_query(self, object: K8sObjectData, duration: str, step: str) -> str:
+    def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
         cluster_label = self.get_prometheus_cluster_label()
         return f"""
@@ -36,7 +36,7 @@ def PercentileCPULoader(percentile: float) -> type[PrometheusMetric]:
         raise ValueError("percentile must be between 0 and 100")
 
     class PercentileCPULoader(PrometheusMetric):
-        def get_query(self, object: K8sObjectData, duration: str, step: str) -> str:
+        def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
             pods_selector = "|".join(pod.name for pod in object.pods)
             cluster_label = self.get_prometheus_cluster_label()
             return f"""
@@ -64,7 +64,7 @@ class CPUAmountLoader(PrometheusMetric):
     A metric loader for loading CPU points count.
     """
 
-    def get_query(self, object: K8sObjectData, duration: str, step: str) -> str:
+    def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
         cluster_label = self.get_prometheus_cluster_label()
         return f"""
diff --git a/robusta_krr/core/integrations/prometheus/metrics/memory.py b/robusta_krr/core/integrations/prometheus/metrics/memory.py
index 85031bc1..ca324f6f 100644
--- a/robusta_krr/core/integrations/prometheus/metrics/memory.py
+++ b/robusta_krr/core/integrations/prometheus/metrics/memory.py
@@ -1,4 +1,4 @@
-from robusta_krr.core.models.objects import K8sObjectData
+from robusta_krr.core.models.objects import K8sWorkload
 
 from .base import PrometheusMetric, QueryType
 
@@ -10,7 +10,7 @@ class MemoryLoader(PrometheusMetric):
 
     query_type: QueryType = QueryType.QueryRange
 
-    def get_query(self, object: K8sObjectData, duration: str, step: str) -> str:
+    def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
         cluster_label = self.get_prometheus_cluster_label()
         return f"""
@@ -30,7 +30,7 @@ class MaxMemoryLoader(PrometheusMetric):
     A metric loader for loading max memory usage metrics.
     """
 
-    def get_query(self, object: K8sObjectData, duration: str, step: str) -> str:
+    def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
         cluster_label = self.get_prometheus_cluster_label()
         return f"""
@@ -53,7 +53,7 @@ class MemoryAmountLoader(PrometheusMetric):
     A metric loader for loading memory points count.
     """
 
-    def get_query(self, object: K8sObjectData, duration: str, step: str) -> str:
+    def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
         cluster_label = self.get_prometheus_cluster_label()
         return f"""
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/base_metric_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/base_metric_service.py
index a3b0ee0f..ae34a7a3 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/base_metric_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/base_metric_service.py
@@ -7,7 +7,7 @@
 
 from robusta_krr.core.abstract.strategies import PodsTimeData
 from robusta_krr.core.models.config import settings
-from robusta_krr.core.models.objects import K8sObjectData
+from robusta_krr.core.models.objects import K8sWorkload
 
 from ..metrics import PrometheusMetric
 
@@ -39,7 +39,7 @@ def get_cluster_names(self) -> Optional[List[str]]:
     @abc.abstractmethod
     async def gather_data(
         self,
-        object: K8sObjectData,
+        object: K8sWorkload,
         LoaderClass: type[PrometheusMetric],
         period: datetime.timedelta,
         step: datetime.timedelta = datetime.timedelta(minutes=30),
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
index 423a29ad..5347422d 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
@@ -11,7 +11,7 @@
 from robusta_krr.core.abstract.strategies import PodsTimeData
 from robusta_krr.core.integrations import openshift
 from robusta_krr.core.models.config import settings
-from robusta_krr.core.models.objects import K8sObjectData, PodData
+from robusta_krr.core.models.objects import K8sWorkload, PodData
 from robusta_krr.utils.batched import batched
 from robusta_krr.utils.service_discovery import MetricsServiceDiscovery
 
@@ -177,7 +177,7 @@ async def get_history_range(self, history_duration: timedelta) -> tuple[datetime
 
     async def gather_data(
         self,
-        object: K8sObjectData,
+        object: K8sWorkload,
         LoaderClass: type[PrometheusMetric],
         period: timedelta,
         step: timedelta = timedelta(minutes=30),
@@ -202,7 +202,7 @@ async def gather_data(
 
         return data
 
-    async def load_pods(self, object: K8sObjectData, period: timedelta) -> list[PodData]:
+    async def load_pods(self, object: K8sWorkload, period: timedelta) -> list[PodData]:
         """
         List pods related to the object and add them to the object's pods list.
         Args:
diff --git a/robusta_krr/core/models/config.py b/robusta_krr/core/models/config.py
index ff6142a6..6e039675 100644
--- a/robusta_krr/core/models/config.py
+++ b/robusta_krr/core/models/config.py
@@ -23,6 +23,7 @@ class Config(pd.BaseSettings):
 
     clusters: Union[list[str], Literal["*"], None] = None
     kubeconfig: Optional[str] = None
+    workload_loader: Literal["kubeapi", "prometheus"] = pd.Field("kubeapi")
     impersonate_user: Optional[str] = None
     impersonate_group: Optional[str] = None
     namespaces: Union[list[str], Literal["*"]] = pd.Field("*")
diff --git a/robusta_krr/core/models/objects.py b/robusta_krr/core/models/objects.py
index e4b400d9..5dac1231 100644
--- a/robusta_krr/core/models/objects.py
+++ b/robusta_krr/core/models/objects.py
@@ -35,7 +35,7 @@ class HPAData(pd.BaseModel):
 ]
 
 
-class K8sObjectData(pd.BaseModel):
+class K8sWorkload(pd.BaseModel):
     # NOTE: Here None means that we are running inside the cluster
     cluster: Optional[str]
     name: str
@@ -80,7 +80,7 @@ def selector(self) -> V1LabelSelector:
         else:
             return self._api_resource.spec.selector
 
-    def split_into_batches(self, n: int) -> list[K8sObjectData]:
+    def split_into_batches(self, n: int) -> list[K8sWorkload]:
         """
         Batch this object into n objects, splitting the pods into batches of size n.
         """
@@ -89,7 +89,7 @@ def split_into_batches(self, n: int) -> list[K8sObjectData]:
             return [self]
 
         return [
-            K8sObjectData(
+            K8sWorkload(
                 cluster=self.cluster,
                 name=self.name,
                 container=self.container,
diff --git a/robusta_krr/core/models/result.py b/robusta_krr/core/models/result.py
index 2d5ffbc9..1735125d 100644
--- a/robusta_krr/core/models/result.py
+++ b/robusta_krr/core/models/result.py
@@ -6,7 +6,7 @@
 
 from robusta_krr.core.abstract import formatters
 from robusta_krr.core.models.allocations import RecommendationValue, ResourceAllocations, ResourceType
-from robusta_krr.core.models.objects import K8sObjectData
+from robusta_krr.core.models.objects import K8sWorkload
 from robusta_krr.core.models.severity import Severity
 
 
@@ -22,12 +22,12 @@ class ResourceRecommendation(pd.BaseModel):
 
 
 class ResourceScan(pd.BaseModel):
-    object: K8sObjectData
+    object: K8sWorkload
     recommended: ResourceRecommendation
     severity: Severity
 
     @classmethod
-    def calculate(cls, object: K8sObjectData, recommendation: ResourceAllocations) -> ResourceScan:
+    def calculate(cls, object: K8sWorkload, recommendation: ResourceAllocations) -> ResourceScan:
         recommendation_processed = ResourceRecommendation(requests={}, limits={}, info={})
 
         for resource_type in ResourceType:
diff --git a/robusta_krr/core/runner.py b/robusta_krr/core/runner.py
index 8e08521c..de3b3c78 100644
--- a/robusta_krr/core/runner.py
+++ b/robusta_krr/core/runner.py
@@ -12,10 +12,10 @@
 from slack_sdk import WebClient
 
 from robusta_krr.core.abstract.strategies import ResourceRecommendation, RunResult
-from robusta_krr.core.integrations.kubernetes import KubernetesLoader
+from robusta_krr.core.integrations.kubernetes import ClusterWorkloadsLoader
 from robusta_krr.core.integrations.prometheus import ClusterNotSpecifiedException, PrometheusMetricsLoader
 from robusta_krr.core.models.config import settings
-from robusta_krr.core.models.objects import K8sObjectData
+from robusta_krr.core.models.objects import K8sWorkload
 from robusta_krr.core.models.result import ResourceAllocations, ResourceScan, ResourceType, Result, StrategyData
 from robusta_krr.utils.intro import load_intro_message
 from robusta_krr.utils.progress_bar import ProgressBar
@@ -40,7 +40,7 @@ class Runner:
     EXPECTED_EXCEPTIONS = (KeyboardInterrupt, PrometheusNotFound)
 
     def __init__(self) -> None:
-        self._k8s_loader = KubernetesLoader()
+        self._k8s_loader = ClusterWorkloadsLoader()
         self._metrics_service_loaders: dict[Optional[str], Union[PrometheusMetricsLoader, Exception]] = {}
         self._metrics_service_loaders_error_logged: set[Exception] = set()
         self._strategy = settings.create_strategy()
@@ -165,7 +165,7 @@ def _format_result(self, result: RunResult) -> RunResult:
             for resource, recommendation in result.items()
         }
 
-    async def _calculate_object_recommendations(self, object: K8sObjectData) -> Optional[RunResult]:
+    async def _calculate_object_recommendations(self, object: K8sWorkload) -> Optional[RunResult]:
         prometheus_loader = self._get_prometheus_loader(object.cluster)
 
         if prometheus_loader is None:
@@ -239,7 +239,7 @@ async def _check_data_availability(self, cluster: Optional[str]) -> None:
                 }
             )
 
-    async def _gather_object_allocations(self, k8s_object: K8sObjectData) -> Optional[ResourceScan]:
+    async def _gather_object_allocations(self, k8s_object: K8sWorkload) -> Optional[ResourceScan]:
         recommendation = await self._calculate_object_recommendations(k8s_object)
 
         self.__progressbar.progress()
@@ -275,7 +275,7 @@ async def _collect_result(self) -> Result:
             await asyncio.gather(*[self._check_data_availability(cluster) for cluster in clusters])
 
         with ProgressBar(title="Calculating Recommendation") as self.__progressbar:
-            workloads = await self._k8s_loader.list_scannable_objects(clusters)
+            workloads = await self._k8s_loader.list_workloads(clusters)
             scans = await asyncio.gather(*[self._gather_object_allocations(k8s_object) for k8s_object in workloads])
 
         successful_scans = [scan for scan in scans if scan is not None]
diff --git a/robusta_krr/strategies/simple.py b/robusta_krr/strategies/simple.py
index 64e58ac5..db15f6c9 100644
--- a/robusta_krr/strategies/simple.py
+++ b/robusta_krr/strategies/simple.py
@@ -5,7 +5,7 @@
 
 from robusta_krr.core.abstract.strategies import (
     BaseStrategy,
-    K8sObjectData,
+    K8sWorkload,
     MetricsPodData,
     PodsTimeData,
     ResourceRecommendation,
@@ -78,7 +78,7 @@ def metrics(self) -> list[type[PrometheusMetric]]:
         return [PercentileCPULoader(self.settings.cpu_percentile), MaxMemoryLoader, CPUAmountLoader, MemoryAmountLoader]
 
     def __calculate_cpu_proposal(
-        self, history_data: MetricsPodData, object_data: K8sObjectData
+        self, history_data: MetricsPodData, object_data: K8sWorkload
     ) -> ResourceRecommendation:
         data = history_data["PercentileCPULoader"]
 
@@ -98,7 +98,7 @@ def __calculate_cpu_proposal(
         return ResourceRecommendation(request=cpu_usage, limit=None)
 
     def __calculate_memory_proposal(
-        self, history_data: MetricsPodData, object_data: K8sObjectData
+        self, history_data: MetricsPodData, object_data: K8sWorkload
     ) -> ResourceRecommendation:
         data = history_data["MaxMemoryLoader"]
 
@@ -117,7 +117,7 @@ def __calculate_memory_proposal(
         memory_usage = self.settings.calculate_memory_proposal(data)
         return ResourceRecommendation(request=memory_usage, limit=memory_usage)
 
-    def run(self, history_data: MetricsPodData, object_data: K8sObjectData) -> RunResult:
+    def run(self, history_data: MetricsPodData, object_data: K8sWorkload) -> RunResult:
         return {
             ResourceType.CPU: self.__calculate_cpu_proposal(history_data, object_data),
             ResourceType.Memory: self.__calculate_memory_proposal(history_data, object_data),
diff --git a/tests/conftest.py b/tests/conftest.py
index b1d8d228..2bc98070 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -5,10 +5,10 @@
 import numpy as np
 import pytest
 
-from robusta_krr.api.models import K8sObjectData, PodData, ResourceAllocations
+from robusta_krr.api.models import K8sWorkload, PodData, ResourceAllocations
 from robusta_krr.strategies.simple import SimpleStrategy, SimpleStrategySettings
 
-TEST_OBJECT = K8sObjectData(
+TEST_OBJECT = K8sWorkload(
     cluster="mock-cluster",
     name="mock-object-1",
     container="mock-container-1",

From c7ad1cde09e79d4821383ceb5dd32fd0471d427d Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Mon, 22 Apr 2024 18:30:02 +0300
Subject: [PATCH 02/24] Moved the logic from #93 for a new refined structure

Co-authored-by: Megrez Lu <lujiajing1126@gmail.com>
---
 .../core/integrations/kubernetes/__init__.py  |  47 ++++++-
 .../kubernetes/workload_loader/base.py        |   5 +-
 .../workload_loader/kube_api/__init__.py      |   9 +-
 .../workload_loader/kube_api/loaders/base.py  |  15 +--
 .../kubernetes/workload_loader/prometheus.py  |  10 --
 .../workload_loader/prometheus/__init__.py    |  31 +++++
 .../prometheus/loaders/__init__.py            |  19 +++
 .../prometheus/loaders/base.py                | 126 ++++++++++++++++++
 .../prometheus/loaders/deployments.py         |  50 +++++++
 .../core/integrations/prometheus/loader.py    |   4 +-
 robusta_krr/core/runner.py                    |  70 ++++------
 robusta_krr/main.py                           |   7 +
 12 files changed, 309 insertions(+), 84 deletions(-)
 delete mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/prometheus.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/__init__.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/deployments.py

diff --git a/robusta_krr/core/integrations/kubernetes/__init__.py b/robusta_krr/core/integrations/kubernetes/__init__.py
index 051cc232..2ff44585 100644
--- a/robusta_krr/core/integrations/kubernetes/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/__init__.py
@@ -17,10 +17,12 @@
     V2HorizontalPodAutoscaler,
 )
 
+from robusta_krr.core.integrations.prometheus.loader import PrometheusMetricsLoader
 from robusta_krr.core.models.config import settings
 from robusta_krr.core.models.objects import HPAData, K8sWorkload, KindLiteral, PodData
 from robusta_krr.core.models.result import ResourceAllocations
 from robusta_krr.utils.object_like_dict import ObjectLikeDict
+from prometrix import PrometheusNotFound
 
 from . import config_patch as _
 from .workload_loader import BaseWorkloadLoader, KubeAPIWorkloadLoader, PrometheusWorkloadLoader
@@ -31,7 +33,13 @@
 HPAKey = tuple[str, str, str]
 
 
-class ClusterWorkloadsLoader:
+class ClusterConnector:
+    EXPECTED_EXCEPTIONS = (KeyboardInterrupt, PrometheusNotFound)
+
+    def __init__(self) -> None:
+        self._metrics_service_loaders: dict[Optional[str], Union[PrometheusMetricsLoader, Exception]] = {}
+        self._metrics_service_loaders_error_logged: set[Exception] = set()
+
     async def list_clusters(self) -> Optional[list[str]]:
         """List all clusters.
 
@@ -71,15 +79,44 @@ async def list_clusters(self) -> Optional[list[str]]:
             return [context["name"] for context in contexts]
 
         return [context["name"] for context in contexts if context["name"] in settings.clusters]
+    
+    def get_prometheus_loader(self, cluster: Optional[str]) -> Optional[PrometheusMetricsLoader]:
+        if cluster not in self._metrics_service_loaders:
+            try:
+                self._metrics_service_loaders[cluster] = PrometheusMetricsLoader(cluster=cluster)
+            except Exception as e:
+                self._metrics_service_loaders[cluster] = e
+
+        result = self._metrics_service_loaders[cluster]
+        if isinstance(result, self.EXPECTED_EXCEPTIONS):
+            if result not in self._metrics_service_loaders_error_logged:
+                self._metrics_service_loaders_error_logged.add(result)
+                logger.error(str(result))
+            return None
+        elif isinstance(result, Exception):
+            raise result
 
-    def _try_create_cluster_loader(self, cluster: Optional[str]) -> Optional[BaseWorkloadLoader]:
-        WorkloadLoader = KubeAPIWorkloadLoader if settings.workload_loader == "kubeapi" else PrometheusWorkloadLoader
+        return result
 
+    def _try_create_cluster_loader(self, cluster: Optional[str]) -> Optional[BaseWorkloadLoader]:
         try:
-            return WorkloadLoader(cluster=cluster)
+            if settings.workload_loader == "kubeapi":
+                return KubeAPIWorkloadLoader(cluster=cluster)
+            elif settings.workload_loader == "prometheus":
+                cluster_loader = self.get_prometheus_loader(cluster)
+                if cluster_loader is not None:
+                    return PrometheusWorkloadLoader(cluster=cluster, metric_loader=cluster_loader)
+                else:
+                    logger.error(
+                        f"Could not load Prometheus for cluster {cluster} and will skip it." 
+                        "Not possible to load workloads through Prometheus without connection to Prometheus."
+                    )
+            else:
+                raise NotImplementedError(f"Workload loader {settings.workload_loader} is not implemented")
         except Exception as e:
             logger.error(f"Could not load cluster {cluster} and will skip it: {e}")
-            return None
+
+        return None
 
     async def list_workloads(self, clusters: Optional[list[str]]) -> list[K8sWorkload]:
         """List all scannable objects.
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
index a7bba214..8581c1a6 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
@@ -4,11 +4,8 @@
 
 
 class BaseWorkloadLoader(abc.ABC):
-    def __init__(self, cluster: Optional[str] = None) -> None:
-        self.cluster = cluster
-
     @abc.abstractmethod
-    async def list_workloads(self, clusters: Optional[list[str]]) -> list[K8sWorkload]:
+    async def list_workloads(self) -> list[K8sWorkload]:
         pass
 
     @abc.abstractmethod
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
index 8586b77a..d23f7a46 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
@@ -11,7 +11,6 @@
 from robusta_krr.core.models.config import settings
 from robusta_krr.core.models.objects import HPAData, K8sWorkload, KindLiteral, PodData
 from robusta_krr.core.models.result import ResourceAllocations
-from robusta_krr.utils.object_like_dict import ObjectLikeDict
 
 from ..base import BaseWorkloadLoader
 from .loaders import (
@@ -41,8 +40,8 @@ class KubeAPIWorkloadLoader(BaseWorkloadLoader):
         CronJobLoader,
     ]
 
-    def __init__(self, cluster: Optional[str] = None):
-        super().__init__(cluster)
+    def __init__(self, cluster: Optional[str] = None) -> None:
+        self.cluster = cluster
 
         # This executor will be running requests to Kubernetes API
         self.executor = ThreadPoolExecutor(settings.max_workers)
@@ -88,7 +87,7 @@ async def list_workloads(self) -> list[K8sWorkload]:
     async def list_pods(self, object: K8sWorkload) -> list[PodData]:
         return await self._workload_loaders[object.kind].list_pods(object)
 
-    def __build_scannable_object(self, item: Any, container: V1Container, kind: Optional[str] = None) -> K8sWorkload:
+    def _build_scannable_object(self, item: Any, container: V1Container, kind: Optional[str] = None) -> K8sWorkload:
         name = item.metadata.name
         namespace = item.metadata.namespace
         kind = kind or item.__class__.__name__[2:]
@@ -160,7 +159,7 @@ async def _fetch_workload(self, loader: BaseKindLoader) -> list[K8sWorkload]:
                 if asyncio.iscoroutine(containers):
                     containers = await containers
 
-                result.extend(self.__build_scannable_object(item, container, kind) for container in containers)
+                result.extend(self._build_scannable_object(item, container, kind) for container in containers)
         except ApiException as e:
             if kind in ("Rollout", "DeploymentConfig") and e.status in [400, 401, 403, 404]:
                 if self._kind_available[kind]:
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/base.py
index 0c14e89f..a6a552e6 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/base.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/base.py
@@ -6,21 +6,12 @@
 
 from kubernetes import client  # type: ignore
 from kubernetes.client.api_client import ApiClient  # type: ignore
-from kubernetes.client.models import (  # type: ignore
-    V1Container,
-    V1DaemonSet,
-    V1Deployment,
-    V1Job,
-    V1Pod,
-    V1PodList,
-    V1StatefulSet,
-)
+from kubernetes.client.models import V1Container, V1PodList  # type: ignore
 
 from robusta_krr.core.models.objects import K8sWorkload, KindLiteral, PodData
 
 logger = logging.getLogger("krr")
 
-AnyKubernetesAPIObject = Union[V1Deployment, V1DaemonSet, V1StatefulSet, V1Pod, V1Job]
 HPAKey = tuple[str, str, str]
 
 
@@ -112,9 +103,7 @@ def _build_selector_query(cls, selector: Any) -> Union[str, None]:
             label_filters += [f"{label[0]}={label[1]}" for label in selector.match_labels.items()]
 
         if selector.match_expressions is not None:
-            label_filters += [
-                cls._get_match_expression_filter(expression) for expression in selector.match_expressions
-            ]
+            label_filters += [cls._get_match_expression_filter(expression) for expression in selector.match_expressions]
 
         if label_filters == []:
             # NOTE: This might mean that we have DeploymentConfig,
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus.py
deleted file mode 100644
index d2a98831..00000000
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus.py
+++ /dev/null
@@ -1,10 +0,0 @@
-import logging
-from .base import BaseWorkloadLoader
-
-
-logger = logging.getLogger("krr")
-
-
-class PrometheusWorkloadLoader(BaseWorkloadLoader):
-    # TODO: Implement PrometheusWorkloadLoader
-    pass
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
new file mode 100644
index 00000000..b277bc28
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
@@ -0,0 +1,31 @@
+import asyncio
+import itertools
+import logging
+
+
+from robusta_krr.core.integrations.prometheus.loader import PrometheusMetricsLoader
+from robusta_krr.core.models.config import settings
+from robusta_krr.core.integrations.prometheus.metrics_service.prometheus_metrics_service import PrometheusMetricsService
+from robusta_krr.core.models.objects import K8sWorkload, PodData
+from ..base import BaseWorkloadLoader
+from .loaders import BaseKindLoader, DeploymentLoader
+
+
+logger = logging.getLogger("krr")
+
+
+class PrometheusWorkloadLoader(BaseWorkloadLoader):
+    workloads: list[type[BaseKindLoader]] = [DeploymentLoader]
+
+    def __init__(self, cluster: str, metric_loader: PrometheusMetricsLoader) -> None:
+        self.cluster = cluster
+        self.metric_service = metric_loader
+        self.loaders = [loader(metric_loader) for loader in self.workloads]
+
+    async def list_workloads(self) -> list[K8sWorkload]:
+        return itertools.chain(await asyncio.gather(*[loader.list_workloads(settings.namespaces, "") for loader in self.loaders]))
+
+    async def list_pods(self, object: K8sWorkload) -> list[PodData]:
+        # This should not be implemented, as implementation will repeat PrometheusMetricsLoader.load_pods
+        # As this method is ment to be a fallback, repeating the same logic will not be beneficial
+        raise NotImplementedError
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/__init__.py
new file mode 100644
index 00000000..6ca6efd6
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/__init__.py
@@ -0,0 +1,19 @@
+from .base import BaseKindLoader
+from .cronjobs import CronJobLoader
+from .daemonsets import DaemonSetLoader
+from .deploymentconfigs import DeploymentConfigLoader
+from .deployments import DeploymentLoader
+from .jobs import JobLoader
+from .rollouts import RolloutLoader
+from .statefulsets import StatefulSetLoader
+
+__all__ = [
+    "BaseKindLoader",
+    "CronJobLoader",
+    "DeploymentLoader",
+    "DaemonSetLoader",
+    "DeploymentConfigLoader",
+    "JobLoader",
+    "RolloutLoader",
+    "StatefulSetLoader",
+]
\ No newline at end of file
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
new file mode 100644
index 00000000..a767eb2f
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
@@ -0,0 +1,126 @@
+import abc
+import asyncio
+import logging
+from concurrent.futures import ThreadPoolExecutor
+from typing import Any, Iterable, Literal, Optional, Union
+
+from kubernetes import client  # type: ignore
+from kubernetes.client.api_client import ApiClient  # type: ignore
+from kubernetes.client.models import (  # type: ignore
+    V1Container,
+    V1DaemonSet,
+    V1Deployment,
+    V1Job,
+    V1Pod,
+    V1PodList,
+    V1StatefulSet,
+)
+
+from robusta_krr.core.integrations.prometheus.loader import PrometheusMetricsLoader
+from robusta_krr.core.models.allocations import RecommendationValue, ResourceAllocations, ResourceType
+from robusta_krr.core.models.objects import K8sWorkload, KindLiteral, PodData
+
+logger = logging.getLogger("krr")
+
+AnyKubernetesAPIObject = Union[V1Deployment, V1DaemonSet, V1StatefulSet, V1Pod, V1Job]
+HPAKey = tuple[str, str, str]
+
+
+class BaseKindLoader(abc.ABC):
+    """
+    This class is used to define how to load a specific kind of Kubernetes object.
+    It does not load the objects itself, but is used by the `KubeAPIWorkloadLoader` to load objects.
+    """
+
+    kind: KindLiteral
+
+    def __init__(self, metrics_loader: PrometheusMetricsLoader) -> None:
+        self.metrics_loader = metrics_loader
+
+    @abc.abstractmethod
+    def list_workloads(self, namespaces: Union[list[str], Literal["*"]], label_selector: str) -> list[K8sWorkload]:
+        pass
+
+    async def __parse_allocation(self, namespace: str, pod_selector: str, container_name: str) -> ResourceAllocations:
+        limits = await self.metrics_loader.loader.query(
+            "avg by(resource) (kube_pod_container_resource_limits{"
+            f'namespace="{namespace}", '
+            f'pod=~"{pod_selector}", '
+            f'container="{container_name}"'
+            "})"
+        )
+        requests = await self.metrics_loader.loader.query(
+            "avg by(resource) (kube_pod_container_resource_requests{"
+            f'namespace="{namespace}", '
+            f'pod=~"{pod_selector}", '
+            f'container="{container_name}"'
+            "})"
+        )
+        requests_values: dict[ResourceType, RecommendationValue] = {ResourceType.CPU: None, ResourceType.Memory: None}
+        limits_values: dict[ResourceType, RecommendationValue] = {ResourceType.CPU: None, ResourceType.Memory: None}
+        for limit in limits:
+            if limit["metric"]["resource"] == ResourceType.CPU:
+                limits_values[ResourceType.CPU] = float(limit["value"][1])
+            elif limit["metric"]["resource"] == ResourceType.Memory:
+                limits_values[ResourceType.Memory] = float(limit["value"][1])
+
+        for request in requests:
+            if request["metric"]["resource"] == ResourceType.CPU:
+                requests_values[ResourceType.CPU] = float(request["value"][1])
+            elif request["metric"]["resource"] == ResourceType.Memory:
+                requests_values[ResourceType.Memory] = float(request["value"][1])
+        return ResourceAllocations(requests=requests_values, limits=limits_values)
+
+    async def __build_from_owner(
+        self, namespace: str, app_name: str, containers: list[str], pod_names: list[str]
+    ) -> list[K8sWorkload]:
+        return [
+            K8sWorkload(
+                cluster=None,
+                namespace=namespace,
+                name=app_name,
+                kind="Deployment",
+                container=container_name,
+                allocations=await self.__parse_allocation(namespace, "|".join(pod_names), container_name),  # find
+                pods=[PodData(name=pod_name, deleted=False) for pod_name in pod_names],  # list pods
+            )
+            for container_name in containers
+        ]
+
+    async def _list_containers(self, namespace: str, pod_selector: str) -> list[str]:
+        containers = await self.metrics_loader.loader.query(
+            f"""
+                count by (container) (
+                    kube_pod_container_info{{
+                        namespace="{namespace}",
+                        pod=~"{pod_selector}"
+                    }}
+                )
+            """
+        )
+        return [container["metric"]["container"] for container in containers]
+
+    async def _list_containers_in_pods(
+        self, app_name: str, pod_owner_kind: str, namespace: str, owner_name: str
+    ) -> list[K8sWorkload]:
+        if pod_owner_kind == "ReplicaSet":
+            # owner_name is ReplicaSet names
+            pods = await self.metrics_loader.loader.query(
+                f"""
+                    count by (owner_name, replicaset, pod) (
+                        kube_pod_owner{{
+                            namespace="{namespace}",
+                            owner_name=~"{owner_name}", '
+                            owner_kind="ReplicaSet"
+                        }}
+                    )
+                """
+            )
+            if pods is None or len(pods) == 0:
+                return []  # no container
+            # [{'metric': {'owner_name': 'wbjs-algorithm-base-565b645489', 'pod': 'wbjs-algorithm-base-565b645489-jqt4x'}, 'value': [1685529217, '1']},
+            #  {'metric': {'owner_name': 'wbjs-algorithm-base-565b645489', 'pod': 'wbjs-algorithm-base-565b645489-lj9qg'}, 'value': [1685529217, '1']}]
+            pod_names = [pod["metric"]["pod"] for pod in pods]
+            container_names = await self._list_containers(namespace, "|".join(pod_names))
+            return await self.__build_from_owner(namespace, app_name, container_names, pod_names)
+        return []
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/deployments.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/deployments.py
new file mode 100644
index 00000000..c895d218
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/deployments.py
@@ -0,0 +1,50 @@
+import logging
+from collections import defaultdict
+import itertools
+import asyncio
+from typing import Literal, Optional, Union
+
+from robusta_krr.core.models.objects import K8sWorkload
+
+from .base import BaseKindLoader
+
+logger = logging.getLogger("krr")
+
+
+class DeploymentLoader(BaseKindLoader):
+    kind = "Deployment"
+
+    async def list_workloads(self, namespaces: Union[list[str], Literal["*"]], label_selector: str) -> list[K8sWorkload]:
+        logger.debug(
+            f"Listing deployments in namespace({namespaces})"
+        )
+        ns = "|".join(namespaces)
+        replicasets = await self.metrics_loader.loader.query(
+            f"""
+                count by (namespace, owner_name, replicaset) (
+                    kube_replicaset_owner{{
+                        namespace=~"{ns}",
+                        owner_kind="Deployment",
+                    }}
+                )
+            """
+        )
+        # groupBy: 'ns/owner_name' => [{metadata}...]
+        pod_owner_kind = "ReplicaSet"
+        replicaset_dict = defaultdict(list)
+        for replicaset in replicasets:
+            replicaset_dict[replicaset["metric"]["namespace"] + "/" + replicaset["metric"]["owner_name"]].append(
+                replicaset["metric"]
+            )
+        objects = await asyncio.gather(
+            *[
+                self._list_containers_in_pods(
+                    replicas[0]["owner_name"],
+                    pod_owner_kind,
+                    replicas[0]["namespace"],
+                    "|".join(list(map(lambda metric: metric["replicaset"], replicas))),
+                )
+                for replicas in replicaset_dict.values()
+            ]
+        )
+        return list(itertools.chain(*objects))
diff --git a/robusta_krr/core/integrations/prometheus/loader.py b/robusta_krr/core/integrations/prometheus/loader.py
index c449bca2..eb734ef0 100644
--- a/robusta_krr/core/integrations/prometheus/loader.py
+++ b/robusta_krr/core/integrations/prometheus/loader.py
@@ -23,6 +23,7 @@
 
 logger = logging.getLogger("krr")
 
+
 class PrometheusMetricsLoader:
     def __init__(self, *, cluster: Optional[str] = None) -> None:
         """
@@ -39,7 +40,8 @@ def __init__(self, *, cluster: Optional[str] = None) -> None:
             raise PrometheusNotFound(
                 f"Wasn't able to connect to any Prometheus service in {cluster or 'inner'} cluster\n"
                 "Try using port-forwarding and/or setting the url manually (using the -p flag.).\n"
-                "For more information, see 'Giving the Explicit Prometheus URL' at https://github.com/robusta-dev/krr?tab=readme-ov-file#usage"
+                "For more information, see 'Giving the Explicit Prometheus URL' at "
+                "https://github.com/robusta-dev/krr?tab=readme-ov-file#usage"
             )
 
         self.loader = loader
diff --git a/robusta_krr/core/runner.py b/robusta_krr/core/runner.py
index de3b3c78..528fd89e 100644
--- a/robusta_krr/core/runner.py
+++ b/robusta_krr/core/runner.py
@@ -2,7 +2,6 @@
 import logging
 import math
 import os
-import sys
 import warnings
 from concurrent.futures import ThreadPoolExecutor
 from typing import Optional, Union
@@ -12,7 +11,7 @@
 from slack_sdk import WebClient
 
 from robusta_krr.core.abstract.strategies import ResourceRecommendation, RunResult
-from robusta_krr.core.integrations.kubernetes import ClusterWorkloadsLoader
+from robusta_krr.core.integrations.kubernetes import ClusterConnector, KubeAPIWorkloadLoader
 from robusta_krr.core.integrations.prometheus import ClusterNotSpecifiedException, PrometheusMetricsLoader
 from robusta_krr.core.models.config import settings
 from robusta_krr.core.models.objects import K8sWorkload
@@ -21,6 +20,7 @@
 from robusta_krr.utils.progress_bar import ProgressBar
 from robusta_krr.utils.version import get_version, load_latest_version
 
+
 logger = logging.getLogger("krr")
 
 
@@ -37,36 +37,14 @@ class CriticalRunnerException(Exception): ...
 
 
 class Runner:
-    EXPECTED_EXCEPTIONS = (KeyboardInterrupt, PrometheusNotFound)
-
     def __init__(self) -> None:
-        self._k8s_loader = ClusterWorkloadsLoader()
-        self._metrics_service_loaders: dict[Optional[str], Union[PrometheusMetricsLoader, Exception]] = {}
-        self._metrics_service_loaders_error_logged: set[Exception] = set()
-        self._strategy = settings.create_strategy()
+        self.connector = ClusterConnector()
+        self.strategy = settings.create_strategy()
 
         self.errors: list[dict] = []
 
         # This executor will be running calculations for recommendations
-        self._executor = ThreadPoolExecutor(settings.max_workers)
-
-    def _get_prometheus_loader(self, cluster: Optional[str]) -> Optional[PrometheusMetricsLoader]:
-        if cluster not in self._metrics_service_loaders:
-            try:
-                self._metrics_service_loaders[cluster] = PrometheusMetricsLoader(cluster=cluster)
-            except Exception as e:
-                self._metrics_service_loaders[cluster] = e
-
-        result = self._metrics_service_loaders[cluster]
-        if isinstance(result, self.EXPECTED_EXCEPTIONS):
-            if result not in self._metrics_service_loaders_error_logged:
-                self._metrics_service_loaders_error_logged.add(result)
-                logger.error(str(result))
-            return None
-        elif isinstance(result, Exception):
-            raise result
-
-        return result
+        self.executor = ThreadPoolExecutor(settings.max_workers)
 
     @staticmethod
     def __parse_version_string(version: str) -> tuple[int, ...]:
@@ -93,7 +71,7 @@ async def _greet(self) -> None:
 
         custom_print(intro_message)
         custom_print(f"\nRunning Robusta's KRR (Kubernetes Resource Recommender) {current_version}")
-        custom_print(f"Using strategy: {self._strategy}")
+        custom_print(f"Using strategy: {self.strategy}")
         custom_print(f"Using formatter: {settings.format}")
         if latest_version is not None and self.__check_newer_version_available(current_version, latest_version):
             custom_print(f"[yellow bold]A newer version of KRR is available: {latest_version}[/yellow bold]")
@@ -171,10 +149,10 @@ async def _calculate_object_recommendations(self, object: K8sWorkload) -> Option
         if prometheus_loader is None:
             return None
 
-        object.pods = await prometheus_loader.load_pods(object, self._strategy.settings.history_timedelta)
-        if object.pods == []:
+        object.pods = await prometheus_loader.load_pods(object, self.strategy.settings.history_timedelta)
+        if object.pods == [] and isinstance(self.connector, KubeAPIWorkloadLoader):
             # Fallback to Kubernetes API
-            object.pods = await self._k8s_loader.load_pods(object)
+            object.pods = await self.connector.load_pods(object)
 
             # NOTE: Kubernetes API returned pods, but Prometheus did not
             # This might happen with fast executing jobs
@@ -187,21 +165,21 @@ async def _calculate_object_recommendations(self, object: K8sWorkload) -> Option
 
         metrics = await prometheus_loader.gather_data(
             object,
-            self._strategy,
-            self._strategy.settings.history_timedelta,
-            step=self._strategy.settings.timeframe_timedelta,
+            self.strategy,
+            self.strategy.settings.history_timedelta,
+            step=self.strategy.settings.timeframe_timedelta,
         )
 
         # NOTE: We run this in a threadpool as the strategy calculation might be CPU intensive
         # But keep in mind that numpy calcluations will not block the GIL
         loop = asyncio.get_running_loop()
-        result = await loop.run_in_executor(self._executor, self._strategy.run, metrics, object)
+        result = await loop.run_in_executor(self.executor, self.strategy.run, metrics, object)
 
         logger.info(f"Calculated recommendations for {object} (using {len(metrics)} metrics)")
         return self._format_result(result)
 
     async def _check_data_availability(self, cluster: Optional[str]) -> None:
-        prometheus_loader = self._get_prometheus_loader(cluster)
+        prometheus_loader = self.connector.get_prometheus_loader(cluster)
         if prometheus_loader is None:
             return
 
@@ -219,11 +197,11 @@ async def _check_data_availability(self, cluster: Optional[str]) -> None:
             return
 
         logger.debug(f"History range for {cluster}: {history_range}")
-        enough_data = self._strategy.settings.history_range_enough(history_range)
+        enough_data = self.strategy.settings.history_range_enough(history_range)
 
         if not enough_data:
             logger.warning(f"Not enough history available for cluster {cluster}.")
-            try_after = history_range[0] + self._strategy.settings.history_timedelta
+            try_after = history_range[0] + self.strategy.settings.history_timedelta
 
             logger.warning(
                 "If the cluster is freshly installed, it might take some time for the enough data to be available."
@@ -257,7 +235,7 @@ async def _gather_object_allocations(self, k8s_object: K8sWorkload) -> Optional[
         )
 
     async def _collect_result(self) -> Result:
-        clusters = await self._k8s_loader.list_clusters()
+        clusters = await self.connector.list_clusters()
         if clusters and len(clusters) > 1 and settings.prometheus_url:
             # this can only happen for multi-cluster querying a single centeralized prometheus
             # In this scenario we dont yet support determining
@@ -275,7 +253,7 @@ async def _collect_result(self) -> Result:
             await asyncio.gather(*[self._check_data_availability(cluster) for cluster in clusters])
 
         with ProgressBar(title="Calculating Recommendation") as self.__progressbar:
-            workloads = await self._k8s_loader.list_workloads(clusters)
+            workloads = await self.connector.list_workloads(clusters)
             scans = await asyncio.gather(*[self._gather_object_allocations(k8s_object) for k8s_object in workloads])
 
         successful_scans = [scan for scan in scans if scan is not None]
@@ -293,10 +271,10 @@ async def _collect_result(self) -> Result:
 
         return Result(
             scans=scans,
-            description=self._strategy.description,
+            description=self.strategy.description,
             strategy=StrategyData(
-                name=str(self._strategy).lower(),
-                settings=self._strategy.settings.dict(),
+                name=str(self.strategy).lower(),
+                settings=self.strategy.settings.dict(),
             ),
         )
 
@@ -313,14 +291,14 @@ async def run(self) -> int:
 
         try:
             # eks has a lower step limit than other types of prometheus, it will throw an error
-            step_count = self._strategy.settings.history_duration * 60 / self._strategy.settings.timeframe_duration
+            step_count = self.strategy.settings.history_duration * 60 / self.strategy.settings.timeframe_duration
             if settings.eks_managed_prom and step_count > 11000:
-                min_step = self._strategy.settings.history_duration * 60 / 10000
+                min_step = self.strategy.settings.history_duration * 60 / 10000
                 logger.warning(
                     f"The timeframe duration provided is insufficient and will be overridden with {min_step}. "
                     f"Kindly adjust --timeframe_duration to a value equal to or greater than {min_step}."
                 )
-                self._strategy.settings.timeframe_duration = min_step
+                self.strategy.settings.timeframe_duration = min_step
 
             result = await self._collect_result()
             logger.info("Result collected, displaying...")
diff --git a/robusta_krr/main.py b/robusta_krr/main.py
index 5c2d01aa..810ccd15 100644
--- a/robusta_krr/main.py
+++ b/robusta_krr/main.py
@@ -55,6 +55,12 @@ def run_strategy(
                     help="Path to kubeconfig file. If not provided, will attempt to find it.",
                     rich_help_panel="Kubernetes Settings",
                 ),
+                workload_loader: str = typer.Option(
+                    "kubeapi",
+                    "--workload",
+                    help="Workload loader to use (kubeapi, prometheus).",
+                    rich_help_panel="Kubernetes Settings",
+                ),
                 impersonate_user: Optional[str] = typer.Option(
                     None,
                     "--as",
@@ -250,6 +256,7 @@ def run_strategy(
                 try:
                     config = Config(
                         kubeconfig=kubeconfig,
+                        workload_loader=workload_loader,
                         impersonate_user=impersonate_user,
                         impersonate_group=impersonate_group,
                         clusters="*" if all_clusters else clusters,

From bf909780f67a58c8647c689a72e2044e53a84e6c Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Wed, 24 Apr 2024 16:05:03 +0300
Subject: [PATCH 03/24] Implement remaining kinds in prometheus workload loader

---
 .../core/integrations/kubernetes/__init__.py  |  24 ++--
 .../kubernetes/workload_loader/__init__.py    |   4 +-
 .../kubernetes/workload_loader/base.py        |   7 +-
 .../workload_loader/kube_api/__init__.py      |  16 ++-
 .../workload_loader/prometheus/__init__.py    |  28 ++--
 .../prometheus/loaders/__init__.py            |  18 +--
 .../prometheus/loaders/base.py                | 104 ++++++---------
 .../prometheus/loaders/deployments.py         |  50 -------
 .../prometheus/loaders/double_parent.py       | 123 ++++++++++++++++++
 .../prometheus/loaders/simple_parent.py       |  65 +++++++++
 .../core/integrations/prometheus/__init__.py  |   2 +-
 .../prometheus/{loader.py => connector.py}    |   5 +-
 .../integrations/prometheus/metrics/base.py   |   3 +-
 .../prometheus_metrics_service.py             |  12 +-
 robusta_krr/core/models/objects.py            |   3 +
 robusta_krr/core/runner.py                    |  15 ++-
 16 files changed, 305 insertions(+), 174 deletions(-)
 delete mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/deployments.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py
 create mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
 rename robusta_krr/core/integrations/prometheus/{loader.py => connector.py} (98%)

diff --git a/robusta_krr/core/integrations/kubernetes/__init__.py b/robusta_krr/core/integrations/kubernetes/__init__.py
index 2ff44585..99b4e3cb 100644
--- a/robusta_krr/core/integrations/kubernetes/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/__init__.py
@@ -17,7 +17,7 @@
     V2HorizontalPodAutoscaler,
 )
 
-from robusta_krr.core.integrations.prometheus.loader import PrometheusMetricsLoader
+from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
 from robusta_krr.core.models.config import settings
 from robusta_krr.core.models.objects import HPAData, K8sWorkload, KindLiteral, PodData
 from robusta_krr.core.models.result import ResourceAllocations
@@ -37,8 +37,8 @@ class ClusterConnector:
     EXPECTED_EXCEPTIONS = (KeyboardInterrupt, PrometheusNotFound)
 
     def __init__(self) -> None:
-        self._metrics_service_loaders: dict[Optional[str], Union[PrometheusMetricsLoader, Exception]] = {}
-        self._metrics_service_loaders_error_logged: set[Exception] = set()
+        self._prometheus_connectors: dict[Optional[str], Union[PrometheusConnector, Exception]] = {}
+        self._connector_errors: set[Exception] = set()
 
     async def list_clusters(self) -> Optional[list[str]]:
         """List all clusters.
@@ -80,22 +80,22 @@ async def list_clusters(self) -> Optional[list[str]]:
 
         return [context["name"] for context in contexts if context["name"] in settings.clusters]
     
-    def get_prometheus_loader(self, cluster: Optional[str]) -> Optional[PrometheusMetricsLoader]:
-        if cluster not in self._metrics_service_loaders:
+    def get_prometheus(self, cluster: Optional[str]) -> Optional[PrometheusConnector]:
+        if cluster not in self._prometheus_connectors:
             try:
-                self._metrics_service_loaders[cluster] = PrometheusMetricsLoader(cluster=cluster)
+                logger.debug(f"Creating Prometheus connector for cluster {cluster}")
+                self._prometheus_connectors[cluster] = PrometheusConnector(cluster=cluster)
             except Exception as e:
-                self._metrics_service_loaders[cluster] = e
+                self._prometheus_connectors[cluster] = e
 
-        result = self._metrics_service_loaders[cluster]
+        result = self._prometheus_connectors[cluster]
         if isinstance(result, self.EXPECTED_EXCEPTIONS):
-            if result not in self._metrics_service_loaders_error_logged:
-                self._metrics_service_loaders_error_logged.add(result)
+            if result not in self._connector_errors:
+                self._connector_errors.add(result)
                 logger.error(str(result))
             return None
         elif isinstance(result, Exception):
             raise result
-
         return result
 
     def _try_create_cluster_loader(self, cluster: Optional[str]) -> Optional[BaseWorkloadLoader]:
@@ -103,7 +103,7 @@ def _try_create_cluster_loader(self, cluster: Optional[str]) -> Optional[BaseWor
             if settings.workload_loader == "kubeapi":
                 return KubeAPIWorkloadLoader(cluster=cluster)
             elif settings.workload_loader == "prometheus":
-                cluster_loader = self.get_prometheus_loader(cluster)
+                cluster_loader = self.get_prometheus(cluster)
                 if cluster_loader is not None:
                     return PrometheusWorkloadLoader(cluster=cluster, metric_loader=cluster_loader)
                 else:
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
index 95431478..06dd8c06 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
@@ -1,5 +1,5 @@
-from .base import BaseWorkloadLoader
+from .base import BaseWorkloadLoader, IListPodsFallback
 from .kube_api import KubeAPIWorkloadLoader
 from .prometheus import PrometheusWorkloadLoader
 
-__all__ = ["BaseWorkloadLoader", "KubeAPIWorkloadLoader", "PrometheusWorkloadLoader"]
\ No newline at end of file
+__all__ = ["BaseWorkloadLoader", "IListPodsFallback", "KubeAPIWorkloadLoader", "PrometheusWorkloadLoader"]
\ No newline at end of file
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
index 8581c1a6..11a27836 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
@@ -1,13 +1,18 @@
 import abc
-from typing import Optional
 from robusta_krr.core.models.objects import K8sWorkload, PodData
 
 
 class BaseWorkloadLoader(abc.ABC):
+    """A base class for workload loaders."""
+
     @abc.abstractmethod
     async def list_workloads(self) -> list[K8sWorkload]:
         pass
 
+
+class IListPodsFallback(abc.ABC):
+    """This is an interface that a workload loader can implement to have a fallback method to list pods."""
+
     @abc.abstractmethod
     async def list_pods(self, object: K8sWorkload) -> list[PodData]:
         pass
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
index d23f7a46..a7470d70 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
@@ -12,7 +12,7 @@
 from robusta_krr.core.models.objects import HPAData, K8sWorkload, KindLiteral, PodData
 from robusta_krr.core.models.result import ResourceAllocations
 
-from ..base import BaseWorkloadLoader
+from ..base import BaseWorkloadLoader, IListPodsFallback
 from .loaders import (
     BaseKindLoader,
     CronJobLoader,
@@ -29,7 +29,7 @@
 HPAKey = tuple[str, str, str]
 
 
-class KubeAPIWorkloadLoader(BaseWorkloadLoader):
+class KubeAPIWorkloadLoader(BaseWorkloadLoader, IListPodsFallback):
     workload_loaders: list[BaseKindLoader] = [
         DeploymentLoader,
         RolloutLoader,
@@ -176,10 +176,12 @@ async def __list_hpa_v1(self) -> dict[HPAKey, HPAData]:
         res = await self._list_namespaced_or_global_objects(
             kind="HPA-v1",
             all_namespaces_request=lambda **kwargs: loop.run_in_executor(
-                self.autoscaling_v1.list_horizontal_pod_autoscaler_for_all_namespaces(**kwargs),
+                self.executor,
+                lambda: self.autoscaling_v1.list_horizontal_pod_autoscaler_for_all_namespaces(**kwargs),
             ),
             namespaced_request=lambda **kwargs: loop.run_in_executor(
-                self.autoscaling_v1.list_namespaced_horizontal_pod_autoscaler(**kwargs),
+                self.executor,
+                lambda: self.autoscaling_v1.list_namespaced_horizontal_pod_autoscaler(**kwargs),
             ),
         )
 
@@ -205,10 +207,12 @@ async def __list_hpa_v2(self) -> dict[HPAKey, HPAData]:
         res = await self._list_namespaced_or_global_objects(
             kind="HPA-v2",
             all_namespaces_request=lambda **kwargs: loop.run_in_executor(
-                self.executor, self.autoscaling_v2.list_horizontal_pod_autoscaler_for_all_namespaces(**kwargs)
+                self.executor,
+                lambda: self.autoscaling_v2.list_horizontal_pod_autoscaler_for_all_namespaces(**kwargs),
             ),
             namespaced_request=lambda **kwargs: loop.run_in_executor(
-                self.autoscaling_v2.list_namespaced_horizontal_pod_autoscaler(**kwargs),
+                self.executor,
+                lambda: self.autoscaling_v2.list_namespaced_horizontal_pod_autoscaler(**kwargs),
             ),
         )
 
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
index b277bc28..bfe68534 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
@@ -2,30 +2,36 @@
 import itertools
 import logging
 
+from collections import Counter
 
-from robusta_krr.core.integrations.prometheus.loader import PrometheusMetricsLoader
+
+from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
 from robusta_krr.core.models.config import settings
-from robusta_krr.core.integrations.prometheus.metrics_service.prometheus_metrics_service import PrometheusMetricsService
-from robusta_krr.core.models.objects import K8sWorkload, PodData
+from robusta_krr.core.models.objects import K8sWorkload
 from ..base import BaseWorkloadLoader
-from .loaders import BaseKindLoader, DeploymentLoader
+from .loaders import BaseKindLoader, DoubleParentLoader, SimpleParentLoader
 
 
 logger = logging.getLogger("krr")
 
 
 class PrometheusWorkloadLoader(BaseWorkloadLoader):
-    workloads: list[type[BaseKindLoader]] = [DeploymentLoader]
+    workloads: list[type[BaseKindLoader]] = [DoubleParentLoader, SimpleParentLoader]
 
-    def __init__(self, cluster: str, metric_loader: PrometheusMetricsLoader) -> None:
+    def __init__(self, cluster: str, metric_loader: PrometheusConnector) -> None:
         self.cluster = cluster
         self.metric_service = metric_loader
         self.loaders = [loader(metric_loader) for loader in self.workloads]
 
     async def list_workloads(self) -> list[K8sWorkload]:
-        return itertools.chain(await asyncio.gather(*[loader.list_workloads(settings.namespaces, "") for loader in self.loaders]))
+        workloads = list(
+            itertools.chain(
+                *await asyncio.gather(*[loader.list_workloads(settings.namespaces) for loader in self.loaders])
+            )
+        )
+
+        kind_counts = Counter([workload.kind for workload in workloads])
+        for kind, count in kind_counts.items():
+            logger.info(f"Found {count} {kind} in {self.cluster}")
 
-    async def list_pods(self, object: K8sWorkload) -> list[PodData]:
-        # This should not be implemented, as implementation will repeat PrometheusMetricsLoader.load_pods
-        # As this method is ment to be a fallback, repeating the same logic will not be beneficial
-        raise NotImplementedError
+        return workloads
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/__init__.py
index 6ca6efd6..18b9a3d3 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/__init__.py
@@ -1,19 +1,9 @@
 from .base import BaseKindLoader
-from .cronjobs import CronJobLoader
-from .daemonsets import DaemonSetLoader
-from .deploymentconfigs import DeploymentConfigLoader
-from .deployments import DeploymentLoader
-from .jobs import JobLoader
-from .rollouts import RolloutLoader
-from .statefulsets import StatefulSetLoader
+from .double_parent import DoubleParentLoader
+from .simple_parent import SimpleParentLoader
 
 __all__ = [
     "BaseKindLoader",
-    "CronJobLoader",
-    "DeploymentLoader",
-    "DaemonSetLoader",
-    "DeploymentConfigLoader",
-    "JobLoader",
-    "RolloutLoader",
-    "StatefulSetLoader",
+    "DoubleParentLoader",
+    "SimpleParentLoader",
 ]
\ No newline at end of file
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
index a767eb2f..4367d800 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
@@ -1,5 +1,6 @@
 import abc
 import asyncio
+from collections import defaultdict
 import logging
 from concurrent.futures import ThreadPoolExecutor
 from typing import Any, Iterable, Literal, Optional, Union
@@ -15,8 +16,10 @@
     V1PodList,
     V1StatefulSet,
 )
+from robusta_krr.core.models.config import settings
 
-from robusta_krr.core.integrations.prometheus.loader import PrometheusMetricsLoader
+from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
+from robusta_krr.core.integrations.prometheus.metrics.base import PrometheusMetric
 from robusta_krr.core.models.allocations import RecommendationValue, ResourceAllocations, ResourceType
 from robusta_krr.core.models.objects import K8sWorkload, KindLiteral, PodData
 
@@ -32,29 +35,44 @@ class BaseKindLoader(abc.ABC):
     It does not load the objects itself, but is used by the `KubeAPIWorkloadLoader` to load objects.
     """
 
-    kind: KindLiteral
+    kinds: list[KindLiteral] = []
 
-    def __init__(self, metrics_loader: PrometheusMetricsLoader) -> None:
-        self.metrics_loader = metrics_loader
+    def __init__(self, connector: PrometheusConnector) -> None:
+        self.connector = connector
+        self.cluster_selector = PrometheusMetric.get_prometheus_cluster_label()
+
+    @property
+    def kinds_to_scan(self) -> list[KindLiteral]:
+        return [kind for kind in self.kinds if kind in settings.resources] if settings.resources != "*" else self.kinds
 
     @abc.abstractmethod
-    def list_workloads(self, namespaces: Union[list[str], Literal["*"]], label_selector: str) -> list[K8sWorkload]:
+    def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> list[K8sWorkload]:
         pass
 
-    async def __parse_allocation(self, namespace: str, pod_selector: str, container_name: str) -> ResourceAllocations:
-        limits = await self.metrics_loader.loader.query(
-            "avg by(resource) (kube_pod_container_resource_limits{"
-            f'namespace="{namespace}", '
-            f'pod=~"{pod_selector}", '
-            f'container="{container_name}"'
-            "})"
+    async def _parse_allocation(self, namespace: str, pods: list[str], container_name: str) -> ResourceAllocations:
+        limits = await self.connector.loader.query(
+            f"""
+                avg by(resource) (
+                    kube_pod_container_resource_limits{{
+                        {self.cluster_selector}
+                        namespace="{namespace}",
+                        pod=~"{'|'.join(pods)}",
+                        container="{container_name}"
+                    }}
+                )
+            """
         )
-        requests = await self.metrics_loader.loader.query(
-            "avg by(resource) (kube_pod_container_resource_requests{"
-            f'namespace="{namespace}", '
-            f'pod=~"{pod_selector}", '
-            f'container="{container_name}"'
-            "})"
+        requests = await self.connector.loader.query(
+            f"""
+                avg by(resource) (
+                    kube_pod_container_resource_requests{{
+                        {self.cluster_selector}
+                        namespace="{namespace}",
+                        pod=~"{'|'.join(pods)}",
+                        container="{container_name}"
+                    }}
+                )
+            """
         )
         requests_values: dict[ResourceType, RecommendationValue] = {ResourceType.CPU: None, ResourceType.Memory: None}
         limits_values: dict[ResourceType, RecommendationValue] = {ResourceType.CPU: None, ResourceType.Memory: None}
@@ -71,56 +89,16 @@ async def __parse_allocation(self, namespace: str, pod_selector: str, container_
                 requests_values[ResourceType.Memory] = float(request["value"][1])
         return ResourceAllocations(requests=requests_values, limits=limits_values)
 
-    async def __build_from_owner(
-        self, namespace: str, app_name: str, containers: list[str], pod_names: list[str]
-    ) -> list[K8sWorkload]:
-        return [
-            K8sWorkload(
-                cluster=None,
-                namespace=namespace,
-                name=app_name,
-                kind="Deployment",
-                container=container_name,
-                allocations=await self.__parse_allocation(namespace, "|".join(pod_names), container_name),  # find
-                pods=[PodData(name=pod_name, deleted=False) for pod_name in pod_names],  # list pods
-            )
-            for container_name in containers
-        ]
-
-    async def _list_containers(self, namespace: str, pod_selector: str) -> list[str]:
-        containers = await self.metrics_loader.loader.query(
+    async def _list_containers_in_pods(self, pods: list[str]) -> set[str]:
+        containers = await self.connector.loader.query(
             f"""
                 count by (container) (
                     kube_pod_container_info{{
-                        namespace="{namespace}",
-                        pod=~"{pod_selector}"
+                        {self.cluster_selector}
+                        pod=~"{'|'.join(pods)}"
                     }}
                 )
             """
         )
-        return [container["metric"]["container"] for container in containers]
 
-    async def _list_containers_in_pods(
-        self, app_name: str, pod_owner_kind: str, namespace: str, owner_name: str
-    ) -> list[K8sWorkload]:
-        if pod_owner_kind == "ReplicaSet":
-            # owner_name is ReplicaSet names
-            pods = await self.metrics_loader.loader.query(
-                f"""
-                    count by (owner_name, replicaset, pod) (
-                        kube_pod_owner{{
-                            namespace="{namespace}",
-                            owner_name=~"{owner_name}", '
-                            owner_kind="ReplicaSet"
-                        }}
-                    )
-                """
-            )
-            if pods is None or len(pods) == 0:
-                return []  # no container
-            # [{'metric': {'owner_name': 'wbjs-algorithm-base-565b645489', 'pod': 'wbjs-algorithm-base-565b645489-jqt4x'}, 'value': [1685529217, '1']},
-            #  {'metric': {'owner_name': 'wbjs-algorithm-base-565b645489', 'pod': 'wbjs-algorithm-base-565b645489-lj9qg'}, 'value': [1685529217, '1']}]
-            pod_names = [pod["metric"]["pod"] for pod in pods]
-            container_names = await self._list_containers(namespace, "|".join(pod_names))
-            return await self.__build_from_owner(namespace, app_name, container_names, pod_names)
-        return []
+        return {container["metric"]["container"] for container in containers}
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/deployments.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/deployments.py
deleted file mode 100644
index c895d218..00000000
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/deployments.py
+++ /dev/null
@@ -1,50 +0,0 @@
-import logging
-from collections import defaultdict
-import itertools
-import asyncio
-from typing import Literal, Optional, Union
-
-from robusta_krr.core.models.objects import K8sWorkload
-
-from .base import BaseKindLoader
-
-logger = logging.getLogger("krr")
-
-
-class DeploymentLoader(BaseKindLoader):
-    kind = "Deployment"
-
-    async def list_workloads(self, namespaces: Union[list[str], Literal["*"]], label_selector: str) -> list[K8sWorkload]:
-        logger.debug(
-            f"Listing deployments in namespace({namespaces})"
-        )
-        ns = "|".join(namespaces)
-        replicasets = await self.metrics_loader.loader.query(
-            f"""
-                count by (namespace, owner_name, replicaset) (
-                    kube_replicaset_owner{{
-                        namespace=~"{ns}",
-                        owner_kind="Deployment",
-                    }}
-                )
-            """
-        )
-        # groupBy: 'ns/owner_name' => [{metadata}...]
-        pod_owner_kind = "ReplicaSet"
-        replicaset_dict = defaultdict(list)
-        for replicaset in replicasets:
-            replicaset_dict[replicaset["metric"]["namespace"] + "/" + replicaset["metric"]["owner_name"]].append(
-                replicaset["metric"]
-            )
-        objects = await asyncio.gather(
-            *[
-                self._list_containers_in_pods(
-                    replicas[0]["owner_name"],
-                    pod_owner_kind,
-                    replicas[0]["namespace"],
-                    "|".join(list(map(lambda metric: metric["replicaset"], replicas))),
-                )
-                for replicas in replicaset_dict.values()
-            ]
-        )
-        return list(itertools.chain(*objects))
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py
new file mode 100644
index 00000000..b4ce13eb
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py
@@ -0,0 +1,123 @@
+import logging
+from collections import defaultdict
+import itertools
+import asyncio
+from typing import Literal, Union
+
+from robusta_krr.core.models.objects import K8sWorkload, KindLiteral, PodData
+
+from .base import BaseKindLoader
+
+logger = logging.getLogger("krr")
+
+SubownerLiteral = Literal["ReplicaSet", "ReplicationController", "Job"]
+
+
+class DoubleParentLoader(BaseKindLoader):
+    kinds = ["Deployment", "Rollout", "DeploymentConfig", "CronJob"]
+
+    kind_subowner_map: dict[KindLiteral, SubownerLiteral] = {
+        "Deployment": "ReplicaSet",
+        "Rollout": "ReplicaSet",
+        "DeploymentConfig": "ReplicationController",
+        "CronJob": "Job",
+    }
+
+    async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> list[K8sWorkload]:
+        return list(
+            itertools.chain(
+                *await asyncio.gather(
+                    *[
+                        self.list_workloads_by_subowner(namespaces, subowner)
+                        for subowner in set(self.kind_subowner_map.values())
+                    ]
+                )
+            )
+        )
+
+    async def list_workloads_by_subowner(
+        self, namespaces: Union[list[str], Literal["*"]], subowner_kind: SubownerLiteral
+    ) -> list[K8sWorkload]:
+        kinds = [kind for kind in self.kinds_to_scan if self.kind_subowner_map[kind] == subowner_kind]
+
+        if kinds == []:
+            return []
+
+        logger.debug(f"Listing {', '.join(kinds)}")
+        # NOTE: kube-system is excluded if we scan all namespaces
+        namespace_selector = (
+            ('namespace=~"' + "|".join(namespaces) + '"') if namespaces != "*" else 'namespace!="kube-system"'
+        )
+
+        metric_name = f"kube_{subowner_kind.lower()}_owner"
+        subowner_label = subowner_kind.lower() if subowner_kind != "Job" else "job_name"
+
+        # Replica is for ReplicaSet and/or ReplicationController
+        subowners = await self.connector.loader.query(
+            f"""
+                count by (namespace, owner_name, {subowner_label}, owner_kind) (
+                    {metric_name} {{
+                        {self.cluster_selector}
+                        {namespace_selector},
+                        owner_kind=~"{'|'.join(kinds)}"
+                    }}
+                )
+            """
+        )
+        # groupBy: (namespace, owner_name, owner_kind) => [replicaset,...]
+        replicas_by_owner = defaultdict(list)
+        for subowner in subowners:
+            metric = subowner["metric"]
+            key = metric["namespace"], metric["owner_name"], metric["owner_kind"]
+            replicas_by_owner[key].append(metric[subowner_label])
+
+        return list(
+            itertools.chain(
+                *await asyncio.gather(
+                    *[
+                        self._list_pods_of_subowner(
+                            namespace,
+                            name,
+                            kind,
+                            subowner_kind,
+                            subowners,
+                        )
+                        for (namespace, name, kind), subowners in replicas_by_owner.items()
+                    ]
+                )
+            )
+        )
+
+    async def _list_pods_of_subowner(
+        self, namespace: str, name: str, kind: str, subowner_kind: str, subowner_names: list[str]
+    ) -> list[K8sWorkload]:
+        pods = await self.connector.loader.query(
+            f"""
+                count by (namespace, owner_name, owner_kind, pod) (
+                    kube_pod_owner{{
+                        {self.cluster_selector}
+                        namespace="{namespace}",
+                        owner_name=~"{'|'.join(subowner_names)}",
+                        owner_kind="{subowner_kind}"
+                    }}
+                )
+            """
+        )
+        if pods is None or len(pods) == 0:
+            return []
+
+        pod_names = [pod["metric"]["pod"] for pod in pods]
+        containers = await self._list_containers_in_pods(pod_names)
+
+        return [
+            K8sWorkload(
+                cluster=self.connector.cluster,
+                namespace=namespace,
+                name=name,
+                kind=kind,
+                container=container_name,
+                allocations=await self._parse_allocation(namespace, pod_names, container_name),  # find
+                pods=[PodData(name=pod_name, deleted=False) for pod_name in pod_names],  # list pods
+            )
+            for container_name in containers
+        ]
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
new file mode 100644
index 00000000..33a8c5ad
--- /dev/null
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
@@ -0,0 +1,65 @@
+import asyncio
+from collections import defaultdict
+import logging
+from typing import Literal, Union
+
+from robusta_krr.core.models.objects import K8sWorkload, PodData
+
+from .base import BaseKindLoader
+
+logger = logging.getLogger("krr")
+
+
+class SimpleParentLoader(BaseKindLoader):
+    kinds = ["DaemonSet", "StatefulSet", "Job"]
+
+    async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> list[K8sWorkload]:
+        if self.kinds_to_scan == []:
+            return []
+
+        logger.debug(f"Listing {', '.join(self.kinds_to_scan)}")
+        namespace_selector = (
+            ('namespace=~"' + "|".join(namespaces) + '"') if namespaces != "*" else 'namespace!="kube-system"'
+        )
+
+        results = await self.connector.loader.query(
+            f"""
+                count by (namespace, owner_name, owner_kind, pod) (
+                    kube_pod_owner{{
+                        {self.cluster_selector}
+                        {namespace_selector},
+                        owner_kind=~"{'|'.join(self.kinds_to_scan)}"
+                    }}
+                )
+            """
+        )
+        if results is None or len(results) == 0:
+            return []
+
+        # groupBy: (namespace, owner_name, owner_kind) => [pod, ... ]
+        workloads: defaultdict[tuple[str, str, str], list[str]] = defaultdict(list)
+        for result in results:
+            metric = result["metric"]
+            key = metric["namespace"], metric["owner_name"], metric["owner_kind"]
+            workloads[key].append(metric["pod"])
+
+        workloads_containers = dict(
+            zip(
+                workloads.keys(),
+                await asyncio.gather(*[self._list_containers_in_pods(pods) for pods in workloads.values()]),
+            )
+        )
+
+        return [
+            K8sWorkload(
+                cluster=self.connector.cluster,
+                namespace=namespace,
+                name=name,
+                kind=kind,
+                container=container,
+                allocations=await self._parse_allocation(namespace, pod_names, container),  # find
+                pods=[PodData(name=pod_name, deleted=False) for pod_name in pod_names],  # list pods
+            )
+            for (namespace, name, kind), pod_names in workloads.items()
+            for container in workloads_containers[namespace, name, kind]
+        ]
diff --git a/robusta_krr/core/integrations/prometheus/__init__.py b/robusta_krr/core/integrations/prometheus/__init__.py
index cedf1c0b..1ce9d2ac 100644
--- a/robusta_krr/core/integrations/prometheus/__init__.py
+++ b/robusta_krr/core/integrations/prometheus/__init__.py
@@ -1,3 +1,3 @@
-from .loader import PrometheusMetricsLoader
+from .connector import PrometheusConnector
 from .metrics_service.prometheus_metrics_service import PrometheusDiscovery, PrometheusNotFound
 from .prometheus_utils import ClusterNotSpecifiedException
diff --git a/robusta_krr/core/integrations/prometheus/loader.py b/robusta_krr/core/integrations/prometheus/connector.py
similarity index 98%
rename from robusta_krr/core/integrations/prometheus/loader.py
rename to robusta_krr/core/integrations/prometheus/connector.py
index eb734ef0..ab89b346 100644
--- a/robusta_krr/core/integrations/prometheus/loader.py
+++ b/robusta_krr/core/integrations/prometheus/connector.py
@@ -24,7 +24,7 @@
 logger = logging.getLogger("krr")
 
 
-class PrometheusMetricsLoader:
+class PrometheusConnector:
     def __init__(self, *, cluster: Optional[str] = None) -> None:
         """
         Initializes the Prometheus Loader.
@@ -34,6 +34,7 @@ def __init__(self, *, cluster: Optional[str] = None) -> None:
         """
 
         self.executor = ThreadPoolExecutor(settings.max_workers)
+        self.cluster = cluster
         self.api_client = settings.get_kube_client(context=cluster)
         loader = self.get_metrics_service(api_client=self.api_client, cluster=cluster)
         if loader is None:
@@ -46,7 +47,7 @@ def __init__(self, *, cluster: Optional[str] = None) -> None:
 
         self.loader = loader
 
-        logger.info(f"{self.loader.name()} connected successfully for {cluster or 'default'} cluster")
+        logger.info(f"{self.loader.name()} connected successfully for {cluster or 'inner'} cluster")
 
     def get_metrics_service(
         self,
diff --git a/robusta_krr/core/integrations/prometheus/metrics/base.py b/robusta_krr/core/integrations/prometheus/metrics/base.py
index d55af004..34957ef6 100644
--- a/robusta_krr/core/integrations/prometheus/metrics/base.py
+++ b/robusta_krr/core/integrations/prometheus/metrics/base.py
@@ -74,7 +74,8 @@ def __init__(
         if self.pods_batch_size is not None and self.pods_batch_size <= 0:
             raise ValueError("pods_batch_size must be positive")
 
-    def get_prometheus_cluster_label(self) -> str:
+    @staticmethod
+    def get_prometheus_cluster_label() -> str:
         """
         Generates the cluster label for querying a centralized Prometheus
 
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
index 5347422d..50b86a63 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
@@ -112,10 +112,14 @@ def check_connection(self):
 
     async def query(self, query: str) -> dict:
         loop = asyncio.get_running_loop()
-        return await loop.run_in_executor(
-            self.executor,
-            lambda: self.prometheus.safe_custom_query(query=query)["result"],
-        )
+        try:
+            return await loop.run_in_executor(
+                self.executor,
+                lambda: self.prometheus.safe_custom_query(query=query)["result"],
+            )
+        except PrometheusApiClientException as e:
+            logger.error(f"Error while querying Prometheus: {query}")
+            raise e
 
     async def query_range(self, query: str, start: datetime, end: datetime, step: timedelta) -> dict:
         loop = asyncio.get_running_loop()
diff --git a/robusta_krr/core/models/objects.py b/robusta_krr/core/models/objects.py
index 5dac1231..27f1c293 100644
--- a/robusta_krr/core/models/objects.py
+++ b/robusta_krr/core/models/objects.py
@@ -52,6 +52,9 @@ class K8sWorkload(pd.BaseModel):
     def __str__(self) -> str:
         return f"{self.kind} {self.namespace}/{self.name}/{self.container}"
 
+    def __repr__(self) -> str:
+        return f"<K8sWorkload {self}>"
+
     def __hash__(self) -> int:
         return hash(str(self))
 
diff --git a/robusta_krr/core/runner.py b/robusta_krr/core/runner.py
index 528fd89e..bb109df8 100644
--- a/robusta_krr/core/runner.py
+++ b/robusta_krr/core/runner.py
@@ -6,13 +6,13 @@
 from concurrent.futures import ThreadPoolExecutor
 from typing import Optional, Union
 from datetime import timedelta
-from prometrix import PrometheusNotFound
 from rich.console import Console
 from slack_sdk import WebClient
 
 from robusta_krr.core.abstract.strategies import ResourceRecommendation, RunResult
-from robusta_krr.core.integrations.kubernetes import ClusterConnector, KubeAPIWorkloadLoader
-from robusta_krr.core.integrations.prometheus import ClusterNotSpecifiedException, PrometheusMetricsLoader
+from robusta_krr.core.integrations.kubernetes.workload_loader import IListPodsFallback
+from robusta_krr.core.integrations.kubernetes import ClusterConnector
+from robusta_krr.core.integrations.prometheus import ClusterNotSpecifiedException
 from robusta_krr.core.models.config import settings
 from robusta_krr.core.models.objects import K8sWorkload
 from robusta_krr.core.models.result import ResourceAllocations, ResourceScan, ResourceType, Result, StrategyData
@@ -144,14 +144,15 @@ def _format_result(self, result: RunResult) -> RunResult:
         }
 
     async def _calculate_object_recommendations(self, object: K8sWorkload) -> Optional[RunResult]:
-        prometheus_loader = self._get_prometheus_loader(object.cluster)
+        prometheus_loader = self.connector.get_prometheus(object.cluster)
 
         if prometheus_loader is None:
             return None
 
         object.pods = await prometheus_loader.load_pods(object, self.strategy.settings.history_timedelta)
-        if object.pods == [] and isinstance(self.connector, KubeAPIWorkloadLoader):
-            # Fallback to Kubernetes API
+        if object.pods == [] and isinstance(self.connector, IListPodsFallback):
+            # Fallback to IListPodsFallback if Prometheus did not return any pods
+            # IListPodsFallback is implemented by the Kubernetes API connector
             object.pods = await self.connector.load_pods(object)
 
             # NOTE: Kubernetes API returned pods, but Prometheus did not
@@ -179,7 +180,7 @@ async def _calculate_object_recommendations(self, object: K8sWorkload) -> Option
         return self._format_result(result)
 
     async def _check_data_availability(self, cluster: Optional[str]) -> None:
-        prometheus_loader = self.connector.get_prometheus_loader(cluster)
+        prometheus_loader = self.connector.get_prometheus(cluster)
         if prometheus_loader is None:
             return
 

From 7cd0c59ecce48c84ac0ed5a7eeeb503c9c9f19fe Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Wed, 24 Apr 2024 16:23:13 +0300
Subject: [PATCH 04/24] Filter Cronjob-created jobs from display

---
 .../prometheus/loaders/simple_parent.py       | 20 +++++++++++++++++++
 1 file changed, 20 insertions(+)

diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
index 33a8c5ad..9bc53d24 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
@@ -43,6 +43,26 @@ async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> li
             key = metric["namespace"], metric["owner_name"], metric["owner_kind"]
             workloads[key].append(metric["pod"])
 
+        # NOTE: We do not show jobs that are a part of a cronjob, so we filter them out
+        job_workloads = [name for (_, name, kind) in workloads if kind == "Job"]
+        if job_workloads != []:
+            cronjobs = await self.connector.loader.query(
+                f"""
+                    count by (namespace, job_name) (
+                        kube_job_owner{{
+                            {self.cluster_selector}
+                            {namespace_selector},
+                            owner_kind="CronJob"
+                        }}
+                    )
+                """
+            )
+            for cronjob in cronjobs:
+                metric = cronjob["metric"]
+                key = (metric["namespace"], metric["job_name"], "Job")
+                if key in workloads:
+                    del workloads[key]
+
         workloads_containers = dict(
             zip(
                 workloads.keys(),

From 4044b4a17ede1e965c837bc3872fdbe5a3835217 Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Thu, 25 Apr 2024 17:08:53 +0300
Subject: [PATCH 05/24] Fix cluster selector

---
 .../kubernetes/workload_loader/prometheus/loaders/base.py   | 6 +++---
 .../workload_loader/prometheus/loaders/double_parent.py     | 4 ++--
 .../workload_loader/prometheus/loaders/simple_parent.py     | 4 ++--
 3 files changed, 7 insertions(+), 7 deletions(-)

diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
index 4367d800..3be8fe17 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
@@ -54,10 +54,10 @@ async def _parse_allocation(self, namespace: str, pods: list[str], container_nam
             f"""
                 avg by(resource) (
                     kube_pod_container_resource_limits{{
-                        {self.cluster_selector}
                         namespace="{namespace}",
                         pod=~"{'|'.join(pods)}",
                         container="{container_name}"
+                        {self.cluster_selector}
                     }}
                 )
             """
@@ -66,10 +66,10 @@ async def _parse_allocation(self, namespace: str, pods: list[str], container_nam
             f"""
                 avg by(resource) (
                     kube_pod_container_resource_requests{{
-                        {self.cluster_selector}
                         namespace="{namespace}",
                         pod=~"{'|'.join(pods)}",
                         container="{container_name}"
+                        {self.cluster_selector}
                     }}
                 )
             """
@@ -94,8 +94,8 @@ async def _list_containers_in_pods(self, pods: list[str]) -> set[str]:
             f"""
                 count by (container) (
                     kube_pod_container_info{{
-                        {self.cluster_selector}
                         pod=~"{'|'.join(pods)}"
+                        {self.cluster_selector}
                     }}
                 )
             """
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py
index b4ce13eb..ea2353b8 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py
@@ -57,9 +57,9 @@ async def list_workloads_by_subowner(
             f"""
                 count by (namespace, owner_name, {subowner_label}, owner_kind) (
                     {metric_name} {{
-                        {self.cluster_selector}
                         {namespace_selector},
                         owner_kind=~"{'|'.join(kinds)}"
+                        {self.cluster_selector}
                     }}
                 )
             """
@@ -95,10 +95,10 @@ async def _list_pods_of_subowner(
             f"""
                 count by (namespace, owner_name, owner_kind, pod) (
                     kube_pod_owner{{
-                        {self.cluster_selector}
                         namespace="{namespace}",
                         owner_name=~"{'|'.join(subowner_names)}",
                         owner_kind="{subowner_kind}"
+                        {self.cluster_selector}
                     }}
                 )
             """
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
index 9bc53d24..05b7d74c 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
@@ -26,9 +26,9 @@ async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> li
             f"""
                 count by (namespace, owner_name, owner_kind, pod) (
                     kube_pod_owner{{
-                        {self.cluster_selector}
                         {namespace_selector},
                         owner_kind=~"{'|'.join(self.kinds_to_scan)}"
+                        {self.cluster_selector}
                     }}
                 )
             """
@@ -50,9 +50,9 @@ async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> li
                 f"""
                     count by (namespace, job_name) (
                         kube_job_owner{{
-                            {self.cluster_selector}
                             {namespace_selector},
                             owner_kind="CronJob"
+                            {self.cluster_selector}
                         }}
                     )
                 """

From b9a62a0d1b52c597540d18b4f33119a36cb5968f Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Thu, 25 Apr 2024 17:17:54 +0300
Subject: [PATCH 06/24] Minor bug fix

---
 robusta_krr/core/integrations/kubernetes/__init__.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/robusta_krr/core/integrations/kubernetes/__init__.py b/robusta_krr/core/integrations/kubernetes/__init__.py
index 99b4e3cb..6af17331 100644
--- a/robusta_krr/core/integrations/kubernetes/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/__init__.py
@@ -136,7 +136,7 @@ async def list_workloads(self, clusters: Optional[list[str]]) -> list[K8sWorkloa
 
         if self.cluster_loaders == {}:
             logger.error("Could not load any cluster.")
-            return
+            return []
 
         return [
             object

From 7e8f1f42f34f5c4ff2824ced92dc37f9afb2ba10 Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Mon, 29 Apr 2024 23:18:01 +0300
Subject: [PATCH 07/24] BaseClusterLoader, class structure change, not finished

---
 .../core/integrations/kubernetes/__init__.py  | 94 +++++--------------
 .../kubernetes/workload_loader/__init__.py    | 16 +++-
 .../kubernetes/workload_loader/base.py        | 41 +++++++-
 .../workload_loader/kube_api/__init__.py      | 57 ++++++++++-
 .../workload_loader/prometheus/__init__.py    | 29 +++++-
 .../prometheus/loaders/base.py                | 10 +-
 .../prometheus/loaders/double_parent.py       |  6 +-
 .../prometheus/loaders/simple_parent.py       |  6 +-
 .../core/integrations/prometheus/connector.py |  8 ++
 .../metrics_service/base_metric_service.py    | 26 ++---
 .../prometheus_metrics_service.py             | 18 ++--
 robusta_krr/core/models/config.py             | 19 +++-
 12 files changed, 206 insertions(+), 124 deletions(-)

diff --git a/robusta_krr/core/integrations/kubernetes/__init__.py b/robusta_krr/core/integrations/kubernetes/__init__.py
index 6af17331..403768ce 100644
--- a/robusta_krr/core/integrations/kubernetes/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/__init__.py
@@ -25,7 +25,13 @@
 from prometrix import PrometheusNotFound
 
 from . import config_patch as _
-from .workload_loader import BaseWorkloadLoader, KubeAPIWorkloadLoader, PrometheusWorkloadLoader
+from .workload_loader import (
+    BaseWorkloadLoader,
+    PrometheusWorkloadLoader,
+    BaseClusterLoader,
+    KubeAPIClusterLoader,
+    PrometheusClusterLoader,
+)
 
 logger = logging.getLogger("krr")
 
@@ -40,81 +46,23 @@ def __init__(self) -> None:
         self._prometheus_connectors: dict[Optional[str], Union[PrometheusConnector, Exception]] = {}
         self._connector_errors: set[Exception] = set()
 
-    async def list_clusters(self) -> Optional[list[str]]:
-        """List all clusters.
-
-        Returns:
-            A list of clusters.
-        """
-
-        if settings.inside_cluster:
-            logger.debug("Working inside the cluster")
-            return None
-
-        try:
-            contexts, current_context = config.list_kube_config_contexts(settings.kubeconfig)
-        except config.ConfigException:
-            if settings.clusters is not None and settings.clusters != "*":
-                logger.warning("Could not load context from kubeconfig.")
-                logger.warning(f"Falling back to clusters from CLI: {settings.clusters}")
-                return settings.clusters
-            else:
-                logger.error(
-                    "Could not load context from kubeconfig. "
-                    "Please check your kubeconfig file or pass -c flag with the context name."
-                )
-            return None
-
-        logger.debug(f"Found {len(contexts)} clusters: {', '.join([context['name'] for context in contexts])}")
-        logger.debug(f"Current cluster: {current_context['name']}")
-
-        logger.debug(f"Configured clusters: {settings.clusters}")
-
-        # None, empty means current cluster
-        if not settings.clusters:
-            return [current_context["name"]]
-
-        # * means all clusters
-        if settings.clusters == "*":
-            return [context["name"] for context in contexts]
-
-        return [context["name"] for context in contexts if context["name"] in settings.clusters]
-    
     def get_prometheus(self, cluster: Optional[str]) -> Optional[PrometheusConnector]:
-        if cluster not in self._prometheus_connectors:
-            try:
-                logger.debug(f"Creating Prometheus connector for cluster {cluster}")
-                self._prometheus_connectors[cluster] = PrometheusConnector(cluster=cluster)
-            except Exception as e:
-                self._prometheus_connectors[cluster] = e
-
-        result = self._prometheus_connectors[cluster]
-        if isinstance(result, self.EXPECTED_EXCEPTIONS):
-            if result not in self._connector_errors:
-                self._connector_errors.add(result)
-                logger.error(str(result))
-            return None
-        elif isinstance(result, Exception):
-            raise result
-        return result
-
-    def _try_create_cluster_loader(self, cluster: Optional[str]) -> Optional[BaseWorkloadLoader]:
+        if settings.workload_loader == "kubeapi":
+            logger.debug(f"Creating Prometheus connector for cluster {cluster}")
+        elif settings.workload_loader == "prometheus":
+            logger.debug(f"Creating Prometheus connector")
+            # NOTE: With prometheus workload loader we can only have one Prometheus provided in parameters
+            # so in case of multiple clusters in one Prometheus (centralized version) 
+            # for each cluster we will have the same PrometheusConnector (keyed by None)
+            cluster = None
+
+        
+
+    def _create_cluster_loader(self) -> BaseClusterLoader:
         try:
-            if settings.workload_loader == "kubeapi":
-                return KubeAPIWorkloadLoader(cluster=cluster)
-            elif settings.workload_loader == "prometheus":
-                cluster_loader = self.get_prometheus(cluster)
-                if cluster_loader is not None:
-                    return PrometheusWorkloadLoader(cluster=cluster, metric_loader=cluster_loader)
-                else:
-                    logger.error(
-                        f"Could not load Prometheus for cluster {cluster} and will skip it." 
-                        "Not possible to load workloads through Prometheus without connection to Prometheus."
-                    )
-            else:
-                raise NotImplementedError(f"Workload loader {settings.workload_loader} is not implemented")
+
         except Exception as e:
-            logger.error(f"Could not load cluster {cluster} and will skip it: {e}")
+            logger.error(f"Could not connect to cluster loader and will skip it: {e}")
 
         return None
 
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
index 06dd8c06..2cad0cca 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
@@ -1,5 +1,13 @@
-from .base import BaseWorkloadLoader, IListPodsFallback
-from .kube_api import KubeAPIWorkloadLoader
-from .prometheus import PrometheusWorkloadLoader
+from .base import BaseWorkloadLoader, IListPodsFallback, BaseClusterLoader
+from .kube_api import KubeAPIWorkloadLoader, KubeAPIClusterLoader
+from .prometheus import PrometheusWorkloadLoader, PrometheusClusterLoader
 
-__all__ = ["BaseWorkloadLoader", "IListPodsFallback", "KubeAPIWorkloadLoader", "PrometheusWorkloadLoader"]
\ No newline at end of file
+__all__ = [
+    "BaseWorkloadLoader",
+    "IListPodsFallback",
+    "KubeAPIWorkloadLoader",
+    "PrometheusWorkloadLoader",
+    "BaseClusterLoader",
+    "KubeAPIClusterLoader",
+    "PrometheusClusterLoader",
+]
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
index 11a27836..316bcbdd 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
@@ -1,9 +1,17 @@
 import abc
+import logging
+
+from typing import Optional, Union
+from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
+from robusta_krr.core.integrations.prometheus.metrics_service.prometheus_metrics_service import PrometheusMetricsService
 from robusta_krr.core.models.objects import K8sWorkload, PodData
 
 
+logger = logging.getLogger("krr")
+
+
 class BaseWorkloadLoader(abc.ABC):
-    """A base class for workload loaders."""
+    """A base class for single cluster workload loaders."""
 
     @abc.abstractmethod
     async def list_workloads(self) -> list[K8sWorkload]:
@@ -16,3 +24,34 @@ class IListPodsFallback(abc.ABC):
     @abc.abstractmethod
     async def list_pods(self, object: K8sWorkload) -> list[PodData]:
         pass
+
+
+class BaseClusterLoader(abc.ABC):
+    """
+    A class that wraps loading data from multiple clusters.
+    For example, a centralized prometheus server that can query multiple clusters.
+    Or one kubeconfig can define connections to multiple clusters.
+    """
+
+    def __init__(self) -> None:
+        self._prometheus_connectors: dict[Optional[str], PrometheusConnector] = {}
+        self._connector_errors: set[Exception] = set()
+
+    @abc.abstractmethod
+    async def list_clusters(self) -> Optional[list[str]]:
+        pass
+
+    @abc.abstractmethod
+    async def connect_cluster(self, cluster: str) -> BaseWorkloadLoader:
+        pass
+
+    def connect_prometheus(self, cluster: Optional[str] = None) -> PrometheusMetricsService:
+        """
+        Connect to a Prometheus server and return a PrometheusConnector instance.
+        Cluster = None means that prometheus is the only one: either centralized or in-cluster.
+        """
+        
+        if cluster not in self._prometheus_connectors:
+            self._prometheus_connectors[cluster] = PrometheusConnector(cluster=cluster)
+
+        return self._prometheus_connectors[cluster]
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
index a7470d70..19cd1083 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
@@ -1,10 +1,12 @@
+from __future__ import annotations
+
 import asyncio
 import logging
 from collections import defaultdict
 from concurrent.futures import ThreadPoolExecutor
 from typing import Any, Awaitable, Callable, Optional
 
-from kubernetes import client  # type: ignore
+from kubernetes import client, config  # type: ignore
 from kubernetes.client import ApiException  # type: ignore
 from kubernetes.client.models import V1Container, V2HorizontalPodAutoscaler  # type: ignore
 
@@ -12,7 +14,7 @@
 from robusta_krr.core.models.objects import HPAData, K8sWorkload, KindLiteral, PodData
 from robusta_krr.core.models.result import ResourceAllocations
 
-from ..base import BaseWorkloadLoader, IListPodsFallback
+from ..base import BaseWorkloadLoader, IListPodsFallback, BaseClusterLoader
 from .loaders import (
     BaseKindLoader,
     CronJobLoader,
@@ -29,8 +31,53 @@
 HPAKey = tuple[str, str, str]
 
 
+class KubeAPIClusterLoader(BaseClusterLoader):
+    # NOTE: For KubeAPIClusterLoader we have to first connect to read kubeconfig
+    # We do not need to connect to Prometheus from here, as we query all data from Kubernetes API
+    # Also here we might have different Prometeus instances for different clusters
+    
+    def __init__(self) -> None:
+        self.api_client = settings.get_kube_client()
+
+    async def list_clusters(self) -> Optional[list[str]]:
+        if settings.inside_cluster:
+            logger.debug("Working inside the cluster")
+            return None
+
+        try:
+            contexts, current_context = config.list_kube_config_contexts(settings.kubeconfig)
+        except config.ConfigException:
+            if settings.clusters is not None and settings.clusters != "*":
+                logger.warning("Could not load context from kubeconfig.")
+                logger.warning(f"Falling back to clusters from CLI: {settings.clusters}")
+                return settings.clusters
+            else:
+                logger.error(
+                    "Could not load context from kubeconfig. "
+                    "Please check your kubeconfig file or pass -c flag with the context name."
+                )
+            return None
+
+        logger.debug(f"Found {len(contexts)} clusters: {', '.join([context['name'] for context in contexts])}")
+        logger.debug(f"Current cluster: {current_context['name']}")
+        logger.debug(f"Configured clusters: {settings.clusters}")
+
+        # None, empty means current cluster
+        if not settings.clusters:
+            return [current_context["name"]]
+
+        # * means all clusters
+        if settings.clusters == "*":
+            return [context["name"] for context in contexts]
+
+        return [context["name"] for context in contexts if context["name"] in settings.clusters]
+
+    async def connect_cluster(self, cluster: str) -> KubeAPIWorkloadLoader:
+        return KubeAPIWorkloadLoader(cluster)
+
+
 class KubeAPIWorkloadLoader(BaseWorkloadLoader, IListPodsFallback):
-    workload_loaders: list[BaseKindLoader] = [
+    kind_loaders: list[BaseKindLoader] = [
         DeploymentLoader,
         RolloutLoader,
         DeploymentConfigLoader,
@@ -40,7 +87,7 @@ class KubeAPIWorkloadLoader(BaseWorkloadLoader, IListPodsFallback):
         CronJobLoader,
     ]
 
-    def __init__(self, cluster: Optional[str] = None) -> None:
+    def __init__(self, cluster: Optional[str]) -> None:
         self.cluster = cluster
 
         # This executor will be running requests to Kubernetes API
@@ -53,7 +100,7 @@ def __init__(self, cluster: Optional[str] = None) -> None:
         self._kind_available: defaultdict[KindLiteral, bool] = defaultdict(lambda: True)
         self._hpa_list: dict[HPAKey, HPAData] = {}
         self._workload_loaders: dict[KindLiteral, BaseKindLoader] = {
-            loader.kind: loader(self.api_client, self.executor) for loader in self.workload_loaders
+            loader.kind: loader(self.api_client, self.executor) for loader in self.kind_loaders
         }
 
     async def list_workloads(self) -> list[K8sWorkload]:
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
index bfe68534..6796d20a 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
@@ -4,24 +4,45 @@
 
 from collections import Counter
 
+from pyparsing import Optional
+
 
 from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
 from robusta_krr.core.models.config import settings
 from robusta_krr.core.models.objects import K8sWorkload
-from ..base import BaseWorkloadLoader
+from ..base import BaseWorkloadLoader, BaseClusterLoader
 from .loaders import BaseKindLoader, DoubleParentLoader, SimpleParentLoader
 
 
 logger = logging.getLogger("krr")
 
 
+class PrometheusClusterLoader(BaseClusterLoader):
+    # NOTE: For PrometheusClusterLoader we have to first connect to Prometheus, as we query all data from it
+
+    def __init__(self) -> None:
+        super().__init__()
+        self.prometheus_connector = super().connect_prometheus()
+
+    async def list_clusters(self) -> list[str]:
+        return []
+    
+    async def connect_cluster(self, cluster: str) -> BaseWorkloadLoader:
+        return PrometheusWorkloadLoader(cluster, self.prometheus_connector)
+    
+    def connect_prometheus(self, cluster: Optional[str] = None) -> PrometheusConnector:
+        # NOTE: With prometheus workload loader we can only have one Prometheus provided in parameters
+        # so in case of multiple clusters in one Prometheus (centralized version)
+        # for each cluster we will have the same PrometheusConnector (keyed by None)
+        return self.prometheus_connector
+
 class PrometheusWorkloadLoader(BaseWorkloadLoader):
     workloads: list[type[BaseKindLoader]] = [DoubleParentLoader, SimpleParentLoader]
 
-    def __init__(self, cluster: str, metric_loader: PrometheusConnector) -> None:
+    def __init__(self, cluster: str, prometheus_connector: PrometheusConnector) -> None:
         self.cluster = cluster
-        self.metric_service = metric_loader
-        self.loaders = [loader(metric_loader) for loader in self.workloads]
+        self.metric_service = prometheus_connector
+        self.loaders = [loader(prometheus_connector) for loader in self.workloads]
 
     async def list_workloads(self) -> list[K8sWorkload]:
         workloads = list(
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
index 3be8fe17..95342616 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
@@ -37,8 +37,8 @@ class BaseKindLoader(abc.ABC):
 
     kinds: list[KindLiteral] = []
 
-    def __init__(self, connector: PrometheusConnector) -> None:
-        self.connector = connector
+    def __init__(self, prometheus: PrometheusConnector) -> None:
+        self.prometheus = prometheus
         self.cluster_selector = PrometheusMetric.get_prometheus_cluster_label()
 
     @property
@@ -50,7 +50,7 @@ def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> list[K8s
         pass
 
     async def _parse_allocation(self, namespace: str, pods: list[str], container_name: str) -> ResourceAllocations:
-        limits = await self.connector.loader.query(
+        limits = await self.prometheus.loader.query(
             f"""
                 avg by(resource) (
                     kube_pod_container_resource_limits{{
@@ -62,7 +62,7 @@ async def _parse_allocation(self, namespace: str, pods: list[str], container_nam
                 )
             """
         )
-        requests = await self.connector.loader.query(
+        requests = await self.prometheus.loader.query(
             f"""
                 avg by(resource) (
                     kube_pod_container_resource_requests{{
@@ -90,7 +90,7 @@ async def _parse_allocation(self, namespace: str, pods: list[str], container_nam
         return ResourceAllocations(requests=requests_values, limits=limits_values)
 
     async def _list_containers_in_pods(self, pods: list[str]) -> set[str]:
-        containers = await self.connector.loader.query(
+        containers = await self.prometheus.loader.query(
             f"""
                 count by (container) (
                     kube_pod_container_info{{
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py
index ea2353b8..e757af47 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py
@@ -53,7 +53,7 @@ async def list_workloads_by_subowner(
         subowner_label = subowner_kind.lower() if subowner_kind != "Job" else "job_name"
 
         # Replica is for ReplicaSet and/or ReplicationController
-        subowners = await self.connector.loader.query(
+        subowners = await self.prometheus.loader.query(
             f"""
                 count by (namespace, owner_name, {subowner_label}, owner_kind) (
                     {metric_name} {{
@@ -91,7 +91,7 @@ async def list_workloads_by_subowner(
     async def _list_pods_of_subowner(
         self, namespace: str, name: str, kind: str, subowner_kind: str, subowner_names: list[str]
     ) -> list[K8sWorkload]:
-        pods = await self.connector.loader.query(
+        pods = await self.prometheus.loader.query(
             f"""
                 count by (namespace, owner_name, owner_kind, pod) (
                     kube_pod_owner{{
@@ -111,7 +111,7 @@ async def _list_pods_of_subowner(
 
         return [
             K8sWorkload(
-                cluster=self.connector.cluster,
+                cluster=self.prometheus.cluster,
                 namespace=namespace,
                 name=name,
                 kind=kind,
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
index 05b7d74c..233ebb29 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
+++ b/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
@@ -22,7 +22,7 @@ async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> li
             ('namespace=~"' + "|".join(namespaces) + '"') if namespaces != "*" else 'namespace!="kube-system"'
         )
 
-        results = await self.connector.loader.query(
+        results = await self.prometheus.loader.query(
             f"""
                 count by (namespace, owner_name, owner_kind, pod) (
                     kube_pod_owner{{
@@ -46,7 +46,7 @@ async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> li
         # NOTE: We do not show jobs that are a part of a cronjob, so we filter them out
         job_workloads = [name for (_, name, kind) in workloads if kind == "Job"]
         if job_workloads != []:
-            cronjobs = await self.connector.loader.query(
+            cronjobs = await self.prometheus.loader.query(
                 f"""
                     count by (namespace, job_name) (
                         kube_job_owner{{
@@ -72,7 +72,7 @@ async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> li
 
         return [
             K8sWorkload(
-                cluster=self.connector.cluster,
+                cluster=self.prometheus.cluster,
                 namespace=namespace,
                 name=name,
                 kind=kind,
diff --git a/robusta_krr/core/integrations/prometheus/connector.py b/robusta_krr/core/integrations/prometheus/connector.py
index ab89b346..399209a3 100644
--- a/robusta_krr/core/integrations/prometheus/connector.py
+++ b/robusta_krr/core/integrations/prometheus/connector.py
@@ -49,6 +49,14 @@ def __init__(self, *, cluster: Optional[str] = None) -> None:
 
         logger.info(f"{self.loader.name()} connected successfully for {cluster or 'inner'} cluster")
 
+    @classmethod
+    def discover(cls, api_client: ApiClient) -> PrometheusConnector:
+        return cls()
+
+    @classmethod
+    def connect(cls, cluster: str) -> PrometheusConnector:
+        return cls(cluster=cluster)
+
     def get_metrics_service(
         self,
         api_client: Optional[ApiClient] = None,
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/base_metric_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/base_metric_service.py
index ae34a7a3..9b0c1630 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/base_metric_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/base_metric_service.py
@@ -13,28 +13,13 @@
 
 
 class MetricsService(abc.ABC):
-    def __init__(
-        self,
-        api_client: Optional[ApiClient] = None,
-        cluster: Optional[str] = None,
-        executor: Optional[ThreadPoolExecutor] = None,
-    ) -> None:
-        self.api_client = api_client
-        self.cluster = cluster or "default"
-        self.executor = executor
-
     @abc.abstractmethod
     def check_connection(self):
-        ...
-
-    @classmethod
-    def name(cls) -> str:
-        classname = cls.__name__
-        return classname.replace("MetricsService", "") if classname != MetricsService.__name__ else classname
+        pass
 
     @abc.abstractmethod
     def get_cluster_names(self) -> Optional[List[str]]:
-        ...
+        pass
 
     @abc.abstractmethod
     async def gather_data(
@@ -44,7 +29,12 @@ async def gather_data(
         period: datetime.timedelta,
         step: datetime.timedelta = datetime.timedelta(minutes=30),
     ) -> PodsTimeData:
-        ...
+        pass
+
+    @classmethod
+    def name(cls) -> str:
+        classname = cls.__name__
+        return classname.replace("MetricsService", "") if classname != MetricsService.__name__ else classname
 
     def get_prometheus_cluster_label(self) -> str:
         """
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
index 50b86a63..4290e64d 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
@@ -56,14 +56,15 @@ class PrometheusMetricsService(MetricsService):
 
     def __init__(
         self,
-        *,
+        url: str,
         cluster: Optional[str] = None,
-        api_client: Optional[ApiClient] = None,
         executor: Optional[ThreadPoolExecutor] = None,
     ) -> None:
-        super().__init__(api_client=api_client, cluster=cluster, executor=executor)
+        self.url = url + self.url_postfix
+        self.cluster = cluster
+        self.executor = executor or ThreadPoolExecutor(settings.max_workers)
 
-        logger.info(f"Trying to connect to {self.name()} for {self.cluster} cluster")
+        logger.info(f"Trying to connect to {self.name()}" + self._for_cluster_postfix)
 
         self.auth_header = settings.prometheus_auth_header
         self.ssl_enabled = settings.prometheus_ssl_enabled
@@ -85,12 +86,12 @@ def __init__(
 
         if not self.url:
             raise PrometheusNotFound(
-                f"{self.name()} instance could not be found while scanning in {self.cluster} cluster."
+                f"{self.name()} instance could not be found while scanning" + self._for_cluster_postfix
             )
 
         self.url += self.url_postfix
 
-        logger.info(f"Using {self.name()} at {self.url} for cluster {cluster or 'default'}")
+        logger.info(f"Using {self.name()} at {self.url}" + self._for_cluster_postfix)
 
         headers = settings.prometheus_other_headers
         headers |= self.additional_headers
@@ -309,3 +310,8 @@ async def load_pods(self, object: K8sWorkload, period: timedelta) -> list[PodDat
             del pods_status_result
 
         return list({PodData(name=pod, deleted=pod not in current_pods_set) for pod in related_pods})
+
+    @property
+    def _for_cluster_postfix(self) -> str:
+        """The string postfix to be used in logging messages."""
+        return (f" for {self.cluster} cluster" if self.cluster else "")
diff --git a/robusta_krr/core/models/config.py b/robusta_krr/core/models/config.py
index 6e039675..4b337c76 100644
--- a/robusta_krr/core/models/config.py
+++ b/robusta_krr/core/models/config.py
@@ -5,13 +5,14 @@
 from typing import Any, Literal, Optional, Union
 
 import pydantic as pd
-from kubernetes import config
+from kubernetes import config, client
 from kubernetes.config.config_exception import ConfigException
 from rich.console import Console
 from rich.logging import RichHandler
 
 from robusta_krr.core.abstract import formatters
 from robusta_krr.core.abstract.strategies import AnyStrategy, BaseStrategy
+from robusta_krr.core.integrations.kubernetes.workload_loader.base import BaseClusterLoader
 from robusta_krr.core.models.objects import KindLiteral
 
 logger = logging.getLogger("krr")
@@ -137,6 +138,20 @@ def logging_console(self) -> Console:
             self._logging_console = Console(file=sys.stderr if self.log_to_stderr else sys.stdout, width=self.width)
         return self._logging_console
 
+    @property
+    def cluster_loader(self) -> BaseClusterLoader:
+        from robusta_krr.core.integrations.kubernetes.workload_loader import (
+            KubeAPIClusterLoader,
+            PrometheusClusterLoader,
+        )
+
+        if settings.workload_loader == "kubeapi":
+            return KubeAPIClusterLoader()
+        elif settings.workload_loader == "prometheus":
+            return PrometheusClusterLoader()
+        else:
+            raise NotImplementedError(f"Workload loader {settings.workload_loader} is not implemented")
+
     def load_kubeconfig(self) -> None:
         try:
             config.load_kube_config(config_file=self.kubeconfig, context=self.context)
@@ -145,7 +160,7 @@ def load_kubeconfig(self) -> None:
             config.load_incluster_config()
             self.inside_cluster = True
 
-    def get_kube_client(self, context: Optional[str] = None):
+    def get_kube_client(self, context: Optional[str] = None) -> client.ApiClient:
         if context is None:
             return None
 

From 4c1f5c9735a8b35df515920bb337ba9962e7ac5d Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Tue, 30 Apr 2024 18:14:44 +0300
Subject: [PATCH 08/24] Finished structure changes and workload loaders

---
 robusta_krr/core/abstract/cluster_loader.py   |  46 ++++++++
 robusta_krr/core/abstract/workload_loader.py  |  23 ++++
 .../core/integrations/kubernetes/__init__.py  | 101 ------------------
 .../kube_api => cluster_loader}/__init__.py   |  34 +++++-
 .../loaders/__init__.py                       |   0
 .../loaders/base.py                           |   0
 .../loaders/cronjobs.py                       |   0
 .../loaders/daemonsets.py                     |   0
 .../loaders/deploymentconfigs.py              |   0
 .../loaders/deployments.py                    |   0
 .../loaders/jobs.py                           |   0
 .../loaders/rollouts.py                       |   0
 .../loaders/statefulsets.py                   |   0
 .../kubernetes/workload_loader/__init__.py    |  13 ---
 .../kubernetes/workload_loader/base.py        |  57 ----------
 .../cluster_loader}/__init__.py               |  48 ++++++---
 .../cluster_loader}/loaders/__init__.py       |   0
 .../cluster_loader}/loaders/base.py           |   0
 .../cluster_loader}/loaders/double_parent.py  |   0
 .../cluster_loader}/loaders/simple_parent.py  |   0
 .../core/integrations/prometheus/connector.py |  96 +++++++++--------
 .../metrics_service/mimir_metrics_service.py  |   1 +
 .../prometheus_metrics_service.py             |  43 ++++----
 robusta_krr/core/models/config.py             |  27 +++--
 robusta_krr/core/models/exceptions.py         |   2 +
 robusta_krr/core/runner.py                    |  83 +++++++++-----
 robusta_krr/main.py                           |  16 +--
 27 files changed, 290 insertions(+), 300 deletions(-)
 create mode 100644 robusta_krr/core/abstract/cluster_loader.py
 create mode 100644 robusta_krr/core/abstract/workload_loader.py
 delete mode 100644 robusta_krr/core/integrations/kubernetes/__init__.py
 rename robusta_krr/core/integrations/kubernetes/{workload_loader/kube_api => cluster_loader}/__init__.py (87%)
 rename robusta_krr/core/integrations/kubernetes/{workload_loader/kube_api => cluster_loader}/loaders/__init__.py (100%)
 rename robusta_krr/core/integrations/kubernetes/{workload_loader/kube_api => cluster_loader}/loaders/base.py (100%)
 rename robusta_krr/core/integrations/kubernetes/{workload_loader/kube_api => cluster_loader}/loaders/cronjobs.py (100%)
 rename robusta_krr/core/integrations/kubernetes/{workload_loader/kube_api => cluster_loader}/loaders/daemonsets.py (100%)
 rename robusta_krr/core/integrations/kubernetes/{workload_loader/kube_api => cluster_loader}/loaders/deploymentconfigs.py (100%)
 rename robusta_krr/core/integrations/kubernetes/{workload_loader/kube_api => cluster_loader}/loaders/deployments.py (100%)
 rename robusta_krr/core/integrations/kubernetes/{workload_loader/kube_api => cluster_loader}/loaders/jobs.py (100%)
 rename robusta_krr/core/integrations/kubernetes/{workload_loader/kube_api => cluster_loader}/loaders/rollouts.py (100%)
 rename robusta_krr/core/integrations/kubernetes/{workload_loader/kube_api => cluster_loader}/loaders/statefulsets.py (100%)
 delete mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
 delete mode 100644 robusta_krr/core/integrations/kubernetes/workload_loader/base.py
 rename robusta_krr/core/integrations/{kubernetes/workload_loader/prometheus => prometheus/cluster_loader}/__init__.py (54%)
 rename robusta_krr/core/integrations/{kubernetes/workload_loader/prometheus => prometheus/cluster_loader}/loaders/__init__.py (100%)
 rename robusta_krr/core/integrations/{kubernetes/workload_loader/prometheus => prometheus/cluster_loader}/loaders/base.py (100%)
 rename robusta_krr/core/integrations/{kubernetes/workload_loader/prometheus => prometheus/cluster_loader}/loaders/double_parent.py (100%)
 rename robusta_krr/core/integrations/{kubernetes/workload_loader/prometheus => prometheus/cluster_loader}/loaders/simple_parent.py (100%)
 create mode 100644 robusta_krr/core/models/exceptions.py

diff --git a/robusta_krr/core/abstract/cluster_loader.py b/robusta_krr/core/abstract/cluster_loader.py
new file mode 100644
index 00000000..86767d1a
--- /dev/null
+++ b/robusta_krr/core/abstract/cluster_loader.py
@@ -0,0 +1,46 @@
+from __future__ import annotations
+
+import abc
+import logging
+from typing import Optional, TYPE_CHECKING
+
+from .workload_loader import BaseWorkloadLoader
+
+if TYPE_CHECKING:
+    from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
+
+
+logger = logging.getLogger("krr")
+
+
+class BaseClusterLoader(abc.ABC):
+    """
+    A class that wraps loading data from multiple clusters.
+    For example, a centralized prometheus server that can query multiple clusters.
+    Or one kubeconfig can define connections to multiple clusters.
+    """
+
+    @abc.abstractmethod
+    async def list_clusters(self) -> Optional[list[str]]:
+        pass
+
+    @abc.abstractmethod
+    def get_workload_loader(self, cluster: Optional[str]) -> BaseWorkloadLoader:
+        pass
+
+    def try_get_workload_loader(self, cluster: Optional[str]) -> Optional[BaseWorkloadLoader]:
+        try:
+            return self.get_workload_loader(cluster)
+        except Exception as e:
+            logger.error(f"Could not connect to cluster {cluster} and will skip it: {e}")
+            return None
+
+    @abc.abstractmethod
+    def get_prometheus(self, cluster: Optional[str]) -> PrometheusConnector:
+        """
+        Connect to a Prometheus server and return a PrometheusConnector instance.
+        Cluster = None means that prometheus is the only one: either centralized or in-cluster.
+        raise prometrix.PrometheusNotFound if Prometheus is not available.
+        """
+
+        pass
diff --git a/robusta_krr/core/abstract/workload_loader.py b/robusta_krr/core/abstract/workload_loader.py
new file mode 100644
index 00000000..42860eef
--- /dev/null
+++ b/robusta_krr/core/abstract/workload_loader.py
@@ -0,0 +1,23 @@
+import abc
+import logging
+
+from robusta_krr.core.models.objects import K8sWorkload, PodData
+
+
+logger = logging.getLogger("krr")
+
+
+class BaseWorkloadLoader(abc.ABC):
+    """A base class for single cluster workload loaders."""
+
+    @abc.abstractmethod
+    async def list_workloads(self) -> list[K8sWorkload]:
+        pass
+
+
+class IListPodsFallback(abc.ABC):
+    """This is an interface that a workload loader can implement to have a fallback method to list pods."""
+
+    @abc.abstractmethod
+    async def load_pods(self, object: K8sWorkload) -> list[PodData]:
+        pass
diff --git a/robusta_krr/core/integrations/kubernetes/__init__.py b/robusta_krr/core/integrations/kubernetes/__init__.py
deleted file mode 100644
index 403768ce..00000000
--- a/robusta_krr/core/integrations/kubernetes/__init__.py
+++ /dev/null
@@ -1,101 +0,0 @@
-import asyncio
-import logging
-from collections import defaultdict
-from concurrent.futures import ThreadPoolExecutor
-from typing import Any, Awaitable, Callable, Iterable, Optional, Union
-
-from kubernetes import client, config  # type: ignore
-from kubernetes.client import ApiException
-from kubernetes.client.models import (
-    V1Container,
-    V1DaemonSet,
-    V1Deployment,
-    V1Job,
-    V1Pod,
-    V1PodList,
-    V1StatefulSet,
-    V2HorizontalPodAutoscaler,
-)
-
-from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
-from robusta_krr.core.models.config import settings
-from robusta_krr.core.models.objects import HPAData, K8sWorkload, KindLiteral, PodData
-from robusta_krr.core.models.result import ResourceAllocations
-from robusta_krr.utils.object_like_dict import ObjectLikeDict
-from prometrix import PrometheusNotFound
-
-from . import config_patch as _
-from .workload_loader import (
-    BaseWorkloadLoader,
-    PrometheusWorkloadLoader,
-    BaseClusterLoader,
-    KubeAPIClusterLoader,
-    PrometheusClusterLoader,
-)
-
-logger = logging.getLogger("krr")
-
-AnyKubernetesAPIObject = Union[V1Deployment, V1DaemonSet, V1StatefulSet, V1Pod, V1Job]
-HPAKey = tuple[str, str, str]
-
-
-class ClusterConnector:
-    EXPECTED_EXCEPTIONS = (KeyboardInterrupt, PrometheusNotFound)
-
-    def __init__(self) -> None:
-        self._prometheus_connectors: dict[Optional[str], Union[PrometheusConnector, Exception]] = {}
-        self._connector_errors: set[Exception] = set()
-
-    def get_prometheus(self, cluster: Optional[str]) -> Optional[PrometheusConnector]:
-        if settings.workload_loader == "kubeapi":
-            logger.debug(f"Creating Prometheus connector for cluster {cluster}")
-        elif settings.workload_loader == "prometheus":
-            logger.debug(f"Creating Prometheus connector")
-            # NOTE: With prometheus workload loader we can only have one Prometheus provided in parameters
-            # so in case of multiple clusters in one Prometheus (centralized version) 
-            # for each cluster we will have the same PrometheusConnector (keyed by None)
-            cluster = None
-
-        
-
-    def _create_cluster_loader(self) -> BaseClusterLoader:
-        try:
-
-        except Exception as e:
-            logger.error(f"Could not connect to cluster loader and will skip it: {e}")
-
-        return None
-
-    async def list_workloads(self, clusters: Optional[list[str]]) -> list[K8sWorkload]:
-        """List all scannable objects.
-
-        Returns:
-            A list of all loaded objects.
-        """
-
-        if clusters is None:
-            _cluster_loaders = [self._try_create_cluster_loader(None)]
-        else:
-            _cluster_loaders = [self._try_create_cluster_loader(cluster) for cluster in clusters]
-
-        self.cluster_loaders: dict[Optional[str], BaseWorkloadLoader] = {
-            cl.cluster: cl for cl in _cluster_loaders if cl is not None
-        }
-
-        if self.cluster_loaders == {}:
-            logger.error("Could not load any cluster.")
-            return []
-
-        return [
-            object
-            for cluster_loader in self.cluster_loaders.values()
-            for object in await cluster_loader.list_workloads()
-        ]
-
-    async def load_pods(self, object: K8sWorkload) -> list[PodData]:
-        try:
-            cluster_loader = self.cluster_loaders[object.cluster]
-        except KeyError:
-            raise RuntimeError(f"Cluster loader for cluster {object.cluster} not found") from None
-
-        return await cluster_loader.list_pods(object)
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
similarity index 87%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
rename to robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
index 19cd1083..ab520bba 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
@@ -9,12 +9,18 @@
 from kubernetes import client, config  # type: ignore
 from kubernetes.client import ApiException  # type: ignore
 from kubernetes.client.models import V1Container, V2HorizontalPodAutoscaler  # type: ignore
+from functools import cache
 
+from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
+from robusta_krr.core.integrations.prometheus.metrics_service.prometheus_metrics_service import PrometheusMetricsService
 from robusta_krr.core.models.config import settings
+from robusta_krr.core.models.exceptions import CriticalRunnerException
 from robusta_krr.core.models.objects import HPAData, K8sWorkload, KindLiteral, PodData
 from robusta_krr.core.models.result import ResourceAllocations
 
-from ..base import BaseWorkloadLoader, IListPodsFallback, BaseClusterLoader
+
+from robusta_krr.core.abstract.workload_loader import BaseWorkloadLoader, IListPodsFallback
+from robusta_krr.core.abstract.cluster_loader import BaseClusterLoader
 from .loaders import (
     BaseKindLoader,
     CronJobLoader,
@@ -37,7 +43,16 @@ class KubeAPIClusterLoader(BaseClusterLoader):
     # Also here we might have different Prometeus instances for different clusters
     
     def __init__(self) -> None:
+        try:
+            settings.load_kubeconfig()
+        except Exception as e:
+            logger.error(f"Could not load kubernetes configuration: {e.__class__.__name__}\n{e}")
+            logger.error("Try to explicitly set --context and/or --kubeconfig flags.")
+            logger.error("Alternatively, try a prometheus-only mode with `--mode prometheus`")
+            raise CriticalRunnerException("Could not load kubernetes configuration") from e
+
         self.api_client = settings.get_kube_client()
+        self._prometheus_connectors: dict[Optional[str], PrometheusConnector] = {}
 
     async def list_clusters(self) -> Optional[list[str]]:
         if settings.inside_cluster:
@@ -72,8 +87,19 @@ async def list_clusters(self) -> Optional[list[str]]:
 
         return [context["name"] for context in contexts if context["name"] in settings.clusters]
 
-    async def connect_cluster(self, cluster: str) -> KubeAPIWorkloadLoader:
+    @cache
+    def get_workload_loader(self, cluster: Optional[str]) -> KubeAPIWorkloadLoader:
         return KubeAPIWorkloadLoader(cluster)
+    
+    @cache
+    def get_prometheus(self, cluster: Optional[str]) -> PrometheusConnector:
+        connector = PrometheusConnector(cluster=cluster)
+        if settings.prometheus_url is not None:
+            logger.info(f"Connecting to Prometheus using URL: {settings.prometheus_url}")
+            connector.connect(settings.prometheus_url)
+        else:
+            logger.info(f"Trying to discover PromQL service" + (f" for cluster {cluster}" if cluster else ""))
+            connector.discover(api_client=self.api_client)
 
 
 class KubeAPIWorkloadLoader(BaseWorkloadLoader, IListPodsFallback):
@@ -131,7 +157,7 @@ async def list_workloads(self) -> list[K8sWorkload]:
             if not (settings.namespaces == "*" and object.namespace == "kube-system")
         ]
 
-    async def list_pods(self, object: K8sWorkload) -> list[PodData]:
+    async def load_pods(self, object: K8sWorkload) -> list[PodData]:
         return await self._workload_loaders[object.kind].list_pods(object)
 
     def _build_scannable_object(self, item: Any, container: V1Container, kind: Optional[str] = None) -> K8sWorkload:
@@ -320,4 +346,4 @@ async def _try_list_hpa(self) -> dict[HPAKey, HPAData]:
             return {}
 
 
-__all__ = ["KubeAPIWorkloadLoader"]
+__all__ = ["KubeAPIWorkloadLoader", "KubeAPIClusterLoader"]
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/__init__.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/__init__.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/__init__.py
rename to robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/__init__.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/base.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/base.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/base.py
rename to robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/base.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/cronjobs.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/cronjobs.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/cronjobs.py
rename to robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/cronjobs.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/daemonsets.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/daemonsets.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/daemonsets.py
rename to robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/daemonsets.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deploymentconfigs.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/deploymentconfigs.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deploymentconfigs.py
rename to robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/deploymentconfigs.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deployments.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/deployments.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/deployments.py
rename to robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/deployments.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/jobs.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/jobs.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/jobs.py
rename to robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/jobs.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/rollouts.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/rollouts.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/rollouts.py
rename to robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/rollouts.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/statefulsets.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/statefulsets.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/kube_api/loaders/statefulsets.py
rename to robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/statefulsets.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py b/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
deleted file mode 100644
index 2cad0cca..00000000
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/__init__.py
+++ /dev/null
@@ -1,13 +0,0 @@
-from .base import BaseWorkloadLoader, IListPodsFallback, BaseClusterLoader
-from .kube_api import KubeAPIWorkloadLoader, KubeAPIClusterLoader
-from .prometheus import PrometheusWorkloadLoader, PrometheusClusterLoader
-
-__all__ = [
-    "BaseWorkloadLoader",
-    "IListPodsFallback",
-    "KubeAPIWorkloadLoader",
-    "PrometheusWorkloadLoader",
-    "BaseClusterLoader",
-    "KubeAPIClusterLoader",
-    "PrometheusClusterLoader",
-]
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/base.py b/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
deleted file mode 100644
index 316bcbdd..00000000
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/base.py
+++ /dev/null
@@ -1,57 +0,0 @@
-import abc
-import logging
-
-from typing import Optional, Union
-from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
-from robusta_krr.core.integrations.prometheus.metrics_service.prometheus_metrics_service import PrometheusMetricsService
-from robusta_krr.core.models.objects import K8sWorkload, PodData
-
-
-logger = logging.getLogger("krr")
-
-
-class BaseWorkloadLoader(abc.ABC):
-    """A base class for single cluster workload loaders."""
-
-    @abc.abstractmethod
-    async def list_workloads(self) -> list[K8sWorkload]:
-        pass
-
-
-class IListPodsFallback(abc.ABC):
-    """This is an interface that a workload loader can implement to have a fallback method to list pods."""
-
-    @abc.abstractmethod
-    async def list_pods(self, object: K8sWorkload) -> list[PodData]:
-        pass
-
-
-class BaseClusterLoader(abc.ABC):
-    """
-    A class that wraps loading data from multiple clusters.
-    For example, a centralized prometheus server that can query multiple clusters.
-    Or one kubeconfig can define connections to multiple clusters.
-    """
-
-    def __init__(self) -> None:
-        self._prometheus_connectors: dict[Optional[str], PrometheusConnector] = {}
-        self._connector_errors: set[Exception] = set()
-
-    @abc.abstractmethod
-    async def list_clusters(self) -> Optional[list[str]]:
-        pass
-
-    @abc.abstractmethod
-    async def connect_cluster(self, cluster: str) -> BaseWorkloadLoader:
-        pass
-
-    def connect_prometheus(self, cluster: Optional[str] = None) -> PrometheusMetricsService:
-        """
-        Connect to a Prometheus server and return a PrometheusConnector instance.
-        Cluster = None means that prometheus is the only one: either centralized or in-cluster.
-        """
-        
-        if cluster not in self._prometheus_connectors:
-            self._prometheus_connectors[cluster] = PrometheusConnector(cluster=cluster)
-
-        return self._prometheus_connectors[cluster]
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py b/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
similarity index 54%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
rename to robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
index 6796d20a..c073ab53 100644
--- a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/__init__.py
+++ b/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
@@ -1,16 +1,20 @@
+from __future__ import annotations
+
 import asyncio
 import itertools
 import logging
 
 from collections import Counter
 
-from pyparsing import Optional
-
+from typing import Optional
+from functools import cache
 
 from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
 from robusta_krr.core.models.config import settings
 from robusta_krr.core.models.objects import K8sWorkload
-from ..base import BaseWorkloadLoader, BaseClusterLoader
+from robusta_krr.core.abstract.workload_loader import BaseWorkloadLoader
+from robusta_krr.core.abstract.cluster_loader import BaseClusterLoader
+from robusta_krr.core.models.exceptions import CriticalRunnerException
 from .loaders import BaseKindLoader, DoubleParentLoader, SimpleParentLoader
 
 
@@ -21,20 +25,34 @@ class PrometheusClusterLoader(BaseClusterLoader):
     # NOTE: For PrometheusClusterLoader we have to first connect to Prometheus, as we query all data from it
 
     def __init__(self) -> None:
-        super().__init__()
-        self.prometheus_connector = super().connect_prometheus()
-
-    async def list_clusters(self) -> list[str]:
-        return []
-    
-    async def connect_cluster(self, cluster: str) -> BaseWorkloadLoader:
-        return PrometheusWorkloadLoader(cluster, self.prometheus_connector)
-    
-    def connect_prometheus(self, cluster: Optional[str] = None) -> PrometheusConnector:
+        self._prometheus_connector = PrometheusConnector()
+        if not settings.prometheus_url:
+            raise CriticalRunnerException(
+                "Prometheus URL is not provided. "
+                "Can not auto-discover Prometheus with `--mode prometheus`. "
+                "Please provide the URL with `--prometheus-url` flag."
+            )
+
+        self._prometheus_connector.connect(settings.prometheus_url)
+
+    async def list_clusters(self) -> Optional[list[str]]:
+        if settings.prometheus_cluster_label is None:
+            return None
+
+        # TODO: We can try to auto-discover clusters by querying Prometheus,
+        # but for that we will need to rework PrometheusMetric.get_prometheus_cluster_label
+        return [settings.prometheus_cluster_label]
+
+    @cache
+    def get_workload_loader(self, cluster: str) -> PrometheusWorkloadLoader:
+        return PrometheusWorkloadLoader(cluster, self._prometheus_connector)
+
+    def get_prometheus(self, cluster: Optional[str]) -> PrometheusConnector:
         # NOTE: With prometheus workload loader we can only have one Prometheus provided in parameters
         # so in case of multiple clusters in one Prometheus (centralized version)
         # for each cluster we will have the same PrometheusConnector (keyed by None)
-        return self.prometheus_connector
+        return self._prometheus_connector
+
 
 class PrometheusWorkloadLoader(BaseWorkloadLoader):
     workloads: list[type[BaseKindLoader]] = [DoubleParentLoader, SimpleParentLoader]
@@ -56,3 +74,5 @@ async def list_workloads(self) -> list[K8sWorkload]:
             logger.info(f"Found {count} {kind} in {self.cluster}")
 
         return workloads
+
+__all__ = ["PrometheusClusterLoader", "PrometheusWorkloadLoader"]
\ No newline at end of file
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/__init__.py b/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/__init__.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/__init__.py
rename to robusta_krr/core/integrations/prometheus/cluster_loader/loaders/__init__.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py b/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/base.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/base.py
rename to robusta_krr/core/integrations/prometheus/cluster_loader/loaders/base.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py b/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/double_parent.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/double_parent.py
rename to robusta_krr/core/integrations/prometheus/cluster_loader/loaders/double_parent.py
diff --git a/robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py b/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/simple_parent.py
similarity index 100%
rename from robusta_krr/core/integrations/kubernetes/workload_loader/prometheus/loaders/simple_parent.py
rename to robusta_krr/core/integrations/prometheus/cluster_loader/loaders/simple_parent.py
diff --git a/robusta_krr/core/integrations/prometheus/connector.py b/robusta_krr/core/integrations/prometheus/connector.py
index 399209a3..d75050f8 100644
--- a/robusta_krr/core/integrations/prometheus/connector.py
+++ b/robusta_krr/core/integrations/prometheus/connector.py
@@ -5,7 +5,6 @@
 from concurrent.futures import ThreadPoolExecutor
 from typing import TYPE_CHECKING, Optional
 
-from kubernetes import config as k8s_config
 from kubernetes.client.api_client import ApiClient
 from kubernetes.client.exceptions import ApiException
 from prometrix import MetricsNotFound, PrometheusNotFound
@@ -35,58 +34,56 @@ def __init__(self, *, cluster: Optional[str] = None) -> None:
 
         self.executor = ThreadPoolExecutor(settings.max_workers)
         self.cluster = cluster
-        self.api_client = settings.get_kube_client(context=cluster)
-        loader = self.get_metrics_service(api_client=self.api_client, cluster=cluster)
-        if loader is None:
-            raise PrometheusNotFound(
-                f"Wasn't able to connect to any Prometheus service in {cluster or 'inner'} cluster\n"
-                "Try using port-forwarding and/or setting the url manually (using the -p flag.).\n"
-                "For more information, see 'Giving the Explicit Prometheus URL' at "
-                "https://github.com/robusta-dev/krr?tab=readme-ov-file#usage"
-            )
-
-        self.loader = loader
-
-        logger.info(f"{self.loader.name()} connected successfully for {cluster or 'inner'} cluster")
-
-    @classmethod
-    def discover(cls, api_client: ApiClient) -> PrometheusConnector:
-        return cls()
 
-    @classmethod
-    def connect(cls, cluster: str) -> PrometheusConnector:
-        return cls(cluster=cluster)
-
-    def get_metrics_service(
-        self,
-        api_client: Optional[ApiClient] = None,
-        cluster: Optional[str] = None,
-    ) -> Optional[PrometheusMetricsService]:
-        if settings.prometheus_url is not None:
-            logger.info("Prometheus URL is specified, will not auto-detect a metrics service")
-            metrics_to_check = [PrometheusMetricsService]
-        else:
-            logger.info("No Prometheus URL is specified, trying to auto-detect a metrics service")
-            metrics_to_check = [VictoriaMetricsService, ThanosMetricsService, MimirMetricsService, PrometheusMetricsService]
+    def discover(self, api_client: ApiClient) -> None:
+        """Try to automatically discover a Prometheus service."""
+        metrics_to_check: list[PrometheusMetricsService] = [
+            VictoriaMetricsService,
+            ThanosMetricsService,
+            MimirMetricsService,
+            PrometheusMetricsService,
+        ]
 
         for metric_service_class in metrics_to_check:
-            service_name = metric_service_class.name()
+            logger.info(f"Trying to find {metric_service_class.name()}{self._for_cluster_postfix}")
             try:
-                loader = metric_service_class(api_client=api_client, cluster=cluster, executor=self.executor)
-                loader.check_connection()
-            except MetricsNotFound as e:
-                logger.info(f"{service_name} not found: {e}")
-            except ApiException as e:
-                logger.warning(
-                    f"Unable to automatically discover a {service_name} in the cluster ({e}). "
-                    "Try specifying how to connect to Prometheus via cli options"
-                )
+                loader = metric_service_class.discover(api_client=api_client)
+                self._connect(loader)
+            except Exception:
+                logger.info(f"Wasn't able to find {metric_service_class.name()}{self._for_cluster_postfix}")
             else:
-                logger.info(f"{service_name} found")
-                loader.validate_cluster_name()
-                return loader
+                return
+
+        raise PrometheusNotFound
 
-        return None
+    def connect(self, url: Optional[str] = None) -> None:
+        """Connect to a Prometheus service using a URL."""
+        try:
+            loader = PrometheusMetricsService(url=url)
+            self._connect(loader)
+        except Exception as e:
+            logger.warning(f"Unable to connect to Prometheus using the provided URL ({e})")
+            raise e
+        else:
+            logger.info(f"{loader.name()} connected successfully")
+
+    def _connect(self, loader: PrometheusMetricsService) -> None:
+        service_name = loader.name()
+        try:
+            loader.check_connection()
+        except MetricsNotFound as e:
+            logger.info(f"{service_name} not found: {e}")
+            raise PrometheusNotFound(f"Wasn't able to connect to {service_name}" + self._for_cluster_postfix)
+        except ApiException as e:
+            logger.warning(
+                f"Unable to automatically discover a {service_name}{self._for_cluster_postfix} ({e}). "
+                "Try specifying how to connect to Prometheus via cli options"
+            )
+            raise e
+        else:
+            logger.info(f"{service_name} found")
+            loader.validate_cluster_name()
+            self.loader = loader
 
     async def get_history_range(
         self, history_duration: datetime.timedelta
@@ -125,3 +122,8 @@ async def gather_data(
             MetricLoader.__name__: await self.loader.gather_data(object, MetricLoader, period, step)
             for MetricLoader in strategy.metrics
         }
+
+    @property
+    def _for_cluster_postfix(self) -> str:
+        """The string postfix to be used in logging messages."""
+        return f" for {self.cluster} cluster" if self.cluster else ""
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/mimir_metrics_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/mimir_metrics_service.py
index ea3af57c..e11d705c 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/mimir_metrics_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/mimir_metrics_service.py
@@ -7,6 +7,7 @@
 
 from .prometheus_metrics_service import PrometheusMetricsService
 
+
 class MimirMetricsDiscovery(MetricsServiceDiscovery):
     def find_metrics_url(self, *, api_client: Optional[ApiClient] = None) -> Optional[str]:
         """
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
index 4290e64d..08fd83fe 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
@@ -1,8 +1,11 @@
+from __future__ import annotations
+
 import asyncio
 import logging
 from concurrent.futures import ThreadPoolExecutor
 from datetime import datetime, timedelta
 from typing import Iterable, List, Optional
+from typing_extensions import Self
 
 from kubernetes.client import ApiClient
 from prometheus_api_client import PrometheusApiClientException
@@ -59,16 +62,18 @@ def __init__(
         url: str,
         cluster: Optional[str] = None,
         executor: Optional[ThreadPoolExecutor] = None,
+        api_client: Optional[ApiClient] = None,
     ) -> None:
         self.url = url + self.url_postfix
         self.cluster = cluster
         self.executor = executor or ThreadPoolExecutor(settings.max_workers)
-
-        logger.info(f"Trying to connect to {self.name()}" + self._for_cluster_postfix)
+        self.api_client = api_client
 
         self.auth_header = settings.prometheus_auth_header
         self.ssl_enabled = settings.prometheus_ssl_enabled
 
+        logger.info(f"Using {self.name()} at {self.url}" + self._for_cluster_postfix)
+
         if settings.openshift:
             logging.info("Openshift flag is set, trying to load token from service account.")
             openshift_token = openshift.load_token()
@@ -79,20 +84,6 @@ def __init__(
             else:
                 logging.warning("Openshift token is not found, trying to connect without it.")
 
-        self.prometheus_discovery = self.service_discovery(api_client=self.api_client)
-
-        self.url = settings.prometheus_url
-        self.url = self.url or self.prometheus_discovery.find_metrics_url()
-
-        if not self.url:
-            raise PrometheusNotFound(
-                f"{self.name()} instance could not be found while scanning" + self._for_cluster_postfix
-            )
-
-        self.url += self.url_postfix
-
-        logger.info(f"Using {self.name()} at {self.url}" + self._for_cluster_postfix)
-
         headers = settings.prometheus_other_headers
         headers |= self.additional_headers
 
@@ -100,9 +91,23 @@ def __init__(
             headers |= {"Authorization": self.auth_header}
         elif not settings.inside_cluster and self.api_client is not None:
             self.api_client.update_params_for_auth(headers, {}, ["BearerToken"])
+
         self.prom_config = generate_prometheus_config(url=self.url, headers=headers, metrics_service=self)
         self.prometheus = get_custom_prometheus_connect(self.prom_config)
 
+    @classmethod
+    def discover(
+        cls,
+        api_client: ApiClient,
+        cluster: Optional[str] = None,
+        executor: Optional[ThreadPoolExecutor] = None,
+    ) -> Self:
+        url = cls.service_discovery(api_client=api_client).find_metrics_url()
+        if not url:
+            raise PrometheusNotFound(f"{cls.name()} instance could not be found while scanning")
+
+        return cls(url, cluster, executor, api_client)
+
     def check_connection(self):
         """
         Checks the connection to Prometheus.
@@ -249,7 +254,9 @@ async def load_pods(self, object: K8sWorkload, period: timedelta) -> list[PodDat
                     }}[{period_literal}]
                 """
             )
-            pod_owners = {repl_controller["metric"]["replicationcontroller"] for repl_controller in replication_controllers}
+            pod_owners = {
+                repl_controller["metric"]["replicationcontroller"] for repl_controller in replication_controllers
+            }
             pod_owner_kind = "ReplicationController"
 
             del replication_controllers
@@ -314,4 +321,4 @@ async def load_pods(self, object: K8sWorkload, period: timedelta) -> list[PodDat
     @property
     def _for_cluster_postfix(self) -> str:
         """The string postfix to be used in logging messages."""
-        return (f" for {self.cluster} cluster" if self.cluster else "")
+        return f" for {self.cluster} cluster" if self.cluster else ""
diff --git a/robusta_krr/core/models/config.py b/robusta_krr/core/models/config.py
index 4b337c76..4f8b5066 100644
--- a/robusta_krr/core/models/config.py
+++ b/robusta_krr/core/models/config.py
@@ -1,6 +1,7 @@
 from __future__ import annotations
 
 import logging
+from enum import Enum
 import sys
 from typing import Any, Literal, Optional, Union
 
@@ -12,19 +13,24 @@
 
 from robusta_krr.core.abstract import formatters
 from robusta_krr.core.abstract.strategies import AnyStrategy, BaseStrategy
-from robusta_krr.core.integrations.kubernetes.workload_loader.base import BaseClusterLoader
+from robusta_krr.core.abstract.cluster_loader import BaseClusterLoader
 from robusta_krr.core.models.objects import KindLiteral
 
 logger = logging.getLogger("krr")
 
 
+class LoadingMode(str, Enum):
+    KUBEAPI = "kubeapi"
+    PROMETHETUS = "prometheus"
+
+
 class Config(pd.BaseSettings):
     quiet: bool = pd.Field(False)
     verbose: bool = pd.Field(False)
 
     clusters: Union[list[str], Literal["*"], None] = None
     kubeconfig: Optional[str] = None
-    workload_loader: Literal["kubeapi", "prometheus"] = pd.Field("kubeapi")
+    mode: LoadingMode = pd.Field(LoadingMode.KUBEAPI)
     impersonate_user: Optional[str] = None
     impersonate_group: Optional[str] = None
     namespaces: Union[list[str], Literal["*"]] = pd.Field("*")
@@ -138,19 +144,18 @@ def logging_console(self) -> Console:
             self._logging_console = Console(file=sys.stderr if self.log_to_stderr else sys.stdout, width=self.width)
         return self._logging_console
 
-    @property
-    def cluster_loader(self) -> BaseClusterLoader:
-        from robusta_krr.core.integrations.kubernetes.workload_loader import (
-            KubeAPIClusterLoader,
-            PrometheusClusterLoader,
-        )
+    def create_cluster_loader(self) -> BaseClusterLoader:
+        from robusta_krr.core.integrations.prometheus.cluster_loader import PrometheusClusterLoader
+        from robusta_krr.core.integrations.kubernetes.cluster_loader import KubeAPIClusterLoader
 
-        if settings.workload_loader == "kubeapi":
+        if settings.mode == LoadingMode.KUBEAPI:
+            logger.info("Connecting using Kubernetes API, will load the kubeconfig.")
             return KubeAPIClusterLoader()
-        elif settings.workload_loader == "prometheus":
+        elif settings.mode == LoadingMode.PROMETHETUS:
+            logger.info("Connecting using Prometheus, will load the kubeconfig.")
             return PrometheusClusterLoader()
         else:
-            raise NotImplementedError(f"Workload loader {settings.workload_loader} is not implemented")
+            raise NotImplementedError(f"Workload loader {settings.mode} is not implemented")
 
     def load_kubeconfig(self) -> None:
         try:
diff --git a/robusta_krr/core/models/exceptions.py b/robusta_krr/core/models/exceptions.py
new file mode 100644
index 00000000..70f3b052
--- /dev/null
+++ b/robusta_krr/core/models/exceptions.py
@@ -0,0 +1,2 @@
+class CriticalRunnerException(Exception):
+    """This exception will be raised when a critical error occurs in the runner and the runner cannot continue."""
diff --git a/robusta_krr/core/runner.py b/robusta_krr/core/runner.py
index bb109df8..75c2191b 100644
--- a/robusta_krr/core/runner.py
+++ b/robusta_krr/core/runner.py
@@ -1,4 +1,5 @@
 import asyncio
+import itertools
 import logging
 import math
 import os
@@ -8,12 +9,13 @@
 from datetime import timedelta
 from rich.console import Console
 from slack_sdk import WebClient
+from prometrix import PrometheusNotFound
 
 from robusta_krr.core.abstract.strategies import ResourceRecommendation, RunResult
-from robusta_krr.core.integrations.kubernetes.workload_loader import IListPodsFallback
-from robusta_krr.core.integrations.kubernetes import ClusterConnector
+from robusta_krr.core.abstract.workload_loader import IListPodsFallback
 from robusta_krr.core.integrations.prometheus import ClusterNotSpecifiedException
 from robusta_krr.core.models.config import settings
+from robusta_krr.core.models.exceptions import CriticalRunnerException
 from robusta_krr.core.models.objects import K8sWorkload
 from robusta_krr.core.models.result import ResourceAllocations, ResourceScan, ResourceType, Result, StrategyData
 from robusta_krr.utils.intro import load_intro_message
@@ -33,12 +35,8 @@ def custom_print(*objects, rich: bool = True, force: bool = False) -> None:
         print_func(*objects)  # type: ignore
 
 
-class CriticalRunnerException(Exception): ...
-
-
 class Runner:
     def __init__(self) -> None:
-        self.connector = ClusterConnector()
         self.strategy = settings.create_strategy()
 
         self.errors: list[dict] = []
@@ -144,16 +142,18 @@ def _format_result(self, result: RunResult) -> RunResult:
         }
 
     async def _calculate_object_recommendations(self, object: K8sWorkload) -> Optional[RunResult]:
-        prometheus_loader = self.connector.get_prometheus(object.cluster)
+        prometheus = self.connector.get_prometheus(object.cluster)
 
-        if prometheus_loader is None:
+        if prometheus is None:
             return None
 
-        object.pods = await prometheus_loader.load_pods(object, self.strategy.settings.history_timedelta)
-        if object.pods == [] and isinstance(self.connector, IListPodsFallback):
+        cluster_loader = self.connector.get_workload_loader(object.cluster)
+
+        object.pods = await prometheus.load_pods(object, self.strategy.settings.history_timedelta)
+        if object.pods == [] and isinstance(cluster_loader, IListPodsFallback):
             # Fallback to IListPodsFallback if Prometheus did not return any pods
             # IListPodsFallback is implemented by the Kubernetes API connector
-            object.pods = await self.connector.load_pods(object)
+            object.pods = await cluster_loader.load_pods(object)
 
             # NOTE: Kubernetes API returned pods, but Prometheus did not
             # This might happen with fast executing jobs
@@ -164,7 +164,7 @@ async def _calculate_object_recommendations(self, object: K8sWorkload) -> Option
                     "Loaded pods from Kubernetes API instead."
                 )
 
-        metrics = await prometheus_loader.gather_data(
+        metrics = await prometheus.gather_data(
             object,
             self.strategy,
             self.strategy.settings.history_timedelta,
@@ -179,10 +179,18 @@ async def _calculate_object_recommendations(self, object: K8sWorkload) -> Option
         logger.info(f"Calculated recommendations for {object} (using {len(metrics)} metrics)")
         return self._format_result(result)
 
-    async def _check_data_availability(self, cluster: Optional[str]) -> None:
-        prometheus_loader = self.connector.get_prometheus(cluster)
-        if prometheus_loader is None:
-            return
+    async def _check_cluster(self, cluster: Optional[str]) -> bool:
+        try:
+            prometheus_loader = self.connector.get_prometheus(cluster)
+        except PrometheusNotFound:
+            logger.error(
+                f"Wasn't able to connect to any Prometheus service"
+                f' for cluster {cluster}' if cluster is not None else ""
+                "\nTry using port-forwarding and/or setting the url manually (using the -p flag.).\n"
+                "For more information, see 'Giving the Explicit Prometheus URL' at "
+                "https://github.com/robusta-dev/krr?tab=readme-ov-file#usage"
+            )
+            return False
 
         try:
             history_range = await prometheus_loader.get_history_range(timedelta(hours=5))
@@ -195,7 +203,7 @@ async def _check_data_availability(self, cluster: Optional[str]) -> None:
                     "name": "HistoryRangeError",
                 }
             )
-            return
+            return True  # We can try to continue without history range
 
         logger.debug(f"History range for {cluster}: {history_range}")
         enough_data = self.strategy.settings.history_range_enough(history_range)
@@ -218,6 +226,8 @@ async def _check_data_availability(self, cluster: Optional[str]) -> None:
                 }
             )
 
+        return True
+
     async def _gather_object_allocations(self, k8s_object: K8sWorkload) -> Optional[ResourceScan]:
         recommendation = await self._calculate_object_recommendations(k8s_object)
 
@@ -248,14 +258,36 @@ async def _collect_result(self) -> Result:
 
         logger.info(f'Using clusters: {clusters if clusters is not None else "inner cluster"}')
 
+        # This is for code clarity. All functions take str | None as cluster parameter
         if clusters is None:
-            await self._check_data_availability(None)
-        else:
-            await asyncio.gather(*[self._check_data_availability(cluster) for cluster in clusters])
+            clusters = [None]
+
+        checks = await asyncio.gather(*[self._check_cluster(cluster) for cluster in clusters])
+        clusters = [cluster for cluster, check in zip(clusters, checks) if check]
+
+        if clusters == []:
+            raise CriticalRunnerException("No clusters available to scan.")
+
+        workload_loaders = {cluster: self.connector.try_get_workload_loader(cluster) for cluster in clusters}
+
+        # NOTE: we filter out None values as they are clusters that we could not connect to
+        workload_loaders = {cluster: loader for cluster, loader in workload_loaders.items() if loader is not None}
+
+        if workload_loaders == {}:
+            raise CriticalRunnerException("Could not connect to any cluster.")
 
         with ProgressBar(title="Calculating Recommendation") as self.__progressbar:
-            workloads = await self.connector.list_workloads(clusters)
+            # We gather all workloads from all clusters in parallel (asyncio.gather)
+            # Then we chain all workloads together (itertools.chain)
+            workloads = list(
+                itertools.chain(*await asyncio.gather(*[loader.list_workloads() for loader in workload_loaders.values()]))
+            )
+            # Then we gather all recommendations for all workloads in parallel (asyncio.gather)
             scans = await asyncio.gather(*[self._gather_object_allocations(k8s_object) for k8s_object in workloads])
+            # NOTE: Previously we were streaming workloads to
+            # calculate recommendations as soon as they were available (not waiting for all workloads to be loaded),
+            # but it gave minor performance improvements (most of the time was spent on calculating recommendations)
+            # So we decided to do those two steps sequentially to simplify the code
 
         successful_scans = [scan for scan in scans if scan is not None]
 
@@ -283,13 +315,6 @@ async def run(self) -> int:
         """Run the Runner. The return value is the exit code of the program."""
         await self._greet()
 
-        try:
-            settings.load_kubeconfig()
-        except Exception as e:
-            logger.error(f"Could not load kubernetes configuration: {e}")
-            logger.error("Try to explicitly set --context and/or --kubeconfig flags.")
-            return 1  # Exit with error
-
         try:
             # eks has a lower step limit than other types of prometheus, it will throw an error
             step_count = self.strategy.settings.history_duration * 60 / self.strategy.settings.timeframe_duration
@@ -301,6 +326,8 @@ async def run(self) -> int:
                 )
                 self.strategy.settings.timeframe_duration = min_step
 
+            self.connector = settings.create_cluster_loader()
+
             result = await self._collect_result()
             logger.info("Result collected, displaying...")
             self._process_result(result)
diff --git a/robusta_krr/main.py b/robusta_krr/main.py
index 810ccd15..6fc0f1fc 100644
--- a/robusta_krr/main.py
+++ b/robusta_krr/main.py
@@ -15,7 +15,7 @@
 from robusta_krr import formatters as concrete_formatters  # noqa: F401
 from robusta_krr.core.abstract import formatters
 from robusta_krr.core.abstract.strategies import BaseStrategy
-from robusta_krr.core.models.config import Config
+from robusta_krr.core.models.config import Config, LoadingMode
 from robusta_krr.core.runner import Runner
 from robusta_krr.utils.version import get_version
 
@@ -55,10 +55,12 @@ def run_strategy(
                     help="Path to kubeconfig file. If not provided, will attempt to find it.",
                     rich_help_panel="Kubernetes Settings",
                 ),
-                workload_loader: str = typer.Option(
-                    "kubeapi",
-                    "--workload",
-                    help="Workload loader to use (kubeapi, prometheus).",
+                mode: LoadingMode = typer.Option(
+                    LoadingMode.KUBEAPI,
+                    "--mode",
+                    "-m",
+                    help="Loading mode. KubeAPI mode requires a kubeconfig and supports auto-discovery. Prometheus mode requires to pass a --prometheus-url.",
+                    case_sensitive=False,
                     rich_help_panel="Kubernetes Settings",
                 ),
                 impersonate_user: Optional[str] = typer.Option(
@@ -138,7 +140,7 @@ def run_strategy(
                     None,
                     "--prometheus-cluster-label",
                     "-l",
-                    help="The label in prometheus for your cluster.(Only relevant for centralized prometheus)",
+                    help="The label in prometheus for your cluster. (Only relevant for centralized prometheus)",
                     rich_help_panel="Prometheus Settings",
                 ),
                 prometheus_label: str = typer.Option(
@@ -256,7 +258,7 @@ def run_strategy(
                 try:
                     config = Config(
                         kubeconfig=kubeconfig,
-                        workload_loader=workload_loader,
+                        mode=mode,
                         impersonate_user=impersonate_user,
                         impersonate_group=impersonate_group,
                         clusters="*" if all_clusters else clusters,

From 7124c80b9a61ede3f90d79e12f617f79c3f71457 Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Tue, 30 Apr 2024 18:54:25 +0300
Subject: [PATCH 09/24] PrometeusClusterLoader.list_clusters implementation

---
 .../prometheus/cluster_loader/__init__.py     | 21 ++++++++++++++-----
 1 file changed, 16 insertions(+), 5 deletions(-)

diff --git a/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py b/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
index c073ab53..1fbe4707 100644
--- a/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
+++ b/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
@@ -36,12 +36,22 @@ def __init__(self) -> None:
         self._prometheus_connector.connect(settings.prometheus_url)
 
     async def list_clusters(self) -> Optional[list[str]]:
-        if settings.prometheus_cluster_label is None:
+        if settings.prometheus_label is None:
+            logger.info(
+                "Assuming that Prometheus contains only one cluster."
+            )
+            logger.info("If you have multiple clusters in Prometheus, please provide the `-l` flag.")
             return None
 
-        # TODO: We can try to auto-discover clusters by querying Prometheus,
-        # but for that we will need to rework PrometheusMetric.get_prometheus_cluster_label
-        return [settings.prometheus_cluster_label]
+        clusters = await self.prometheus.loader.query(
+            f"""
+                avg by({settings.prometheus_label}) (
+                    kube_pod_container_resource_limits
+                )
+            """
+        )
+
+        return [cluster["metric"][settings.prometheus_label] for cluster in clusters["data"]["result"]]
 
     @cache
     def get_workload_loader(self, cluster: str) -> PrometheusWorkloadLoader:
@@ -75,4 +85,5 @@ async def list_workloads(self) -> list[K8sWorkload]:
 
         return workloads
 
-__all__ = ["PrometheusClusterLoader", "PrometheusWorkloadLoader"]
\ No newline at end of file
+
+__all__ = ["PrometheusClusterLoader", "PrometheusWorkloadLoader"]

From d1ad17d01a818cad989280ab0274c8b230aa3286 Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Tue, 30 Apr 2024 18:54:43 +0300
Subject: [PATCH 10/24] Minor additional logging improvements

---
 .../core/integrations/prometheus/connector.py        | 11 +++--------
 robusta_krr/core/runner.py                           |  2 ++
 robusta_krr/main.py                                  | 12 ++++++------
 3 files changed, 11 insertions(+), 14 deletions(-)

diff --git a/robusta_krr/core/integrations/prometheus/connector.py b/robusta_krr/core/integrations/prometheus/connector.py
index d75050f8..8020c2e0 100644
--- a/robusta_krr/core/integrations/prometheus/connector.py
+++ b/robusta_krr/core/integrations/prometheus/connector.py
@@ -58,14 +58,9 @@ def discover(self, api_client: ApiClient) -> None:
 
     def connect(self, url: Optional[str] = None) -> None:
         """Connect to a Prometheus service using a URL."""
-        try:
-            loader = PrometheusMetricsService(url=url)
-            self._connect(loader)
-        except Exception as e:
-            logger.warning(f"Unable to connect to Prometheus using the provided URL ({e})")
-            raise e
-        else:
-            logger.info(f"{loader.name()} connected successfully")
+        loader = PrometheusMetricsService(url=url)
+        self._connect(loader)
+        logger.info(f"{loader.name()} connected successfully")
 
     def _connect(self, loader: PrometheusMetricsService) -> None:
         service_name = loader.name()
diff --git a/robusta_krr/core/runner.py b/robusta_krr/core/runner.py
index 75c2191b..a52f1be0 100644
--- a/robusta_krr/core/runner.py
+++ b/robusta_krr/core/runner.py
@@ -247,6 +247,8 @@ async def _gather_object_allocations(self, k8s_object: K8sWorkload) -> Optional[
 
     async def _collect_result(self) -> Result:
         clusters = await self.connector.list_clusters()
+        logger.info(f"Clusters available: {', '.join(clusters)}")
+
         if clusters and len(clusters) > 1 and settings.prometheus_url:
             # this can only happen for multi-cluster querying a single centeralized prometheus
             # In this scenario we dont yet support determining
diff --git a/robusta_krr/main.py b/robusta_krr/main.py
index 6fc0f1fc..c64c0f4c 100644
--- a/robusta_krr/main.py
+++ b/robusta_krr/main.py
@@ -53,7 +53,7 @@ def run_strategy(
                     "--kubeconfig",
                     "-k",
                     help="Path to kubeconfig file. If not provided, will attempt to find it.",
-                    rich_help_panel="Kubernetes Settings",
+                    rich_help_panel="KubeAPI Mode Settings",
                 ),
                 mode: LoadingMode = typer.Option(
                     LoadingMode.KUBEAPI,
@@ -67,13 +67,13 @@ def run_strategy(
                     None,
                     "--as",
                     help="Impersonate a user, just like `kubectl --as`. For example, system:serviceaccount:default:krr-account.",
-                    rich_help_panel="Kubernetes Settings",
+                    rich_help_panel="KubeAPI Mode Settings",
                 ),
                 impersonate_group: Optional[str] = typer.Option(
                     None,
                     "--as-group",
                     help="Impersonate a user inside of a group, just like `kubectl --as-group`. For example, system:authenticated.",
-                    rich_help_panel="Kubernetes Settings",
+                    rich_help_panel="KubeAPI Mode Settings",
                 ),
                 clusters: List[str] = typer.Option(
                     None,
@@ -81,13 +81,13 @@ def run_strategy(
                     "--cluster",
                     "-c",
                     help="List of clusters to run on. By default, will run on the current cluster. Use --all-clusters to run on all clusters.",
-                    rich_help_panel="Kubernetes Settings",
+                    rich_help_panel="KubeAPI Mode Settings",
                 ),
                 all_clusters: bool = typer.Option(
                     False,
                     "--all-clusters",
                     help="Run on all clusters. Overrides --context.",
-                    rich_help_panel="Kubernetes Settings",
+                    rich_help_panel="KubeAPI Mode Settings",
                 ),
                 namespaces: List[str] = typer.Option(
                     None,
@@ -108,7 +108,7 @@ def run_strategy(
                     "--selector",
                     "-s",
                     help="Selector (label query) to filter on, supports '=', '==', and '!='.(e.g. -s key1=value1,key2=value2). Matching objects must satisfy all of the specified label constraints.",
-                    rich_help_panel="Kubernetes Settings",
+                    rich_help_panel="KubeAPI Mode Settings",
                 ),
                 prometheus_url: Optional[str] = typer.Option(
                     None,

From f7d841278afe46fe3b21da64ca57691b44670ab4 Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Tue, 30 Apr 2024 18:59:43 +0300
Subject: [PATCH 11/24] Minor debug comment

---
 robusta_krr/utils/service_discovery.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/robusta_krr/utils/service_discovery.py b/robusta_krr/utils/service_discovery.py
index 988a8c0c..5f4853ec 100644
--- a/robusta_krr/utils/service_discovery.py
+++ b/robusta_krr/utils/service_discovery.py
@@ -81,6 +81,7 @@ def find_url(self, selectors: list[str]) -> Optional[str]:
             self.find_ingress_host(label_selector)
             ingress_url = self.find_ingress_host(label_selector)
             if ingress_url:
+                logger.debug(f"Found ingress with label selector {label_selector}")
                 return ingress_url
 
         return None

From 59cc29da2174f6c1245f0fa6a9832466d74d68d5 Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Tue, 30 Apr 2024 19:14:55 +0300
Subject: [PATCH 12/24] Fix prometheus auto-discovery

---
 .../core/integrations/kubernetes/cluster_loader/__init__.py  | 5 +++--
 .../prometheus/metrics_service/mimir_metrics_service.py      | 2 +-
 .../prometheus/metrics_service/prometheus_metrics_service.py | 2 +-
 .../prometheus/metrics_service/thanos_metrics_service.py     | 2 +-
 .../prometheus/metrics_service/victoria_metrics_service.py   | 2 +-
 robusta_krr/utils/service_discovery.py                       | 2 +-
 6 files changed, 8 insertions(+), 7 deletions(-)

diff --git a/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
index ab520bba..b7e86d80 100644
--- a/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
@@ -51,7 +51,6 @@ def __init__(self) -> None:
             logger.error("Alternatively, try a prometheus-only mode with `--mode prometheus`")
             raise CriticalRunnerException("Could not load kubernetes configuration") from e
 
-        self.api_client = settings.get_kube_client()
         self._prometheus_connectors: dict[Optional[str], PrometheusConnector] = {}
 
     async def list_clusters(self) -> Optional[list[str]]:
@@ -99,7 +98,9 @@ def get_prometheus(self, cluster: Optional[str]) -> PrometheusConnector:
             connector.connect(settings.prometheus_url)
         else:
             logger.info(f"Trying to discover PromQL service" + (f" for cluster {cluster}" if cluster else ""))
-            connector.discover(api_client=self.api_client)
+            connector.discover(api_client=settings.get_kube_client(cluster))
+
+        return connector
 
 
 class KubeAPIWorkloadLoader(BaseWorkloadLoader, IListPodsFallback):
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/mimir_metrics_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/mimir_metrics_service.py
index e11d705c..05bbc702 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/mimir_metrics_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/mimir_metrics_service.py
@@ -9,7 +9,7 @@
 
 
 class MimirMetricsDiscovery(MetricsServiceDiscovery):
-    def find_metrics_url(self, *, api_client: Optional[ApiClient] = None) -> Optional[str]:
+    def find_metrics_url(self) -> Optional[str]:
         """
         Finds the Mimir Metrics URL using selectors.
         Args:
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
index 08fd83fe..98951699 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/prometheus_metrics_service.py
@@ -26,7 +26,7 @@
 
 
 class PrometheusDiscovery(MetricsServiceDiscovery):
-    def find_metrics_url(self, *, api_client: Optional[ApiClient] = None) -> Optional[str]:
+    def find_metrics_url(self) -> Optional[str]:
         """
         Finds the Prometheus URL using selectors.
         Args:
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/thanos_metrics_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/thanos_metrics_service.py
index eaf16201..4a3dea11 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/thanos_metrics_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/thanos_metrics_service.py
@@ -9,7 +9,7 @@
 
 
 class ThanosMetricsDiscovery(MetricsServiceDiscovery):
-    def find_metrics_url(self, *, api_client: Optional[ApiClient] = None) -> Optional[str]:
+    def find_metrics_url(self) -> Optional[str]:
         """
         Finds the Thanos URL using selectors.
         Args:
diff --git a/robusta_krr/core/integrations/prometheus/metrics_service/victoria_metrics_service.py b/robusta_krr/core/integrations/prometheus/metrics_service/victoria_metrics_service.py
index e8fbcd02..f2c46904 100644
--- a/robusta_krr/core/integrations/prometheus/metrics_service/victoria_metrics_service.py
+++ b/robusta_krr/core/integrations/prometheus/metrics_service/victoria_metrics_service.py
@@ -9,7 +9,7 @@
 
 
 class VictoriaMetricsDiscovery(MetricsServiceDiscovery):
-    def find_metrics_url(self, *, api_client: Optional[ApiClient] = None) -> Optional[str]:
+    def find_metrics_url(self) -> Optional[str]:
         """
         Finds the Victoria Metrics URL using selectors.
         Args:
diff --git a/robusta_krr/utils/service_discovery.py b/robusta_krr/utils/service_discovery.py
index 5f4853ec..056ce1bb 100644
--- a/robusta_krr/utils/service_discovery.py
+++ b/robusta_krr/utils/service_discovery.py
@@ -89,5 +89,5 @@ def find_url(self, selectors: list[str]) -> Optional[str]:
 
 class MetricsServiceDiscovery(ServiceDiscovery, ABC):
     @abstractmethod
-    def find_metrics_url(self, *, api_client: Optional[ApiClient] = None) -> Optional[str]:
+    def find_metrics_url(self) -> Optional[str]:
         pass

From eb84c954dc831449f09c9e42d233f8ff8eba855c Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Tue, 30 Apr 2024 19:23:24 +0300
Subject: [PATCH 13/24] Logging improvement

---
 .../kubernetes/cluster_loader/__init__.py     |  4 ++--
 .../integrations/prometheus/metrics/memory.py |  5 +++--
 robusta_krr/core/runner.py                    | 19 ++++++++++++++-----
 3 files changed, 19 insertions(+), 9 deletions(-)

diff --git a/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
index b7e86d80..54047a31 100644
--- a/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
@@ -208,14 +208,14 @@ async def _list_namespaced_or_global_objects(
 
         result = [item for request_result in await asyncio.gather(*requests) for item in request_result.items]
 
-        logger.debug(f"Found {len(result)} {kind} in {self.cluster}")
+        logger.debug(f"Found {len(result)} {kind}" + (f" for cluster {self.cluster}" if self.cluster else ""))
         return result
 
     async def _fetch_workload(self, loader: BaseKindLoader) -> list[K8sWorkload]:
         kind = loader.kind
 
         if not self._should_list_resource(kind):
-            logger.debug(f"Skipping {kind}s in {self.cluster}")
+            logger.debug(f"Skipping {kind}s" + (f" for cluster {self.cluster}" if self.cluster else ""))
             return
 
         if not self._kind_available[kind]:
diff --git a/robusta_krr/core/integrations/prometheus/metrics/memory.py b/robusta_krr/core/integrations/prometheus/metrics/memory.py
index 9f7e30d0..97fb2a65 100644
--- a/robusta_krr/core/integrations/prometheus/metrics/memory.py
+++ b/robusta_krr/core/integrations/prometheus/metrics/memory.py
@@ -70,6 +70,7 @@ def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
             )
         """
 
+
 # TODO: Need to battle test if this one is correct.
 class MaxOOMKilledMemoryLoader(PrometheusMetric):
     """
@@ -78,7 +79,7 @@ class MaxOOMKilledMemoryLoader(PrometheusMetric):
 
     warning_on_no_data = False
 
-    def get_query(self, object: K8sObjectData, duration: str, step: str) -> str:
+    def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
         cluster_label = self.get_prometheus_cluster_label()
         return f"""
@@ -91,7 +92,7 @@ def get_query(self, object: K8sObjectData, duration: str, step: str) -> str:
                             pod=~"{pods_selector}",
                             container="{object.container}"
                             {cluster_label}
-                        }} 
+                        }}
                     ) by (pod, container, job)
                     * on(pod, container, job) group_left(reason)
                     max(
diff --git a/robusta_krr/core/runner.py b/robusta_krr/core/runner.py
index a52f1be0..787982fa 100644
--- a/robusta_krr/core/runner.py
+++ b/robusta_krr/core/runner.py
@@ -184,8 +184,9 @@ async def _check_cluster(self, cluster: Optional[str]) -> bool:
             prometheus_loader = self.connector.get_prometheus(cluster)
         except PrometheusNotFound:
             logger.error(
-                f"Wasn't able to connect to any Prometheus service"
-                f' for cluster {cluster}' if cluster is not None else ""
+                f"Wasn't able to connect to any Prometheus service" f" for cluster {cluster}"
+                if cluster is not None
+                else ""
                 "\nTry using port-forwarding and/or setting the url manually (using the -p flag.).\n"
                 "For more information, see 'Giving the Explicit Prometheus URL' at "
                 "https://github.com/robusta-dev/krr?tab=readme-ov-file#usage"
@@ -205,7 +206,10 @@ async def _check_cluster(self, cluster: Optional[str]) -> bool:
             )
             return True  # We can try to continue without history range
 
-        logger.debug(f"History range for {cluster}: {history_range}")
+        logger.debug(
+            f"History range{f' for cluster {cluster}' if cluster else ''}: "
+            f"({history_range[0]})-({history_range[1]})"
+        )
         enough_data = self.strategy.settings.history_range_enough(history_range)
 
         if not enough_data:
@@ -247,7 +251,10 @@ async def _gather_object_allocations(self, k8s_object: K8sWorkload) -> Optional[
 
     async def _collect_result(self) -> Result:
         clusters = await self.connector.list_clusters()
-        logger.info(f"Clusters available: {', '.join(clusters)}")
+        if clusters is None:
+            logger.info("Can not list clusters, single cluster mode.")
+        else:
+            logger.info(f"Clusters available: {', '.join(clusters)}")
 
         if clusters and len(clusters) > 1 and settings.prometheus_url:
             # this can only happen for multi-cluster querying a single centeralized prometheus
@@ -282,7 +289,9 @@ async def _collect_result(self) -> Result:
             # We gather all workloads from all clusters in parallel (asyncio.gather)
             # Then we chain all workloads together (itertools.chain)
             workloads = list(
-                itertools.chain(*await asyncio.gather(*[loader.list_workloads() for loader in workload_loaders.values()]))
+                itertools.chain(
+                    *await asyncio.gather(*[loader.list_workloads() for loader in workload_loaders.values()])
+                )
             )
             # Then we gather all recommendations for all workloads in parallel (asyncio.gather)
             scans = await asyncio.gather(*[self._gather_object_allocations(k8s_object) for k8s_object in workloads])

From e350084fdf3404559f23837c649d74e1152fc681 Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Thu, 2 May 2024 14:34:24 +0300
Subject: [PATCH 14/24] Add HPA detection for prometheus mode

---
 .../kubernetes/cluster_loader/__init__.py     | 18 ++---
 .../prometheus/cluster_loader/__init__.py     | 77 +++++++++++++++++--
 robusta_krr/core/models/objects.py            | 14 +++-
 3 files changed, 87 insertions(+), 22 deletions(-)

diff --git a/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
index 54047a31..0174adc8 100644
--- a/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
@@ -15,7 +15,7 @@
 from robusta_krr.core.integrations.prometheus.metrics_service.prometheus_metrics_service import PrometheusMetricsService
 from robusta_krr.core.models.config import settings
 from robusta_krr.core.models.exceptions import CriticalRunnerException
-from robusta_krr.core.models.objects import HPAData, K8sWorkload, KindLiteral, PodData
+from robusta_krr.core.models.objects import HPAData, HPAKey, K8sWorkload, KindLiteral, PodData
 from robusta_krr.core.models.result import ResourceAllocations
 
 
@@ -34,14 +34,12 @@
 
 logger = logging.getLogger("krr")
 
-HPAKey = tuple[str, str, str]
-
 
 class KubeAPIClusterLoader(BaseClusterLoader):
     # NOTE: For KubeAPIClusterLoader we have to first connect to read kubeconfig
     # We do not need to connect to Prometheus from here, as we query all data from Kubernetes API
     # Also here we might have different Prometeus instances for different clusters
-    
+
     def __init__(self) -> None:
         try:
             settings.load_kubeconfig()
@@ -89,7 +87,7 @@ async def list_clusters(self) -> Optional[list[str]]:
     @cache
     def get_workload_loader(self, cluster: Optional[str]) -> KubeAPIWorkloadLoader:
         return KubeAPIWorkloadLoader(cluster)
-    
+
     @cache
     def get_prometheus(self, cluster: Optional[str]) -> PrometheusConnector:
         connector = PrometheusConnector(cluster=cluster)
@@ -173,7 +171,7 @@ def _build_scannable_object(self, item: Any, container: V1Container, kind: Optio
             kind=kind,
             container=container.name,
             allocations=ResourceAllocations.from_container(container),
-            hpa=self._hpa_list.get((namespace, kind, name)),
+            hpa=self._hpa_list.get(HPAKey(namespace, kind, name)),
         )
         obj._api_resource = item
         return obj
@@ -260,15 +258,13 @@ async def __list_hpa_v1(self) -> dict[HPAKey, HPAData]:
         )
 
         return {
-            (
+            HPAKey(
                 hpa.metadata.namespace,
                 hpa.spec.scale_target_ref.kind,
                 hpa.spec.scale_target_ref.name,
             ): HPAData(
                 min_replicas=hpa.spec.min_replicas,
                 max_replicas=hpa.spec.max_replicas,
-                current_replicas=hpa.status.current_replicas,
-                desired_replicas=hpa.status.desired_replicas,
                 target_cpu_utilization_percentage=hpa.spec.target_cpu_utilization_percentage,
                 target_memory_utilization_percentage=None,
             )
@@ -301,15 +297,13 @@ def __get_metric(hpa: V2HorizontalPodAutoscaler, metric_name: str) -> Optional[f
             )
 
         return {
-            (
+            HPAKey(
                 hpa.metadata.namespace,
                 hpa.spec.scale_target_ref.kind,
                 hpa.spec.scale_target_ref.name,
             ): HPAData(
                 min_replicas=hpa.spec.min_replicas,
                 max_replicas=hpa.spec.max_replicas,
-                current_replicas=hpa.status.current_replicas,
-                desired_replicas=hpa.status.desired_replicas,
                 target_cpu_utilization_percentage=__get_metric(hpa, "cpu"),
                 target_memory_utilization_percentage=__get_metric(hpa, "memory"),
             )
diff --git a/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py b/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
index 1fbe4707..5ac42eb1 100644
--- a/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
+++ b/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
@@ -4,14 +4,15 @@
 import itertools
 import logging
 
-from collections import Counter
+from collections import Counter, defaultdict
 
 from typing import Optional
 from functools import cache
 
 from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
+from robusta_krr.core.integrations.prometheus.metrics.base import PrometheusMetric
 from robusta_krr.core.models.config import settings
-from robusta_krr.core.models.objects import K8sWorkload
+from robusta_krr.core.models.objects import HPAData, HPAKey, K8sWorkload
 from robusta_krr.core.abstract.workload_loader import BaseWorkloadLoader
 from robusta_krr.core.abstract.cluster_loader import BaseClusterLoader
 from robusta_krr.core.models.exceptions import CriticalRunnerException
@@ -37,9 +38,7 @@ def __init__(self) -> None:
 
     async def list_clusters(self) -> Optional[list[str]]:
         if settings.prometheus_label is None:
-            logger.info(
-                "Assuming that Prometheus contains only one cluster."
-            )
+            logger.info("Assuming that Prometheus contains only one cluster.")
             logger.info("If you have multiple clusters in Prometheus, please provide the `-l` flag.")
             return None
 
@@ -67,10 +66,12 @@ def get_prometheus(self, cluster: Optional[str]) -> PrometheusConnector:
 class PrometheusWorkloadLoader(BaseWorkloadLoader):
     workloads: list[type[BaseKindLoader]] = [DoubleParentLoader, SimpleParentLoader]
 
-    def __init__(self, cluster: str, prometheus_connector: PrometheusConnector) -> None:
+    def __init__(self, cluster: str, prometheus: PrometheusConnector) -> None:
         self.cluster = cluster
-        self.metric_service = prometheus_connector
-        self.loaders = [loader(prometheus_connector) for loader in self.workloads]
+        self.prometheus = prometheus
+        self.loaders = [loader(prometheus) for loader in self.workloads]
+
+        self.cluster_selector = PrometheusMetric.get_prometheus_cluster_label()
 
     async def list_workloads(self) -> list[K8sWorkload]:
         workloads = list(
@@ -79,11 +80,71 @@ async def list_workloads(self) -> list[K8sWorkload]:
             )
         )
 
+        hpas = await self.__list_hpa()
+
+        for workload in workloads:
+            workload.hpa = hpas.get(
+                HPAKey(
+                    namespace=workload.namespace,
+                    kind=workload.kind,
+                    name=workload.name,
+                )
+            )
+
         kind_counts = Counter([workload.kind for workload in workloads])
         for kind, count in kind_counts.items():
             logger.info(f"Found {count} {kind} in {self.cluster}")
 
         return workloads
 
+    async def __list_hpa(self) -> dict[HPAKey, HPAData]:
+        hpa_metrics, max_replicas, min_replicas, target_metrics = await asyncio.gather(
+            self.prometheus.loader.query("kube_horizontalpodautoscaler_info"),
+            self.prometheus.loader.query("kube_horizontalpodautoscaler_spec_max_replicas"),
+            self.prometheus.loader.query("kube_horizontalpodautoscaler_spec_min_replicas"),
+            self.prometheus.loader.query("kube_horizontalpodautoscaler_spec_target_metric"),
+        )
+
+        max_replicas_dict = {
+            (metric["metric"]["namespace"], metric["metric"]["horizontalpodautoscaler"]): metric["value"][1]
+            for metric in max_replicas
+        }
+        min_replicas_dict = {
+            (metric["metric"]["namespace"], metric["metric"]["horizontalpodautoscaler"]): metric["value"][1]
+            for metric in min_replicas
+        }
+        target_metric_dict = defaultdict(dict)
+        for metric in target_metrics:
+            target_metric_dict[(metric["metric"]["namespace"], metric["metric"]["horizontalpodautoscaler"])] |= {
+                metric["metric"]["metric_name"]: metric["value"][1]
+            }
+
+        hpas = {}
+        if not hpa_metrics:
+            return {}
+
+        for hpa in hpa_metrics:
+            metric = hpa["metric"]
+            hpa_name = metric["horizontalpodautoscaler"]
+            key = HPAKey(
+                namespace=metric["namespace"],
+                kind=metric["scaletargetref_kind"],
+                name=metric["scaletargetref_name"],
+            )
+
+            max_replicas_value = max_replicas_dict[metric["namespace"], hpa_name]
+            min_replicas_value = min_replicas_dict[metric["namespace"], hpa_name]
+            cpu_utilization = target_metric_dict[metric["namespace"], hpa_name].get("cpu")
+            memory_utilization = target_metric_dict[metric["namespace"], hpa_name].get("memory")
+
+            hpas[key] = HPAData(
+                min_replicas=max_replicas_value,
+                max_replicas=min_replicas_value,
+                target_cpu_utilization_percentage=cpu_utilization,
+                target_memory_utilization_percentage=memory_utilization,
+            )
+
+        return hpas
+
 
 __all__ = ["PrometheusClusterLoader", "PrometheusWorkloadLoader"]
diff --git a/robusta_krr/core/models/objects.py b/robusta_krr/core/models/objects.py
index 27f1c293..c5d375e9 100644
--- a/robusta_krr/core/models/objects.py
+++ b/robusta_krr/core/models/objects.py
@@ -19,11 +19,21 @@ def __hash__(self) -> int:
         return hash(self.name)
 
 
+class HPAKey(pd.BaseModel):
+    namespace: str
+    kind: str
+    name: str
+
+    class Config:
+        allow_mutation = False
+
+    def __hash__(self) -> int:
+        return hash((self.namespace, self.kind, self.name))
+
+
 class HPAData(pd.BaseModel):
     min_replicas: Optional[int]
     max_replicas: int
-    current_replicas: Optional[int]
-    desired_replicas: int
     target_cpu_utilization_percentage: Optional[float]
     target_memory_utilization_percentage: Optional[float]
 

From d4e09b04dfc1e424e08bb156be13a313cd526c5d Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Thu, 2 May 2024 16:21:24 +0300
Subject: [PATCH 15/24] Fix tests

---
 tests/conftest.py | 44 ++++++++++++++++++++++++++++----------------
 1 file changed, 28 insertions(+), 16 deletions(-)

diff --git a/tests/conftest.py b/tests/conftest.py
index 2bc98070..c582ac3c 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -7,6 +7,11 @@
 
 from robusta_krr.api.models import K8sWorkload, PodData, ResourceAllocations
 from robusta_krr.strategies.simple import SimpleStrategy, SimpleStrategySettings
+from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
+from robusta_krr.core.integrations.prometheus.metrics_service.prometheus_metrics_service import PrometheusMetricsService
+from robusta_krr.core.models.config import Config
+from robusta_krr.core.integrations.kubernetes.cluster_loader import KubeAPIClusterLoader, KubeAPIWorkloadLoader
+
 
 TEST_OBJECT = K8sWorkload(
     cluster="mock-cluster",
@@ -28,8 +33,9 @@
 
 @pytest.fixture(autouse=True, scope="session")
 def mock_list_clusters():
-    with patch(
-        "robusta_krr.core.integrations.kubernetes.KubernetesLoader.list_clusters",
+    with patch.object(
+        KubeAPIClusterLoader,
+        "list_clusters",
         new=AsyncMock(return_value=[TEST_OBJECT.cluster]),
     ):
         yield
@@ -37,8 +43,9 @@ def mock_list_clusters():
 
 @pytest.fixture(autouse=True, scope="session")
 def mock_list_scannable_objects():
-    with patch(
-        "robusta_krr.core.integrations.kubernetes.KubernetesLoader.list_scannable_objects",
+    with patch.object(
+        KubeAPIWorkloadLoader,
+        "list_workloads",
         new=AsyncMock(return_value=[TEST_OBJECT]),
     ):
         yield
@@ -46,8 +53,9 @@ def mock_list_scannable_objects():
 
 @pytest.fixture(autouse=True, scope="session")
 def mock_load_kubeconfig():
-    with patch("robusta_krr.core.models.config.Config.load_kubeconfig", return_value=None):
-        yield
+    with patch.object(Config, "load_kubeconfig", return_value=None):
+        with patch.object(Config, "get_kube_client", return_value=None):
+            yield
 
 
 @pytest.fixture(autouse=True, scope="session")
@@ -60,8 +68,9 @@ def mock_prometheus_loader():
     settings = SimpleStrategySettings()
     strategy = SimpleStrategy(settings)
 
-    with patch(
-        "robusta_krr.core.integrations.prometheus.loader.PrometheusMetricsLoader.gather_data",
+    with patch.object(
+        PrometheusConnector,
+        "gather_data",
         new=AsyncMock(
             return_value={
                 metric.__name__: {pod.name: metric_points_data for pod in TEST_OBJECT.pods}
@@ -75,8 +84,9 @@ def mock_prometheus_loader():
 
 @pytest.fixture(autouse=True, scope="session")
 def mock_prometheus_load_pods():
-    with patch(
-        "robusta_krr.core.integrations.prometheus.loader.PrometheusMetricsLoader.load_pods",
+    with patch.object(
+        PrometheusConnector,
+        "load_pods",
         new=AsyncMock(
             return_value=TEST_OBJECT.pods,
         ),
@@ -92,13 +102,15 @@ async def get_history_range(self, history_duration: timedelta) -> tuple[datetime
         start = now - history_duration
         return start, now
 
-    with patch(
-        "robusta_krr.core.integrations.prometheus.loader.PrometheusMetricsLoader.get_history_range", get_history_range
-    ):
+    with patch.object(PrometheusConnector, "get_history_range", get_history_range):
         yield
 
 
 @pytest.fixture(autouse=True, scope="session")
-def mock_prometheus_init():
-    with patch("robusta_krr.core.integrations.prometheus.loader.PrometheusMetricsLoader.__init__", return_value=None):
-        yield
+def mock_prometheus_connector_connect():
+    def _connect(self, loader) -> None:
+        self.loader = loader
+
+    with patch.object(PrometheusConnector, "_connect", _connect):
+        with patch.object(PrometheusMetricsService, "discover", return_value=None):
+            yield

From 7b6be353ff7108c5a23b61ea1b5bd238b51e9d0f Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Thu, 2 May 2024 18:33:14 +0300
Subject: [PATCH 16/24] Rework ckyster selector for prometheus mode

---
 robusta_krr/core/abstract/strategies.py       |  1 -
 .../prometheus/cluster_loader/__init__.py     | 28 ++++++++--------
 .../prometheus/cluster_loader/loaders/base.py | 33 ++++++++++---------
 .../cluster_loader/loaders/double_parent.py   |  6 ++--
 .../cluster_loader/loaders/simple_parent.py   |  6 ++--
 .../integrations/prometheus/metrics/base.py   | 12 -------
 .../integrations/prometheus/metrics/cpu.py    | 13 ++++----
 .../integrations/prometheus/metrics/memory.py | 14 +++-----
 robusta_krr/core/models/objects.py            | 12 +++++++
 9 files changed, 61 insertions(+), 64 deletions(-)

diff --git a/robusta_krr/core/abstract/strategies.py b/robusta_krr/core/abstract/strategies.py
index 388595fe..3f640020 100644
--- a/robusta_krr/core/abstract/strategies.py
+++ b/robusta_krr/core/abstract/strategies.py
@@ -12,7 +12,6 @@
 from robusta_krr.core.models.result import K8sWorkload, ResourceType
 
 if TYPE_CHECKING:
-    from robusta_krr.core.abstract.metrics import BaseMetric  # noqa: F401
     from robusta_krr.core.integrations.prometheus.metrics import PrometheusMetric
 
 SelfRR = TypeVar("SelfRR", bound="ResourceRecommendation")
diff --git a/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py b/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
index 5ac42eb1..5c88dc7b 100644
--- a/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
+++ b/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
@@ -26,7 +26,7 @@ class PrometheusClusterLoader(BaseClusterLoader):
     # NOTE: For PrometheusClusterLoader we have to first connect to Prometheus, as we query all data from it
 
     def __init__(self) -> None:
-        self._prometheus_connector = PrometheusConnector()
+        self.prometheus = PrometheusConnector()
         if not settings.prometheus_url:
             raise CriticalRunnerException(
                 "Prometheus URL is not provided. "
@@ -34,33 +34,33 @@ def __init__(self) -> None:
                 "Please provide the URL with `--prometheus-url` flag."
             )
 
-        self._prometheus_connector.connect(settings.prometheus_url)
+        self.prometheus.connect(settings.prometheus_url)
 
     async def list_clusters(self) -> Optional[list[str]]:
-        if settings.prometheus_label is None:
+        if settings.prometheus_cluster_label is None:
             logger.info("Assuming that Prometheus contains only one cluster.")
             logger.info("If you have multiple clusters in Prometheus, please provide the `-l` flag.")
             return None
 
         clusters = await self.prometheus.loader.query(
             f"""
-                avg by({settings.prometheus_label}) (
+                avg by({settings.prometheus_cluster_label}) (
                     kube_pod_container_resource_limits
                 )
             """
         )
 
-        return [cluster["metric"][settings.prometheus_label] for cluster in clusters["data"]["result"]]
+        return [cluster["metric"][settings.prometheus_cluster_label] for cluster in clusters]
 
     @cache
     def get_workload_loader(self, cluster: str) -> PrometheusWorkloadLoader:
-        return PrometheusWorkloadLoader(cluster, self._prometheus_connector)
+        return PrometheusWorkloadLoader(cluster, self.prometheus)
 
     def get_prometheus(self, cluster: Optional[str]) -> PrometheusConnector:
         # NOTE: With prometheus workload loader we can only have one Prometheus provided in parameters
         # so in case of multiple clusters in one Prometheus (centralized version)
         # for each cluster we will have the same PrometheusConnector (keyed by None)
-        return self._prometheus_connector
+        return self.prometheus
 
 
 class PrometheusWorkloadLoader(BaseWorkloadLoader):
@@ -69,9 +69,7 @@ class PrometheusWorkloadLoader(BaseWorkloadLoader):
     def __init__(self, cluster: str, prometheus: PrometheusConnector) -> None:
         self.cluster = cluster
         self.prometheus = prometheus
-        self.loaders = [loader(prometheus) for loader in self.workloads]
-
-        self.cluster_selector = PrometheusMetric.get_prometheus_cluster_label()
+        self.loaders = [loader(cluster, prometheus) for loader in self.workloads]
 
     async def list_workloads(self) -> list[K8sWorkload]:
         workloads = list(
@@ -98,11 +96,13 @@ async def list_workloads(self) -> list[K8sWorkload]:
         return workloads
 
     async def __list_hpa(self) -> dict[HPAKey, HPAData]:
+        cluster_selector = f"{settings.prometheus_label}={self.cluster}" if settings.prometheus_label else ""
+
         hpa_metrics, max_replicas, min_replicas, target_metrics = await asyncio.gather(
-            self.prometheus.loader.query("kube_horizontalpodautoscaler_info"),
-            self.prometheus.loader.query("kube_horizontalpodautoscaler_spec_max_replicas"),
-            self.prometheus.loader.query("kube_horizontalpodautoscaler_spec_min_replicas"),
-            self.prometheus.loader.query("kube_horizontalpodautoscaler_spec_target_metric"),
+            self.prometheus.loader.query("kube_horizontalpodautoscaler_info" + cluster_selector),
+            self.prometheus.loader.query("kube_horizontalpodautoscaler_spec_max_replicas" + cluster_selector),
+            self.prometheus.loader.query("kube_horizontalpodautoscaler_spec_min_replicas" + cluster_selector),
+            self.prometheus.loader.query("kube_horizontalpodautoscaler_spec_target_metric" + cluster_selector),
         )
 
         max_replicas_dict = {
diff --git a/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/base.py b/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/base.py
index 95342616..cc91a3f8 100644
--- a/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/base.py
+++ b/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/base.py
@@ -1,27 +1,20 @@
 import abc
-import asyncio
-from collections import defaultdict
 import logging
-from concurrent.futures import ThreadPoolExecutor
-from typing import Any, Iterable, Literal, Optional, Union
 
-from kubernetes import client  # type: ignore
-from kubernetes.client.api_client import ApiClient  # type: ignore
+from typing import Literal, Union
+
 from kubernetes.client.models import (  # type: ignore
-    V1Container,
     V1DaemonSet,
     V1Deployment,
     V1Job,
     V1Pod,
-    V1PodList,
     V1StatefulSet,
 )
 from robusta_krr.core.models.config import settings
 
 from robusta_krr.core.integrations.prometheus.connector import PrometheusConnector
-from robusta_krr.core.integrations.prometheus.metrics.base import PrometheusMetric
 from robusta_krr.core.models.allocations import RecommendationValue, ResourceAllocations, ResourceType
-from robusta_krr.core.models.objects import K8sWorkload, KindLiteral, PodData
+from robusta_krr.core.models.objects import K8sWorkload, KindLiteral
 
 logger = logging.getLogger("krr")
 
@@ -37,14 +30,24 @@ class BaseKindLoader(abc.ABC):
 
     kinds: list[KindLiteral] = []
 
-    def __init__(self, prometheus: PrometheusConnector) -> None:
+    def __init__(self, cluster: str, prometheus: PrometheusConnector) -> None:
+        self.cluster = cluster
         self.prometheus = prometheus
-        self.cluster_selector = PrometheusMetric.get_prometheus_cluster_label()
 
     @property
     def kinds_to_scan(self) -> list[KindLiteral]:
         return [kind for kind in self.kinds if kind in settings.resources] if settings.resources != "*" else self.kinds
 
+    @property
+    def cluster_selector(self) -> str:
+        if settings.prometheus_label is not None:
+            return f'{settings.prometheus_cluster_label}="{settings.prometheus_label}",'
+
+        if settings.prometheus_cluster_label is None:
+            return ""
+
+        return f'{settings.prometheus_cluster_label}="{self.cluster}",' if self.cluster else ""
+
     @abc.abstractmethod
     def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> list[K8sWorkload]:
         pass
@@ -54,10 +57,10 @@ async def _parse_allocation(self, namespace: str, pods: list[str], container_nam
             f"""
                 avg by(resource) (
                     kube_pod_container_resource_limits{{
+                        {self.cluster_selector}
                         namespace="{namespace}",
                         pod=~"{'|'.join(pods)}",
                         container="{container_name}"
-                        {self.cluster_selector}
                     }}
                 )
             """
@@ -66,10 +69,10 @@ async def _parse_allocation(self, namespace: str, pods: list[str], container_nam
             f"""
                 avg by(resource) (
                     kube_pod_container_resource_requests{{
+                        {self.cluster_selector}
                         namespace="{namespace}",
                         pod=~"{'|'.join(pods)}",
                         container="{container_name}"
-                        {self.cluster_selector}
                     }}
                 )
             """
@@ -94,8 +97,8 @@ async def _list_containers_in_pods(self, pods: list[str]) -> set[str]:
             f"""
                 count by (container) (
                     kube_pod_container_info{{
-                        pod=~"{'|'.join(pods)}"
                         {self.cluster_selector}
+                        pod=~"{'|'.join(pods)}"
                     }}
                 )
             """
diff --git a/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/double_parent.py b/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/double_parent.py
index e757af47..942d3fab 100644
--- a/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/double_parent.py
+++ b/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/double_parent.py
@@ -57,9 +57,9 @@ async def list_workloads_by_subowner(
             f"""
                 count by (namespace, owner_name, {subowner_label}, owner_kind) (
                     {metric_name} {{
+                        {self.cluster_selector}
                         {namespace_selector},
                         owner_kind=~"{'|'.join(kinds)}"
-                        {self.cluster_selector}
                     }}
                 )
             """
@@ -95,10 +95,10 @@ async def _list_pods_of_subowner(
             f"""
                 count by (namespace, owner_name, owner_kind, pod) (
                     kube_pod_owner{{
+                        {self.cluster_selector}
                         namespace="{namespace}",
                         owner_name=~"{'|'.join(subowner_names)}",
                         owner_kind="{subowner_kind}"
-                        {self.cluster_selector}
                     }}
                 )
             """
@@ -111,7 +111,7 @@ async def _list_pods_of_subowner(
 
         return [
             K8sWorkload(
-                cluster=self.prometheus.cluster,
+                cluster=self.cluster,
                 namespace=namespace,
                 name=name,
                 kind=kind,
diff --git a/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/simple_parent.py b/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/simple_parent.py
index 233ebb29..00d30236 100644
--- a/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/simple_parent.py
+++ b/robusta_krr/core/integrations/prometheus/cluster_loader/loaders/simple_parent.py
@@ -26,9 +26,9 @@ async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> li
             f"""
                 count by (namespace, owner_name, owner_kind, pod) (
                     kube_pod_owner{{
+                        {self.cluster_selector}
                         {namespace_selector},
                         owner_kind=~"{'|'.join(self.kinds_to_scan)}"
-                        {self.cluster_selector}
                     }}
                 )
             """
@@ -50,9 +50,9 @@ async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> li
                 f"""
                     count by (namespace, job_name) (
                         kube_job_owner{{
+                            {self.cluster_selector}
                             {namespace_selector},
                             owner_kind="CronJob"
-                            {self.cluster_selector}
                         }}
                     )
                 """
@@ -72,7 +72,7 @@ async def list_workloads(self, namespaces: Union[list[str], Literal["*"]]) -> li
 
         return [
             K8sWorkload(
-                cluster=self.prometheus.cluster,
+                cluster=self.cluster,
                 namespace=namespace,
                 name=name,
                 kind=kind,
diff --git a/robusta_krr/core/integrations/prometheus/metrics/base.py b/robusta_krr/core/integrations/prometheus/metrics/base.py
index 807a11fd..67266dd2 100644
--- a/robusta_krr/core/integrations/prometheus/metrics/base.py
+++ b/robusta_krr/core/integrations/prometheus/metrics/base.py
@@ -75,18 +75,6 @@ def __init__(
         if self.pods_batch_size is not None and self.pods_batch_size <= 0:
             raise ValueError("pods_batch_size must be positive")
 
-    @staticmethod
-    def get_prometheus_cluster_label() -> str:
-        """
-        Generates the cluster label for querying a centralized Prometheus
-
-        Returns:
-        str: a promql safe label string for querying the cluster.
-        """
-        if settings.prometheus_cluster_label is None:
-            return ""
-        return f', {settings.prometheus_label}="{settings.prometheus_cluster_label}"'
-
     @abc.abstractmethod
     def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         """
diff --git a/robusta_krr/core/integrations/prometheus/metrics/cpu.py b/robusta_krr/core/integrations/prometheus/metrics/cpu.py
index 72576545..b30a4d9c 100644
--- a/robusta_krr/core/integrations/prometheus/metrics/cpu.py
+++ b/robusta_krr/core/integrations/prometheus/metrics/cpu.py
@@ -12,15 +12,14 @@ class CPULoader(PrometheusMetric):
 
     def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
-        cluster_label = self.get_prometheus_cluster_label()
         return f"""
             max(
                 rate(
                     container_cpu_usage_seconds_total{{
+                        {object.cluster_selector}
                         namespace="{object.namespace}",
                         pod=~"{pods_selector}",
                         container="{object.container}"
-                        {cluster_label}
                     }}[{step}]
                 )
             ) by (container, pod, job)
@@ -38,17 +37,16 @@ def PercentileCPULoader(percentile: float) -> type[PrometheusMetric]:
     class PercentileCPULoader(PrometheusMetric):
         def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
             pods_selector = "|".join(pod.name for pod in object.pods)
-            cluster_label = self.get_prometheus_cluster_label()
             return f"""
                 quantile_over_time(
                     {round(percentile / 100, 2)},
                     max(
                         rate(
                             container_cpu_usage_seconds_total{{
+                                {object.cluster_selector}
                                 namespace="{object.namespace}",
                                 pod=~"{pods_selector}",
                                 container="{object.container}"
-                                {cluster_label}
                             }}[{step}]
                         )
                     ) by (container, pod, job)
@@ -66,17 +64,18 @@ class CPUAmountLoader(PrometheusMetric):
 
     def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
-        cluster_label = self.get_prometheus_cluster_label()
-        return f"""
+        res = f"""
             count_over_time(
                 max(
                     container_cpu_usage_seconds_total{{
+                        {object.cluster_selector}
                         namespace="{object.namespace}",
                         pod=~"{pods_selector}",
                         container="{object.container}"
-                        {cluster_label}
                     }}
                 ) by (container, pod, job)
                 [{duration}:{step}]
             )
         """
+
+        raise(Exception(res))
diff --git a/robusta_krr/core/integrations/prometheus/metrics/memory.py b/robusta_krr/core/integrations/prometheus/metrics/memory.py
index 97fb2a65..d6d5baa3 100644
--- a/robusta_krr/core/integrations/prometheus/metrics/memory.py
+++ b/robusta_krr/core/integrations/prometheus/metrics/memory.py
@@ -12,14 +12,13 @@ class MemoryLoader(PrometheusMetric):
 
     def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
-        cluster_label = self.get_prometheus_cluster_label()
         return f"""
             max(
                 container_memory_working_set_bytes{{
+                    {object.cluster_selector}
                     namespace="{object.namespace}",
                     pod=~"{pods_selector}",
                     container="{object.container}"
-                    {cluster_label}
                 }}
             ) by (container, pod, job)
         """
@@ -32,15 +31,14 @@ class MaxMemoryLoader(PrometheusMetric):
 
     def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
-        cluster_label = self.get_prometheus_cluster_label()
         return f"""
             max_over_time(
                 max(
                     container_memory_working_set_bytes{{
+                        {object.cluster_selector}
                         namespace="{object.namespace}",
                         pod=~"{pods_selector}",
                         container="{object.container}"
-                        {cluster_label}
                     }}
                 ) by (container, pod, job)
                 [{duration}:{step}]
@@ -55,15 +53,14 @@ class MemoryAmountLoader(PrometheusMetric):
 
     def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
-        cluster_label = self.get_prometheus_cluster_label()
         return f"""
             count_over_time(
                 max(
                     container_memory_working_set_bytes{{
+                        {object.cluster_selector}
                         namespace="{object.namespace}",
                         pod=~"{pods_selector}",
                         container="{object.container}"
-                        {cluster_label}
                     }}
                 ) by (container, pod, job)
                 [{duration}:{step}]
@@ -81,27 +78,26 @@ class MaxOOMKilledMemoryLoader(PrometheusMetric):
 
     def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
-        cluster_label = self.get_prometheus_cluster_label()
         return f"""
             max_over_time(
                 max(
                     max(
                         kube_pod_container_resource_limits{{
+                            {object.cluster_selector}
                             resource="memory",
                             namespace="{object.namespace}",
                             pod=~"{pods_selector}",
                             container="{object.container}"
-                            {cluster_label}
                         }}
                     ) by (pod, container, job)
                     * on(pod, container, job) group_left(reason)
                     max(
                         kube_pod_container_status_last_terminated_reason{{
+                            {object.cluster_selector}
                             reason="OOMKilled",
                             namespace="{object.namespace}",
                             pod=~"{pods_selector}",
                             container="{object.container}"
-                            {cluster_label}
                         }}
                     ) by (pod, container, job, reason)
                 ) by (container, pod, job)
diff --git a/robusta_krr/core/models/objects.py b/robusta_krr/core/models/objects.py
index c5d375e9..21289036 100644
--- a/robusta_krr/core/models/objects.py
+++ b/robusta_krr/core/models/objects.py
@@ -71,6 +71,18 @@ def __hash__(self) -> int:
     def add_warning(self, warning: PodWarning) -> None:
         self.warnings.add(warning)
 
+    @property
+    def cluster_selector(self) -> str:
+        from robusta_krr.core.models.config import settings
+
+        if settings.prometheus_label is not None:
+            return f'{settings.prometheus_cluster_label}="{settings.prometheus_label}",'
+
+        if settings.prometheus_cluster_label is None:
+            return ""
+
+        return f'{settings.prometheus_cluster_label}="{self.cluster}",' if self.cluster else ""
+
     @property
     def current_pods_count(self) -> int:
         return len([pod for pod in self.pods if not pod.deleted])

From dce207f2e1a5aa6b2dad673192f3e59bf25e833b Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Thu, 2 May 2024 18:34:40 +0300
Subject: [PATCH 17/24] Remove test raise

---
 robusta_krr/core/integrations/prometheus/metrics/cpu.py | 4 +---
 1 file changed, 1 insertion(+), 3 deletions(-)

diff --git a/robusta_krr/core/integrations/prometheus/metrics/cpu.py b/robusta_krr/core/integrations/prometheus/metrics/cpu.py
index b30a4d9c..14318caf 100644
--- a/robusta_krr/core/integrations/prometheus/metrics/cpu.py
+++ b/robusta_krr/core/integrations/prometheus/metrics/cpu.py
@@ -64,7 +64,7 @@ class CPUAmountLoader(PrometheusMetric):
 
     def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
         pods_selector = "|".join(pod.name for pod in object.pods)
-        res = f"""
+        return f"""
             count_over_time(
                 max(
                     container_cpu_usage_seconds_total{{
@@ -77,5 +77,3 @@ def get_query(self, object: K8sWorkload, duration: str, step: str) -> str:
                 [{duration}:{step}]
             )
         """
-
-        raise(Exception(res))

From 43ffb7f79a17479c7706e2e312e6bd344303da57 Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Fri, 3 May 2024 09:30:03 +0300
Subject: [PATCH 18/24] Fix HPAKey

---
 .../integrations/kubernetes/cluster_loader/__init__.py    | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
index 0174adc8..09f27ab8 100644
--- a/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
@@ -171,7 +171,7 @@ def _build_scannable_object(self, item: Any, container: V1Container, kind: Optio
             kind=kind,
             container=container.name,
             allocations=ResourceAllocations.from_container(container),
-            hpa=self._hpa_list.get(HPAKey(namespace, kind, name)),
+            hpa=self._hpa_list.get(HPAKey(namespace=namespace, kind=kind, name=name)),
         )
         obj._api_resource = item
         return obj
@@ -259,9 +259,9 @@ async def __list_hpa_v1(self) -> dict[HPAKey, HPAData]:
 
         return {
             HPAKey(
-                hpa.metadata.namespace,
-                hpa.spec.scale_target_ref.kind,
-                hpa.spec.scale_target_ref.name,
+                namespace=hpa.metadata.namespace,
+                kind=hpa.spec.scale_target_ref.kind,
+                name=hpa.spec.scale_target_ref.name,
             ): HPAData(
                 min_replicas=hpa.spec.min_replicas,
                 max_replicas=hpa.spec.max_replicas,

From 24038980696aa658ee790743d7b6fc8d85fc3bf0 Mon Sep 17 00:00:00 2001
From: LeaveMyYard <zhukovpavel2001@gmail.com>
Date: Fri, 3 May 2024 09:34:58 +0300
Subject: [PATCH 19/24] One more HPAKey fix

---
 .../core/integrations/kubernetes/cluster_loader/__init__.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
index 09f27ab8..1af3de93 100644
--- a/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
+++ b/robusta_krr/core/integrations/kubernetes/cluster_loader/__init__.py
@@ -298,9 +298,9 @@ def __get_metric(hpa: V2HorizontalPodAutoscaler, metric_name: str) -> Optional[f
 
         return {
             HPAKey(
-                hpa.metadata.namespace,
-                hpa.spec.scale_target_ref.kind,
-                hpa.spec.scale_target_ref.name,
+                namespace=hpa.metadata.namespace,
+                kind=hpa.spec.scale_target_ref.kind,
+                name=hpa.spec.scale_target_ref.name,
             ): HPAData(
                 min_replicas=hpa.spec.min_replicas,
                 max_replicas=hpa.spec.max_replicas,

From 73eb5f3a7f1d284695fbe431985fbe674fad71c7 Mon Sep 17 00:00:00 2001
From: Robusta Runner <aantny@gmail.com>
Date: Fri, 14 Jun 2024 08:03:10 +0300
Subject: [PATCH 20/24] Deprecate --prometheus-cluster-label

The name is misleading. Before this change we had both --prometheus-cluster-label and --prometheus-label which referred to very different things, leading to a bug in the code (to be fixed in the next commit).

We still support -l and have added support for  "--prometheus-cluster-value" which is what `-l` really represents.
---
 README.md           | 2 +-
 robusta_krr/main.py | 7 ++++---
 2 files changed, 5 insertions(+), 4 deletions(-)

diff --git a/README.md b/README.md
index 6dfafc29..de05e3cf 100644
--- a/README.md
+++ b/README.md
@@ -430,7 +430,7 @@ If your Prometheus monitors multiple clusters we require the label you defined f
 For example, if your cluster has the Prometheus label `cluster: "my-cluster-name"`, then run this command:
 
 ```sh
-krr.py simple --prometheus-label cluster -l my-cluster-name
+krr.py simple --prometheus-cluster-key cluster -l my-cluster-name
 ```
 
 You may also need the `-p` flag to explicitly give Prometheus' URL.
diff --git a/robusta_krr/main.py b/robusta_krr/main.py
index c64c0f4c..021c9efa 100644
--- a/robusta_krr/main.py
+++ b/robusta_krr/main.py
@@ -138,15 +138,16 @@ def run_strategy(
                 ),
                 prometheus_cluster_label: Optional[str] = typer.Option(
                     None,
-                    "--prometheus-cluster-label",
+                    "--prometheus-cluster-value",
                     "-l",
-                    help="The label in prometheus for your cluster. (Only relevant for centralized prometheus)",
+                    help="The name of the cluster in Prometheus to scan. e.g. 'gke-prod-1'. Use with `--prometheus-cluster-key`. Only relevant for centralized prometheus.",
                     rich_help_panel="Prometheus Settings",
                 ),
                 prometheus_label: str = typer.Option(
                     None,
+                    "--prometheus-cluster-key",
                     "--prometheus-label",
-                    help="The label in prometheus used to differentiate clusters. (Only relevant for centralized prometheus)",
+                    help="The label in prometheus used to differentiate different clusters (e.g. 'cluster'). Only relevant for centralized prometheus.",
                     rich_help_panel="Prometheus Settings",
                 ),
                 eks_managed_prom: bool = typer.Option(

From 24af7f551fc72e5d801721936f6f49f87f57ee6c Mon Sep 17 00:00:00 2001
From: Robusta Runner <aantny@gmail.com>
Date: Fri, 14 Jun 2024 08:18:14 +0300
Subject: [PATCH 21/24] Bug fix - thank you @deutschj

See https://github.com/robusta-dev/krr/pull/266#issuecomment-2124477234
---
 .../core/integrations/prometheus/cluster_loader/__init__.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py b/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
index 5c88dc7b..3cc6b04f 100644
--- a/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
+++ b/robusta_krr/core/integrations/prometheus/cluster_loader/__init__.py
@@ -37,20 +37,20 @@ def __init__(self) -> None:
         self.prometheus.connect(settings.prometheus_url)
 
     async def list_clusters(self) -> Optional[list[str]]:
-        if settings.prometheus_cluster_label is None:
+        if settings.prometheus_label is None:
             logger.info("Assuming that Prometheus contains only one cluster.")
             logger.info("If you have multiple clusters in Prometheus, please provide the `-l` flag.")
             return None
 
         clusters = await self.prometheus.loader.query(
             f"""
-                avg by({settings.prometheus_cluster_label}) (
+                avg by({settings.prometheus_label}) (
                     kube_pod_container_resource_limits
                 )
             """
         )
 
-        return [cluster["metric"][settings.prometheus_cluster_label] for cluster in clusters]
+        return [cluster["metric"][settings.prometheus_label] for cluster in clusters]
 
     @cache
     def get_workload_loader(self, cluster: str) -> PrometheusWorkloadLoader:

From 9fda8bea24992b5b875df092b6bb495490a0abfc Mon Sep 17 00:00:00 2001
From: Robusta Runner <aantny@gmail.com>
Date: Fri, 28 Jun 2024 11:22:36 +0300
Subject: [PATCH 22/24] add TODO

---
 robusta_krr/core/abstract/strategies.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/robusta_krr/core/abstract/strategies.py b/robusta_krr/core/abstract/strategies.py
index 3f640020..2d1ea9be 100644
--- a/robusta_krr/core/abstract/strategies.py
+++ b/robusta_krr/core/abstract/strategies.py
@@ -17,6 +17,7 @@
 SelfRR = TypeVar("SelfRR", bound="ResourceRecommendation")
 
 
+# TODO: rename so it isn't the same name as ResourceRecommendation in result.py
 class ResourceRecommendation(pd.BaseModel):
     """A class to represent resource recommendation with optional request and limit values.
 

From f71abd1e559a2949357deed3667fbfb3957aa93c Mon Sep 17 00:00:00 2001
From: Natan Yellin <aantn@users.noreply.github.com>
Date: Mon, 1 Jul 2024 10:33:18 +0300
Subject: [PATCH 23/24] Fix ArgoRollouts (#308)

---
 .../integrations/kubernetes/cluster_loader/loaders/base.py   | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/base.py b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/base.py
index a6a552e6..6430a6df 100644
--- a/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/base.py
+++ b/robusta_krr/core/integrations/kubernetes/cluster_loader/loaders/base.py
@@ -102,6 +102,11 @@ def _build_selector_query(cls, selector: Any) -> Union[str, None]:
         if selector.match_labels is not None:
             label_filters += [f"{label[0]}={label[1]}" for label in selector.match_labels.items()]
 
+        # normally the kubernetes API client renames matchLabels to match_labels in python
+        # but for CRDs like ArgoRollouts that renaming doesn't happen
+        if getattr(selector, "matchLabels", None):
+            label_filters += [f"{label[0]}={label[1]}" for label in getattr(selector, "matchLabels").items()]
+
         if selector.match_expressions is not None:
             label_filters += [cls._get_match_expression_filter(expression) for expression in selector.match_expressions]
 

From 66389e63586e5a306c75c4d66c8078354e224390 Mon Sep 17 00:00:00 2001
From: Natan Yellin <aantn@users.noreply.github.com>
Date: Mon, 1 Jul 2024 10:33:30 +0300
Subject: [PATCH 24/24] Prevent single errors from failing scan (#307)

Fixes #301
---
 robusta_krr/core/runner.py | 33 +++++++++++++++++++--------------
 1 file changed, 19 insertions(+), 14 deletions(-)

diff --git a/robusta_krr/core/runner.py b/robusta_krr/core/runner.py
index 787982fa..68cbeb05 100644
--- a/robusta_krr/core/runner.py
+++ b/robusta_krr/core/runner.py
@@ -233,22 +233,27 @@ async def _check_cluster(self, cluster: Optional[str]) -> bool:
         return True
 
     async def _gather_object_allocations(self, k8s_object: K8sWorkload) -> Optional[ResourceScan]:
-        recommendation = await self._calculate_object_recommendations(k8s_object)
+        try:
+            recommendation = await self._calculate_object_recommendations(k8s_object)
 
-        self.__progressbar.progress()
+            self.__progressbar.progress()
 
-        if recommendation is None:
-            return None
-
-        return ResourceScan.calculate(
-            k8s_object,
-            ResourceAllocations(
-                requests={resource: recommendation[resource].request for resource in ResourceType},
-                limits={resource: recommendation[resource].limit for resource in ResourceType},
-                info={resource: recommendation[resource].info for resource in ResourceType},
-            ),
-        )
+            if recommendation is None:
+                return None
 
+            return ResourceScan.calculate(
+                k8s_object,
+                ResourceAllocations(
+                    requests={resource: recommendation[resource].request for resource in ResourceType},
+                    limits={resource: recommendation[resource].limit for resource in ResourceType},
+                    info={resource: recommendation[resource].info for resource in ResourceType},
+                ),
+            )
+        except Exception as e:
+            logger.error(f"Failed to gather allocations for {k8s_object}")
+            logger.exception(e)
+            return None
+    
     async def _collect_result(self) -> Result:
         clusters = await self.connector.list_clusters()
         if clusters is None:
@@ -314,7 +319,7 @@ async def _collect_result(self) -> Result:
             raise CriticalRunnerException("No successful scans were made. Check the logs for more information.")
 
         return Result(
-            scans=scans,
+            scans=successful_scans,
             description=self.strategy.description,
             strategy=StrategyData(
                 name=str(self.strategy).lower(),