3 лет назад · 0dcc28a1e7
--- a/pkg/cmd/costmodel/costmodel.go
+++ b/pkg/cmd/costmodel/costmodel.go
@@ -58,7 +58,7 @@ func StartExportWorker(ctx context.Context, model costmodel.AllocationModel) {
 
				 
			
 
				 	fm, err := filemanager.NewFileManager(exportPath)
			
 
				 	if err != nil {
			
 
				-		log.Errorf("could not start CSV exporter", err)
			
 
				+		log.Errorf("could not start CSV exporter: %v", err)
			
 
				 		return
			
 
				 	}
			
 
				 	go func() {
			
--- a/pkg/costmodel/allocation.go
+++ b/pkg/costmodel/allocation.go
@@ -13,51 +13,52 @@ import (
 
				 )
			
 
				 
			
 
				 const (
			
 
				-	queryFmtPods                     = `avg(kube_pod_container_status_running{}) by (pod, namespace, %s)[%s:%s]`
			
 
				-	queryFmtPodsUID                  = `avg(kube_pod_container_status_running{}) by (pod, namespace, uid, %s)[%s:%s]`
			
 
				-	queryFmtRAMBytesAllocated        = `avg(avg_over_time(container_memory_allocation_bytes{container!="", container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s, provider_id)`
			
 
				-	queryFmtRAMRequests              = `avg(avg_over_time(kube_pod_container_resource_requests{resource="memory", unit="byte", container!="", container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s)`
			
 
				-	queryFmtRAMUsageAvg              = `avg(avg_over_time(container_memory_working_set_bytes{container!="", container_name!="POD", container!="POD"}[%s])) by (container_name, container, pod_name, pod, namespace, instance, %s)`
			
 
				-	queryFmtRAMUsageMax              = `max(max_over_time(container_memory_working_set_bytes{container!="", container_name!="POD", container!="POD"}[%s])) by (container_name, container, pod_name, pod, namespace, instance, %s)`
			
 
				-	queryFmtCPUCoresAllocated        = `avg(avg_over_time(container_cpu_allocation{container!="", container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s)`
			
 
				-	queryFmtCPURequests              = `avg(avg_over_time(kube_pod_container_resource_requests{resource="cpu", unit="core", container!="", container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s)`
			
 
				-	queryFmtCPUUsageAvg              = `avg(rate(container_cpu_usage_seconds_total{container!="", container_name!="POD", container!="POD"}[%s])) by (container_name, container, pod_name, pod, namespace, instance, %s)`
			
 
				-	queryFmtGPUsRequested            = `avg(avg_over_time(kube_pod_container_resource_requests{resource="nvidia_com_gpu", container!="",container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s)`
			
 
				-	queryFmtGPUsAllocated            = `avg(avg_over_time(container_gpu_allocation{container!="", container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s)`
			
 
				-	queryFmtNodeCostPerCPUHr         = `avg(avg_over_time(node_cpu_hourly_cost[%s])) by (node, %s, instance_type, provider_id)`
			
 
				-	queryFmtNodeCostPerRAMGiBHr      = `avg(avg_over_time(node_ram_hourly_cost[%s])) by (node, %s, instance_type, provider_id)`
			
 
				-	queryFmtNodeCostPerGPUHr         = `avg(avg_over_time(node_gpu_hourly_cost[%s])) by (node, %s, instance_type, provider_id)`
			
 
				-	queryFmtNodeIsSpot               = `avg_over_time(kubecost_node_is_spot[%s])`
			
 
				-	queryFmtPVCInfo                  = `avg(kube_persistentvolumeclaim_info{volumename != ""}) by (persistentvolumeclaim, storageclass, volumename, namespace, %s)[%s:%s]`
			
 
				-	queryFmtPodPVCAllocation         = `avg(avg_over_time(pod_pvc_allocation[%s])) by (persistentvolume, persistentvolumeclaim, pod, namespace, %s)`
			
 
				-	queryFmtPVCBytesRequested        = `avg(avg_over_time(kube_persistentvolumeclaim_resource_requests_storage_bytes{}[%s])) by (persistentvolumeclaim, namespace, %s)`
			
 
				-	queryFmtPVActiveMins             = `count(kube_persistentvolume_capacity_bytes) by (persistentvolume, %s)[%s:%s]`
			
 
				-	queryFmtPVBytes                  = `avg(avg_over_time(kube_persistentvolume_capacity_bytes[%s])) by (persistentvolume, %s)`
			
 
				-	queryFmtPVCostPerGiBHour         = `avg(avg_over_time(pv_hourly_cost[%s])) by (volumename, %s)`
			
 
				-	queryFmtNetZoneGiB               = `sum(increase(kubecost_pod_network_egress_bytes_total{internet="false", sameZone="false", sameRegion="true"}[%s])) by (pod_name, namespace, %s) / 1024 / 1024 / 1024`
			
 
				-	queryFmtNetZoneCostPerGiB        = `avg(avg_over_time(kubecost_network_zone_egress_cost{}[%s])) by (%s)`
			
 
				-	queryFmtNetRegionGiB             = `sum(increase(kubecost_pod_network_egress_bytes_total{internet="false", sameZone="false", sameRegion="false"}[%s])) by (pod_name, namespace, %s) / 1024 / 1024 / 1024`
			
 
				-	queryFmtNetRegionCostPerGiB      = `avg(avg_over_time(kubecost_network_region_egress_cost{}[%s])) by (%s)`
			
 
				-	queryFmtNetInternetGiB           = `sum(increase(kubecost_pod_network_egress_bytes_total{internet="true"}[%s])) by (pod_name, namespace, %s) / 1024 / 1024 / 1024`
			
 
				-	queryFmtNetInternetCostPerGiB    = `avg(avg_over_time(kubecost_network_internet_egress_cost{}[%s])) by (%s)`
			
 
				-	queryFmtNetReceiveBytes          = `sum(increase(container_network_receive_bytes_total{pod!=""}[%s])) by (pod_name, pod, namespace, %s)`
			
 
				-	queryFmtNetTransferBytes         = `sum(increase(container_network_transmit_bytes_total{pod!=""}[%s])) by (pod_name, pod, namespace, %s)`
			
 
				-	queryFmtNodeLabels               = `avg_over_time(kube_node_labels[%s])`
			
 
				-	queryFmtNamespaceLabels          = `avg_over_time(kube_namespace_labels[%s])`
			
 
				-	queryFmtNamespaceAnnotations     = `avg_over_time(kube_namespace_annotations[%s])`
			
 
				-	queryFmtPodLabels                = `avg_over_time(kube_pod_labels[%s])`
			
 
				-	queryFmtPodAnnotations           = `avg_over_time(kube_pod_annotations[%s])`
			
 
				-	queryFmtServiceLabels            = `avg_over_time(service_selector_labels[%s])`
			
 
				-	queryFmtDeploymentLabels         = `avg_over_time(deployment_match_labels[%s])`
			
 
				-	queryFmtStatefulSetLabels        = `avg_over_time(statefulSet_match_labels[%s])`
			
 
				-	queryFmtDaemonSetLabels          = `sum(avg_over_time(kube_pod_owner{owner_kind="DaemonSet"}[%s])) by (pod, owner_name, namespace, %s)`
			
 
				-	queryFmtJobLabels                = `sum(avg_over_time(kube_pod_owner{owner_kind="Job"}[%s])) by (pod, owner_name, namespace ,%s)`
			
 
				-	queryFmtPodsWithReplicaSetOwner  = `sum(avg_over_time(kube_pod_owner{owner_kind="ReplicaSet"}[%s])) by (pod, owner_name, namespace ,%s)`
			
 
				-	queryFmtReplicaSetsWithoutOwners = `avg(avg_over_time(kube_replicaset_owner{owner_kind="<none>", owner_name="<none>"}[%s])) by (replicaset, namespace, %s)`
			
 
				-	queryFmtLBCostPerHr              = `avg(avg_over_time(kubecost_load_balancer_cost[%s])) by (namespace, service_name, %s)`
			
 
				-	queryFmtLBActiveMins             = `count(kubecost_load_balancer_cost) by (namespace, service_name, %s)[%s:%s]`
			
 
				-	queryFmtOldestSample             = `min_over_time(timestamp(group(node_cpu_hourly_cost))[%s:%s])`
			
 
				-	queryFmtNewestSample             = `max_over_time(timestamp(group(node_cpu_hourly_cost))[%s:%s])`
			
 
				+	queryFmtPods                        = `avg(kube_pod_container_status_running{}) by (pod, namespace, %s)[%s:%s]`
			
 
				+	queryFmtPodsUID                     = `avg(kube_pod_container_status_running{}) by (pod, namespace, uid, %s)[%s:%s]`
			
 
				+	queryFmtRAMBytesAllocated           = `avg(avg_over_time(container_memory_allocation_bytes{container!="", container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s, provider_id)`
			
 
				+	queryFmtRAMRequests                 = `avg(avg_over_time(kube_pod_container_resource_requests{resource="memory", unit="byte", container!="", container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s)`
			
 
				+	queryFmtRAMUsageAvg                 = `avg(avg_over_time(container_memory_working_set_bytes{container!="", container_name!="POD", container!="POD"}[%s])) by (container_name, container, pod_name, pod, namespace, instance, %s)`
			
 
				+	queryFmtRAMUsageMax                 = `max(max_over_time(container_memory_working_set_bytes{container!="", container_name!="POD", container!="POD"}[%s])) by (container_name, container, pod_name, pod, namespace, instance, %s)`
			
 
				+	queryFmtCPUCoresAllocated           = `avg(avg_over_time(container_cpu_allocation{container!="", container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s)`
			
 
				+	queryFmtCPURequests                 = `avg(avg_over_time(kube_pod_container_resource_requests{resource="cpu", unit="core", container!="", container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s)`
			
 
				+	queryFmtCPUUsageAvg                 = `avg(rate(container_cpu_usage_seconds_total{container!="", container_name!="POD", container!="POD"}[%s])) by (container_name, container, pod_name, pod, namespace, instance, %s)`
			
 
				+	queryFmtGPUsRequested               = `avg(avg_over_time(kube_pod_container_resource_requests{resource="nvidia_com_gpu", container!="",container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s)`
			
 
				+	queryFmtGPUsAllocated               = `avg(avg_over_time(container_gpu_allocation{container!="", container!="POD", node!=""}[%s])) by (container, pod, namespace, node, %s)`
			
 
				+	queryFmtNodeCostPerCPUHr            = `avg(avg_over_time(node_cpu_hourly_cost[%s])) by (node, %s, instance_type, provider_id)`
			
 
				+	queryFmtNodeCostPerRAMGiBHr         = `avg(avg_over_time(node_ram_hourly_cost[%s])) by (node, %s, instance_type, provider_id)`
			
 
				+	queryFmtNodeCostPerGPUHr            = `avg(avg_over_time(node_gpu_hourly_cost[%s])) by (node, %s, instance_type, provider_id)`
			
 
				+	queryFmtNodeIsSpot                  = `avg_over_time(kubecost_node_is_spot[%s])`
			
 
				+	queryFmtPVCInfo                     = `avg(kube_persistentvolumeclaim_info{volumename != ""}) by (persistentvolumeclaim, storageclass, volumename, namespace, %s)[%s:%s]`
			
 
				+	queryFmtPodPVCAllocation            = `avg(avg_over_time(pod_pvc_allocation[%s])) by (persistentvolume, persistentvolumeclaim, pod, namespace, %s)`
			
 
				+	queryFmtPVCBytesRequested           = `avg(avg_over_time(kube_persistentvolumeclaim_resource_requests_storage_bytes{}[%s])) by (persistentvolumeclaim, namespace, %s)`
			
 
				+	queryFmtPVActiveMins                = `count(kube_persistentvolume_capacity_bytes) by (persistentvolume, %s)[%s:%s]`
			
 
				+	queryFmtPVBytes                     = `avg(avg_over_time(kube_persistentvolume_capacity_bytes[%s])) by (persistentvolume, %s)`
			
 
				+	queryFmtPVCostPerGiBHour            = `avg(avg_over_time(pv_hourly_cost[%s])) by (volumename, %s)`
			
 
				+	queryFmtNetZoneGiB                  = `sum(increase(kubecost_pod_network_egress_bytes_total{internet="false", sameZone="false", sameRegion="true"}[%s])) by (pod_name, namespace, %s) / 1024 / 1024 / 1024`
			
 
				+	queryFmtNetZoneCostPerGiB           = `avg(avg_over_time(kubecost_network_zone_egress_cost{}[%s])) by (%s)`
			
 
				+	queryFmtNetRegionGiB                = `sum(increase(kubecost_pod_network_egress_bytes_total{internet="false", sameZone="false", sameRegion="false"}[%s])) by (pod_name, namespace, %s) / 1024 / 1024 / 1024`
			
 
				+	queryFmtNetRegionCostPerGiB         = `avg(avg_over_time(kubecost_network_region_egress_cost{}[%s])) by (%s)`
			
 
				+	queryFmtNetInternetGiB              = `sum(increase(kubecost_pod_network_egress_bytes_total{internet="true"}[%s])) by (pod_name, namespace, %s) / 1024 / 1024 / 1024`
			
 
				+	queryFmtNetInternetCostPerGiB       = `avg(avg_over_time(kubecost_network_internet_egress_cost{}[%s])) by (%s)`
			
 
				+	queryFmtNetReceiveBytes             = `sum(increase(container_network_receive_bytes_total{pod!="", container="POD"}[%s])) by (pod_name, pod, namespace, %s)`
			
 
				+	queryFmtNetTransferBytes            = `sum(increase(container_network_transmit_bytes_total{pod!="", container="POD"}[%s])) by (pod_name, pod, namespace, %s)`
			
 
				+	queryFmtNodeLabels                  = `avg_over_time(kube_node_labels[%s])`
			
 
				+	queryFmtNamespaceLabels             = `avg_over_time(kube_namespace_labels[%s])`
			
 
				+	queryFmtNamespaceAnnotations        = `avg_over_time(kube_namespace_annotations[%s])`
			
 
				+	queryFmtPodLabels                   = `avg_over_time(kube_pod_labels[%s])`
			
 
				+	queryFmtPodAnnotations              = `avg_over_time(kube_pod_annotations[%s])`
			
 
				+	queryFmtServiceLabels               = `avg_over_time(service_selector_labels[%s])`
			
 
				+	queryFmtDeploymentLabels            = `avg_over_time(deployment_match_labels[%s])`
			
 
				+	queryFmtStatefulSetLabels           = `avg_over_time(statefulSet_match_labels[%s])`
			
 
				+	queryFmtDaemonSetLabels             = `sum(avg_over_time(kube_pod_owner{owner_kind="DaemonSet"}[%s])) by (pod, owner_name, namespace, %s)`
			
 
				+	queryFmtJobLabels                   = `sum(avg_over_time(kube_pod_owner{owner_kind="Job"}[%s])) by (pod, owner_name, namespace ,%s)`
			
 
				+	queryFmtPodsWithReplicaSetOwner     = `sum(avg_over_time(kube_pod_owner{owner_kind="ReplicaSet"}[%s])) by (pod, owner_name, namespace ,%s)`
			
 
				+	queryFmtReplicaSetsWithoutOwners    = `avg(avg_over_time(kube_replicaset_owner{owner_kind="<none>", owner_name="<none>"}[%s])) by (replicaset, namespace, %s)`
			
 
				+	queryFmtReplicaSetsWithRolloutOwner = `avg(avg_over_time(kube_replicaset_owner{owner_kind="Rollout"}[%s])) by (replicaset, namespace, owner_kind, owner_name, %s)`
			
 
				+	queryFmtLBCostPerHr                 = `avg(avg_over_time(kubecost_load_balancer_cost[%s])) by (namespace, service_name, %s)`
			
 
				+	queryFmtLBActiveMins                = `count(kubecost_load_balancer_cost) by (namespace, service_name, %s)[%s:%s]`
			
 
				+	queryFmtOldestSample                = `min_over_time(timestamp(group(node_cpu_hourly_cost))[%s:%s])`
			
 
				+	queryFmtNewestSample                = `max_over_time(timestamp(group(node_cpu_hourly_cost))[%s:%s])`
			
 
				 
			
 
				 
			
 
				 	// Because we use container_cpu_usage_seconds_total to calculate CPU usage
			
@@ -504,6 +505,9 @@ func (cm *CostModel) computeAllocation(start, end time.Time, resolution time.Dur
 
				 	queryReplicaSetsWithoutOwners := fmt.Sprintf(queryFmtReplicaSetsWithoutOwners, durStr, env.GetPromClusterLabel())
			
 
				 	resChReplicaSetsWithoutOwners := ctx.QueryAtTime(queryReplicaSetsWithoutOwners, end)
			
 
				 
			
 
				+	queryReplicaSetsWithRolloutOwner := fmt.Sprintf(queryFmtReplicaSetsWithRolloutOwner, durStr, env.GetPromClusterLabel())
			
 
				+	resChReplicaSetsWithRolloutOwner := ctx.QueryAtTime(queryReplicaSetsWithRolloutOwner, end)
			
 
				+
			
 
				 	queryJobLabels := fmt.Sprintf(queryFmtJobLabels, durStr, env.GetPromClusterLabel())
			
 
				 	resChJobLabels := ctx.QueryAtTime(queryJobLabels, end)
			
 
				 
			
@@ -561,6 +565,7 @@ func (cm *CostModel) computeAllocation(start, end time.Time, resolution time.Dur
 
				 	resDaemonSetLabels, _ := resChDaemonSetLabels.Await()
			
 
				 	resPodsWithReplicaSetOwner, _ := resChPodsWithReplicaSetOwner.Await()
			
 
				 	resReplicaSetsWithoutOwners, _ := resChReplicaSetsWithoutOwners.Await()
			
 
				+	resReplicaSetsWithRolloutOwner, _ := resChReplicaSetsWithRolloutOwner.Await()
			
 
				 	resJobLabels, _ := resChJobLabels.Await()
			
 
				 	resLBCostPerHr, _ := resChLBCostPerHr.Await()
			
 
				 	resLBActiveMins, _ := resChLBActiveMins.Await()
			
@@ -616,7 +621,7 @@ func (cm *CostModel) computeAllocation(start, end time.Time, resolution time.Dur
 
				 	podStatefulSetMap := labelsToPodControllerMap(podLabels, resToStatefulSetLabels(resStatefulSetLabels))
			
 
				 	podDaemonSetMap := resToPodDaemonSetMap(resDaemonSetLabels, podUIDKeyMap, ingestPodUID)
			
 
				 	podJobMap := resToPodJobMap(resJobLabels, podUIDKeyMap, ingestPodUID)
			
 
				-	podReplicaSetMap := resToPodReplicaSetMap(resPodsWithReplicaSetOwner, resReplicaSetsWithoutOwners, podUIDKeyMap, ingestPodUID)
			
 
				+	podReplicaSetMap := resToPodReplicaSetMap(resPodsWithReplicaSetOwner, resReplicaSetsWithoutOwners, resReplicaSetsWithRolloutOwner, podUIDKeyMap, ingestPodUID)
			
 
				 	applyControllersToPods(podMap, podDeploymentMap)
			
 
				 	applyControllersToPods(podMap, podStatefulSetMap)
			
 
				 	applyControllersToPods(podMap, podDaemonSetMap)
			
--- a/pkg/costmodel/allocation_helpers.go
+++ b/pkg/costmodel/allocation_helpers.go
@@ -1156,13 +1156,16 @@ func resToPodJobMap(resJobLabels []*prom.QueryResult, podUIDKeyMap map[podKey][]
 
				 	return jobLabels
			
 
				 }
			
 
				 
			
 
				-func resToPodReplicaSetMap(resPodsWithReplicaSetOwner []*prom.QueryResult, resReplicaSetsWithoutOwners []*prom.QueryResult, podUIDKeyMap map[podKey][]podKey, ingestPodUID bool) map[podKey]controllerKey {
			
 
				+func resToPodReplicaSetMap(resPodsWithReplicaSetOwner []*prom.QueryResult, resReplicaSetsWithoutOwners []*prom.QueryResult, resReplicaSetsWithRolloutOwner []*prom.QueryResult, podUIDKeyMap map[podKey][]podKey, ingestPodUID bool) map[podKey]controllerKey {
			
 
				 	// Build out set of ReplicaSets that have no owners, themselves, such that
			
 
				 	// the ReplicaSet should be used as the owner of the Pods it controls.
			
 
				 	// (This should exclude, for example, ReplicaSets that are controlled by
			
 
				 	// Deployments, in which case the Deployment should be the pod's owner.)
			
 
				+	// Additionally, add to this set of ReplicaSets those ReplicaSets that
			
 
				+	// are owned by a Rollout
			
 
				 	replicaSets := map[controllerKey]struct{}{}
			
 
				 
			
 
				+	// Create unowned ReplicaSet controller keys
			
 
				 	for _, res := range resReplicaSetsWithoutOwners {
			
 
				 		controllerKey, err := resultReplicaSetKey(res, env.GetPromClusterLabel(), "namespace", "replicaset")
			
 
				 		if err != nil {
			
@@ -1172,17 +1175,34 @@ func resToPodReplicaSetMap(resPodsWithReplicaSetOwner []*prom.QueryResult, resRe
 
				 		replicaSets[controllerKey] = struct{}{}
			
 
				 	}
			
 
				 
			
 
				+	// Create Rollout-owned ReplicaSet controller keys
			
 
				+	for _, res := range resReplicaSetsWithRolloutOwner {
			
 
				+		controllerKey, err := resultReplicaSetRolloutKey(res, env.GetPromClusterLabel(), "namespace", "replicaset")
			
 
				+		if err != nil {
			
 
				+			continue
			
 
				+		}
			
 
				+
			
 
				+		replicaSets[controllerKey] = struct{}{}
			
 
				+	}
			
 
				+
			
 
				 	// Create the mapping of Pods to ReplicaSets, ignoring any ReplicaSets that
			
 
				-	// to not appear in the set of uncontrolled ReplicaSets above.
			
 
				+	// do not appear in the set of unowned/Rollout-owned ReplicaSets above.
			
 
				 	podToReplicaSet := map[podKey]controllerKey{}
			
 
				 
			
 
				 	for _, res := range resPodsWithReplicaSetOwner {
			
 
				+		// First, check if this pod is owned by an unowned ReplicaSet
			
 
				 		controllerKey, err := resultReplicaSetKey(res, env.GetPromClusterLabel(), "namespace", "owner_name")
			
 
				 		if err != nil {
			
 
				 			continue
			
 
				-		}
			
 
				-		if _, ok := replicaSets[controllerKey]; !ok {
			
 
				-			continue
			
 
				+		} else if _, ok := replicaSets[controllerKey]; !ok {
			
 
				+			// If the pod is not owned by an unowned ReplicaSet, check if
			
 
				+			// it's owned by a Rollout-owned ReplicaSet
			
 
				+			controllerKey, err = resultReplicaSetRolloutKey(res, env.GetPromClusterLabel(), "namespace", "owner_name")
			
 
				+			if err != nil {
			
 
				+				continue
			
 
				+			} else if _, ok := replicaSets[controllerKey]; !ok {
			
 
				+				continue
			
 
				+			}
			
 
				 		}
			
 
				 
			
 
				 		pod, err := res.GetString("pod")
			
@@ -1196,18 +1216,14 @@ func resToPodReplicaSetMap(resPodsWithReplicaSetOwner []*prom.QueryResult, resRe
 
				 
			
 
				 		if ingestPodUID {
			
 
				 			if uidKeys, ok := podUIDKeyMap[key]; ok {
			
 
				-
			
 
				 				keys = append(keys, uidKeys...)
			
 
				-
			
 
				 			}
			
 
				 		} else {
			
 
				 			keys = []podKey{key}
			
 
				 		}
			
 
				 
			
 
				 		for _, key := range keys {
			
 
				-
			
 
				 			podToReplicaSet[key] = controllerKey
			
 
				-
			
 
				 		}
			
 
				 	}
			
 
				 
			
--- a/pkg/costmodel/key.go
+++ b/pkg/costmodel/key.go
@@ -243,6 +243,12 @@ func resultReplicaSetKey(res *prom.QueryResult, clusterLabel, namespaceLabel, co
 
				 	return resultControllerKey("replicaset", res, clusterLabel, namespaceLabel, controllerLabel)
			
 
				 }
			
 
				 
			
 
				+// resultReplicaSetRolloutKey creates a controllerKey for a Job.
			
 
				+// (See resultControllerKey for more.)
			
 
				+func resultReplicaSetRolloutKey(res *prom.QueryResult, clusterLabel, namespaceLabel, controllerLabel string) (controllerKey, error) {
			
 
				+	return resultControllerKey("rollout", res, clusterLabel, namespaceLabel, controllerLabel)
			
 
				+}
			
 
				+
			
 
				 type serviceKey struct {
			
 
				 	Cluster   string
			
 
				 	Namespace string
			
--- a/pkg/kubecost/window_test.go
+++ b/pkg/kubecost/window_test.go
@@ -239,7 +239,11 @@ func TestParseWindowUTC(t *testing.T) {
 
				 	if month.Duration().Hours() > hoursThisMonth || month.Duration().Hours() < (hoursThisMonth-24.0) {
			
 
				 		t.Fatalf(`expect: window "month" to have approximately %f hours; actual: %f hours`, hoursThisMonth, month.Duration().Hours())
			
 
				 	}
			
 
				-	if !month.End().Before(time.Now().UTC()) {
			
 
				+
			
 
				+	// this test fails periodically if execution is so fast that time.Now() during the condition
			
 
				+	// check is the same as the end of the current month time computed by ParseWindowUTC
			
 
				+	// so we add one nanosecond to sure time.Now() is later than when invoked earlier
			
 
				+	if !month.End().Before(time.Now().UTC().Add(time.Nanosecond)) {
			
 
				 		t.Fatalf(`expect: window "month" to end before now; actual: %s ends after %s`, month, time.Now().UTC())
			
 
				 	}
			
 
				 
			
--- a/pkg/prom/diagnostics.go
+++ b/pkg/prom/diagnostics.go
@@ -61,7 +61,7 @@ var diagnosticDefinitions map[string]*diagnosticDefinition = map[string]*diagnos
 
				 	CAdvisorDiagnosticMetricID: {
			
 
				 		ID:          CAdvisorDiagnosticMetricID,
			
 
				 		QueryFmt:    `absent_over_time(container_cpu_usage_seconds_total[5m] %s)`,
			
 
				-		Label:       "cAdvsior metrics available",
			
 
				+		Label:       "cAdvisor metrics available",
			
 
				 		Description: "Determine if cAdvisor metrics are available during last 5 minutes.",
			
 
				 		DocLink:     fmt.Sprintf("%s#cadvisor-metrics-available", DocumentationBaseURL),
			
 
				 	},
			
@@ -88,7 +88,7 @@ var diagnosticDefinitions map[string]*diagnosticDefinition = map[string]*diagnos
 
				 	CAdvisorLabelDiagnosticMetricID: {
			
 
				 		ID:          CAdvisorLabelDiagnosticMetricID,
			
 
				 		QueryFmt:    `absent_over_time(container_cpu_usage_seconds_total{container!="",pod!=""}[5m] %s)`,
			
 
				-		Label:       "Expected cAdvsior labels available",
			
 
				+		Label:       "Expected cAdvisor labels available",
			
 
				 		Description: "Determine if expected cAdvisor labels are present during last 5 minutes.",
			
 
				 		DocLink:     fmt.Sprintf("%s#cadvisor-metrics-available", DocumentationBaseURL),
			
 
				 	},
			
@@ -122,7 +122,7 @@ var diagnosticDefinitions map[string]*diagnosticDefinition = map[string]*diagnos
 
				 	CAdvisorWorkingSetBytesMetricID: {
			
 
				 		ID:          CAdvisorWorkingSetBytesMetricID,
			
 
				 		QueryFmt:    `absent_over_time(container_memory_working_set_bytes{container="cost-model", container!="POD", instance!=""}[5m] %s)`,
			
 
				-		Label:       "cAdvsior working set bytes metrics available",
			
 
				+		Label:       "cAdvisor working set bytes metrics available",
			
 
				 		Description: "Determine if cAdvisor working set bytes metrics are available during last 5 minutes.",
			
 
				 	},
			
 
				 	KSMCPUCapacityMetricID: {