akillibulut
/
cost-model
mirror of https://github.com/kubecost/cost-model


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485
							package prom

var queries = map[string]string{
	"RAMRequests": `
		avg(
			count_over_time(
				kube_pod_container_resource_requests{
					resource="memory",
					unit="byte",
					node!="",
					<< .container >>!="",
					<< .container >>!="POD",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
			*
			avg_over_time(
				kube_pod_container_resource_requests{
					resource="memory",
					unit="byte",
					node!="",
					<< .container >>!="",
					<< .container >>!="POD",
					<< .filter >>
				}[<< .duration >>] << .offset >>
				)
			) by (
				namespace,
				node,
				<< .container >>,
				<< .pod >>,
				<< .cluster >>
			)`,
	"RAMUsage": `
		sort_desc(
			avg(
				count_over_time(
					container_memory_working_set_bytes{
						node!="",
						<< .container >>!="",
						<< .container >>!="POD",
						<< .filter >>
					}[<< .duration >>] << .offset >>
				)
				*
				avg_over_time(
					container_memory_working_set_bytes{
						node!=""
						<< .container >>!="",
						<< .container >>!="POD",
						<< .filter >>
					}[<< .duration >>] << .offset >>
				)
			) by (
				namespace,
				node,
				<< .container >>,
				<< .pod >>,
				<< .cluster >>
			)
		)`,
	"CPURequests": `
		avg(
			count_over_time(
				kube_pod_container_resource_requests{
					resource="cpu",
					unit="core",
					node!="",
					<< .container >>!="",
					<< .container >>!="POD",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
			*
			avg_over_time(
				kube_pod_container_resource_requests{
					resource="cpu",
					unit="core",
					node!="",
					<< .container >>!="",
					<< .container >>!="POD",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
		) by (
			namespace,
			node,
			<< .container >>,
			<< .pod >>,
			<< .cluster >>
		)`,
	"CPUUsage": `
		avg(
			rate(
				container_cpu_usage_seconds_total{
					node!="",
					<< .container >>!="",
					<< .container >>!="POD",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
		) by (
			namespace,
			node,
			<< .container >>,
			<< .pod >>,
			<< .cluster >>
		)`,
	"GPURequests": `
		avg(
			count_over_time(
				kube_pod_container_resource_requests{
					resource="nvidia_com_gpu",
					node!="",
					<< .container >>!="",
					<< .container >>!="POD",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
			*
			avg_over_time(
				kube_pod_container_resource_requests{
					resource="nvidia_com_gpu",
					node!="",
					<< .container >>!="",
					<< .container >>!="POD",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
			* 
			<< .interval >>
		) by (
			namespace,
			node,
			<< .container >>,
			<< .pod >>,
			<< .cluster >>
		)
		* on (
			namespace,
			<< .pod >>,
			<< .cluster >>
		) group_left(
			<< .container >>
		) avg(
			avg_over_time(
				kube_pod_status_phase{
					phase="Running",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
		) by (
			namespace,
			<< .pod >>,
			<< .cluster >>
		)`,
	"PVRequests": `
		avg(
			avg(
				kube_persistentvolumeclaim_info{
					volumename!="",
					<< .filter >>
				}
			) by (
				persistentvolumeclaim,
				storageclass,
				namespace,
				volumename,
				kubernetes_node,
				<< .cluster >>
			)
			*
			on (
				persistentvolumeclaim,
				namespace,
				kubernetes_node,
				<< .cluster >>
			) group_right(
				storageclass,
				volumename
			) sum(
				kube_persistentvolumeclaim_resource_requests_storage_bytes{
					<< .filter >>
				}
			) by (
				persistentvolumeclaim,
				namespace,
				kubernetes_node,
				kubernetes_name,
				<< .cluster >>
			)
		) by (
			persistentvolumeclaim,
			storageclass,
			namespace,
			volumename,
			kubernetes_node,
			<< .cluster >>
		)`,
	"RAMAlloc": `
		sum(
			sum_over_time(
				container_memory_allocation_bytes{
					node!="",
					<< .container >>!="",
					<< .container >>!="POD",
					<< .filter >>
				}[<< .duration >>]
			)
		) by (
			namespace,
			node,
			<< .pod >>,
			<< .container >>,
			<< .cluster >>
		)
		* 
		<< .interval >> / 60 / 60`,
	"CPUAlloc": `
		sum(
			sum_over_time(
				container_cpu_allocation{
					node!="",
					<< .container >>!="",
					<< .container >>!="POD",
					<< .filter >>
				}[<< .duration >>]
			)
		) by (
			namespace,
			node,
			<< .pod >>,
			<< .container >>,
			<< .cluster >>
		) 
		* 
		<< .interval >> / 60 / 60`,
	"PVCAlloc": `
		sum(
			sum_over_time(
				pod_pvc_allocation{
					<< .filter >>
				}[<< .duration >>]
			)
		) by (
			namespace,
			persistentvolume,
			persistentvolumeclaim,
			<< .cluster >>
		)
		*
		<< .interval >>/60/60`,
	"PVHourlyCost": `
		avg_over_time(
			pv_hourly_cost{
				<< .filter >>
			}[<< .duration >>]
		)`,
	"NamespaceLabels": `
		avg_over_time(
			kube_namespace_labels{
				<< .filter >>
			}[<< .duration >>]
		)`,
	"PodLabels": `
		avg_over_time(
			kube_pod_labels{
				<< .filter >>
			}[<< .duration >>]
		)`,
	"NamespaceAnnotations": `
		avg_over_time(
			kube_namespace_annotations{
				<< .filter >>
			}[<< .duration >>]
		)`,
	"PodAnnotations": `
		avg_over_time(
			kube_pod_annotations{
				<< .filter >>
			}[<< .duration >>]
		)`,
	"DeploymentLabels": `
		avg_over_time(
			deployment_match_labels{
				<< .filter >>
			}[<< .duration >>]
		)`,
	"StatefulSetLabels": `
		avg_over_time(
			statefulSet_match_labels{
				<< .filter >>
			}[<< .duration >>]
		)`,
	"DaemonSetLabels": `
		sum(
			kube_pod_owner{
				owner_kind="DaemonSet",
				<< .filter >>
			}
		) by (
			namespace,
			owner_name,
			<< .pod >>,
			<< .cluster >>
		)`,
	"JobLabels": `
		sum(
			kube_pod_owner{
				owner_kind="Job",
				<< .filter >>
			}
		) by (
			namespace,
			owner_name,
			<< .pod >>,
			<< .cluster >>
		)`,
	"ServiceLabels": `
		avg_over_time(
			service_selector_labels{
				<< .filter >>
			}[<< .duration >>]
		)`,
	"NetZoneRequests": `
		sum(
			increase(
				kubecost_pod_network_egress_bytes_total{
					internet="false",
					sameZone="false",
					sameRegion="true",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
		) by (
			namespace,
			<< .pod >>,
			<< .cluster >>
		) / 1024 / 1024 / 1024`,
	"NetRegionRequests": `
		sum(
			increase(
				kubecost_pod_network_egress_bytes_total{
					internet="false",
					sameZone="false",
					sameRegion="false",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
		) by (
			namespace,
			<< .pod >>,
			<< .cluster >>
		) / 1024 / 1024 / 1024`,
	"NetInternetRequests": `
		sum(
			increase(
				kubecost_pod_network_egress_bytes_total{
					internet="true",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
		) by (
			namespace,
			<< .pod >>,
			<< .cluster >>
		) / 1024 / 1024 / 1024`,
	"Normalization": `
		max(
			count_over_time(
				kube_pod_container_resource_requests{
					resource="memory",
					unit="byte",
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
		)`,
	"CPUCost": `
		avg(
			avg_over_time(
				node_cpu_hourly_cost{
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
		) by (
			node,
			instance,
			<< .cluster >>
		)`,
	"RAMCost": `
		avg(
			avg_over_time(
				node_ram_hourly_cost{
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
		) by (
			node,
			instance,
			<< .cluster >>
		)`,
	"GPUCost": `
		avg(
			avg_over_time(
				node_gpu_hourly_cost{
					<< .filter >>
				}[<< .duration >>] << .offset >>
			)
		) by (
			node,
			instance,
			<< .cluster >>
		)`,


	"Pods": `avg(kube_pod_container_status_running{<< .filter >>}) by (namespace, << .pod >>, << .cluster >>)[<< .duration >>: << .resolution >>]`,
	"PodsUID": `avg(kube_pod_container_status_running{<< .filter >>}) by (namespace, uid, << .pod >>, << .cluster >>)[<< .duration >>: << .resolution >>]`,
	"RAMBytesAllocated": `avg(avg_over_time(container_memory_allocation_bytes{<< .container >>!="", << .container >>!="POD", node!="", << .filter >>}[<< .duration >>])) by (namespace, provider_id, node, << .container >>, << .pod >>, << .cluster >>)`,
	"RAMReq": `avg(avg_over_time(kube_pod_container_resource_requests{resource="memory", unit="byte", << .container >>!="", << .container >>!="POD", node!="", << .filter >>}[<< .duration >>])) by (namespace, node, << .container >>, << .pod >>, << .cluster >>)`,
	"RAMUsageAvg": `avg(avg_over_time(container_memory_working_set_bytes{<< .container >>!="", << .container >>!="POD", << .filter >>}[<< .duration >>])) by (namespace, node, << .container >>, << .pod >>, << .cluster >>)`,
	"RAMUsageMax": `max(max_over_time(container_memory_working_set_bytes{<< .container >>!="", << .container >>!="POD", << .filter >>}[<< .duration >>])) by (namespace, node, << .container >>, << .pod >>, << .cluster >>)`,
	"CPUCoresAllocated": `avg(avg_over_time(container_cpu_allocation{<< .container >>!="", << .container >>!="POD", node!="", << .filter >>}[<< .duration >>])) by (namespace, node, << .container >>, << .pod >>, << .cluster >>)`,
	"CPUReq": `avg(avg_over_time(kube_pod_container_resource_requests{resource="cpu", unit="core", << .container >>!="", << .container >>!="POD", node!="", << .filter >>}[<< .duration >>])) by (namespace, node, << .container >>, << .pod >>, << .cluster>>)`,
	"CPUUsageAvg": `avg(rate(container_cpu_usage_seconds_total{<< .container >>!="", << .container >>!="POD", << .filter >>}[<< .duration >>])) by (namespace, node, << .container >>, << .pod >>, << .cluster >>)`,
	"CPUUsageMax": `max(rate(container_cpu_usage_seconds_total{<< .container >>!="", << .container >>!="POD", << .filter >>}[<< .duration >>])) by (namespace, node, << .container >>, << .pod >>, << .cluster >>)`,
	"GPUsRequested": `avg(avg_over_time(kube_pod_container_resource_requests{resource="nvidia_com_gpu", << .container >>!="",<< .container >>!="POD", node!="", << .filter >>}[<< .duration >>])) by (namespace, node, << .container >>, << .pod >>,  << .cluster >>)`,
	"GPUsAllocated": `avg(avg_over_time(container_gpu_allocation{<< .container >>!="", << .container >>!="POD", node!=""}[<< .duration >>])) by (namespace, node, << .container >>, << .pod >>, << .cluster >>)`,
	"NodeCostPerCPUHr": `avg(avg_over_time(node_cpu_hourly_cost{<< .filter >>}[<< .duration >>])) by (instance_type, provider_id, node, << .cluster >>)`,
	"NodeCostPerRAMGiBHr": `avg(avg_over_time(node_ram_hourly_cost{<< .filter >>}[<< .duration >>])) by (instance_type, provider_id, node, << .cluster >>)`,
	"NodeCostPerGPUHr": `avg(avg_over_time(node_gpu_hourly_cost{<< .filter >>}[<< .duration >>])) by (instance_type, provider_id, node, << .cluster >>)`,
	"NodeIsSpot": `avg_over_time(kubecost_node_is_spot{<< .filter >>}[<< .duration >>])`,
	"PVCInfo": `avg(kube_persistentvolumeclaim_info{volumename != "", << .filter >>}) by (persistentvolumeclaim, storageclass, volumename, namespace, << .cluster >>)[<< .duration >>: << .resolution >>]`,
	"PVBytes": `avg(avg_over_time(kube_persistentvolume_capacity_bytes{<< .filter >>}[<< .duration >>])) by (persistentvolume, << .cluster >>)`,
	"PodPVCAllocation": `avg(avg_over_time(pod_pvc_allocation{<< .filter >>}[<< .duration >>])) by (persistentvolume, persistentvolumeclaim, namespace, << .pod >>, << .cluster >>)`,
	"PVCBytesRequested": `avg(avg_over_time(kube_persistentvolumeclaim_resource_requests_storage_bytes{<< .filter >>}[<< .duration >>])) by (persistentvolumeclaim, namespace, << .cluster >>)`,
	"PVCostPerGiBHour": `avg(avg_over_time(pv_hourly_cost{<< .filter >>}[<< .duration >>])) by (volumename, << .cluster >>)`,
	"NetZoneGiB": `sum(increase(kubecost_pod_network_egress_bytes_total{internet="false", sameZone="false", sameRegion="true", << .filter >>}[<< .duration >>])) by (namespace, << .pod >>, << .cluster >>) / 1024 / 1024 / 1024`,
	"NetZoneCostPerGiB": `avg(avg_over_time(kubecost_network_zone_egress_cost{<< .filter >>}[<< .duration >>])) by (<< .cluster >>)`,
	"NetRegionGiB": `sum(increase(kubecost_pod_network_egress_bytes_total{internet="false", sameZone="false", sameRegion="false", << .filter >>}[<< .duration >>])) by (namespace, << .pod >>, << .cluster >>) / 1024 / 1024 / 1024`,
	"NetRegionCostPerGiB": `avg(avg_over_time(kubecost_network_region_egress_cost{<< .filter >>}[<< .duration >>])) by (<< .cluster >>)`,
	"NetInternetGiB": `sum(increase(kubecost_pod_network_egress_bytes_total{internet="true", << .filter >>}[<< .duration >>])) by (namespace, << .pod >>, << .cluster >>) / 1024 / 1024 / 1024`,
	"NetInternetCostPerGiB": `avg(avg_over_time(kubecost_network_internet_egress_cost{<< .filter >>}[<< .duration >>])) by (<< .cluster >>)`,
	"NetReceiveBytes": `sum(increase(container_network_receive_bytes_total{<< .pod >>!="", << .container >>="POD", << .filter >>}[<< .duration >>])) by (namespace, << .pod >>, << .cluster >>)`,
	"NetTransferBytes": `sum(increase(container_network_transmit_bytes_total{<< .pod >>!="", << .container >>="POD", << .filter >>}[<< .duration >>])) by (namespace, << .pod >>, << .cluster >>)`,
	"PodsWithReplicaSetOwner": `
		sum(
			avg_over_time(kube_pod_owner{owner_kind="ReplicaSet", << .filter >>}[<< .duration >>])) by (owner_name, namespace, << .pod >>, << .cluster >>)`,
	"ReplicaSetsWithoutOwners": `
		avg(
			avg_over_time(
				kube_replicaset_owner{
					owner_kind="<none>",
					owner_name="<none>",
					<< .filter >>
				}[<< .duration >>]
			)
		) by (
			replicaset,
			namespace,
			<< .cluster >>
		)`,
	"LBCostPerHr": `
		avg(
			avg_over_time(
				kubecost_load_balancer_cost{
					<< .filter >>
				}[<< .duration >>]
			)
		) by (
			namespace,
			service_name,
			<< .cluster >>
		)`,
	"LBActiveMins": `
		count(
			kubecost_load_balancer_cost{
				<< .filter >>
			}
		) by (
			namespace,
			service_name,
			<< .cluster >>
		)[<< .duration >>: << .resolution >>]`,
}