From patchwork Wed Mar 11 02:54:06 2020
Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: 7bit
X-Patchwork-Submitter: Xiubo Li <xiubli@redhat.com>
X-Patchwork-Id: 11430591
Return-Path: <SRS0=9jXo=44=vger.kernel.org=ceph-devel-owner@kernel.org>
Received: from mail.kernel.org (pdx-korg-mail-1.web.codeaurora.org
 [172.30.200.123])
	by pdx-korg-patchwork-2.web.codeaurora.org (Postfix) with ESMTP id B5EDD1874
	for <patchwork-ceph-devel@patchwork.kernel.org>;
 Wed, 11 Mar 2020 02:54:28 +0000 (UTC)
Received: from vger.kernel.org (vger.kernel.org [209.132.180.67])
	by mail.kernel.org (Postfix) with ESMTP id 950A9215A4
	for <patchwork-ceph-devel@patchwork.kernel.org>;
 Wed, 11 Mar 2020 02:54:28 +0000 (UTC)
Authentication-Results: mail.kernel.org;
	dkim=pass (1024-bit key) header.d=redhat.com header.i=@redhat.com
 header.b="MY16Fysf"
Received: (majordomo@vger.kernel.org) by vger.kernel.org via listexpand
        id S1727888AbgCKCy2 (ORCPT
        <rfc822;patchwork-ceph-devel@patchwork.kernel.org>);
        Tue, 10 Mar 2020 22:54:28 -0400
Received: from us-smtp-1.mimecast.com ([205.139.110.61]:24765 "EHLO
        us-smtp-delivery-1.mimecast.com" rhost-flags-OK-OK-OK-FAIL)
        by vger.kernel.org with ESMTP id S1727648AbgCKCy1 (ORCPT
        <rfc822;ceph-devel@vger.kernel.org>);
        Tue, 10 Mar 2020 22:54:27 -0400
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=redhat.com;
        s=mimecast20190719; t=1583895265;
        h=from:from:reply-to:subject:subject:date:date:message-id:message-id:
         to:to:cc:cc:in-reply-to:in-reply-to:references:references;
        bh=dDAyTiA8z4tUaDJfbJsU8xG7hwtg3q/4131ko+/H6TM=;
        b=MY16FysfNl2JfXHxaQtKxWs302O0R1IIuCOIWLr69m8QSgltDHwGAM/n9aJE7nmxauViz9
        srpxPUnNwY4bsrhGK3OlLUOseDL8GVP6wLu0bskqrRCuTicQBIq8ibSKzsjgMfLrTdyTre
        QqeNLODeyHgz5bSFXyG3vw1+APN6cBc=
Received: from mimecast-mx01.redhat.com (mimecast-mx01.redhat.com
 [209.132.183.4]) (Using TLS) by relay.mimecast.com with ESMTP id
 us-mta-428-lsHr_Dn0Pv6zeFqLSzSJww-1; Tue, 10 Mar 2020 22:54:19 -0400
X-MC-Unique: lsHr_Dn0Pv6zeFqLSzSJww-1
Received: from smtp.corp.redhat.com (int-mx02.intmail.prod.int.phx2.redhat.com
 [10.5.11.12])
        (using TLSv1.2 with cipher AECDH-AES256-SHA (256/256 bits))
        (No client certificate requested)
        by mimecast-mx01.redhat.com (Postfix) with ESMTPS id 26053106C011;
        Wed, 11 Mar 2020 02:54:18 +0000 (UTC)
Received: from lxbceph0.gsslab.pek2.redhat.com
 (vm36-245.gsslab.pek2.redhat.com [10.72.36.245])
        by smtp.corp.redhat.com (Postfix) with ESMTP id A752A60C18;
        Wed, 11 Mar 2020 02:54:15 +0000 (UTC)
From: xiubli@redhat.com
To: jlayton@kernel.org
Cc: sage@redhat.com, idryomov@gmail.com, zyan@redhat.com,
        pdonnell@redhat.com, ceph-devel@vger.kernel.org,
        Xiubo Li <xiubli@redhat.com>
Subject: [PATCH 1/2] ceph: move all the metric helpers into one separate file
Date: Tue, 10 Mar 2020 22:54:06 -0400
Message-Id: <1583895247-17312-2-git-send-email-xiubli@redhat.com>
In-Reply-To: <1583895247-17312-1-git-send-email-xiubli@redhat.com>
References: <1583895247-17312-1-git-send-email-xiubli@redhat.com>
X-Scanned-By: MIMEDefang 2.79 on 10.5.11.12
Sender: ceph-devel-owner@vger.kernel.org
Precedence: bulk
List-ID: <ceph-devel.vger.kernel.org>
X-Mailing-List: ceph-devel@vger.kernel.org

From: Xiubo Li <xiubli@redhat.com>

The inline is not proper any more due to the helper becoming
larger and larger.

URL: https://tracker.ceph.com/issues/44534
Signed-off-by: Xiubo Li <xiubli@redhat.com>
---
 fs/ceph/Makefile     |   2 +-
 fs/ceph/mds_client.c |  95 +--------------------------
 fs/ceph/metric.c     | 177 +++++++++++++++++++++++++++++++++++++++++++++++++++
 fs/ceph/metric.h     |  90 +++++---------------------
 4 files changed, 194 insertions(+), 170 deletions(-)
 create mode 100644 fs/ceph/metric.c

diff --git a/fs/ceph/Makefile b/fs/ceph/Makefile
index 0a0823d..50c635d 100644
--- a/fs/ceph/Makefile
+++ b/fs/ceph/Makefile
@@ -8,7 +8,7 @@ obj-$(CONFIG_CEPH_FS) += ceph.o
 ceph-y := super.o inode.o dir.o file.o locks.o addr.o ioctl.o \
 	export.o caps.o snap.o xattr.o quota.o io.o \
 	mds_client.o mdsmap.o strings.o ceph_frag.o \
-	debugfs.o util.o
+	debugfs.o util.o metric.o
 
 ceph-$(CONFIG_CEPH_FSCACHE) += cache.o
 ceph-$(CONFIG_CEPH_FS_POSIX_ACL) += acl.o
diff --git a/fs/ceph/mds_client.c b/fs/ceph/mds_client.c
index ff6c2be..eb2657e 100644
--- a/fs/ceph/mds_client.c
+++ b/fs/ceph/mds_client.c
@@ -4326,90 +4326,6 @@ static void delayed_work(struct work_struct *work)
 	schedule_delayed(mdsc);
 }
 
-static int ceph_mdsc_metric_init(struct ceph_client_metric *metric)
-{
-	int ret;
-
-	if (!metric)
-		return -EINVAL;
-
-	atomic64_set(&metric->total_dentries, 0);
-	ret = percpu_counter_init(&metric->d_lease_hit, 0, GFP_KERNEL);
-	if (ret)
-		return ret;
-
-	ret = percpu_counter_init(&metric->d_lease_mis, 0, GFP_KERNEL);
-	if (ret)
-		goto err_d_lease_mis;
-
-	ret = percpu_counter_init(&metric->i_caps_hit, 0, GFP_KERNEL);
-	if (ret)
-		goto err_i_caps_hit;
-
-	ret = percpu_counter_init(&metric->i_caps_mis, 0, GFP_KERNEL);
-	if (ret)
-		goto err_i_caps_mis;
-
-	ret = percpu_counter_init(&metric->total_reads, 0, GFP_KERNEL);
-	if (ret)
-		goto err_total_reads;
-
-	ret = percpu_counter_init(&metric->read_latency_sum, 0, GFP_KERNEL);
-	if (ret)
-		goto err_read_latency_sum;
-
-	spin_lock_init(&metric->read_latency_lock);
-	atomic64_set(&metric->read_latency_min, S64_MAX);
-	atomic64_set(&metric->read_latency_max, 0);
-
-	ret = percpu_counter_init(&metric->total_writes, 0, GFP_KERNEL);
-	if (ret)
-		goto err_total_writes;
-
-	ret = percpu_counter_init(&metric->write_latency_sum, 0, GFP_KERNEL);
-	if (ret)
-		goto err_write_latency_sum;
-
-	spin_lock_init(&metric->write_latency_lock);
-	atomic64_set(&metric->write_latency_min, S64_MAX);
-	atomic64_set(&metric->write_latency_max, 0);
-
-	ret = percpu_counter_init(&metric->total_metadatas, 0, GFP_KERNEL);
-	if (ret)
-		goto err_total_metadatas;
-
-	ret = percpu_counter_init(&metric->metadata_latency_sum, 0, GFP_KERNEL);
-	if (ret)
-		goto err_metadata_latency_sum;
-
-	spin_lock_init(&metric->metadata_latency_lock);
-	atomic64_set(&metric->metadata_latency_min, S64_MAX);
-	atomic64_set(&metric->metadata_latency_max, 0);
-
-	return 0;
-
-err_metadata_latency_sum:
-	percpu_counter_destroy(&metric->total_metadatas);
-err_total_metadatas:
-	percpu_counter_destroy(&metric->write_latency_sum);
-err_write_latency_sum:
-	percpu_counter_destroy(&metric->total_writes);
-err_total_writes:
-	percpu_counter_destroy(&metric->read_latency_sum);
-err_read_latency_sum:
-	percpu_counter_destroy(&metric->total_reads);
-err_total_reads:
-	percpu_counter_destroy(&metric->i_caps_mis);
-err_i_caps_mis:
-	percpu_counter_destroy(&metric->i_caps_hit);
-err_i_caps_hit:
-	percpu_counter_destroy(&metric->d_lease_mis);
-err_d_lease_mis:
-	percpu_counter_destroy(&metric->d_lease_hit);
-
-	return ret;
-}
-
 int ceph_mdsc_init(struct ceph_fs_client *fsc)
 
 {
@@ -4747,16 +4663,7 @@ void ceph_mdsc_destroy(struct ceph_fs_client *fsc)
 
 	ceph_mdsc_stop(mdsc);
 
-	percpu_counter_destroy(&mdsc->metric.metadata_latency_sum);
-	percpu_counter_destroy(&mdsc->metric.total_metadatas);
-	percpu_counter_destroy(&mdsc->metric.write_latency_sum);
-	percpu_counter_destroy(&mdsc->metric.total_writes);
-	percpu_counter_destroy(&mdsc->metric.read_latency_sum);
-	percpu_counter_destroy(&mdsc->metric.total_reads);
-	percpu_counter_destroy(&mdsc->metric.i_caps_mis);
-	percpu_counter_destroy(&mdsc->metric.i_caps_hit);
-	percpu_counter_destroy(&mdsc->metric.d_lease_mis);
-	percpu_counter_destroy(&mdsc->metric.d_lease_hit);
+	ceph_mdsc_metric_destroy(&mdsc->metric);
 
 	fsc->mdsc = NULL;
 	kfree(mdsc);
diff --git a/fs/ceph/metric.c b/fs/ceph/metric.c
new file mode 100644
index 0000000..4a1bf27
--- /dev/null
+++ b/fs/ceph/metric.c
@@ -0,0 +1,177 @@
+// SPDX-License-Identifier: GPL-2.0-only
+
+#include <linux/atomic.h>
+#include <linux/percpu_counter.h>
+#include <linux/spinlock.h>
+
+#include "metric.h"
+
+int ceph_mdsc_metric_init(struct ceph_client_metric *m)
+{
+	int ret;
+
+	atomic64_set(&m->total_dentries, 0);
+	ret = percpu_counter_init(&m->d_lease_hit, 0, GFP_KERNEL);
+	if (ret)
+		return ret;
+
+	ret = percpu_counter_init(&m->d_lease_mis, 0, GFP_KERNEL);
+	if (ret)
+		goto err_d_lease_mis;
+
+	ret = percpu_counter_init(&m->i_caps_hit, 0, GFP_KERNEL);
+	if (ret)
+		goto err_i_caps_hit;
+
+	ret = percpu_counter_init(&m->i_caps_mis, 0, GFP_KERNEL);
+	if (ret)
+		goto err_i_caps_mis;
+
+	ret = percpu_counter_init(&m->total_reads, 0, GFP_KERNEL);
+	if (ret)
+		goto err_total_reads;
+
+	ret = percpu_counter_init(&m->read_latency_sum, 0, GFP_KERNEL);
+	if (ret)
+		goto err_read_latency_sum;
+
+	spin_lock_init(&m->read_latency_lock);
+	atomic64_set(&m->read_latency_min, S64_MAX);
+	atomic64_set(&m->read_latency_max, 0);
+
+	ret = percpu_counter_init(&m->total_writes, 0, GFP_KERNEL);
+	if (ret)
+		goto err_total_writes;
+
+	ret = percpu_counter_init(&m->write_latency_sum, 0, GFP_KERNEL);
+	if (ret)
+		goto err_write_latency_sum;
+
+	spin_lock_init(&m->write_latency_lock);
+	atomic64_set(&m->write_latency_min, S64_MAX);
+	atomic64_set(&m->write_latency_max, 0);
+
+	ret = percpu_counter_init(&m->total_metadatas, 0, GFP_KERNEL);
+	if (ret)
+		goto err_total_metadatas;
+
+	ret = percpu_counter_init(&m->metadata_latency_sum, 0, GFP_KERNEL);
+	if (ret)
+		goto err_metadata_latency_sum;
+
+	spin_lock_init(&m->metadata_latency_lock);
+	atomic64_set(&m->metadata_latency_min, S64_MAX);
+	atomic64_set(&m->metadata_latency_max, 0);
+
+	return 0;
+
+err_metadata_latency_sum:
+	percpu_counter_destroy(&m->total_metadatas);
+err_total_metadatas:
+	percpu_counter_destroy(&m->write_latency_sum);
+err_write_latency_sum:
+	percpu_counter_destroy(&m->total_writes);
+err_total_writes:
+	percpu_counter_destroy(&m->read_latency_sum);
+err_read_latency_sum:
+	percpu_counter_destroy(&m->total_reads);
+err_total_reads:
+	percpu_counter_destroy(&m->i_caps_mis);
+err_i_caps_mis:
+	percpu_counter_destroy(&m->i_caps_hit);
+err_i_caps_hit:
+	percpu_counter_destroy(&m->d_lease_mis);
+err_d_lease_mis:
+	percpu_counter_destroy(&m->d_lease_hit);
+
+	return ret;
+}
+
+void ceph_mdsc_metric_destroy(struct ceph_client_metric *m)
+{
+	percpu_counter_destroy(&m->metadata_latency_sum);
+	percpu_counter_destroy(&m->total_metadatas);
+	percpu_counter_destroy(&m->write_latency_sum);
+	percpu_counter_destroy(&m->total_writes);
+	percpu_counter_destroy(&m->read_latency_sum);
+	percpu_counter_destroy(&m->total_reads);
+	percpu_counter_destroy(&m->i_caps_mis);
+	percpu_counter_destroy(&m->i_caps_hit);
+	percpu_counter_destroy(&m->d_lease_mis);
+	percpu_counter_destroy(&m->d_lease_hit);
+}
+
+void ceph_update_read_latency(struct ceph_client_metric *m,
+			      unsigned long r_start,
+			      unsigned long r_end,
+			      int rc)
+{
+	unsigned long lat = r_end - r_start;
+
+	if (rc < 0 && rc != -ENOENT && rc != -ETIMEDOUT)
+		return;
+
+	percpu_counter_inc(&m->total_reads);
+	percpu_counter_add(&m->read_latency_sum, lat);
+
+	if (lat >= atomic64_read(&m->read_latency_min) &&
+	    lat <= atomic64_read(&m->read_latency_max))
+		return;
+
+	spin_lock(&m->read_latency_lock);
+	if (lat < atomic64_read(&m->read_latency_min))
+		atomic64_set(&m->read_latency_min, lat);
+	if (lat > atomic64_read(&m->read_latency_max))
+		atomic64_set(&m->read_latency_max, lat);
+	spin_unlock(&m->read_latency_lock);
+}
+
+void ceph_update_write_latency(struct ceph_client_metric *m,
+			       unsigned long r_start,
+			       unsigned long r_end,
+			       int rc)
+{
+	unsigned long lat = r_end - r_start;
+
+	if (rc && rc != -ETIMEDOUT)
+		return;
+
+	percpu_counter_inc(&m->total_writes);
+	percpu_counter_add(&m->write_latency_sum, r_end - r_start);
+
+	if (lat >= atomic64_read(&m->write_latency_min) &&
+	    lat <= atomic64_read(&m->write_latency_max))
+		return;
+
+	spin_lock(&m->write_latency_lock);
+	if (lat < atomic64_read(&m->write_latency_min))
+		atomic64_set(&m->write_latency_min, lat);
+	if (lat > atomic64_read(&m->write_latency_max))
+		atomic64_set(&m->write_latency_max, lat);
+	spin_unlock(&m->write_latency_lock);
+}
+
+void ceph_update_metadata_latency(struct ceph_client_metric *m,
+				  unsigned long r_start,
+				  unsigned long r_end,
+				  int rc)
+{
+	unsigned long lat = r_end - r_start;
+
+	if (rc && rc != -ENOENT)
+		return;
+
+	percpu_counter_inc(&m->total_metadatas);
+	percpu_counter_add(&m->metadata_latency_sum, r_end - r_start);
+
+	if (lat >= atomic64_read(&m->metadata_latency_min) &&
+	    lat <= atomic64_read(&m->metadata_latency_max))
+		return;
+
+	spin_lock(&m->metadata_latency_lock);
+	if (lat < atomic64_read(&m->metadata_latency_min))
+		atomic64_set(&m->metadata_latency_min, lat);
+	if (lat > atomic64_read(&m->metadata_latency_max))
+		atomic64_set(&m->metadata_latency_max, lat);
+	spin_unlock(&m->metadata_latency_lock);
+}
diff --git a/fs/ceph/metric.h b/fs/ceph/metric.h
index 9f0d050..493e787 100644
--- a/fs/ceph/metric.h
+++ b/fs/ceph/metric.h
@@ -3,7 +3,7 @@
 #define _FS_CEPH_MDS_METRIC_H
 
 #include <linux/atomic.h>
-#include <linux/percpu.h>
+#include <linux/percpu_counter.h>
 #include <linux/spinlock.h>
 
 /* This is the global metrics */
@@ -44,78 +44,18 @@ static inline void ceph_update_cap_mis(struct ceph_client_metric *m)
 	percpu_counter_inc(&m->i_caps_mis);
 }
 
-static inline void ceph_update_read_latency(struct ceph_client_metric *m,
-					    unsigned long r_start,
-					    unsigned long r_end,
-					    int rc)
-{
-	unsigned long lat = r_end - r_start;
-
-	if (rc < 0 && rc != -ENOENT && rc != -ETIMEDOUT)
-		return;
-
-	percpu_counter_inc(&m->total_reads);
-	percpu_counter_add(&m->read_latency_sum, lat);
-
-	if (lat >= atomic64_read(&m->read_latency_min) &&
-	    lat <= atomic64_read(&m->read_latency_max))
-		return;
-
-	spin_lock(&m->read_latency_lock);
-	if (lat < atomic64_read(&m->read_latency_min))
-		atomic64_set(&m->read_latency_min, lat);
-	if (lat > atomic64_read(&m->read_latency_max))
-		atomic64_set(&m->read_latency_max, lat);
-	spin_unlock(&m->read_latency_lock);
-}
-
-static inline void ceph_update_write_latency(struct ceph_client_metric *m,
-					     unsigned long r_start,
-					     unsigned long r_end,
-					     int rc)
-{
-	unsigned long lat = r_end - r_start;
-
-	if (rc && rc != -ETIMEDOUT)
-		return;
-
-	percpu_counter_inc(&m->total_writes);
-	percpu_counter_add(&m->write_latency_sum, r_end - r_start);
-
-	if (lat >= atomic64_read(&m->write_latency_min) &&
-	    lat <= atomic64_read(&m->write_latency_max))
-		return;
-
-	spin_lock(&m->write_latency_lock);
-	if (lat < atomic64_read(&m->write_latency_min))
-		atomic64_set(&m->write_latency_min, lat);
-	if (lat > atomic64_read(&m->write_latency_max))
-		atomic64_set(&m->write_latency_max, lat);
-	spin_unlock(&m->write_latency_lock);
-}
-
-static inline void ceph_update_metadata_latency(struct ceph_client_metric *m,
-						unsigned long r_start,
-						unsigned long r_end,
-						int rc)
-{
-	unsigned long lat = r_end - r_start;
-
-	if (rc && rc != -ENOENT)
-		return;
-
-	percpu_counter_inc(&m->total_metadatas);
-	percpu_counter_add(&m->metadata_latency_sum, r_end - r_start);
-
-	if (lat >= atomic64_read(&m->metadata_latency_min) &&
-	    lat <= atomic64_read(&m->metadata_latency_max))
-		return;
-
-	spin_lock(&m->metadata_latency_lock);
-	if (lat < atomic64_read(&m->metadata_latency_min))
-		atomic64_set(&m->metadata_latency_min, lat);
-	if (lat > atomic64_read(&m->metadata_latency_max))
-		atomic64_set(&m->metadata_latency_max, lat);
-	spin_unlock(&m->metadata_latency_lock);
-}
+extern int ceph_mdsc_metric_init(struct ceph_client_metric *m);
+extern void ceph_mdsc_metric_destroy(struct ceph_client_metric *m);
+extern void ceph_update_read_latency(struct ceph_client_metric *m,
+				     unsigned long r_start,
+				     unsigned long r_end,
+				     int rc);
+extern void ceph_update_write_latency(struct ceph_client_metric *m,
+				      unsigned long r_start,
+				      unsigned long r_end,
+				      int rc);
+extern void ceph_update_metadata_latency(struct ceph_client_metric *m,
+					 unsigned long r_start,
+					 unsigned long r_end,
+					 int rc);
 #endif /* _FS_CEPH_MDS_METRIC_H */

From patchwork Wed Mar 11 02:54:07 2020
Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: 7bit
X-Patchwork-Submitter: Xiubo Li <xiubli@redhat.com>
X-Patchwork-Id: 11430589
Return-Path: <SRS0=9jXo=44=vger.kernel.org=ceph-devel-owner@kernel.org>
Received: from mail.kernel.org (pdx-korg-mail-1.web.codeaurora.org
 [172.30.200.123])
	by pdx-korg-patchwork-2.web.codeaurora.org (Postfix) with ESMTP id 6D24213A4
	for <patchwork-ceph-devel@patchwork.kernel.org>;
 Wed, 11 Mar 2020 02:54:28 +0000 (UTC)
Received: from vger.kernel.org (vger.kernel.org [209.132.180.67])
	by mail.kernel.org (Postfix) with ESMTP id 38E14215A4
	for <patchwork-ceph-devel@patchwork.kernel.org>;
 Wed, 11 Mar 2020 02:54:28 +0000 (UTC)
Authentication-Results: mail.kernel.org;
	dkim=pass (1024-bit key) header.d=redhat.com header.i=@redhat.com
 header.b="a3kQvOch"
Received: (majordomo@vger.kernel.org) by vger.kernel.org via listexpand
        id S1727702AbgCKCy1 (ORCPT
        <rfc822;patchwork-ceph-devel@patchwork.kernel.org>);
        Tue, 10 Mar 2020 22:54:27 -0400
Received: from us-smtp-delivery-1.mimecast.com ([205.139.110.120]:41978 "EHLO
        us-smtp-1.mimecast.com" rhost-flags-OK-OK-OK-FAIL) by vger.kernel.org
        with ESMTP id S1727685AbgCKCy1 (ORCPT
        <rfc822;ceph-devel@vger.kernel.org>); Tue, 10 Mar 2020 22:54:27 -0400
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=redhat.com;
        s=mimecast20190719; t=1583895265;
        h=from:from:reply-to:subject:subject:date:date:message-id:message-id:
         to:to:cc:cc:in-reply-to:in-reply-to:references:references;
        bh=kFnduoFT4OTlbGGTIMjB9A5R7JOSMufqnAoTFmPCjtc=;
        b=a3kQvOchlFic9MIGFECVZ9dkSKH1vi5AfWdkT7ukqYk4gYy0ZD8LnUA6jspy4nIIeqSLx/
        cROfLjeLdkLzH8Nzk2pqtaf7r/dKJGQglkZOhUFbk6EVoGCQL2EVxDI+SqIKQ/1k51llHr
        bz/7LNHZNRPZqMR/N/hxtq9E8tm+08A=
Received: from mimecast-mx01.redhat.com (mimecast-mx01.redhat.com
 [209.132.183.4]) (Using TLS) by relay.mimecast.com with ESMTP id
 us-mta-98-7mlZUuCtPw6h6da1Ng7lVA-1; Tue, 10 Mar 2020 22:54:21 -0400
X-MC-Unique: 7mlZUuCtPw6h6da1Ng7lVA-1
Received: from smtp.corp.redhat.com (int-mx02.intmail.prod.int.phx2.redhat.com
 [10.5.11.12])
        (using TLSv1.2 with cipher AECDH-AES256-SHA (256/256 bits))
        (No client certificate requested)
        by mimecast-mx01.redhat.com (Postfix) with ESMTPS id D563C8017CC;
        Wed, 11 Mar 2020 02:54:20 +0000 (UTC)
Received: from lxbceph0.gsslab.pek2.redhat.com
 (vm36-245.gsslab.pek2.redhat.com [10.72.36.245])
        by smtp.corp.redhat.com (Postfix) with ESMTP id A199360C18;
        Wed, 11 Mar 2020 02:54:18 +0000 (UTC)
From: xiubli@redhat.com
To: jlayton@kernel.org
Cc: sage@redhat.com, idryomov@gmail.com, zyan@redhat.com,
        pdonnell@redhat.com, ceph-devel@vger.kernel.org,
        Xiubo Li <xiubli@redhat.com>
Subject: [PATCH 2/2] ceph: add standard deviation support for
 read/write/metadata perf metric
Date: Tue, 10 Mar 2020 22:54:07 -0400
Message-Id: <1583895247-17312-3-git-send-email-xiubli@redhat.com>
In-Reply-To: <1583895247-17312-1-git-send-email-xiubli@redhat.com>
References: <1583895247-17312-1-git-send-email-xiubli@redhat.com>
X-Scanned-By: MIMEDefang 2.79 on 10.5.11.12
Sender: ceph-devel-owner@vger.kernel.org
Precedence: bulk
List-ID: <ceph-devel.vger.kernel.org>
X-Mailing-List: ceph-devel@vger.kernel.org

From: Xiubo Li <xiubli@redhat.com>

This could help us to understand the perf issue better.

URL: https://tracker.ceph.com/issues/44534
Signed-off-by: Xiubo Li <xiubli@redhat.com>
---
 fs/ceph/debugfs.c | 70 ++++++++++++++++++++++++++++---------------
 fs/ceph/metric.c  | 89 +++++++++++++++++++++++++++++++++++++++----------------
 fs/ceph/metric.h  | 12 ++++++--
 3 files changed, 118 insertions(+), 53 deletions(-)

diff --git a/fs/ceph/debugfs.c b/fs/ceph/debugfs.c
index 9ef0ffe..dca751e 100644
--- a/fs/ceph/debugfs.c
+++ b/fs/ceph/debugfs.c
@@ -1,6 +1,7 @@
 // SPDX-License-Identifier: GPL-2.0
 #include <linux/ceph/ceph_debug.h>
 
+#include <linux/kernel.h>
 #include <linux/device.h>
 #include <linux/slab.h>
 #include <linux/module.h>
@@ -129,43 +130,64 @@ static int metric_show(struct seq_file *s, void *p)
 	struct ceph_fs_client *fsc = s->private;
 	struct ceph_mds_client *mdsc = fsc->mdsc;
 	int i, nr_caps = 0;
-	s64 total, sum, avg = 0, min, max;
+	s64 total, sum, avg = 0, min, max, sq;
 
-	seq_printf(s, "item          total       sum_lat(us)     avg_lat(us)     min_lat(us)     max_lat(us)\n");
-	seq_printf(s, "-------------------------------------------------------------------------------------\n");
+	seq_printf(s, "item          total       sum_lat(us)     avg_lat(us)     min_lat(us)     max_lat(us)     stdev(us)\n");
+	seq_printf(s, "---------------------------------------------------------------------------------------------------\n");
 
-	total = percpu_counter_sum(&mdsc->metric.total_reads);
-	sum = percpu_counter_sum(&mdsc->metric.read_latency_sum);
-	sum = jiffies_to_usecs(sum);
-	avg = total ? sum / total : 0;
+	spin_lock(&mdsc->metric.read_latency_lock);
+	total = atomic64_read(&mdsc->metric.total_reads);
+	avg = atomic64_read(&mdsc->metric.read_latency_avg);
 	min = atomic64_read(&mdsc->metric.read_latency_min);
-	min = jiffies_to_usecs(min == S64_MAX ? 0 : min);
 	max = atomic64_read(&mdsc->metric.read_latency_max);
-	max = jiffies_to_usecs(max);
-	seq_printf(s, "%-14s%-12lld%-16lld%-16lld%-16lld%lld\n", "read",
-		   total, sum, avg, min, max);
+	spin_unlock(&mdsc->metric.read_latency_lock);
 
-	total = percpu_counter_sum(&mdsc->metric.total_writes);
-	sum = percpu_counter_sum(&mdsc->metric.write_latency_sum);
+	sum = percpu_counter_sum(&mdsc->metric.read_latency_sum);
+	sq = percpu_counter_sum(&mdsc->metric.read_latency_sq_sum);
+
+	avg = jiffies_to_usecs(avg);
+	min = jiffies_to_usecs(min == S64_MAX ? 0 : min);
+	max = jiffies_to_usecs(max);
 	sum = jiffies_to_usecs(sum);
-	avg = total ? sum / total : 0;
+	sq = jiffies_to_usecs(total > 1 ? sq / (total - 1) : 0);
+	seq_printf(s, "%-14s%-12lld%-16lld%-16lld%-16lld%-16lld%u\n",
+		   "read", total, sum, avg, min, max, int_sqrt64(sq));
+
+	spin_lock(&mdsc->metric.write_latency_lock);
+	total = atomic64_read(&mdsc->metric.total_writes);
+	avg = atomic64_read(&mdsc->metric.write_latency_avg);
 	min = atomic64_read(&mdsc->metric.write_latency_min);
-	min = jiffies_to_usecs(min == S64_MAX ? 0 : min);
 	max = atomic64_read(&mdsc->metric.write_latency_max);
-	max = jiffies_to_usecs(max);
-	seq_printf(s, "%-14s%-12lld%-16lld%-16lld%-16lld%lld\n", "write",
-		   total, sum, avg, min, max);
+	spin_unlock(&mdsc->metric.write_latency_lock);
 
-	total = percpu_counter_sum(&mdsc->metric.total_metadatas);
-	sum = percpu_counter_sum(&mdsc->metric.metadata_latency_sum);
+	sum = percpu_counter_sum(&mdsc->metric.write_latency_sum);
+	sq = percpu_counter_sum(&mdsc->metric.write_latency_sq_sum);
+
+	avg = jiffies_to_usecs(avg);
+	min = jiffies_to_usecs(min == S64_MAX ? 0 : min);
+	max = jiffies_to_usecs(max);
 	sum = jiffies_to_usecs(sum);
-	avg = total ? sum / total : 0;
+	sq = jiffies_to_usecs(total > 1 ? sq / (total - 1) : 0);
+	seq_printf(s, "%-14s%-12lld%-16lld%-16lld%-16lld%-16lld%u\n",
+		   "write", total, sum, avg, min, max, int_sqrt64(sq));
+
+	spin_lock(&mdsc->metric.metadata_latency_lock);
+	total = atomic64_read(&mdsc->metric.total_metadatas);
+	avg = atomic64_read(&mdsc->metric.metadata_latency_avg);
 	min = atomic64_read(&mdsc->metric.metadata_latency_min);
-	min = jiffies_to_usecs(min == S64_MAX ? 0 : min);
 	max = atomic64_read(&mdsc->metric.metadata_latency_max);
+	spin_unlock(&mdsc->metric.metadata_latency_lock);
+
+	sum = percpu_counter_sum(&mdsc->metric.metadata_latency_sum);
+	sq = percpu_counter_sum(&mdsc->metric.metadata_latency_sq_sum);
+
+	avg = jiffies_to_usecs(avg);
+	min = jiffies_to_usecs(min == S64_MAX ? 0 : min);
 	max = jiffies_to_usecs(max);
-	seq_printf(s, "%-14s%-12lld%-16lld%-16lld%-16lld%lld\n", "metadata",
-		   total, sum, avg, min, max);
+	sum = jiffies_to_usecs(sum);
+	sq = jiffies_to_usecs(total > 1 ? sq / (total - 1) : 0);
+	seq_printf(s, "%-14s%-12lld%-16lld%-16lld%-16lld%-16lld%u\n",
+		   "metadata", total, sum, avg, min, max, int_sqrt64(sq));
 
 	seq_printf(s, "\n");
 	seq_printf(s, "item          total           miss            hit\n");
diff --git a/fs/ceph/metric.c b/fs/ceph/metric.c
index 4a1bf27..17bf278 100644
--- a/fs/ceph/metric.c
+++ b/fs/ceph/metric.c
@@ -1,5 +1,6 @@
 // SPDX-License-Identifier: GPL-2.0-only
 
+#include <linux/kernel.h>
 #include <linux/atomic.h>
 #include <linux/percpu_counter.h>
 #include <linux/spinlock.h>
@@ -27,55 +28,61 @@ int ceph_mdsc_metric_init(struct ceph_client_metric *m)
 	if (ret)
 		goto err_i_caps_mis;
 
-	ret = percpu_counter_init(&m->total_reads, 0, GFP_KERNEL);
-	if (ret)
-		goto err_total_reads;
-
 	ret = percpu_counter_init(&m->read_latency_sum, 0, GFP_KERNEL);
 	if (ret)
 		goto err_read_latency_sum;
 
+	ret = percpu_counter_init(&m->read_latency_sq_sum, 0, GFP_KERNEL);
+	if (ret)
+		goto err_read_latency_sq_sum;
+
 	spin_lock_init(&m->read_latency_lock);
+	atomic64_set(&m->total_reads, 0);
 	atomic64_set(&m->read_latency_min, S64_MAX);
 	atomic64_set(&m->read_latency_max, 0);
-
-	ret = percpu_counter_init(&m->total_writes, 0, GFP_KERNEL);
-	if (ret)
-		goto err_total_writes;
+	atomic64_set(&m->read_latency_avg, 0);
 
 	ret = percpu_counter_init(&m->write_latency_sum, 0, GFP_KERNEL);
 	if (ret)
 		goto err_write_latency_sum;
 
+	ret = percpu_counter_init(&m->write_latency_sq_sum, 0, GFP_KERNEL);
+	if (ret)
+		goto err_write_latency_sq_sum;
+
 	spin_lock_init(&m->write_latency_lock);
+	atomic64_set(&m->total_writes, 0);
 	atomic64_set(&m->write_latency_min, S64_MAX);
 	atomic64_set(&m->write_latency_max, 0);
-
-	ret = percpu_counter_init(&m->total_metadatas, 0, GFP_KERNEL);
-	if (ret)
-		goto err_total_metadatas;
+	atomic64_set(&m->write_latency_avg, 0);
 
 	ret = percpu_counter_init(&m->metadata_latency_sum, 0, GFP_KERNEL);
 	if (ret)
 		goto err_metadata_latency_sum;
 
+	ret = percpu_counter_init(&m->metadata_latency_sq_sum, 0, GFP_KERNEL);
+	if (ret)
+		goto err_metadata_latency_sq_sum;
+
 	spin_lock_init(&m->metadata_latency_lock);
+	atomic64_set(&m->total_metadatas, 0);
 	atomic64_set(&m->metadata_latency_min, S64_MAX);
 	atomic64_set(&m->metadata_latency_max, 0);
+	atomic64_set(&m->metadata_latency_avg, 0);
 
 	return 0;
 
+err_metadata_latency_sq_sum:
+	percpu_counter_destroy(&m->metadata_latency_sum);
 err_metadata_latency_sum:
-	percpu_counter_destroy(&m->total_metadatas);
-err_total_metadatas:
+	percpu_counter_destroy(&m->write_latency_sq_sum);
+err_write_latency_sq_sum:
 	percpu_counter_destroy(&m->write_latency_sum);
 err_write_latency_sum:
-	percpu_counter_destroy(&m->total_writes);
-err_total_writes:
+	percpu_counter_destroy(&m->read_latency_sq_sum);
+err_read_latency_sq_sum:
 	percpu_counter_destroy(&m->read_latency_sum);
 err_read_latency_sum:
-	percpu_counter_destroy(&m->total_reads);
-err_total_reads:
 	percpu_counter_destroy(&m->i_caps_mis);
 err_i_caps_mis:
 	percpu_counter_destroy(&m->i_caps_hit);
@@ -89,12 +96,12 @@ int ceph_mdsc_metric_init(struct ceph_client_metric *m)
 
 void ceph_mdsc_metric_destroy(struct ceph_client_metric *m)
 {
+	percpu_counter_destroy(&m->metadata_latency_sq_sum);
 	percpu_counter_destroy(&m->metadata_latency_sum);
-	percpu_counter_destroy(&m->total_metadatas);
+	percpu_counter_destroy(&m->write_latency_sq_sum);
 	percpu_counter_destroy(&m->write_latency_sum);
-	percpu_counter_destroy(&m->total_writes);
+	percpu_counter_destroy(&m->read_latency_sq_sum);
 	percpu_counter_destroy(&m->read_latency_sum);
-	percpu_counter_destroy(&m->total_reads);
 	percpu_counter_destroy(&m->i_caps_mis);
 	percpu_counter_destroy(&m->i_caps_hit);
 	percpu_counter_destroy(&m->d_lease_mis);
@@ -107,11 +114,21 @@ void ceph_update_read_latency(struct ceph_client_metric *m,
 			      int rc)
 {
 	unsigned long lat = r_end - r_start;
+	s64 sum, avg, sq, tmp;
 
 	if (rc < 0 && rc != -ENOENT && rc != -ETIMEDOUT)
 		return;
 
-	percpu_counter_inc(&m->total_reads);
+	spin_lock(&m->read_latency_lock);
+	sum = atomic64_inc_return(&m->total_reads);
+	avg = atomic64_read(&m->read_latency_avg);
+	sq = lat - avg;
+	tmp = sq > 0 ? sq + (sum - 1) : sq - (sum - 1);
+	avg = atomic64_add_return(tmp / sum, &m->read_latency_avg);
+	spin_unlock(&m->read_latency_lock);
+
+	sq = sq * (lat - avg);
+	percpu_counter_add(&m->read_latency_sq_sum, sq);
 	percpu_counter_add(&m->read_latency_sum, lat);
 
 	if (lat >= atomic64_read(&m->read_latency_min) &&
@@ -132,12 +149,22 @@ void ceph_update_write_latency(struct ceph_client_metric *m,
 			       int rc)
 {
 	unsigned long lat = r_end - r_start;
+	s64 sum, avg, sq, tmp;
 
 	if (rc && rc != -ETIMEDOUT)
 		return;
 
-	percpu_counter_inc(&m->total_writes);
-	percpu_counter_add(&m->write_latency_sum, r_end - r_start);
+	spin_lock(&m->write_latency_lock);
+	sum = atomic64_inc_return(&m->total_writes);
+	avg = atomic64_read(&m->write_latency_avg);
+	sq = lat - avg;
+	tmp = sq > 0 ? sq + (sum - 1) : sq - (sum - 1);
+	avg = atomic64_add_return(tmp / sum, &m->write_latency_avg);
+	spin_unlock(&m->write_latency_lock);
+
+	sq = sq * (lat - avg);
+	percpu_counter_add(&m->write_latency_sq_sum, sq);
+	percpu_counter_add(&m->write_latency_sum, lat);
 
 	if (lat >= atomic64_read(&m->write_latency_min) &&
 	    lat <= atomic64_read(&m->write_latency_max))
@@ -157,12 +184,22 @@ void ceph_update_metadata_latency(struct ceph_client_metric *m,
 				  int rc)
 {
 	unsigned long lat = r_end - r_start;
+	s64 sum, avg, sq, tmp;
 
 	if (rc && rc != -ENOENT)
 		return;
 
-	percpu_counter_inc(&m->total_metadatas);
-	percpu_counter_add(&m->metadata_latency_sum, r_end - r_start);
+	spin_lock(&m->metadata_latency_lock);
+	sum = atomic64_inc_return(&m->total_metadatas);
+	avg = atomic64_read(&m->metadata_latency_avg);
+	sq = lat - avg;
+	tmp = sq > 0 ? sq + (sum - 1) : sq - (sum - 1);
+	avg = atomic64_add_return(tmp / sum, &m->metadata_latency_avg);
+	spin_unlock(&m->metadata_latency_lock);
+
+	sq = sq * (lat - avg);
+	percpu_counter_add(&m->metadata_latency_sq_sum, sq);
+	percpu_counter_add(&m->metadata_latency_sum, lat);
 
 	if (lat >= atomic64_read(&m->metadata_latency_min) &&
 	    lat <= atomic64_read(&m->metadata_latency_max))
diff --git a/fs/ceph/metric.h b/fs/ceph/metric.h
index 493e787..35d26e7 100644
--- a/fs/ceph/metric.h
+++ b/fs/ceph/metric.h
@@ -15,23 +15,29 @@ struct ceph_client_metric {
 	struct percpu_counter i_caps_hit;
 	struct percpu_counter i_caps_mis;
 
-	struct percpu_counter total_reads;
 	struct percpu_counter read_latency_sum;
+	struct percpu_counter read_latency_sq_sum;
 	spinlock_t read_latency_lock;
+	atomic64_t total_reads;
 	atomic64_t read_latency_min;
 	atomic64_t read_latency_max;
+	atomic64_t read_latency_avg;
 
-	struct percpu_counter total_writes;
 	struct percpu_counter write_latency_sum;
+	struct percpu_counter write_latency_sq_sum;
 	spinlock_t write_latency_lock;
+	atomic64_t total_writes;
 	atomic64_t write_latency_min;
 	atomic64_t write_latency_max;
+	atomic64_t write_latency_avg;
 
-	struct percpu_counter total_metadatas;
 	struct percpu_counter metadata_latency_sum;
+	struct percpu_counter metadata_latency_sq_sum;
 	spinlock_t metadata_latency_lock;
+	atomic64_t total_metadatas;
 	atomic64_t metadata_latency_min;
 	atomic64_t metadata_latency_max;
+	atomic64_t metadata_latency_avg;
 };
 
 static inline void ceph_update_cap_hit(struct ceph_client_metric *m)