perf script python: Fix buffer size to report iregs in perf script
authorKajol Jain <kjain@linux.ibm.com>
Mon, 28 Jun 2021 06:23:41 +0000 (11:53 +0530)
committerArnaldo Carvalho de Melo <acme@redhat.com>
Wed, 7 Jul 2021 14:15:44 +0000 (11:15 -0300)
Commit 48a1f565261d2ab1 ("perf script python: Add more PMU fields to
event handler dict") added functionality to report fields like weight,
iregs, uregs etc via perf report.  That commit predefined buffer size to
512 bytes to print those fields.

But in PowerPC, since we added extended regs support in:

  068aeea3773a6f4c ("perf powerpc: Support exposing Performance Monitor Counter SPRs as part of extended regs")
  d735599a069f6936 ("powerpc/perf: Add extended regs support for power10 platform")

Now iregs can carry more bytes of data and this predefined buffer size
can result to data loss in perf script output.

This patch resolves this issue by making the buffer size dynamic, based
on the number of registers needed to print. It also changes the
regs_map() return type from int to void, as it is not being used by the
set_regs_in_dict(), its only caller.

Fixes: 068aeea3773a6f4c ("perf powerpc: Support exposing Performance Monitor Counter SPRs as part of extended regs")
Signed-off-by: Kajol Jain <kjain@linux.ibm.com>
Tested-by: Nageswara R Sastry <rnsastry@linux.ibm.com>
Cc: Athira Jajeev <atrajeev@linux.vnet.ibm.com>
Cc: Jiri Olsa <jolsa@redhat.com>
Cc: Madhavan Srinivasan <maddy@linux.vnet.ibm.com>
Cc: Paul Clarke <pc@us.ibm.com>
Cc: Ravi Bangoria <ravi.bangoria@linux.ibm.com>
Cc: linuxppc-dev@lists.ozlabs.org
Link: http://lore.kernel.org/lkml/20210628062341.155839-1-kjain@linux.ibm.com
Signed-off-by: Arnaldo Carvalho de Melo <acme@redhat.com>
tools/perf/util/scripting-engines/trace-event-python.c

index 164d2f45028c2b8abf1ebbd9639a8746a665d58b..69129e2aa7a18ac7c814ff06d66205b509ffda89 100644 (file)
@@ -687,7 +687,7 @@ static void set_sample_datasrc_in_dict(PyObject *dict,
                        _PyUnicode_FromString(decode));
 }
 
-static int regs_map(struct regs_dump *regs, uint64_t mask, char *bf, int size)
+static void regs_map(struct regs_dump *regs, uint64_t mask, char *bf, int size)
 {
        unsigned int i = 0, r;
        int printed = 0;
@@ -695,7 +695,7 @@ static int regs_map(struct regs_dump *regs, uint64_t mask, char *bf, int size)
        bf[0] = 0;
 
        if (!regs || !regs->regs)
-               return 0;
+               return;
 
        for_each_set_bit(r, (unsigned long *) &mask, sizeof(mask) * 8) {
                u64 val = regs->regs[i++];
@@ -704,8 +704,6 @@ static int regs_map(struct regs_dump *regs, uint64_t mask, char *bf, int size)
                                     "%5s:0x%" PRIx64 " ",
                                     perf_reg_name(r), val);
        }
-
-       return printed;
 }
 
 static void set_regs_in_dict(PyObject *dict,
@@ -713,7 +711,16 @@ static void set_regs_in_dict(PyObject *dict,
                             struct evsel *evsel)
 {
        struct perf_event_attr *attr = &evsel->core.attr;
-       char bf[512];
+
+       /*
+        * Here value 28 is a constant size which can be used to print
+        * one register value and its corresponds to:
+        * 16 chars is to specify 64 bit register in hexadecimal.
+        * 2 chars is for appending "0x" to the hexadecimal value and
+        * 10 chars is for register name.
+        */
+       int size = __sw_hweight64(attr->sample_regs_intr) * 28;
+       char bf[size];
 
        regs_map(&sample->intr_regs, attr->sample_regs_intr, bf, sizeof(bf));