Added a script to provdb-python to validate the saved viz output json data against the provDB

giltirn · giltirn · commit eee5657eae0a · 2023-05-16T14:02:46.000-04:00
diff --git a/scripts/provdb_python/src/provdb_python/cli.py b/scripts/provdb_python/src/provdb_python/cli.py
@@ -2,6 +2,7 @@
 import provdb_python.provdb_analyze as pa
 import provdb_python.provdb_counter_analyze as pca
 import provdb_python.provdb_between_run_analyze as pbr
+import provdb_python.provdb_viz_validate as pvv
 
 import sys
 
@@ -14,6 +15,7 @@ def cli():
         print("basic-analysis")
         print("counter-analysis")
         print("between-run-analysis")
+        print("viz-output-validate")
         sys.exit(0)
     tool = args[1]
     tool_args = args[2:]
@@ -25,6 +27,8 @@ def cli():
         pca.provdb_counter_analysis(tool_args)
     elif tool == 'between-run-analysis':
         pbr.provdb_between_run_analysis(tool_args)
+    elif tool == 'viz-output-validate':
+        pvv.provdb_viz_validate(tool_args)
     else:
         print("Invalid tool")
 
diff --git a/scripts/provdb_python/src/provdb_python/provdb_analyze.py b/scripts/provdb_python/src/provdb_python/provdb_analyze.py
@@ -139,7 +139,7 @@ def summarizeEvent(event):
     thr_str = "{}".format(event['tid'])
     if event['is_gpu_event']:
         thr_str = "GPU{}/{}/{}".format(event['gpu_location']['device'],event['gpu_location']['context'],event['gpu_location']['stream'])    
-    return "pid={} rid={} tid={} func=\"{}\" step={} excl={}s tot={}s score={} severity={}".format(event['pid'],event['rid'],  thr_str, event['func'], event['io_step'], float(event['runtime_exclusive'])/1e6, float(event['runtime_total'])/1e6, event['outlier_score'], event['outlier_severity'])
+    return "pid={} rid={} tid={} fid={} func=\"{}\" step={} excl={}s tot={}s score={} severity={}".format(event['pid'],event['rid'],  thr_str, event['fid'], event['func'], event['io_step'], float(event['runtime_exclusive'])/1e6, float(event['runtime_total'])/1e6, event['outlier_score'], event['outlier_severity'])
                                              
 
 #Get the function profile information for application index 'app'
diff --git a/scripts/provdb_python/src/provdb_python/provdb_viz_validate.py b/scripts/provdb_python/src/provdb_python/provdb_viz_validate.py
@@ -0,0 +1,100 @@
+#A Python module for offline analysis of the provenance database
+#Executed as a script it performs some rudimentary analysis
+import provdb_python.provdb_interact as pdb
+import provdb_python.provdb_analyze as pa
+import pymargo
+from pymargo.core import Engine
+import json
+import sys
+import copy
+from cmd import Cmd
+import glob
+
+
+
+def provdb_viz_validate(args):
+    if(len(args) != 2):
+        print("Arguments: <nshards> <viz output dir>")
+        sys.exit(0)
+    nshards = int(args[0])
+    viz_dir=args[1]
+    
+    with Engine('na+sm', pymargo.server) as engine:
+        db = pdb.provDBinterface(engine, r'provdb.%d.unqlite', nshards)
+        
+        dkeys = ['rid','pid','fid','io_step']
+        index=pa.generateIndex(db, dkeys, 'anomalies')
+        print(index)
+        index_sets = {}
+        for k in dkeys:
+            index_sets[k] = {}
+            for v in index[k].keys():
+                index_sets[k][v] = set(index[k][v])
+
+        print(index_sets)
+
+        files=glob.glob("%s/pserver_output_stats_*.json" % viz_dir)
+
+        fail=False
+        for f in files:
+            print(f)
+            fp = open(f)
+            v = json.load(fp)
+            fp.close()
+
+            if 'anomaly_metrics' in v:
+                for anom_group in v['anomaly_metrics']:
+                    print(anom_group)
+                    fid=str(anom_group['fid'])
+                    pid=str(anom_group['app'])
+                    rid=str(anom_group['rank'])
+                    new_data = anom_group['new_data']
+                    nanom=int(new_data['count']['accumulate'])
+                    iostep_start=int(new_data['first_io_step'])
+                    iostep_end=int(new_data['last_io_step'])
+                    print("%d anomalies in [%s,%s] on (%s,%s,%s)" % (nanom,iostep_start,iostep_end,pid,rid,fid))
+                    
+                    if pid not in index_sets['pid'].keys():
+                        print("Could not find any anomalies for this pid!")
+                        continue
+                    if rid not in index_sets['rid'].keys():
+                        print("Could not find any anomalies for this rid!")
+                        continue
+                    if fid not in index_sets['fid'].keys():
+                        print("Could not find any anomalies for this fid!")
+                        continue
+                    
+                    iosets = []
+                    for i in range(iostep_start,iostep_end+1):
+                        if(str(i) in index_sets['io_step'].keys()):
+                            iosets.append(index_sets['io_step'][str(i)])
+                    if(len(iosets)==0):
+                        print("Could not find any anomalies in this time window!")
+                        continue
+
+                        
+                    aset = index_sets['rid'][rid] & index_sets['fid'][fid] & index_sets['pid'][pid]
+                    acount=0
+                    for i in iosets:
+                        bset = aset & i
+                        acount += len(bset)
+                    print("Found %d anomalies matching these keys" % acount)
+                    if acount != nanom:
+                        print("!!INVALID: Mismatch in number of anomalies: found %d, expected %d" % (acount,nanom) )
+                        print("All anomalies in this time window:")
+                        for i in range(iostep_start,iostep_end+1):
+                            if(str(i) in index_sets['io_step'].keys()):
+                                print("IO step %d" % i)
+                                for anom in index_sets['io_step'][str(i)]:
+                                    print(anom, pa.summarizeEvent(pa.getEventByID(db,index,anom)))
+
+
+
+                        fail=True
+        if(fail):
+            print("Validation FAILED")
+        else:
+            print("Validation passed")
+
+        del db
+        engine.finalize()