Merge branch 'jdev' of https://github.com/PPPLDeepLearning/plasma-python

Julian Kates-Harbeck · Julian Kates-Harbeck · commit 69063c0f7edc · 2018-02-05T15:40:46.000-05:00
diff --git a/data/signals.py b/data/signals.py
@@ -237,10 +237,15 @@ def fetch_nstx_data(signal_path,shot_num,c):
 
 fully_defined_signals = {sig_name: sig for (sig_name, sig) in all_signals_restricted.items() if sig.is_defined_on_machines(all_machines)}
 fully_defined_signals_0D = {sig_name: sig for (sig_name, sig) in all_signals_restricted.items() if ( sig.is_defined_on_machines(all_machines) and sig.num_channels == 1)  }
+fully_defined_signals_1D = {sig_name: sig for (sig_name, sig) in all_signals_restricted.items() if ( sig.is_defined_on_machines(all_machines) and sig.num_channels > 1)  }
+
 d3d_signals = {sig_name: sig for (sig_name, sig) in all_signals_restricted.items() if sig.is_defined_on_machine(d3d)}
+d3d_signals_0D = {sig_name: sig for (sig_name, sig) in all_signals_restricted.items() if (sig.is_defined_on_machine(d3d) and sig.num_channels == 1)}
+d3d_signals_1D = {sig_name: sig for (sig_name, sig) in all_signals_restricted.items() if (sig.is_defined_on_machine(d3d) and sig.num_channels > 1)}
+
 jet_signals = {sig_name: sig for (sig_name, sig) in all_signals_restricted.items() if sig.is_defined_on_machine(jet)}
 jet_signals_0D = {sig_name: sig for (sig_name, sig) in all_signals_restricted.items() if (sig.is_defined_on_machine(jet) and sig.num_channels == 1)}
-
+jet_signals_1D = {sig_name: sig for (sig_name, sig) in all_signals_restricted.items() if (sig.is_defined_on_machine(jet) and sig.num_channels > 1)}
 
 #['pcechpwrf'] #Total ECH Power Not always on!
 ### 0D EFIT signals ###
diff --git a/examples/conf.yaml b/examples/conf.yaml
@@ -10,15 +10,16 @@ paths:
     signal_prepath: '/signal_data/' #/signal_data/jet/
     shot_list_dir: '/shot_lists/'
     tensorboard_save_path: '/Graph/'
-    data: jet_data #'d3d_to_jet_data' #'d3d_to_jet_data' # 'jet_to_d3d_data' #jet_data
+    data: jet_to_d3d_data #'d3d_to_jet_data' #'d3d_to_jet_data' # 'jet_to_d3d_data' #jet_data
     specific_signals: [] #['q95','li','ip','betan','energy','lm','pradcore','pradedge','pradtot','pin','torquein','tmamp1','tmamp2','tmfreq1','tmfreq2','pechin','energydt','ipdirect','etemp_profile','edens_profile'] #if left empty will use all valid signals defined on a machine. Only use if need a custom set
     executable: "mpi_learn.py"
     shallow_executable: "learn.py"
 
 data:
-    bleed_in: 0 #how many shots from the test sit to use in training?
+    bleed_in: 5 #how many shots from the test sit to use in training?
+    bleed_in_repeat_fac: 10
     bleed_in_remove_from_test: True
-    bleed_in_equalize_sets: True
+    bleed_in_equalize_sets: False
     signal_to_augment: None #'plasma current' #or None
     augmentation_mode: 'none'
     augment_during_training: False
@@ -52,10 +53,10 @@ data:
     floatx: 'float32'
 
 model:
-    shallow: False
+    shallow: True
     shallow_model: 
         num_samples: 1000000 #1000000 #the number of samples to use for training
-        type: "mlp" #"xgboost" #"xgboost" #"random_forest" "xgboost"
+        type: "xgboost" #"xgboost" #"xgboost" #"random_forest" "xgboost"
         n_estimators: 100 #for random forest
         max_depth: 3 #for random forest and xgboost (def = 3)
         C: 1.0 #for svm
@@ -89,8 +90,8 @@ model:
     #have not found a difference yet
     optimizer: 'adam'
     clipnorm: 10.0
-    regularization: 0.0
-    dense_regularization: 0.01
+    regularization: 0.001
+    dense_regularization: 0.001
     #1e-4 is too high, 5e-7 is too low. 5e-5 seems best at 256 batch size, full dataset and ~10 epochs, and lr decay of 0.90. 1e-4 also works well if we decay a lot (i.e ~0.7 or more)
     lr: 0.00002 #0.00001 #0.0005 #for adam plots 0.0000001 #0.00005 #0.00005 #0.00005
     lr_decay: 0.97 #0.98 #0.9
diff --git a/examples/tune_hyperparams.py b/examples/tune_hyperparams.py
@@ -7,8 +7,8 @@
 
 tunables = []
 shallow = False
-num_nodes = 2
-num_trials = 50
+num_nodes = 1
+num_trials = 20
 
 t_warn = CategoricalHyperparam(['data','T_warning'],[0.256,1.024,10.024])
 cut_ends = CategoricalHyperparam(['data','cut_shot_ends'],[False,True])
@@ -34,14 +34,20 @@
     lr_decay = CategoricalHyperparam(['model','lr_decay'],[0.97,0.985,1.0])
     fac = CategoricalHyperparam(['data','positive_example_penalty'],[1.0,4.0,16.0])
     target = CategoricalHyperparam(['target'],['maxhinge','hinge','ttdinv','ttd'])
-    batch_size = CategoricalHyperparam(['training','batch_size'],[64,256,1024])
-    dropout_prob = CategoricalHyperparam(['model','dropout_prob'],[0.1,0.3,0.5])
-    conv_filters = CategoricalHyperparam(['model','num_conv_filters'],[5,10])
+    #target = CategoricalHyperparam(['target'],['hinge','ttdinv','ttd'])
+    batch_size = CategoricalHyperparam(['training','batch_size'],[128,256])
+    dropout_prob = CategoricalHyperparam(['model','dropout_prob'],[0.01,0.05,0.1])
+    conv_filters = CategoricalHyperparam(['model','num_conv_filters'],[128,256])
     conv_layers = IntegerHyperparam(['model','num_conv_layers'],2,4)
-    rnn_layers = IntegerHyperparam(['model','rnn_layers'],1,4)
-    rnn_size = CategoricalHyperparam(['model','rnn_size'],[100,200,300])
-    tunables = [lr,lr_decay,fac,target,batch_size,dropout_prob]
-    tunables += [conv_filters,conv_layers,rnn_layers,rnn_size]
+    rnn_layers = IntegerHyperparam(['model','rnn_layers'],1,3)
+    rnn_size = CategoricalHyperparam(['model','rnn_size'],[128,256])
+    dense_size = CategoricalHyperparam(['model','dense_size'],[128,256])
+    extra_dense_input = CategoricalHyperparam(['model','extra_dense_input'],[False,True])
+    equalize_classes = CategoricalHyperparam(['data','equalize_classes'],[False,True])
+    #rnn_length = CategoricalHyperparam(['model','length'],[32,128])
+    #tunables = [lr,lr_decay,fac,target,batch_size,dropout_prob]
+    tunables = [lr,lr_decay,fac,target,batch_size,equalize_classes,dropout_prob]
+    tunables += [conv_filters,conv_layers,rnn_layers,rnn_size,dense_size,extra_dense_input]
 tunables += [cut_ends,t_warn]
 
 
diff --git a/plasma/conf_parser.py b/plasma/conf_parser.py
@@ -93,6 +93,10 @@ def parameters(input_file):
             params['paths']['shot_files'] = [jet_carbon_wall]
             params['paths']['shot_files_test'] = [jet_iterlike_wall]
             params['paths']['use_signals_dict'] = jet_signals_0D
+        elif params['paths']['data'] == 'jet_data_1D':
+            params['paths']['shot_files'] = [jet_carbon_wall]
+            params['paths']['shot_files_test'] = [jet_iterlike_wall]
+            params['paths']['use_signals_dict'] = jet_signals_1D
         elif params['paths']['data'] == 'jet_carbon_data':
             params['paths']['shot_files'] = [jet_carbon_wall]
             params['paths']['shot_files_test'] = []
@@ -105,6 +109,17 @@ def parameters(input_file):
             params['paths']['shot_files'] = [jenkins_jet_carbon_wall]
             params['paths']['shot_files_test'] = [jenkins_jet_iterlike_wall]
             params['paths']['use_signals_dict'] = jet_signals
+        elif params['paths']['data'] == 'jet_data_fully_defined': #jet data but with fully defined signals
+            params['paths']['shot_files'] = [jet_carbon_wall]
+            params['paths']['shot_files_test'] = [jet_iterlike_wall]
+            params['paths']['use_signals_dict'] = fully_defined_signals
+        elif params['paths']['data'] == 'jet_data_fully_defined_0D': #jet data but with fully defined signals
+            params['paths']['shot_files'] = [jet_carbon_wall]
+            params['paths']['shot_files_test'] = [jet_iterlike_wall]
+            params['paths']['use_signals_dict'] = fully_defined_signals_0D
+
+
+
         elif params['paths']['data'] == 'd3d_data':
             params['paths']['shot_files'] = [d3d_full]
             params['paths']['shot_files_test'] = [] 
@@ -131,25 +146,40 @@ def parameters(input_file):
             params['paths']['shot_files_test'] = []
             params['paths']['use_signals_dict'] = {'q95':q95,'li':li,'ip':ip,'lm':lm,'betan':betan,'energy':energy,'dens':dens,'pradcore':pradcore,'pradedge':pradedge,'pin':pin,'torquein':torquein,'ipdirect':ipdirect,'iptarget':iptarget,'iperr':iperr,
 'etemp_profile':etemp_profile ,'edens_profile':edens_profile}
-
+        elif params['paths']['data'] == 'd3d_data_fully_defined': #jet data but with fully defined signals
+            params['paths']['shot_files'] = [d3d_full]
+            params['paths']['shot_files_test'] = []
+            params['paths']['use_signals_dict'] = fully_defined_signals
+        elif params['paths']['data'] == 'd3d_data_fully_defined_0D': #jet data but with fully defined signals
+            params['paths']['shot_files'] = [d3d_full]
+            params['paths']['shot_files_test'] = []
+            params['paths']['use_signals_dict'] = fully_defined_signals_0D
 
         #cross-machine
         elif params['paths']['data'] == 'jet_to_d3d_data':
-            params['paths']['shot_files'] = [jet_carbon_wall]
+            params['paths']['shot_files'] = [jet_full]
             params['paths']['shot_files_test'] = [d3d_full]
             params['paths']['use_signals_dict'] = fully_defined_signals
         elif params['paths']['data'] == 'd3d_to_jet_data':
             params['paths']['shot_files'] = [d3d_full]
             params['paths']['shot_files_test'] = [jet_iterlike_wall]
             params['paths']['use_signals_dict'] = fully_defined_signals
         elif params['paths']['data'] == 'jet_to_d3d_data_0D':
-            params['paths']['shot_files'] = [jet_carbon_wall]
+            params['paths']['shot_files'] = [jet_full]
             params['paths']['shot_files_test'] = [d3d_full]
             params['paths']['use_signals_dict'] = fully_defined_signals_0D
         elif params['paths']['data'] == 'd3d_to_jet_data_0D':
             params['paths']['shot_files'] = [d3d_full]
             params['paths']['shot_files_test'] = [jet_iterlike_wall]
             params['paths']['use_signals_dict'] = fully_defined_signals_0D
+        elif params['paths']['data'] == 'jet_to_d3d_data_1D':
+            params['paths']['shot_files'] = [jet_full]
+            params['paths']['shot_files_test'] = [d3d_full]
+            params['paths']['use_signals_dict'] = fully_defined_signals_1D
+        elif params['paths']['data'] == 'd3d_to_jet_data_1D':
+            params['paths']['shot_files'] = [d3d_full]
+            params['paths']['shot_files_test'] = [jet_iterlike_wall]
+            params['paths']['use_signals_dict'] = fully_defined_signals_1D
 
 
 
diff --git a/plasma/preprocessor/preprocess.py b/plasma/preprocessor/preprocess.py
@@ -146,7 +146,7 @@ def save_shotlists(self,shot_list_train,shot_list_validate,shot_list_test):
 
 
 def apply_bleed_in(conf,shot_list_train,shot_list_validate,shot_list_test):
-    np.random.seed(1)
+    np.random.seed(2)
     num = conf['data']['bleed_in']
     new_shots = []
     if num > 0:
@@ -168,19 +168,28 @@ def apply_bleed_in(conf,shot_list_train,shot_list_validate,shot_list_test):
             else:
                 num_sampled_nd += 1
         print("Sampled {} shots, {} disruptive, {} nondisruptive".format(num_sampled_nd+num_sampled_d,num_sampled_d,num_sampled_nd))
-        print("Before adding: training shots: {} validation shots: {}".format(len(shot_list_train,shot_list_validate)))
+        print("Before adding: training shots: {} validation shots: {}".format(len(shot_list_train),len(shot_list_validate)))
         assert(num_sampled_d == num)
-        num_to_sample = len(shot_list_bleed)
         if conf['data']['bleed_in_equalize_sets']:#add bleed-in shots to training and validation set repeatedly
+            print("Applying equalized bleed in")
             for shot_list_curr in [shot_list_train,shot_list_validate]:
                 for i in range(len(shot_list_curr)):
                     s = shot_list_bleed.sample_shot()
                     shot_list_curr.append(s)
+        elif conf['data']['bleed_in_repeat_fac'] > 1:
+            repeat_fac = conf['data']['bleed_in_repeat_fac']
+            print("Applying bleed in with repeat factor {}".format(repeat_fac))
+            num_to_sample = int(round(repeat_fac*len(shot_list_bleed)))
+            for i in range(num_to_sample):
+                s = shot_list_bleed.sample_shot()
+                shot_list_train.append(s)
+                shot_list_validate.append(s)
         else: #add each shot only once
+            print("Applying bleed in without repetition")
             for s in shot_list_bleed:
                 shot_list_train.append(s)
                 shot_list_validate.append(s)
-        print("After adding: training shots: {} validation shots: {}".format(len(shot_list_train,shot_list_validate)))
+        print("After adding: training shots: {} validation shots: {}".format(len(shot_list_train),len(shot_list_validate)))
         print("Added bleed in shots to training and validation sets")
         # if num_d > 0:
         #     for i in range(num):
diff --git a/plasma/primitives/data.py b/plasma/primitives/data.py
@@ -227,7 +227,7 @@ def load_data(self,prepath,shot,dtype='float32'):
         for i in range(timesteps):
             _,order = np.unique(mapping[i,:],return_index=True) #make sure the mapping is ordered and unique
             if sig[i,order].shape[0] > 2:
-                f = UnivariateSpline(mapping[i,order],sig[i,order],s=0,k=1,ext=0)
+                f = UnivariateSpline(mapping[i,order],sig[i,order],s=0,k=1,ext=3) #ext = 0 is extrapolation, ext = 3 is boundary value.
                 sig_interp[i,:] = f(remapping)
             else:
                 print('Signal {}, shot {} has not enough points for linear interpolation. dfitpack.error: (m>k) failed for hidden m: fpcurf0:m=1'.format(self.description,shot.number))
diff --git a/plasma/utils/batch_jobs.py b/plasma/utils/batch_jobs.py
@@ -112,7 +112,7 @@ def create_slurm_header(num_nodes,use_mpi,idx):
         assert(num_nodes == 1)
     lines = []
     lines.append('#!/bin/bash\n')
-    lines.append('#SBATCH -t 06:00:00\n')
+    lines.append('#SBATCH -t 20:00:00\n')
     lines.append('#SBATCH -N '+str(num_nodes)+'\n')
     if use_mpi:
         lines.append('#SBATCH --ntasks-per-node=4\n')