devdio
diff --git a/‎07keras/09fasttext_multi_classification.py‎
Lines changed: 2 additions & 1 deletion b/‎07keras/09fasttext_multi_classification.py‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎17tensorflow/4_cnn_text_classification/config.py‎
Lines changed: 28 additions & 26 deletions b/‎17tensorflow/4_cnn_text_classification/config.py‎
Lines changed: 28 additions & 26 deletions
diff --git a/‎17tensorflow/4_cnn_text_classification/data/zh_polarity/neg.txt‎
Lines changed: 18576 additions & 18576 deletions b/‎17tensorflow/4_cnn_text_classification/data/zh_polarity/neg.txt‎
Lines changed: 18576 additions & 18576 deletions
diff --git a/‎17tensorflow/4_cnn_text_classification/data/zh_polarity/neg_sample.txt‎
Lines changed: 0 additions & 13 deletions b/‎17tensorflow/4_cnn_text_classification/data/zh_polarity/neg_sample.txt‎
Lines changed: 0 additions & 13 deletions
@@ -24,7 +24,8 @@ def get_corpus(data_dir):
     for file_name in os.listdir(data_dir):
         with open(os.path.join(data_dir, file_name), mode='r', encoding='utf-8') as f:
             for line in f:
-                parts = line.rstrip().split(',')
+                # label in first sep
+                parts = line.rstrip().split(',', 1)
                 if parts and len(parts) > 1:
                     # keras categorical label start with 0
                     lbl = int(parts[0]) - 1
 
@@ -2,34 +2,36 @@
 # Author: XuMing <[email protected]>
 # Data: 17/10/17
 # Brief: 配置
+import os
 
-config = {
-    # data
-    "dev_sample_percentage": 0.1,  # percentage of the training data for validation
-    "positive_data_file": "./data/zh_polarity/pos.txt",  # positive data
-    "negative_data_file": "./data/zh_polarity/neg.txt",  # negative data
 
-    # model
-    "embedding_dim": 128,  # dimensionality of character embedding (default: 128)
-    "filter_sizes": "3,4,5",  # comma-separated filter size (default: "3,4,5")
-    "num_filters": 128,  # number of filters per filter size
-    "dropout_keep_prob": 0.5,  # dropout keep probability
-    "l2_reg_lambda": 0.0,  # l2 regulaization lambda
+# data
+dev_sample_percentage = 0.1  # percentage of the training data for validation
+data_dir = "./data/zh_polarity"  # data file path
 
-    # train
-    "batch_size": 64,  # batch size (default: 64)
-    "num_epochs": 200,  # number of training epochs (default: 200)
-    "evaluate_every": 100,  # evaluate model on dev set after this many steps (default: 100)
-    "checkpoint_every": 100,  # save model after this many steps (default: 100)
-    "num_checkpoints": 5,  # number of checkpoints to store
+# model
+embedding_dim = 128  # dimensionality of character embedding (default: 128)
+filter_sizes = "3,4,5"  # comma-separated filter size (default: "3,4,5")
+num_filters = 128  # number of filters per filter size
+dropout_keep_prob = 0.5  # dropout keep probability
+l2_reg_lambda = 0.0  # l2 regulaization lambda
 
-    # proto
-    "allow_soft_placement": True,  # allow device soft device placement
-    "log_device_placement": False,  # log placement of ops on devices
-}
+# train
+batch_size = 64  # batch size (default: 64)
+num_epochs = 200  # number of training epochs (default: 200)
+evaluate_every = 100  # evaluate model on dev set after this many steps (default: 100)
+checkpoint_every = 100  # save model after this many epochs (default: 100)
+num_checkpoints = 5  # number of checkpoints to store
 
-evaluate = {
-    "infer_data": "./data/input_data.txt",  # infer data
-    "checkpoint_dir": "runs/20171020-1508503142/checkpoints",  # checkpoint directory from training run
-    "eval_all_train_data": False,  # evaluate on all training data
-}
+# proto
+allow_soft_placement = True  # allow device soft device placement
+log_device_placement = False  # log placement of ops on devices
+
+infer_data_path = "./data/input_data.txt"  # infer data
+checkpoint_dir = "./models/checkpoints"  # checkpoint directory from training run
+eval_all_train_data = False  # evaluate on all training data
+
+# directory to save the trained model
+# create a new directory if the dir does not exist
+if not os.path.exists(checkpoint_dir):
+    os.mkdir(checkpoint_dir)