From: jijoong.moon <jijoong.moon@samsung.com>
Date: Wed, 21 Oct 2020 02:16:43 +0000 (+0900)
Subject: [ Application ] VGG using learning rate decay
X-Git-Tag: accepted/tizen/unified/20201120.125454~60
X-Git-Url: http://review.tizen.org/git/?a=commitdiff_plain;h=aa88b3b0bcf47c966395957f11fb564ebe436a40;p=platform%2Fcore%2Fml%2Fnntrainer.git

[ Application ] VGG using learning rate decay

Change to use learning rate decay

**Self evaluation:**
1. Build test:	 [X]Passed [ ]Failed [ ]Skipped
2. Run test:	 [X]Passed [ ]Failed [ ]Skipped

Signed-off-by: jijoong.moon <jijoong.moon@samsung.com>
---

diff --git a/Applications/VGG/Tensorflow/vgg_keras.py b/Applications/VGG/Tensorflow/vgg_keras.py
index e962159..7c48355 100755
--- a/Applications/VGG/Tensorflow/vgg_keras.py
+++ b/Applications/VGG/Tensorflow/vgg_keras.py
@@ -51,7 +51,6 @@ def save(filename, *data):
           np.array(item, dtype=np.float32).tofile(outfile)
           try:
             print(item.shape, " data is generated")
-            print(item)
           except:
             pass
 
@@ -62,7 +61,7 @@ def save(filename, *data):
 # @param[in] y_data : total label data
 # @param[in] batch_size : batch_size
 # @return (x_batch, y_batch)
-def datagen( x_data, y_data, batch_size):
+def datagen(x_data, y_data, batch_size):
     size=len(x_data)
     while True:
         for i in range(size // batch_size):
@@ -128,7 +127,8 @@ def train_nntrainer(target):
         tf_logit = model(inputs, training=True)
         tf_loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(
             labels=labels, logits=tf_logit))
-        optimizer = tf.keras.optimizers.Adam(learning_rate=1.0e-4, epsilon=1.0e-7, beta_1=0.9, beta_2=0.999)
+        lr_schedule = tf.keras.optimizers.schedules.ExponentialDecay(initial_learning_rate = 1e-2, decay_steps=10000, decay_rate=0.96)
+        optimizer = tf.keras.optimizers.Adam(learning_rate=lr_schedule, epsilon=1.0e-7, beta_1=0.9, beta_2=0.999)
 
         trainable_variables = tf.compat.v1.trainable_variables()
         tf_grad = optimizer.get_gradients(tf_loss, params = trainable_variables)
@@ -143,6 +143,90 @@ def train_nntrainer(target):
 
         sess.run(tf.compat.v1.global_variables_initializer())
 
+        conv2_0 = np.transpose(model.get_weights()[0], [3,2,0,1])
+        conv2_1 = np.transpose(model.get_weights()[2], [3,2,0,1])
+        conv2_2 = np.transpose(model.get_weights()[4], [3,2,0,1])
+        conv2_3 = np.transpose(model.get_weights()[6], [3,2,0,1])
+        conv2_4 = np.transpose(model.get_weights()[8], [3,2,0,1])
+        conv2_5 = np.transpose(model.get_weights()[10], [3,2,0,1])
+        conv2_6 = np.transpose(model.get_weights()[12], [3,2,0,1])
+        conv2_7 = np.transpose(model.get_weights()[14], [3,2,0,1])
+        conv2_8 = np.transpose(model.get_weights()[16], [3,2,0,1])
+        conv2_9 = np.transpose(model.get_weights()[18], [3,2,0,1])
+        conv2_10 = np.transpose(model.get_weights()[20], [3,2,0,1])
+        conv2_11 = np.transpose(model.get_weights()[22], [3,2,0,1])
+        conv2_12 = np.transpose(model.get_weights()[24], [3,2,0,1])
+
+        bn_1_0 = np.transpose(model.get_weights()[26])
+        bn_1_1 = np.transpose(model.get_weights()[27])
+        bn_1_2 = np.transpose(model.get_weights()[28])
+        bn_1_3 = np.transpose(model.get_weights()[29])
+
+        fc_0_0 = np.transpose(model.get_weights()[30])
+        fc_0_1 = np.transpose(model.get_weights()[31])
+
+        bn_2_0 = np.transpose(model.get_weights()[32])
+        bn_2_1 = np.transpose(model.get_weights()[33])
+        bn_2_2 = np.transpose(model.get_weights()[34])
+        bn_2_3 = np.transpose(model.get_weights()[35])
+
+        fc_1_0 = np.transpose(model.get_weights()[36])
+        fc_1_1 = np.transpose(model.get_weights()[37])
+
+        bn_3_0 = np.transpose(model.get_weights()[38])
+        bn_3_1 = np.transpose(model.get_weights()[39])
+        bn_3_2 = np.transpose(model.get_weights()[40])
+        bn_3_3 = np.transpose(model.get_weights()[41])
+
+        fc_2_0 = np.transpose(model.get_weights()[42])
+        fc_2_1 = np.transpose(model.get_weights()[43])
+
+        save("model.bin", conv2_0)
+        save("model.bin", model.get_weights()[1])
+        save("model.bin", conv2_1)
+        save("model.bin", model.get_weights()[3])
+        save("model.bin", conv2_2)
+        save("model.bin", model.get_weights()[5])
+        save("model.bin", conv2_3)
+        save("model.bin", model.get_weights()[7])
+        save("model.bin", conv2_4)
+        save("model.bin", model.get_weights()[9])
+        save("model.bin", conv2_5)
+        save("model.bin", model.get_weights()[11])
+        save("model.bin", conv2_6)
+        save("model.bin", model.get_weights()[13])
+        save("model.bin", conv2_7)
+        save("model.bin", model.get_weights()[15])
+        save("model.bin", conv2_8)
+        save("model.bin", model.get_weights()[17])
+        save("model.bin", conv2_9)
+        save("model.bin", model.get_weights()[19])
+        save("model.bin", conv2_10)
+        save("model.bin", model.get_weights()[21])
+        save("model.bin", conv2_11)
+        save("model.bin", model.get_weights()[23])
+        save("model.bin", conv2_12)
+        save("model.bin", model.get_weights()[25])
+
+        save("model.bin", bn_1_0)
+        save("model.bin", bn_1_1)
+        save("model.bin", bn_1_2)
+        save("model.bin", bn_1_3)
+        save("model.bin", fc_0_0)
+        save("model.bin", fc_0_1)
+        save("model.bin", bn_2_0)
+        save("model.bin", bn_2_1)
+        save("model.bin", bn_2_2)
+        save("model.bin", bn_2_3)
+        save("model.bin", fc_1_0)
+        save("model.bin", fc_1_1)
+        save("model.bin", bn_3_0)
+        save("model.bin", bn_3_1)
+        save("model.bin", bn_3_2)
+        save("model.bin", bn_3_3)
+        save("model.bin", fc_2_0)
+        save("model.bin", fc_2_1)
+
         for i in range(0, num_epoch):
             count = 0
             accuracy = 0;
@@ -176,7 +260,9 @@ def train_nntrainer(target):
             print('#{}/{} - Training Loss: {:10.6f} - Training Accuracy: {:10.6f} >> [ Accuracy: {:10.6f}% - Validation Loss : {:10.6f} ]'. format(i + 1, num_epoch, training_loss, training_accuracy, accuracy, loss))
     else:
         ## Method 1 : using keras fit (training and evaluating manually)
-        optimizer = optimizers.Adam(learning_rate=1.0e-4, beta_1=0.9, beta_2=0.999, epsilon=1.0e-7)
+        lr_schedule = tf.keras.optimizers.schedules.ExponentialDecay(initial_learning_rate = 1e-2, decay_steps=10000, decay_rate=0.96)
+        optimizer = tf.keras.optimizers.Adam(learning_rate=lr_schedule, epsilon=1.0e-7, beta_1=0.9, beta_2=0.999)
+
         model.compile(optimizer = optimizer,
                       loss = tf.keras.losses.CategoricalCrossentropy(from_logits = True),
                       metrics = ['accuracy'])
diff --git a/Applications/VGG/res/vgg_small.ini b/Applications/VGG/res/vgg_small.ini
index fd54cb3..d00c72b 100644
--- a/Applications/VGG/res/vgg_small.ini
+++ b/Applications/VGG/res/vgg_small.ini
@@ -8,8 +8,8 @@
 
 [Model]
 Type = NeuralNetwork	# Network Type : Regression, KNN, NeuralNetwork
-Learning_rate = 1e-4 	# Learning Rate
-Epochs = 1500		# Epochs
+Learning_rate = 1e-2 	# Learning Rate
+Epochs = 3000		# Epochs
 Optimizer = adam 	# Optimizer : sgd (stochastic gradien decent),
  	    		#             adam (Adamtive Moment Estimation)
 Loss = cross  		# Loss function : mse (mean squared error)
@@ -19,12 +19,13 @@ batch_size = 128		# batch size
 beta1 = 0.9 		# beta 1 for adam
 beta2 = 0.999	# beta 2 for adam
 epsilon = 1e-7	# epsilon for adam
+decay_step = 10000
+decay_rate = 0.96
 
 # Layer Section : Name
 [inputlayer]
 Type = input
 Input_Shape = 3:32:32
-normalization = true
 
 # Layer Section : Name
 [conv2d_c1_layer]