Synchronize GPU before CPU timers start and stop in net_speed_benchmark

author Kai Li <kaili_kloud@163.com>

Thu, 20 Feb 2014 10:29:08 +0000 (18:29 +0800)

committer Kai Li <kaili_kloud@163.com>

Tue, 4 Mar 2014 02:01:42 +0000 (10:01 +0800)
author Kai Li <kaili_kloud@163.com>
Thu, 20 Feb 2014 10:29:08 +0000 (18:29 +0800)
committer Kai Li <kaili_kloud@163.com>
Tue, 4 Mar 2014 02:01:42 +0000 (10:01 +0800)
diff --git a/tools/net_speed_benchmark.cpp b/tools/net_speed_benchmark.cpp

index 9976744..83fba14 100644 (file)
--- a/tools/net_speed_benchmark.cpp
+++ b/tools/net_speed_benchmark.cpp
@@ -67,13 +67,22 @@ int main(int argc, char** argv) {
    vector<vector<Blob<float>*> >& bottom_vecs = caffe_net.bottom_vecs();
    vector<vector<Blob<float>*> >& top_vecs = caffe_net.top_vecs();
    LOG(ERROR) << "*** Benchmark begins ***";
+  if (Caffe::mode() == Caffe::GPU) {
+    cudaDeviceSynchronize();
+  }
    clock_t forward_start = clock();
    for (int i = 0; i < layers.size(); ++i) {
      const string& layername = layers[i]->layer_param().name();
+    if (Caffe::mode() == Caffe::GPU) {
+      cudaDeviceSynchronize();
+    }
      clock_t start = clock();
      for (int j = 0; j < total_iter; ++j) {
        layers[i]->Forward(bottom_vecs[i], &top_vecs[i]);
      }
+    if (Caffe::mode() == Caffe::GPU) {
+      cudaDeviceSynchronize();
+    }
      LOG(ERROR) << layername << "\tforward: "
          << static_cast<float>(clock() - start) / CLOCKS_PER_SEC
          << " seconds.";
@@ -84,10 +93,16 @@ int main(int argc, char** argv) {
    clock_t backward_start = clock();
    for (int i = layers.size() - 1; i >= 0; --i) {
      const string& layername = layers[i]->layer_param().name();
+    if (Caffe::mode() == Caffe::GPU) {
+      cudaDeviceSynchronize();
+    }
      clock_t start = clock();
      for (int j = 0; j < total_iter; ++j) {
        layers[i]->Backward(top_vecs[i], true, &bottom_vecs[i]);
      }
+    if (Caffe::mode() == Caffe::GPU) {
+      cudaDeviceSynchronize();
+    }
      LOG(ERROR) << layername << "\tbackward: "
          << static_cast<float>(clock() - start) / CLOCKS_PER_SEC
          << " seconds.";
author	Kai Li <kaili_kloud@163.com>
	Thu, 20 Feb 2014 10:29:08 +0000 (18:29 +0800)
committer	Kai Li <kaili_kloud@163.com>
	Tue, 4 Mar 2014 02:01:42 +0000 (10:01 +0800)