ore/exofs: Define new ore_verify_layout

[profile/ivi/kernel-adaptation-intel-automotive.git] / fs / exofs / inode.c
diff --git a/fs/exofs/inode.c b/fs/exofs/inode.c

index f39a38f..5a62420 100644 (file)
--- a/fs/exofs/inode.c
+++ b/fs/exofs/inode.c
@@ -37,11 +37,7 @@
  
  #define EXOFS_DBGMSG2(M...) do {} while (0)
  
-enum { BIO_MAX_PAGES_KMALLOC =
-               (PAGE_SIZE - sizeof(struct bio)) / sizeof(struct bio_vec),
-       MAX_PAGES_KMALLOC =
-               PAGE_SIZE / sizeof(struct page *),
-};
+enum {MAX_PAGES_KMALLOC = PAGE_SIZE / sizeof(struct page *), };
  
  unsigned exofs_max_io_pages(struct ore_layout *layout,
                             unsigned expected_pages)
@@ -49,8 +45,7 @@ unsigned exofs_max_io_pages(struct ore_layout *layout,
         unsigned pages = min_t(unsigned, expected_pages, MAX_PAGES_KMALLOC);
  
         /* TODO: easily support bio chaining */
-       pages =  min_t(unsigned, pages,
-                      layout->group_width * BIO_MAX_PAGES_KMALLOC);
+       pages =  min_t(unsigned, pages, layout->max_io_length / PAGE_SIZE);
         return pages;
  }
  
@@ -149,14 +144,17 @@ static int pcol_add_page(struct page_collect *pcol, struct page *page,
         return 0;
  }
  
+enum {PAGE_WAS_NOT_IN_IO = 17};
  static int update_read_page(struct page *page, int ret)
  {
-       if (ret == 0) {
+       switch (ret) {
+       case 0:
                 /* Everything is OK */
                 SetPageUptodate(page);
                 if (PageError(page))
                         ClearPageError(page);
-       } else if (ret == -EFAULT) {
+               break;
+       case -EFAULT:
                 /* In this case we were trying to read something that wasn't on
                  * disk yet - return a page full of zeroes.  This should be OK,
                  * because the object should be empty (if there was a write
@@ -167,16 +165,22 @@ static int update_read_page(struct page *page, int ret)
                 SetPageUptodate(page);
                 if (PageError(page))
                         ClearPageError(page);
-               ret = 0; /* recovered error */
                 EXOFS_DBGMSG("recovered read error\n");
-       } else /* Error */
+               /* fall through */
+       case PAGE_WAS_NOT_IN_IO:
+               ret = 0; /* recovered error */
+               break;
+       default:
                 SetPageError(page);
-
+       }
         return ret;
  }
  
  static void update_write_page(struct page *page, int ret)
  {
+       if (unlikely(ret == PAGE_WAS_NOT_IN_IO))
+               return; /* don't pass start don't collect $200 */
+
         if (ret) {
                 mapping_set_error(page->mapping, ret);
                 SetPageError(page);
@@ -195,10 +199,14 @@ static int __readpages_done(struct page_collect *pcol)
         u64 length = 0;
         int ret = ore_check_io(pcol->ios, &resid);
  
-       if (likely(!ret))
+       if (likely(!ret)) {
                 good_bytes = pcol->length;
-       else
+               ret = PAGE_WAS_NOT_IN_IO;
+       } else {
                 good_bytes = pcol->length - resid;
+       }
+       if (good_bytes > pcol->ios->length)
+               good_bytes = pcol->ios->length;
  
         EXOFS_DBGMSG2("readpages_done(0x%lx) good_bytes=0x%llx"
                      " length=0x%lx nr_pages=%u\n",
@@ -259,6 +267,46 @@ static void _unlock_pcol_pages(struct page_collect *pcol, int ret, int rw)
         }
  }
  
+static int _maybe_not_all_in_one_io(struct ore_io_state *ios,
+       struct page_collect *pcol_src, struct page_collect *pcol)
+{
+       /* length was wrong or offset was not page aligned */
+       BUG_ON(pcol_src->nr_pages < ios->nr_pages);
+
+       if (pcol_src->nr_pages > ios->nr_pages) {
+               struct page **src_page;
+               unsigned pages_less = pcol_src->nr_pages - ios->nr_pages;
+               unsigned long len_less = pcol_src->length - ios->length;
+               unsigned i;
+               int ret;
+
+               /* This IO was trimmed */
+               pcol_src->nr_pages = ios->nr_pages;
+               pcol_src->length = ios->length;
+
+               /* Left over pages are passed to the next io */
+               pcol->expected_pages += pages_less;
+               pcol->nr_pages = pages_less;
+               pcol->length = len_less;
+               src_page = pcol_src->pages + pcol_src->nr_pages;
+               pcol->pg_first = (*src_page)->index;
+
+               ret = pcol_try_alloc(pcol);
+               if (unlikely(ret))
+                       return ret;
+
+               for (i = 0; i < pages_less; ++i)
+                       pcol->pages[i] = *src_page++;
+
+               EXOFS_DBGMSG("Length was adjusted nr_pages=0x%x "
+                       "pages_less=0x%x expected_pages=0x%x "
+                       "next_offset=0x%llx next_len=0x%lx\n",
+                       pcol_src->nr_pages, pages_less, pcol->expected_pages,
+                       pcol->pg_first * PAGE_SIZE, pcol->length);
+       }
+       return 0;
+}
+
  static int read_exec(struct page_collect *pcol)
  {
         struct exofs_i_info *oi = exofs_i(pcol->inode);
@@ -270,7 +318,7 @@ static int read_exec(struct page_collect *pcol)
                 return 0;
  
         if (!pcol->ios) {
-               int ret = ore_get_rw_state(&pcol->sbi->layout, &oi->comps, true,
+               int ret = ore_get_rw_state(&pcol->sbi->layout, &oi->oc, true,
                                              pcol->pg_first << PAGE_CACHE_SHIFT,
                                              pcol->length, &pcol->ios);
  
@@ -280,7 +328,6 @@ static int read_exec(struct page_collect *pcol)
  
         ios = pcol->ios;
         ios->pages = pcol->pages;
-       ios->nr_pages = pcol->nr_pages;
  
         if (pcol->read_4_write) {
                 ore_read(pcol->ios);
@@ -296,17 +343,23 @@ static int read_exec(struct page_collect *pcol)
         *pcol_copy = *pcol;
         ios->done = readpages_done;
         ios->private = pcol_copy;
+
+       /* pages ownership was passed to pcol_copy */
+       _pcol_reset(pcol);
+
+       ret = _maybe_not_all_in_one_io(ios, pcol_copy, pcol);
+       if (unlikely(ret))
+               goto err;
+
+       EXOFS_DBGMSG2("read_exec(0x%lx) offset=0x%llx length=0x%llx\n",
+               pcol->inode->i_ino, _LLU(ios->offset), _LLU(ios->length));
+
         ret = ore_read(ios);
         if (unlikely(ret))
                 goto err;
  
         atomic_inc(&pcol->sbi->s_curr_pending);
  
-       EXOFS_DBGMSG2("read_exec obj=0x%llx start=0x%llx length=0x%lx\n",
-                 oi->one_comp.obj.id, _LLU(ios->offset), pcol->length);
-
-       /* pages ownership was passed to pcol_copy */
-       _pcol_reset(pcol);
         return 0;
  
  err:
@@ -429,6 +482,10 @@ static int exofs_readpages(struct file *file, struct address_space *mapping,
                 return ret;
         }
  
+       ret = read_exec(&pcol);
+       if (unlikely(ret))
+               return ret;
+
         return read_exec(&pcol);
  }
  
@@ -469,10 +526,14 @@ static void writepages_done(struct ore_io_state *ios, void *p)
  
         atomic_dec(&pcol->sbi->s_curr_pending);
  
-       if (likely(!ret))
+       if (likely(!ret)) {
                 good_bytes = pcol->length;
-       else
+               ret = PAGE_WAS_NOT_IN_IO;
+       } else {
                 good_bytes = pcol->length - resid;
+       }
+       if (good_bytes > pcol->ios->length)
+               good_bytes = pcol->ios->length;
  
         EXOFS_DBGMSG2("writepages_done(0x%lx) good_bytes=0x%llx"
                      " length=0x%lx nr_pages=%u\n",
@@ -516,10 +577,9 @@ static int write_exec(struct page_collect *pcol)
                 return 0;
  
         BUG_ON(pcol->ios);
-       ret = ore_get_rw_state(&pcol->sbi->layout, &oi->comps, false,
+       ret = ore_get_rw_state(&pcol->sbi->layout, &oi->oc, false,
                                  pcol->pg_first << PAGE_CACHE_SHIFT,
                                  pcol->length, &pcol->ios);
-
         if (unlikely(ret))
                 goto err;
  
@@ -534,10 +594,19 @@ static int write_exec(struct page_collect *pcol)
  
         ios = pcol->ios;
         ios->pages = pcol_copy->pages;
-       ios->nr_pages = pcol_copy->nr_pages;
         ios->done = writepages_done;
         ios->private = pcol_copy;
  
+       /* pages ownership was passed to pcol_copy */
+       _pcol_reset(pcol);
+
+       ret = _maybe_not_all_in_one_io(ios, pcol_copy, pcol);
+       if (unlikely(ret))
+               goto err;
+
+       EXOFS_DBGMSG2("write_exec(0x%lx) offset=0x%llx length=0x%llx\n",
+               pcol->inode->i_ino, _LLU(ios->offset), _LLU(ios->length));
+
         ret = ore_write(ios);
         if (unlikely(ret)) {
                 EXOFS_ERR("write_exec: ore_write() Failed\n");
@@ -545,11 +614,6 @@ static int write_exec(struct page_collect *pcol)
         }
  
         atomic_inc(&pcol->sbi->s_curr_pending);
-       EXOFS_DBGMSG2("write_exec(0x%lx, 0x%llx) start=0x%llx length=0x%lx\n",
-                 pcol->inode->i_ino, pcol->pg_first, _LLU(ios->offset),
-                 pcol->length);
-       /* pages ownership was passed to pcol_copy */
-       _pcol_reset(pcol);
         return 0;
  
  err:
@@ -689,12 +753,30 @@ static int exofs_writepages(struct address_space *mapping,
         _pcol_init(&pcol, expected_pages, mapping->host);
  
         ret = write_cache_pages(mapping, wbc, writepage_strip, &pcol);
-       if (ret) {
+       if (unlikely(ret)) {
                 EXOFS_ERR("write_cache_pages => %d\n", ret);
                 return ret;
         }
  
-       return write_exec(&pcol);
+       ret = write_exec(&pcol);
+       if (unlikely(ret))
+               return ret;
+
+       if (wbc->sync_mode == WB_SYNC_ALL) {
+               return write_exec(&pcol); /* pump the last reminder */
+       } else if (pcol.nr_pages) {
+               /* not SYNC let the reminder join the next writeout */
+               unsigned i;
+
+               for (i = 0; i < pcol.nr_pages; i++) {
+                       struct page *page = pcol.pages[i];
+
+                       end_page_writeback(page);
+                       set_page_dirty(page);
+                       unlock_page(page);
+               }
+       }
+       return 0;
  }
  
  static int exofs_writepage(struct page *page, struct writeback_control *wbc)
@@ -860,7 +942,7 @@ static int _do_truncate(struct inode *inode, loff_t newsize)
  
         inode->i_mtime = inode->i_ctime = CURRENT_TIME;
  
-       ret = ore_truncate(&sbi->layout, &oi->comps, (u64)newsize);
+       ret = ore_truncate(&sbi->layout, &oi->oc, (u64)newsize);
         if (likely(!ret))
                 truncate_setsize(inode, newsize);
  
@@ -927,14 +1009,14 @@ static int exofs_get_inode(struct super_block *sb, struct exofs_i_info *oi,
         struct exofs_on_disk_inode_layout *layout;
         int ret;
  
-       ret = ore_get_io_state(&sbi->layout, &oi->comps, &ios);
+       ret = ore_get_io_state(&sbi->layout, &oi->oc, &ios);
         if (unlikely(ret)) {
                 EXOFS_ERR("%s: ore_get_io_state failed.\n", __func__);
                 return ret;
         }
  
-       attrs[1].len = exofs_on_disk_inode_layout_size(sbi->comps.numdevs);
-       attrs[2].len = exofs_on_disk_inode_layout_size(sbi->comps.numdevs);
+       attrs[1].len = exofs_on_disk_inode_layout_size(sbi->oc.numdevs);
+       attrs[2].len = exofs_on_disk_inode_layout_size(sbi->oc.numdevs);
  
         ios->in_attr = attrs;
         ios->in_attr_len = ARRAY_SIZE(attrs);
@@ -1018,7 +1100,7 @@ struct inode *exofs_iget(struct super_block *sb, unsigned long ino)
                 return inode;
         oi = exofs_i(inode);
         __oi_init(oi);
-       exofs_init_comps(&oi->comps, &oi->one_comp, sb->s_fs_info,
+       exofs_init_comps(&oi->oc, &oi->one_comp, sb->s_fs_info,
                          exofs_oi_objno(oi));
  
         /* read the inode from the osd */
@@ -1172,13 +1254,13 @@ struct inode *exofs_new_inode(struct inode *dir, int mode)
         spin_unlock(&sbi->s_next_gen_lock);
         insert_inode_hash(inode);
  
-       exofs_init_comps(&oi->comps, &oi->one_comp, sb->s_fs_info,
+       exofs_init_comps(&oi->oc, &oi->one_comp, sb->s_fs_info,
                          exofs_oi_objno(oi));
         exofs_sbi_write_stats(sbi); /* Make sure new sbi->s_nextid is on disk */
  
         mark_inode_dirty(inode);
  
-       ret = ore_get_io_state(&sbi->layout, &oi->comps, &ios);
+       ret = ore_get_io_state(&sbi->layout, &oi->oc, &ios);
         if (unlikely(ret)) {
                 EXOFS_ERR("exofs_new_inode: ore_get_io_state failed\n");
                 return ERR_PTR(ret);
@@ -1267,7 +1349,7 @@ static int exofs_update_inode(struct inode *inode, int do_sync)
         } else
                 memcpy(fcb->i_data, oi->i_data, sizeof(fcb->i_data));
  
-       ret = ore_get_io_state(&sbi->layout, &oi->comps, &ios);
+       ret = ore_get_io_state(&sbi->layout, &oi->oc, &ios);
         if (unlikely(ret)) {
                 EXOFS_ERR("%s: ore_get_io_state failed.\n", __func__);
                 goto free_args;
@@ -1350,7 +1432,7 @@ void exofs_evict_inode(struct inode *inode)
         /* ignore the error, attempt a remove anyway */
  
         /* Now Remove the OSD objects */
-       ret = ore_get_io_state(&sbi->layout, &oi->comps, &ios);
+       ret = ore_get_io_state(&sbi->layout, &oi->oc, &ios);
         if (unlikely(ret)) {
                 EXOFS_ERR("%s: ore_get_io_state failed\n", __func__);
                 return;