mm, thp, migrate: handling migration of 64KB hugepages
[platform/kernel/linux-rpi.git] / include / linux / swapops.h
1 /* SPDX-License-Identifier: GPL-2.0 */
2 #ifndef _LINUX_SWAPOPS_H
3 #define _LINUX_SWAPOPS_H
4
5 #include <linux/radix-tree.h>
6 #include <linux/bug.h>
7 #include <linux/mm_types.h>
8
9 #ifdef CONFIG_MMU
10
11 /*
12  * swapcache pages are stored in the swapper_space radix tree.  We want to
13  * get good packing density in that tree, so the index should be dense in
14  * the low-order bits.
15  *
16  * We arrange the `type' and `offset' fields so that `type' is at the seven
17  * high-order bits of the swp_entry_t and `offset' is right-aligned in the
18  * remaining bits.  Although `type' itself needs only five bits, we allow for
19  * shmem/tmpfs to shift it all up a further two bits: see swp_to_radix_entry().
20  *
21  * swp_entry_t's are *never* stored anywhere in their arch-dependent format.
22  */
23 #define SWP_TYPE_SHIFT  (BITS_PER_XA_VALUE - MAX_SWAPFILES_SHIFT)
24 #define SWP_OFFSET_MASK ((1UL << SWP_TYPE_SHIFT) - 1)
25
26 /* Clear all flags but only keep swp_entry_t related information */
27 static inline pte_t pte_swp_clear_flags(pte_t pte)
28 {
29         if (pte_swp_soft_dirty(pte))
30                 pte = pte_swp_clear_soft_dirty(pte);
31         if (pte_swp_uffd_wp(pte))
32                 pte = pte_swp_clear_uffd_wp(pte);
33         return pte;
34 }
35
36 /*
37  * Store a type+offset into a swp_entry_t in an arch-independent format
38  */
39 static inline swp_entry_t swp_entry(unsigned long type, pgoff_t offset)
40 {
41         swp_entry_t ret;
42
43         ret.val = (type << SWP_TYPE_SHIFT) | (offset & SWP_OFFSET_MASK);
44         return ret;
45 }
46
47 /*
48  * Extract the `type' field from a swp_entry_t.  The swp_entry_t is in
49  * arch-independent format
50  */
51 static inline unsigned swp_type(swp_entry_t entry)
52 {
53         return (entry.val >> SWP_TYPE_SHIFT);
54 }
55
56 /*
57  * Extract the `offset' field from a swp_entry_t.  The swp_entry_t is in
58  * arch-independent format
59  */
60 static inline pgoff_t swp_offset(swp_entry_t entry)
61 {
62         return entry.val & SWP_OFFSET_MASK;
63 }
64
65 /* check whether a pte points to a swap entry */
66 static inline int is_swap_pte(pte_t pte)
67 {
68         return !pte_none(pte) && !pte_present(pte);
69 }
70
71 /*
72  * Convert the arch-dependent pte representation of a swp_entry_t into an
73  * arch-independent swp_entry_t.
74  */
75 static inline swp_entry_t pte_to_swp_entry(pte_t pte)
76 {
77         swp_entry_t arch_entry;
78
79         pte = pte_swp_clear_flags(pte);
80         arch_entry = __pte_to_swp_entry(pte);
81         return swp_entry(__swp_type(arch_entry), __swp_offset(arch_entry));
82 }
83
84 /*
85  * Convert the arch-independent representation of a swp_entry_t into the
86  * arch-dependent pte representation.
87  */
88 static inline pte_t swp_entry_to_pte(swp_entry_t entry)
89 {
90         swp_entry_t arch_entry;
91
92         arch_entry = __swp_entry(swp_type(entry), swp_offset(entry));
93         return __swp_entry_to_pte(arch_entry);
94 }
95
96 static inline swp_entry_t radix_to_swp_entry(void *arg)
97 {
98         swp_entry_t entry;
99
100         entry.val = xa_to_value(arg);
101         return entry;
102 }
103
104 static inline void *swp_to_radix_entry(swp_entry_t entry)
105 {
106         return xa_mk_value(entry.val);
107 }
108
109 #if IS_ENABLED(CONFIG_DEVICE_PRIVATE)
110 static inline swp_entry_t make_device_private_entry(struct page *page, bool write)
111 {
112         return swp_entry(write ? SWP_DEVICE_WRITE : SWP_DEVICE_READ,
113                          page_to_pfn(page));
114 }
115
116 static inline bool is_device_private_entry(swp_entry_t entry)
117 {
118         int type = swp_type(entry);
119         return type == SWP_DEVICE_READ || type == SWP_DEVICE_WRITE;
120 }
121
122 static inline void make_device_private_entry_read(swp_entry_t *entry)
123 {
124         *entry = swp_entry(SWP_DEVICE_READ, swp_offset(*entry));
125 }
126
127 static inline bool is_write_device_private_entry(swp_entry_t entry)
128 {
129         return unlikely(swp_type(entry) == SWP_DEVICE_WRITE);
130 }
131
132 static inline unsigned long device_private_entry_to_pfn(swp_entry_t entry)
133 {
134         return swp_offset(entry);
135 }
136
137 static inline struct page *device_private_entry_to_page(swp_entry_t entry)
138 {
139         return pfn_to_page(swp_offset(entry));
140 }
141 #else /* CONFIG_DEVICE_PRIVATE */
142 static inline swp_entry_t make_device_private_entry(struct page *page, bool write)
143 {
144         return swp_entry(0, 0);
145 }
146
147 static inline void make_device_private_entry_read(swp_entry_t *entry)
148 {
149 }
150
151 static inline bool is_device_private_entry(swp_entry_t entry)
152 {
153         return false;
154 }
155
156 static inline bool is_write_device_private_entry(swp_entry_t entry)
157 {
158         return false;
159 }
160
161 static inline unsigned long device_private_entry_to_pfn(swp_entry_t entry)
162 {
163         return 0;
164 }
165
166 static inline struct page *device_private_entry_to_page(swp_entry_t entry)
167 {
168         return NULL;
169 }
170 #endif /* CONFIG_DEVICE_PRIVATE */
171
172 #ifdef CONFIG_MIGRATION
173 static inline swp_entry_t make_migration_entry(struct page *page, int write)
174 {
175         BUG_ON(!PageLocked(compound_head(page)));
176
177         return swp_entry(write ? SWP_MIGRATION_WRITE : SWP_MIGRATION_READ,
178                         page_to_pfn(page));
179 }
180
181 static inline int is_migration_entry(swp_entry_t entry)
182 {
183         return unlikely(swp_type(entry) == SWP_MIGRATION_READ ||
184                         swp_type(entry) == SWP_MIGRATION_WRITE);
185 }
186
187 static inline int is_write_migration_entry(swp_entry_t entry)
188 {
189         return unlikely(swp_type(entry) == SWP_MIGRATION_WRITE);
190 }
191
192 static inline unsigned long migration_entry_to_pfn(swp_entry_t entry)
193 {
194         return swp_offset(entry);
195 }
196
197 static inline struct page *migration_entry_to_page(swp_entry_t entry)
198 {
199         struct page *p = pfn_to_page(swp_offset(entry));
200         /*
201          * Any use of migration entries may only occur while the
202          * corresponding page is locked
203          */
204         BUG_ON(!PageLocked(compound_head(p)));
205         return p;
206 }
207
208 static inline void make_migration_entry_read(swp_entry_t *entry)
209 {
210         *entry = swp_entry(SWP_MIGRATION_READ, swp_offset(*entry));
211 }
212
213 extern void __migration_entry_wait(struct mm_struct *mm, pte_t *ptep,
214                                         spinlock_t *ptl);
215 extern void migration_entry_wait(struct mm_struct *mm, pmd_t *pmd,
216                                         unsigned long address);
217 extern void migration_entry_wait_huge(struct vm_area_struct *vma,
218                 struct mm_struct *mm, pte_t *pte);
219 #else
220
221 #define make_migration_entry(page, write) swp_entry(0, 0)
222 static inline int is_migration_entry(swp_entry_t swp)
223 {
224         return 0;
225 }
226
227 static inline unsigned long migration_entry_to_pfn(swp_entry_t entry)
228 {
229         return 0;
230 }
231
232 static inline struct page *migration_entry_to_page(swp_entry_t entry)
233 {
234         return NULL;
235 }
236
237 static inline void make_migration_entry_read(swp_entry_t *entryp) { }
238 static inline void __migration_entry_wait(struct mm_struct *mm, pte_t *ptep,
239                                         spinlock_t *ptl) { }
240 static inline void migration_entry_wait(struct mm_struct *mm, pmd_t *pmd,
241                                          unsigned long address) { }
242 static inline void migration_entry_wait_huge(struct vm_area_struct *vma,
243                 struct mm_struct *mm, pte_t *pte) { }
244 static inline int is_write_migration_entry(swp_entry_t entry)
245 {
246         return 0;
247 }
248
249 #endif
250
251 struct page_vma_mapped_walk;
252
253 #ifdef CONFIG_ARCH_ENABLE_THP_MIGRATION
254 extern void set_pmd_migration_entry(struct page_vma_mapped_walk *pvmw,
255                 struct page *page);
256
257 extern void remove_migration_pmd(struct page_vma_mapped_walk *pvmw,
258                 struct page *new);
259
260 #ifdef CONFIG_FINEGRAINED_THP
261 extern void set_huge_pte_migration_entry(struct page_vma_mapped_walk *pvmw,
262                 struct page *page);
263
264 extern void remove_migration_huge_pte(struct page_vma_mapped_walk *pvmw,
265                 struct page *new);
266 #endif
267
268 extern void pmd_migration_entry_wait(struct mm_struct *mm, pmd_t *pmd);
269
270 static inline swp_entry_t pmd_to_swp_entry(pmd_t pmd)
271 {
272         swp_entry_t arch_entry;
273
274         if (pmd_swp_soft_dirty(pmd))
275                 pmd = pmd_swp_clear_soft_dirty(pmd);
276         if (pmd_swp_uffd_wp(pmd))
277                 pmd = pmd_swp_clear_uffd_wp(pmd);
278         arch_entry = __pmd_to_swp_entry(pmd);
279         return swp_entry(__swp_type(arch_entry), __swp_offset(arch_entry));
280 }
281
282 static inline pmd_t swp_entry_to_pmd(swp_entry_t entry)
283 {
284         swp_entry_t arch_entry;
285
286         arch_entry = __swp_entry(swp_type(entry), swp_offset(entry));
287         return __swp_entry_to_pmd(arch_entry);
288 }
289
290 static inline int is_pmd_migration_entry(pmd_t pmd)
291 {
292         return !pmd_present(pmd) && is_migration_entry(pmd_to_swp_entry(pmd));
293 }
294 #ifdef CONFIG_FINEGRAINED_THP
295 static inline int is_pte_migration_entry(pte_t pte)
296 {
297         return !pte_present(pte) && is_migration_entry(pte_to_swp_entry(pte));
298 }
299 #endif
300 #else
301 static inline void set_pmd_migration_entry(struct page_vma_mapped_walk *pvmw,
302                 struct page *page)
303 {
304         BUILD_BUG();
305 }
306
307 static inline void remove_migration_pmd(struct page_vma_mapped_walk *pvmw,
308                 struct page *new)
309 {
310         BUILD_BUG();
311 }
312 #ifdef CONFIG_FINEGRAINED_THP
313 static inline void set_huge_pte_migration_entry(struct page_vma_mapped_walk *pvmw,
314                 struct page *page)
315 {
316         BUILD_BUG();
317 }
318
319 static inline void remove_migration_huge_pte(struct page_vma_mapped_walk *pvmw,
320                 struct page *new)
321 {
322         BUILD_BUG();
323 }
324 #endif
325
326 static inline void pmd_migration_entry_wait(struct mm_struct *m, pmd_t *p) { }
327
328 static inline swp_entry_t pmd_to_swp_entry(pmd_t pmd)
329 {
330         return swp_entry(0, 0);
331 }
332
333 static inline pmd_t swp_entry_to_pmd(swp_entry_t entry)
334 {
335         return __pmd(0);
336 }
337
338 static inline int is_pmd_migration_entry(pmd_t pmd)
339 {
340         return 0;
341 }
342
343 #ifdef CONFIG_FINEGRAINED_THP
344 static inline int is_pte_migration_entry(pte_t pte)
345 {
346         return 0;
347 }
348 #endif /* CONFIG_FINEGRAINED_THP */
349 #endif
350
351 #ifdef CONFIG_MEMORY_FAILURE
352
353 extern atomic_long_t num_poisoned_pages __read_mostly;
354
355 /*
356  * Support for hardware poisoned pages
357  */
358 static inline swp_entry_t make_hwpoison_entry(struct page *page)
359 {
360         BUG_ON(!PageLocked(page));
361         return swp_entry(SWP_HWPOISON, page_to_pfn(page));
362 }
363
364 static inline int is_hwpoison_entry(swp_entry_t entry)
365 {
366         return swp_type(entry) == SWP_HWPOISON;
367 }
368
369 static inline void num_poisoned_pages_inc(void)
370 {
371         atomic_long_inc(&num_poisoned_pages);
372 }
373
374 static inline void num_poisoned_pages_dec(void)
375 {
376         atomic_long_dec(&num_poisoned_pages);
377 }
378
379 #else
380
381 static inline swp_entry_t make_hwpoison_entry(struct page *page)
382 {
383         return swp_entry(0, 0);
384 }
385
386 static inline int is_hwpoison_entry(swp_entry_t swp)
387 {
388         return 0;
389 }
390
391 static inline void num_poisoned_pages_inc(void)
392 {
393 }
394 #endif
395
396 #if defined(CONFIG_MEMORY_FAILURE) || defined(CONFIG_MIGRATION) || \
397     defined(CONFIG_DEVICE_PRIVATE)
398 static inline int non_swap_entry(swp_entry_t entry)
399 {
400         return swp_type(entry) >= MAX_SWAPFILES;
401 }
402 #else
403 static inline int non_swap_entry(swp_entry_t entry)
404 {
405         return 0;
406 }
407 #endif
408
409 #endif /* CONFIG_MMU */
410 #endif /* _LINUX_SWAPOPS_H */