x86/boot/compressed: Enable 5-level paging during decompression stage
authorKirill A. Shutemov <kirill.shutemov@linux.intel.com>
Tue, 6 Jun 2017 11:31:25 +0000 (14:31 +0300)
committerIngo Molnar <mingo@kernel.org>
Tue, 13 Jun 2017 06:56:53 +0000 (08:56 +0200)
We need to cover two basic cases: when bootloader left us in 32-bit mode
and when bootloader enabled long mode.

The patch implements unified codepath to enabled 5-level paging for both
cases. It means case when we start in 32-bit mode, we first enable long
mode with 4-level and then switch over to 5-level paging.

Switching from 4-level to 5-level paging is not trivial. We cannot do it
directly. Setting LA57 in long mode would trigger #GP. So we need to
switch off long mode first and the then re-enable with 5-level paging.

NOTE: The need of switching off long mode means we are in trouble if
bootloader put us above 4G boundary. If bootloader wants to boot 5-level
paging kernel, it has to put kernel below 4G or enable 5-level paging on
it's own, so we could avoid the step.

Signed-off-by: Kirill A. Shutemov <kirill.shutemov@linux.intel.com>
Cc: Andrew Morton <akpm@linux-foundation.org>
Cc: Andy Lutomirski <luto@amacapital.net>
Cc: Andy Lutomirski <luto@kernel.org>
Cc: Borislav Petkov <bp@alien8.de>
Cc: Brian Gerst <brgerst@gmail.com>
Cc: Dave Hansen <dave.hansen@intel.com>
Cc: Denys Vlasenko <dvlasenk@redhat.com>
Cc: H. Peter Anvin <hpa@zytor.com>
Cc: Josh Poimboeuf <jpoimboe@redhat.com>
Cc: Linus Torvalds <torvalds@linux-foundation.org>
Cc: Peter Zijlstra <peterz@infradead.org>
Cc: Thomas Gleixner <tglx@linutronix.de>
Cc: linux-arch@vger.kernel.org
Cc: linux-mm@kvack.org
Link: http://lkml.kernel.org/r/20170606113133.22974-7-kirill.shutemov@linux.intel.com
Signed-off-by: Ingo Molnar <mingo@kernel.org>
arch/x86/boot/compressed/head_64.S

index d2ae1f8..fbf4c32 100644 (file)
@@ -346,6 +346,48 @@ preferred_addr:
        /* Set up the stack */
        leaq    boot_stack_end(%rbx), %rsp
 
+#ifdef CONFIG_X86_5LEVEL
+       /* Check if 5-level paging has already enabled */
+       movq    %cr4, %rax
+       testl   $X86_CR4_LA57, %eax
+       jnz     lvl5
+
+       /*
+        * At this point we are in long mode with 4-level paging enabled,
+        * but we want to enable 5-level paging.
+        *
+        * The problem is that we cannot do it directly. Setting LA57 in
+        * long mode would trigger #GP. So we need to switch off long mode
+        * first.
+        *
+        * NOTE: This is not going to work if bootloader put us above 4G
+        * limit.
+        *
+        * The first step is go into compatibility mode.
+        */
+
+       /* Clear additional page table */
+       leaq    lvl5_pgtable(%rbx), %rdi
+       xorq    %rax, %rax
+       movq    $(PAGE_SIZE/8), %rcx
+       rep     stosq
+
+       /*
+        * Setup current CR3 as the first and only entry in a new top level
+        * page table.
+        */
+       movq    %cr3, %rdi
+       leaq    0x7 (%rdi), %rax
+       movq    %rax, lvl5_pgtable(%rbx)
+
+       /* Switch to compatibility mode (CS.L = 0 CS.D = 1) via far return */
+       pushq   $__KERNEL32_CS
+       leaq    compatible_mode(%rip), %rax
+       pushq   %rax
+       lretq
+lvl5:
+#endif
+
        /* Zero EFLAGS */
        pushq   $0
        popfq
@@ -429,6 +471,44 @@ relocated:
        jmp     *%rax
 
        .code32
+#ifdef CONFIG_X86_5LEVEL
+compatible_mode:
+       /* Setup data and stack segments */
+       movl    $__KERNEL_DS, %eax
+       movl    %eax, %ds
+       movl    %eax, %ss
+
+       /* Disable paging */
+       movl    %cr0, %eax
+       btrl    $X86_CR0_PG_BIT, %eax
+       movl    %eax, %cr0
+
+       /* Point CR3 to 5-level paging */
+       leal    lvl5_pgtable(%ebx), %eax
+       movl    %eax, %cr3
+
+       /* Enable PAE and LA57 mode */
+       movl    %cr4, %eax
+       orl     $(X86_CR4_PAE | X86_CR4_LA57), %eax
+       movl    %eax, %cr4
+
+       /* Calculate address we are running at */
+       call    1f
+1:     popl    %edi
+       subl    $1b, %edi
+
+       /* Prepare stack for far return to Long Mode */
+       pushl   $__KERNEL_CS
+       leal    lvl5(%edi), %eax
+       push    %eax
+
+       /* Enable paging back */
+       movl    $(X86_CR0_PG | X86_CR0_PE), %eax
+       movl    %eax, %cr0
+
+       lret
+#endif
+
 no_longmode:
        /* This isn't an x86-64 CPU so hang */
 1:
@@ -442,7 +522,7 @@ gdt:
        .word   gdt_end - gdt
        .long   gdt
        .word   0
-       .quad   0x0000000000000000      /* NULL descriptor */
+       .quad   0x00cf9a000000ffff      /* __KERNEL32_CS */
        .quad   0x00af9a000000ffff      /* __KERNEL_CS */
        .quad   0x00cf92000000ffff      /* __KERNEL_DS */
        .quad   0x0080890000000000      /* TS descriptor */
@@ -486,3 +566,7 @@ boot_stack_end:
        .balign 4096
 pgtable:
        .fill BOOT_PGT_SIZE, 1, 0
+#ifdef CONFIG_X86_5LEVEL
+lvl5_pgtable:
+       .fill PAGE_SIZE, 1, 0
+#endif