]> Gentwo Git Trees - linux/.git/commit
arm64/fpsimd: Allocate kernel mode FP/SIMD buffers on the stack
authorArd Biesheuvel <ardb@kernel.org>
Wed, 1 Oct 2025 11:59:42 +0000 (13:59 +0200)
committerArd Biesheuvel <ardb@kernel.org>
Wed, 12 Nov 2025 08:52:03 +0000 (09:52 +0100)
commit4fa617cc6851488759f79dc8f66822ae332d98f0
treeb8625238c236d5b3a525c8f2d549f79b95ecdbab
parent103728a7162cb5ed22904e31066904375f1fb71e
arm64/fpsimd: Allocate kernel mode FP/SIMD buffers on the stack

Commit aefbab8e77eb16b5

  ("arm64: fpsimd: Preserve/restore kernel mode NEON at context switch")

added a 'kernel_fpsimd_state' field to struct thread_struct, which is
the arch-specific portion of struct task_struct, and is allocated for
each task in the system. The size of this field is 528 bytes, resulting
in non-negligible bloat of task_struct, and the resulting memory
overhead may impact performance on systems with many processes.

This allocation is only used if the task is scheduled out or interrupted
by a softirq while using the FP/SIMD unit in kernel mode, and so it is
possible to transparently allocate this buffer on the caller's stack
instead.

So tweak the 'ksimd' scoped guard implementation so that a stack buffer
is allocated and passed to both kernel_neon_begin() and
kernel_neon_end(), and either record it in the task struct, or use it
directly to preserve the task mode kernel FP/SIMD when running in
softirq context. Passing the address to both functions, and checking the
addresses for consistency ensures that callers of the updated bare
begin/end API use it in a manner that is consistent with the new context
switch semantics.

Acked-by: Catalin Marinas <catalin.marinas@arm.com>
Signed-off-by: Ard Biesheuvel <ardb@kernel.org>
arch/arm64/include/asm/fpu.h
arch/arm64/include/asm/neon.h
arch/arm64/include/asm/processor.h
arch/arm64/include/asm/simd.h
arch/arm64/kernel/fpsimd.c