我正在比较MethodHandle::invoke和直接静态方法调用的性能。这是静态方法:

public class IntSum {
    public static int sum(int a, int b){
        return a + b;
    }
}

这是我的基准:
@State(Scope.Benchmark)
public class MyBenchmark {

    public int first;
    public int second;
    public final MethodHandle mhh;

    @Benchmark
    @OutputTimeUnit(TimeUnit.NANOSECONDS)
    @BenchmarkMode(Mode.AverageTime)
    public int directMethodCall() {
        return IntSum.sum(first, second);
    }

    @Benchmark
    @OutputTimeUnit(TimeUnit.NANOSECONDS)
    @BenchmarkMode(Mode.AverageTime)
    public int finalMethodHandle() throws Throwable {
        return (int) mhh.invoke(first, second);
    }

    public MyBenchmark() {
        MethodHandle mhhh = null;

        try {
            mhhh = MethodHandles.lookup().findStatic(IntSum.class, "sum", MethodType.methodType(int.class, int.class, int.class));
        } catch (NoSuchMethodException | IllegalAccessException e) {
            e.printStackTrace();
        }

        mhh = mhhh;
    }

    @Setup
    public void setup() throws Exception {
        first = 9857893;
        second = 893274;
    }
}

我得到以下结果:
Benchmark                      Mode  Cnt  Score   Error  Units
MyBenchmark.directMethodCall   avgt    5  3.069 ± 0.077  ns/op
MyBenchmark.finalMethodHandle  avgt    5  6.234 ± 0.150  ns/op
MethodHandle有一些性能下降。

使用-prof perfasm运行它显示以下内容:
....[Hottest Regions]...............................................................................
 31.21%   31.98%         C2, level 4  java.lang.invoke.LambdaForm$DMH::invokeStatic_II_I, version 490 (27 bytes)
 26.57%   28.02%         C2, level 4  org.sample.generated.MyBenchmark_finalMethodHandle_jmhTest::finalMethodHandle_avgt_jmhStub, version 514 (84 bytes)
 20.98%   28.15%         C2, level 4  org.openjdk.jmh.infra.Blackhole::consume, version 497 (44 bytes)

据我能确定出基准测试结果的原因,是 HitTest 区域2 org.sample.generated.MyBenchmark_finalMethodHandle_jmhTest::finalMethodHandle_avgt_jmhStub包含了JHM循环中MethodHandle::invoke执行的所有类型检查。程序集输出片段(省略了一些代码):
....[Hottest Region 2]..............................................................................
C2, level 4, org.sample.generated.MyBenchmark_finalMethodHandle_jmhTest::finalMethodHandle_avgt_jmhStub, version 519 (84 bytes)
;...
0x00007fa2112119b0: mov     0x60(%rsp),%r10
;...
0x00007fa2112119d4: mov     0x14(%r12,%r11,8),%r8d  ;*getfield form
0x00007fa2112119d9: mov     0x1c(%r12,%r8,8),%r10d  ;*getfield customized
0x00007fa2112119de: test    %r10d,%r10d
0x00007fa2112119e1: je      0x7fa211211a65    ;*ifnonnull
0x00007fa2112119e7: lea     (%r12,%r11,8),%rsi
0x00007fa2112119eb: callq   0x7fa211046020    ;*invokevirtual invokeBasic
;...
0x00007fa211211a01: movzbl  0x94(%r10),%r10d  ;*getfield isDone
;...
0x00007fa211211a13: test    %r10d,%r10d
;jumping at the begging of jmh loop if not done
0x00007fa211211a16: je      0x7fa2112119b0    ;*aload_1
;...

在调用invokeBasic之前,我们执行类型检查(在jmh循环内),这会影响输出avgt。

问题:为什么所有类型检查都没有移到循环之外?我在基准测试中声明了public final MethodHandle mhh;。因此,我希望编译器可以解决该问题并消除相同的类型检查。如何消除相同的类型检查?是否可以?

最佳答案

您使用MethodHandle的反射调用。它的工作原理大致类似于Method.invoke,但运行时检查更少,并且无需装箱/拆箱。由于此MethodHandle不是static final,因此JVM不会将其视为常量,也就是说,MethodHandle的目标是黑盒,无法内联。

即使mhh是最终的,它也包含实例字段,例如MethodType typeLambdaForm form,它们在每次迭代时重新加载。由于内部有黑匣子调用,因此无法将这些负载提升到循环之外(请参见上文)。此外,可以在调用之间的运行时更改(定制)LambdaFormMethodHandle,因此需要重新加载它。

如何使通话速度更快?

  • 使用static final MethodHandle。 JIT将知道此类MethodHandle的目标,因此可以在调用站点内联它。
  • 即使您具有非静态的MethodHandle,也可以将其绑定(bind)到静态CallSite并像直接方法一样快地调用它。这类似于lambda的调用方式。
    private static final MutableCallSite callSite = new MutableCallSite(
            MethodType.methodType(int.class, int.class, int.class));
    private static final MethodHandle invoker = callSite.dynamicInvoker();
    
    public MethodHandle mh;
    
    public MyBenchmark() {
        mh = ...;
        callSite.setTarget(mh);
    }
    
    @Benchmark
    public int boundMethodHandle() throws Throwable {
        return (int) invoker.invokeExact(first, second);
    }
    
  • 使用常规的invokeinterface代替@Holger建议的MethodHandle.invoke。可以使用 LambdaMetafactory.metafactory() 生成用于调用给定MethodHandle的接口(interface)的实例。
  • 09-11 16:59