出错代码

写java 和 scala 混合代码的时候遇到一个小问题

def extractRefInputFieldsWithType(exprs: JList[RexNode]): Array[(Int, RelDataType)] = {
  val visitor = new InputRefVisitor
  // extract referenced input fields from expressions
  exprs.foreach(_.accept(visitor))
  visitor.getFieldsWithType
}
final scala.Tuple2<Integer, RelDataType>[] refFields =
      RexNodeExtractor.extractRefInputFieldsWithType(project.getProjects());

Java访问Scala中的Int类型-LMLPHP
IDE提示的错误是返回的类型是 Tuple2<Object, RelDataType> 但是我们承接的类型是Tuple2<Integer, RelDataType>

原因

这本质原因是因为scala中的Int和java的Integer并不对标。
从这个 api介绍中https://www.scala-lang.org/api/current/scala/Int.html我们可以知道scala中Int是一个value class (继承自 AnyVal) 有点类似java中的新提案中的 value types,可以让用户定义的类型在运行时不需要装箱拆箱操作,可以减少不必要的堆内存分配。
从Stack Overflow上看到这样的测试样例

class SomeClass {
  def testIntTuple: (Int, Int) = (0, 1)
  def testIntegerTuple: (java.lang.Integer, java.lang.Integer) = (0, 1)
  def testIntArray: Array[Int] = Array(1, 2)
}
javap SomeClass
Compiled from "IntValue.scala"
public class org.apache.flink.table.planner.plan.stream.sql.SomeClass {
  public scala.Tuple2<java.lang.Object, java.lang.Object> testIntTuple();
  public scala.Tuple2<java.lang.Integer, java.lang.Integer> testIntegerTuple();
  public int[] testIntArray();
  public org.apache.flink.table.planner.plan.stream.sql.SomeClass();
}

通过反编译之后的代码可以看到运行时表示的类型是Object类型,而如果直接返回的类型是Array[Int] 则相应的表示的类型是int[]
Java访问Scala中的Int类型-LMLPHP
从上面这段描述可以看到,因为Int类型是value class 所以在运行时并不直接对应到java.lang.Integer 因为scala中实现了value class的语义,所以他不需要将其转化成包装类,这样就可以获得更好的性能,避免创建Int值时还需要堆上分配内存和创建引用。
因此转到java class时/或者java的泛型参数时就没有直接的Reference类型映射,而转到数组时,就可以直接表示为 primitive 数组int[]

参考

https://stackoverflow.com/questions/10248180/scala-tuple-type-inference-in-java
https://scala.cool/2017/07/scala-types-of-types-part-4/#17-value-%E7%B1%BB
https://docs.scala-lang.org/overviews/core/value-classes.html value class 介绍
https://www.jesperdj.com/2015/10/04/project-valhalla-value-types/ java value types
https://openjdk.org/projects/valhalla/ jep

09-12 16:06